Kalev Leetaru은 1500년부터 1922년 사이에 출판된 모든 서적 내부의 이미지들을 OCR을 이용하여 자동 추출하여 문맥요소를 활용하여 자동으로 태깅을 부여하는 방식으로 추출한 14만장의 이미지를 Internet Archive’s public domain ebooks에 저장하고, 그 중에서 2.6만장을 세계적인 사진공유 온라인 서비스 플리커(Flickr)을 통해서 서비스하고 있다. (Internet Archive Book Images)
주소 : Internet Archive Book Images
바로 : 아직 태깅이 부정확한 면이 있지만, 그것은 사용자들이 알아서 하나하나 수정해주는 대중지성이 해결해주리라 생각한다. 개인적으로 [디지털인문학/DH_DB] - [DH리뷰] 포토그래머(Photogrammar) - 이미지와 지도의 만남나 이번 프로젝트 같이 저작권 문제에서 자유로운 이미지의 공개가 한국에서도 빨리 이루어졌으면 좋겠다.
'디지털인문학 > DH_DB' 카테고리의 다른 글
[DH리뷰]Cytoscape - 네트워크 분석 및 시각화용 오픈소스 소프트웨어 (0) | 2014.09.18 |
---|---|
[DH리뷰] 1차세계대전 예술 아카이브 - Illustrated First World War Art (0) | 2014.09.17 |
[DH리뷰] 포토그래머(Photogrammar) - 이미지와 지도의 만남 (0) | 2014.09.15 |
[자원] OCR을 활용한 고문헌 폰트 자동 추출 (0) | 2014.09.03 |
디지털 시대의 종이 출판 워크 플로우 (0) | 2014.09.02 |