국사편찬워원회의 한국사 LOD는 국사편찬위원회의 인물 온톨로지와 시소러스, 한국학중앙연구원의 민족문화대백과사전, 문화재청의 유물/유적데이터, 한국콘텐츠진흥원의 사극/이미지 데이터 및 한국사 주요 주제별 DB을 통합하는 온톨로지 기법의 한국사 LOD(Linked Open Data)을 제공하고 있다. 


홈페이지 : http://lod.koreanhistory.or.kr/

소개 페이지 : http://lod.koreanhistory.or.kr/lodIntro.do


개인적으로 발상자체에서는 박수를 주고 싶다. 또한 구축된 한국사 LOD가 그 이후 다양한 시각화 작업에서 활용되었다는 점에서는 더욱 그러하다. 


한국에 선행 LOD가 전무한 상황에서 자체적으로 한국사에 최적화된 LOD을 설계한 점은 그 노력을 높이 살만하다. 온톨로지 설계의 특성상 해외 LOD 사례와 한국사를 동시에 공부하느라 얼마나 힘들었을지 눈에 그려진다. 다만 개인적으로 세부 LOD 설계에서 국제표준이 되어 있는 DC나 LIDO 혹은 SKOS을 좀 더 이용하였으면 하는 아쉬움이 남는다. 또한 RDB 설계와 LOD 설계 간의 미묘한 차이에 대해서 조금 더 주의했으면 하는 바람이 있다. 


그러나!!!1 무엇보다 모든 데이터를 공개해놓고 있다는 경악스러울 정도의 완벽한 정부 3.0 대응에는 감격의 눈물이 흐른다. 화이팅!! 국편 잘한다~ 국편 잘한다~~~





모든 학문은 선현들의 수 많은 성과를 바탕으로 발전한다. 그렇기에 기본적으로 어떤 논문에도 선행연구에 대해서 서술하도록 되어 있다. 다시 말해서 학문성과의 축적은 모든 학문의 기본 중에 기본이다. 


그러나 한국의 학문성과축적은 상당히 방대하며 빈약하다. 방대하다고 하는 이유는 한국연구재단 등의 국가기관이나 각 대학들이나 연구소등의 사립기관들이 예산을 투여해가면서 수 많은 학문성과를 축적해왔다. 빈약하다는 이유는 축적된 데이터는 데이터허깅으로 인하여 어디까지나 해당 기관이나 개인이 소장하고 있을 뿐 다른 이와 공유되지 못한다. 또한 길어봐야 10년에 불과하고 대부분이 3년도 되지 않는 프로젝트 수행기간은 지엽적인 주제의 데이터의 축적을 할 수 밖에 없게 한다.


디지털인문학은 축적된 학문성과의 공유문제와 짦은 수행기간으로 인한 지엽적인 주제의 데이터생산문제의 탈출구로 온톨로지를 제안한다. 


데이터 공유 문제에서는 이미 정부 3.0으로 인하여 데이터 보유 기관들이 현실적인 압박을 받고 있기에 5년내로는 공유되는 데이터의 양 자체에서는 상당한 성과를 보일 수 있다고 생각한다. 그러나 정리되지 않고, 타인이 알아볼 수 없는 데이터는 자원낭비이자 쓰레기일 뿐이다. 온톨로지를 통하여 초기 프로젝트 단계부터 데이터를 정비하여야 한다. 인문학자 자신이 데이터를 만들면서 데이터를 정비해야 한다는 말이다. 어떤 컴퓨터 공학자가가 해줄 수 있으리라는 것은 착각이며, 오해이다. 컴퓨터 공학자는 어디까지나 컴퓨터 공학쪽으로 잘 알 뿐이고, 인문학자들이 생산하는 인문학 데이터에 대해서는 일자무식에 가깝다. 못한다. 해도 엉터리다[각주:1]


짦은 수행기간으로 인한 지엽적인 주제의 데이터 생산 문제 역시 온톨로지을 통해서 해결할 수 있다. 단일 프로젝트는 짦은 수행기간과 적은 인력으로 인하여 지엽적인 주제에 한정될 수 밖에 없다고 하더라도, 온톨로지를 통해서 다른 프로젝트의 성과와 연결될 수 있다면 별 문제가 없다. 오히려 단일 프로젝트의 전문성을 확장하고, 전체적인 맥락에서는 인문학 빅데이터를 구축하는 방법이 될 것이다. 물론 짦은 수행기간 자체와 적은 예산으로 인한 인력문제에 대한 근본적인 수정이 있으면 좋겠지만......


이미 2012년부터 한국연구재단에서도 토대 사업을 대상으로 적합한 XML이나 RDB 형식의 데이터를 제출하도록 하고 있다. XML이나 RDB 설계 모두가 넓은 범위에서 온톨로지의 일부분이라도 할 수 있다. 이제 인문학 프로젝트를 하려고 해도 온톨로지를 해야되는 세상인 것이다. 그런데 온톨로지는 인문학에서 태어난 개념이기에 인문학자들이 오히려 컴퓨터 공학자들보다 손쉽게 배우고 자유롭게 활용하는 모습을 자주 본다. 다시 말해서 온톨로지라는 기술에 밑도 끝도 없는 두려움만 가지지 않는다면 인문학자들이 온톨로지를 다루는데 어떠한 문제도 발생하지 않는다. 








바로 : .....생각나는대로 쓰윽쓰윽~~ 카테고리가 잡담잡상~~ 우훗~ 머....몰라몰라~~ ^^::: (요즘 살짝 미쳐가고 있는듯 함.)


  1. 조금 다른 예이지만, "고구려왕조실록"으로 인물네트워크 분석을 한다면 어떻게 생각되는가?! [본문으로]



도쿄대학 지식의 구조화 센터(東京大学知の構造化センタ)에서 일본을 대표하는 사상 철학 처널인 이와나미 서점의 「사상(思想)」을 대상으로 디지털인문학의 방법론을 동원하여 연구한 프로젝트이다. 디지털 방법론의 1단계로 종이문서로 되어 있는 “사상(思想)”을 OCR 기술을 이용하여 디지털화하였다. 그 이후 디지털화 된 “사상(思想)” 텍스트에 대하여 자체 제작한 온톨로지 시스템 MIMA서치(MIMAサーチ)을 활용하여 말뭉치(코퍼스) 분석을 하여 그 결과를 시각화하였다. 


일본 잡지 사상의 구조화(「思想」の構造化) http://www.cks.u-tokyo.ac.jp/p1.html 

본 내용은 한국학중앙연구원 인문정보학과 석사과정의 김사현씨가 온톨로지 수업에서 발표한  "Europeana(유로파이나)" 자료입니다. 유로피아나는 EU에서 개발한 유럽 문화 정보를 종합한 정보시스템이며, 자체적인 ESE와 EDM이라는 온톨로지 기술을 활용하고 있습니다. 


본 내용은 출처표기를 하시면 자유롭게 활용 가능합니다. 문의사항이나 수정요청 사항 등은 ddokbaro@gmail.com 으로 메일을 보내주시기 바랍니다.










본 내용은 한국학중앙연구원 인문정보학과 필수교육과정인 김현 교수님의 "전자문서와 하이퍼텍스트" 강의자료 중에서 "전자문서 편찬 실습"부분 입니다. 디지털 인문학에서 데이터 수집-정리의 기본이 되는 XML에 대한 기초적인 내용과 디지털 인문학의 방향성과 방법에 대한 내용으로 구성되어 있습니다. 


본 내용은 출처표기를 하시면 자유롭게 활용 가능합니다. 문의사항이나 수정요청 사항 등은 ddokbaro@gmail.com 으로 메일을 보내주시기 바랍니다.












본 내용은 한국학중앙연구원 인문정보학과 필수교육과정인 김현 교수님의 "전자문서와 하이퍼텍스트" 강의자료 중에서 "XPath의 이해"부분 입니다. 디지털 인문학에서 데이터 수집-정리의 기본이 되는 XML에 대한 기초적인 내용과 디지털 인문학의 방향성과 방법에 대한 내용으로 구성되어 있습니다. 


본 내용은 출처표기를 하시면 자유롭게 활용 가능합니다. 문의사항이나 수정요청 사항 등은 ddokbaro@gmail.com 으로 메일을 보내주시기 바랍니다.












본 내용은 한국학중앙연구원 인문정보학과 필수교육과정인 김현 교수님의 "전자문서와 하이퍼텍스트" 강의자료 중에서 "XSL의 이해"부분 입니다. 디지털 인문학에서 데이터 수집-정리의 기본이 되는 XML에 대한 기초적인 내용과 디지털 인문학의 방향성과 방법에 대한 내용으로 구성되어 있습니다. 


본 내용은 출처표기를 하시면 자유롭게 활용 가능합니다. 문의사항이나 수정요청 사항 등은 ddokbaro@gmail.com 으로 메일을 보내주시기 바랍니다.












본 내용은 한국학중앙연구원 인문정보학과 필수교육과정인 김현 교수님의 "전자문서와 하이퍼텍스트" 강의자료 중에서 "XML NAMESPACE의 이해"부분 입니다. 디지털 인문학에서 데이터 수집-정리의 기본이 되는 XML에 대한 기초적인 내용과 디지털 인문학의 방향성과 방법에 대한 내용으로 구성되어 있습니다. 


본 내용은 출처표기를 하시면 자유롭게 활용 가능합니다. 문의사항이나 수정요청 사항 등은 ddokbaro@gmail.com 으로 메일을 보내주시기 바랍니다.












본 내용은 한국학중앙연구원 인문정보학과 필수교육과정인 김현 교수님의 "전자문서와 하이퍼텍스트" 강의자료 중에서 "INTERNET과 www"부분 입니다. 디지털 인문학에서 데이터 수집-정리의 기본이 되는 XML에 대한 기초적인 내용과 디지털 인문학의 방향성과 방법에 대한 내용으로 구성되어 있습니다. 


본 내용은 출처표기를 하시면 자유롭게 활용 가능합니다. 문의사항이나 수정요청 사항 등은 

ddokbaro@gmail.com 으로 메일을 보내주시기 바랍니다.












본 내용은 한국학중앙연구원 인문정보학과 필수교육과정인 김현 교수님의 "전자문서와 하이퍼텍스트" 강의자료 중에서 "XML의 이해"부분 입니다. 디지털 인문학에서 데이터 수집-정리의 기본이 되는 XML에 대한 기초적인 내용과 디지털 인문학의 방향성과 방법에 대한 내용으로 구성되어 있습니다. 


본 내용은 출처표기를 하시면 자유롭게 활용 가능합니다. 문의사항이나 수정요청 사항 등은 ddokbaro@gmail.com 으로 메일을 보내주시기 바랍니다.










본 내용은 한국학중앙연구원 인문정보학과 필수교육과정인 김현 교수님의 "전자문서와 하이퍼텍스트" 강의자료 중에서 "HTML의 이해"부분 입니다. 디지털 인문학에서 데이터 수집-정리의 기본이 되는 XML에 대한 기초적인 내용과 디지털 인문학의 방향성과 방법에 대한 내용으로 구성되어 있습니다. 


본 내용은 출처표기를 하시면 자유롭게 활용 가능합니다. 문의사항이나 수정요청 사항 등은 ddokbaro@gmail.com 으로 메일을 보내주시기 바랍니다.









본 내용은 한국학중앙연구원 인문정보학과 필수교육과정인 김현 교수님의 "전자문서와 하이퍼텍스트" 강의자료 중에서 "INTERNET과 www"부분 입니다. 디지털 인문학에서 데이터 수집-정리의 기본이 되는 XML에 대한 기초적인 내용과 디지털 인문학의 방향성과 방법에 대한 내용으로 구성되어 있습니다. 


본 내용은 출처표기를 하시면 자유롭게 활용 가능합니다. 문의사항이나 수정요청 사항 등은 ddokbaro@gmail.com 으로 메일을 보내주시기 바랍니다.








본 내용은 한국학중앙연구원 인문정보학과 석사과정의 서소리씨가 온톨로지 수업에서 발표한  "LIDO(리도)" 자료입니다. LIDO는 ICOM에서 개발하고 W3C에서 표준으로 지정된 문화유산-유물에 대해서 박물관 측면에서 최적화된 XML 기반의 스키마입니다. 


본 내용은 출처표기를 하시면 자유롭게 활용 가능합니다. 문의사항이나 수정요청 사항 등은 ddokbaro@gmail.com 으로 메일을 보내주시기 바랍니다.







본 내용은 한국학중앙연구원 인문정보학과 김바로 박사과정의 "온톨로지 개론"입니다. 인문학자를 위해서 온톨로지에 대한 사항을 최대한 간략한 설명과 다양한 예시로 설명하고 있습니다. 


본 내용은 출처표기를 하시면 자유롭게 활용 가능합니다. 문의사항이나 수정요청 사항 등은 ddokbaro@gmail.com 으로 메일을 보내주시기 바랍니다.






+ Recent posts