가칭 "한국 역사 관계 데이터베이스(Korea Historical Network DataBase, KHNDB)"
본 내용은 한국 역사에서 출현하는 관계를 데이터베이스화 하기 위한 기초작업이다. 관계는 인물, 기관, 사물 등 다양한 영역의 관계를 의미한다. 그러나 역량의 한계로 우선적으로 특정 DB들을 바탕으로 인물관계 데이터베이스만 구축 시도한다.(그래도 10만건……혼자서 10만건 하려니 죽을 거 같…-_)
아래의 규칙들은 추후 수정될 수도 있다.
혹시 괜찮은 아이디어나 관련 정보가 있으시면 언제든지....조언 좀..ㅠㅠ
+ 인물 ID 값 규칙
예시 : 1가귀U9999X0
남녀구별 : 남자(1), 여자(2), 혼합(3), 미상(9)
한글이름 : 이름(가귀) 명시. 3자리 이상의 이름도 모두 서술
보조연도 : B(생년) or D(몰년) or U(미상) B1545 : 생년(Birth)이 1545년을 의미, 몰년일 경우 D와 서기연도, 생몰년 미상일 경우 U9999가 옴
X0 : 중복되는 인물이 있을 경우 X1, X2로 증가. 단 X9는 기존DB에 없는 것을 표기
+ 사회관계 ID값 규칙
예시 : S0101
사회관계고유값 : S(society)
분류코드값 : 분류코드표 참조
ID값 |
한국어 |
영어 |
중국어 |
S0100 |
사회관계(포괄) |
Associations (General) |
社會關係(籠統) |
S0101 |
사회관계(포괄) |
Associations (General) |
社會關係(籠統) |
S0102 |
모두 X 의 구성원 |
Association through common membership |
同為……之成員 |
S0103 |
사회교제 |
Social Interactions |
社會交際 |
S0200 |
학술관계류 |
Scholarship |
學術關係類 |
S0201 |
학술(포괄) |
Scholarship (General) |
學術(籠統) |
S0202 |
사도관계(스승) |
Teacher-Student |
師生關係 |
S0203 |
사도관계(제자) |
Teacher-Student |
師生關係 |
S0204 |
학술교류 |
Intellectual Affiliations |
學術交往 |
S0205 |
학술주제밀접 |
Association by Scholarly Topic |
學術主題相近 |
S0206 |
모두 X의 구성원 |
Association through common membership |
同為……之成員 |
S0207 |
학술원조 |
Academic Patronage |
學術襄助 |
S0208 |
문학예술교류 |
Literary and Artistic Affiliations |
文學藝術交往 |
S0209 |
학술비판 |
Intellectual Attacks |
學術攻訐 |
S0300 |
친구관계류 |
Friendship |
朋友關係類 |
S0301 |
친구관계(포괄) |
Friendship(General) |
朋友關係(籠統) |
S0400 |
정치관계류 |
Politics |
政治關係類 |
S0401 |
정치관계(포괄) |
Politics (General) |
政治關係(籠統) |
S0402 |
관직관계(동급) |
Connection via office (equal) |
官場關係(平級) |
S0403 |
관직관계(부하) |
Connection via office (subordinate) |
官場關係(下屬) |
S0404 |
관직관계(상사) |
Connection via office (superior) |
官場關係(上司) |
S0405 |
정치원조 |
Supportive political association |
政治奧援 |
S0406 |
천거보증 |
Recommendation and sponsorship |
薦舉保任 |
S0407 |
정치대항 |
Oppositional political association |
政治對抗 |
S0500 |
저술관계류 |
Writings |
著述關係類 |
S0501 |
저술관계(포괄) |
Writings (General) |
著述關係(籠統) |
S0502 |
일반문장 |
Commemorative Texts |
記詠文字 |
S0503 |
묘지문장 |
Epitaphs |
墓誌文字 |
S0504 |
서발문문장 |
Prefaces/Postfaces |
序跋文字 |
S0505 |
예의문장 |
Ritual Texts |
禮儀文字 |
S0506 |
전기문장 |
Biographical Texts |
傳記文字 |
S0507 |
논설문장 |
Explanatory Texts |
論說文字 |
S0508 |
모토문장 |
Mottos |
箴銘文字 |
S0509 |
서찰문장 |
Correspondences |
書札文字 |
S0510 |
계약(보상)문장 |
Occasional Texts |
應酬文字 |
S0600 |
군사관계류 |
Military |
軍事關係類 |
S0601 |
군사관계(포괄) |
Military (General) |
軍事關係(籠統) |
S0602 |
군사지원 |
Supportive military association |
軍事支持 |
S0603 |
군사대항 |
Oppositional military association |
軍事對抗 |
S0700 |
의료관계류 |
Medicine |
醫療關係類 |
S0701 |
의료관계(포괄) |
Medicine (General) |
醫療關係(籠統) |
S0800 |
종교관계류 |
Religion |
宗教關係類 |
S0801 |
종교관계(포괄) |
Religion (General) |
宗教關係(籠統) |
S0900 |
가정관계류 |
Family |
家庭關係類 |
S0901 |
가정관계(포괄) |
Family (General) |
家庭關係(籠統) |
S1000 |
재정관계류 |
Finance |
財務關係類 |
S1001 |
재정관계(포괄) |
Finance (General) |
財務關係(籠統) |
S1100 |
예술관계류 |
|
|
S1101 |
예술관계(포괄) |
|
|
+ 혈연관계 ID값 규칙
B0201_0302
혈연관계 고유값 : B
촌수 : 01, 02, 03 (단순촌수계산. 법도무시)
관계속성(상하위) : 0(통합), 1(상위) 2(동급) 3(하위)
관계속성(구분) : 무속성(0) 친계(1) 외계(2) 부당계(3) 처당계(4)
구분자 : _
남녀구별 : 통합(0), 남자(1), 여자(2)
고유값 : 3자리
사실 위의 규칙으로 확장시 1000개정도는 무난히 넘을 것이다. 일단 몇 개만 예시로 제시한 것일 뿐이다. CBDB의 혈연코드가 559개였는데, 본인이 4촌이하 주요정보만 대략 했는데도 170여개이다. 만약 본인이 마음만 먹으면 정말 1000개 만들수도 있다. 하지만 실제로 그런 관계가 문헌이나 자료에 명시된 경우는 거의 없기에 사실상 아래 코드로 90%이상 커버 가능하다고 본다.
코드 |
설명 |
B9999_9999 |
미상 |
B0000_0000 |
친척 |
B0000_0100 |
姻親(통합) |
B0000_0200 |
親族 |
B0000_0300 |
親屬 |
B0000_0400 |
直系親族 |
B0001_0000 |
直系血族 |
B0011_0000 |
直系尊屬 |
B0031_0000 |
直系卑屬 |
B0003_0000 |
부당(夫黨) |
B0004_0000 |
처당(妻黨) |
B0020_0000 |
부부(통합) |
B0020_1000 |
丈夫(통합) |
B0020_1001 |
未婚夫 |
B0020_1051 |
第二任丈夫 |
B0020_1052 |
第三任丈夫 |
B0020_2000 |
妻子(통합) |
B0020_2001 |
未婚妻 |
B0020_2010 |
妾 |
B0110_0000 |
부모(통합) |
B0110_1000 |
부(통합) |
B0110_1001 |
生父 |
B0110_1002 |
養父 |
B0110_1003 |
繼父 |
B0110_1004 |
嗣父 |
B0110_2000 |
모(통합) |
B0110_2001 |
生母 |
B0110_2002 |
養母 |
B0110_2003 |
繼母 |
B0110_2004 |
嗣母 |
B0110_2005 |
乳母,유모 |
B0114_0000 |
장인-장모(통합) |
B0114_1000 |
장인 |
B0114_2000 |
장모 |
B0113_0000 |
시아버지-시어머니 |
B0113_1000 |
시아버지(시부) |
B0113_2000 |
시어머니(시모) |
B0130_0000 |
자식(통합) |
B0130_1000 |
아들(통합) |
B0130_1001 |
獨子 |
B0130_1002 |
繼子 |
B0130_1003 |
養子(非嗣子) |
B0130_1004 |
庶子 |
B0130_1005 |
私生子 |
B0130_1101 |
長子; 第一子 |
B0130_1102 |
次子 |
B0130_1103 |
三子 |
B0130_1104 |
四子 |
B0130_1105 |
五子 |
B0130_1106 |
六子 |
B0130_1107 |
七子 |
B0130_1108 |
八子 |
B0130_1109 |
九子 |
B0130_2000 |
딸(통합) |
B0130_2001 |
獨女 |
B0130_2002 |
繼女 |
B0130_2003 |
養女(非嗣女) |
B0130_2004 |
庶女 |
B0130_2005 |
私生女 |
B0130_2101 |
長女; 第一女 |
B0130_2102 |
次女 |
B0130_2103 |
三女 |
B0130_2104 |
四女 |
B0130_2105 |
五女 |
B0130_2106 |
六女 |
B0130_2107 |
七女 |
B0130_2108 |
八女 |
B0130_2109 |
九女 |
B0211_0000 |
조부모 |
B0211_1000 |
할아버지 |
B0211_2000 |
할머니 |
B0212_0000 |
외조부모 |
B0212_1000 |
외할아버지 |
B0212_2000 |
외할머니 |
B0214_0000 |
처조부모 |
B0214_1000 |
처조부 |
B0214_2000 |
처조모 |
B0213_0000 |
부조부모 |
B0213_1000 |
부조부 |
B0213_2000 |
부조모 |
B0220_0000 |
형제-자매 |
B0220_1000 |
형(오빠) |
B0220_2000 |
형(오빠)의 처 |
B0220_2100 |
누나(언니) |
B0200_1100 |
누나(언니의) 남편 |
B0220_1200 |
남동생 |
B0220_2200 |
남동생의 처 |
B0220_2300 |
여동생 |
B0220_1300 |
여동생의 남편 |
B0224_0000 |
처의 형제-자매 |
B0224_1000 |
처의 형(오빠) |
B0224_2000 |
처의 형(오빠)의 처 |
B0224_2100 |
처의 누나(언니) |
B0204_1100 |
처의 누나(언니의) 남편 |
B0224_1200 |
처의 남동생 |
B0224_2200 |
처의 남동생의 처 |
B0224_2300 |
처의 여동생 |
B0224_1300 |
처의 여동생의 남편 |
B0223_0000 |
남편의 형제-자매 |
B0223_1000 |
남편의 형(오빠) |
B0223_2000 |
남편의 형(오빠)의 처 |
B0223_2100 |
남편의 누나(언니) |
B0203_1100 |
남편의 누나(언니의) 남편 |
B0223_1200 |
남편의 남동생 |
B0223_2200 |
남편의 남동생의 처 |
B0223_2300 |
남편의 여동생 |
B0223_1300 |
남편의 여동생의 남편 |
B0230_0000 |
손자-손녀 |
B0230_1000 |
손자 |
B0230_2000 |
손자의 처 |
B0230_2100 |
손녀 |
B0230_1100 |
손녀의 남편 |
B0311_0000 |
증조부모 |
B0311_1000 |
증조부 |
B0311_2000 |
증조모 |
B0312_0000 |
외증조부 |
B0312_1000 |
외증조부 |
B0312_2000 |
외증조모 |
B0314_0000 |
처증조부모 |
B0314_1000 |
처증조부 |
B0314_2000 |
처증조모 |
B0313_0000 |
부증조부모 |
B0313_1000 |
부증조부 |
B0313_2000 |
부증조모 |
B0311_0100 |
삼촌-고모-처 |
B0311_1100 |
삼촌 |
B0311_2100 |
삼촌의 처 |
B0311_1110 |
백부(큰아버지) |
B0311_2110 |
백모(큰아버지의 처) |
B0311_1120 |
숙부(작은아버지) |
B0311_2120 |
숙모(작은아버지의 처) |
B0311_2150 |
고모 |
B0311_1150 |
고모의 남편 |
B0311_2160 |
큰고모 |
B0311_1160 |
큰고모의 남편 |
B0311_2170 |
작은고모 |
B0311_1170 |
작은고모의 남편 |
B0312_0200 |
외숙-이모-처 |
B0312_1200 |
외숙 |
B0312_2200 |
외숙의 처 |
B0312_2150 |
이모 |
B0312_1150 |
이모의 남편 |
B0314_0100 |
처고모부-처숙부-처 |
B0314_1100 |
처고모부 |
B0314_2100 |
처고모부의 처 |
B0314_2150 |
처고모 |
B0314_1150 |
처고모의 남편 |
B0313_0100 |
부고모부-부숙부-처 |
B0313_1100 |
부고모부 |
B0313_2100 |
부고모부의 처 |
B0313_2150 |
부고모 |
B0313_1150 |
부고모의 남편 |
B0331_0100 |
질-생질-처 |
B0331_1100 |
질 |
B0331_1200 |
질의 처 |
B0331_2150 |
생질 |
B0331_1150 |
생질의 처 |
B0411_0000 |
고조부모 |
B0411_1000 |
고조부 |
B0411_2000 |
고조모 |
B0412_0000 |
사촌 |
B0412_1000 |
남자사촌 |
B0412_2000 |
여자사촌 |
B0412_0100 |
종형제 |
B0412_1100 |
남자종형제 |
B0412_2100 |
여자종형제 |
B0412_0200 |
내종형제 |
B0412_1200 |
남자내종형제 |
B0412_2200 |
여자내종형제 |
B1001_1000 |
대부(大父) |
B1001_1100 |
족숙(族叔) |
B1002_1000 |
족형(族兄) |
B1002_1100 |
족제(族弟) |
B1003_1000 |
족질(族姪) |
B9900_1000 |
종씨(宗氏), 존장(尊長) |
+ XML 문서 설계
최대한 단순화 시켰다. 사실 복잡하게 하는게 더 이상하다.
문제는 어떤 관계인지 판단해서 추가해주는 것이...일이지. ㅠㅠ 아우..ㅠㅠ
DTD
<?xml version="1.0" encoding="UTF-8"?>
<?generated by 바로-Baro-把路 ddokbaro.com ddokbaro@gmail.com (2014.01.10)?>
<?Korea Historical Network DataBase?>
<!ELEMENT KHNDB ((인물+))>
<?우선 인물만 네트워킹 작업을 하고 추후 기관, 관직 등을 추가?>
<!ELEMENT 인물 ((관계정보))>
<!ATTLIST 인물 id CDATA #REQUIRED>
<!ELEMENT 관계정보 ((관계*))>
<!ELEMENT 관계 (#PCDATA)>
<!ATTLIST 관계 유형 CDATA #REQUIRED>
XML 예시
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE KHNDB SYSTEM "KHNDB.dtd">
<?generated by 바로-Baro-把路 ddokbaro.com ddokbaro@gmail.com (2014.01.10)?>
<?Korea Historical Network DataBase?>
<?대상 인물 : 98140개......어느 세월에 하나?>
<KHNDB>
<인물 id="가귀U9999X0">
<관계정보>
<관계 유형="S202">승전U9999X0</관계>
</관계정보>
</인물>
<인물 id="가루U9999X0">
<관계정보>
<관계 유형="S404">안승U9999X0</관계>
</관계정보>
</인물>
<인물 id="가마U9999X0">
<관계정보>
<관계 유형="S0401">아탁득문U9999X0</관계>
<관계 유형="S0401">奇非U9999X9</관계>
<관계 유형="S0401">欽明王U9999X9</관계>
<관계 유형="S0401">眞慕宣文U9999X9</관계>
</관계정보>
</인물>
<인물 id="가실U9999X0">
<관계정보>
<관계 유형="B0020_2000">설씨녀U9999X0</관계>
</관계정보>
</인물>
<인물 id="가실왕U9999X0">
<관계정보>
<관계 유형="S0403">우륵U9999X0</관계>
<관계 유형="S0111">우륵U9999X0</관계>
<관계 유형="S0407">진흥왕U9999X9</관계>
<관계 유형="S0603">진흥왕U9999X9</관계>
</관계정보>
</인물>
<인물 id="가안책B1559X0">
<관계정보>
<관계 유형="B0110_1000">賈忠權U9999X9</관계>
<관계 유형="B0220_1200">賈安術U9999X9</관계>
</관계정보>
</인물>
<인물 id="가안책B1559X0">
<관계정보>
<관계 유형="S0404">부여융B0615X0</관계>
<관계 유형="S0603">蘇定方U9999X9</관계>
</관계정보>
</인물>
</KHNDB>
'디지털인문학 > DH_기술문서' 카테고리의 다른 글
R을 통해서 무료로 PDF파일에서 텍스트 추출 (0) | 2014.07.22 |
---|---|
XML DTD 관련 요약정리 (0) | 2014.01.08 |
오픈 데이터-SW 저작권 관련 정보모음 (0) | 2014.01.07 |
데이터 제공형태 및 제공기술에 대하여 (0) | 2014.01.07 |
MSSQL XML 관련 요약정리 (0) | 2013.12.31 |