1
古籍文本数据格式比较研究
1.8.2.1 一、谱系文本XML结构
一、谱系文本XML结构

谱系文本XML由六部分组成,包括文件头、书目元数据、卷目数据、实体间关系数据、实体数据和集外字数据,如图7-7所示,以家谱谱系为例,使用fileHeader(文件头)、bibliographyMetadata(书目元数据)、catalog(卷目数据)、relation(关系)、personList(人物列表)、gaijiList(外字列表)等标签。文件头是谱系文本XML的整体属性说明和创建、修改、发布等过程描述;书目元数据描述家谱书目信息;卷目数据描述家谱的逻辑结构;关系数据描述人物间的关系,是谱系文本XML的核心;人物数据描述人物的基本信息,是谱系文本XML的基础;集外字数据是谱系文本XML的补充说明,针对谱系文本XML中的集外字。

图7-7 谱系文本XML结构图

(一)文件头

与纯文本XML基本相同,由于谱系文本XML只使用家谱的部分内容,需在文件头中进行说明,同时,关系描述可能有多种方式,也要在文件头中进行说明。如图7-8所示,使用genealogicalRange(谱系范围)、relationOption(关系描述方式)等标签描述。

图7-8 谱系文本文件头结构图

(二)书目元数据

与纯文本XML相同,此处不再赘述。

(三)卷目数据

与位置文本XML相同,此处不再赘述。

(四)实体间关系数据

以家谱谱系数据为例,关系数据描述人物间的关系,是家谱谱系文本XML的核心,如图7-9所示,使用relation(关系)、relationFamily(家庭树)、family(家庭)、husband(丈夫)、wife(妻子)、child(孩子)、familyLink(家庭链接)、relationClan(家族树)、clanNode(家族节点)、rootNode(根节点)等标签描述。

图7-9 实体间关系数据结构图

(五)实体数据

以家谱谱系数据为例,人物数据描述人物的基本信息,是谱系文本XML的基础,如图7-10所示,使用nameIn Genealogy(谱名)、person Core(人物核心数据)、surname(姓)、firstname(名)、personInfo(人物信息)、personExtendBasic(人物基础扩展)、nationality(国籍)、citizenship(民族)、birthday(出生时间)、deathDate(死亡时间)、otherInfo(其他信息)、personExtendAncient(人物扩展)、zi(字)、biehao(别号)、shihao(谥号)、otherName(其他名字)、jiguan(籍贯)、birthplace(出生地)、deathPlace(死亡地)、buryPlace(埋葬地)、buryDate(埋葬时间)、keju(科举)、zhiguan(职官)、fengzeng(封赠)、zhushu(著述)、biography(生平)、portrait(像)、zan(赞)、zhuan(传)等标签描述。

图7-10 实体数据结构图

(六)集外字数据

与版式文本XML相同,此处不再赘述。