1
古籍文本数据格式比较研究
1.6.2.1 一、头文件XML结构
一、头文件XML结构

头文件XML由五部分组成,包括文件头、书目元数据、卷目数据、默认版式数据和集外字数据,如图5-18所示,使用fileHeader(文件头)、bibliographyMetadata(书目元数据)、catalog(卷目)、defaultFormat(默认版式)、gaijiList(外字列表)等标签。文件头是头文件XML的整体属性说明和创建、修改、发布等过程描述;书目元数据是头文件XML的整体内容说明,针对书目信息;卷目数据描述古籍的逻辑结构,针对原书图像进行说明;默认版式是头文件XML的重要组成部分,包括版式描述、版框、版心、界栏、图形设置、字符设置、墨围设置、墨盖子设置等XML描述;集外字数据是头文件的补充说明,针对头文件XML中的集外字。

图5-18 头文件XML结构图

(一)文件头

与纯文本XML相同,此处不再赘述。

(二)书目元数据

与纯文本XML相同,此处不再赘述。

(三)卷目数据

与位置文本XML相同,此处不再赘述。

(四)默认版式数据

默版式数据是头文件XML的重要组成部分,包括版式描述、版框、版心、界栏、图形设置、字符设置、墨围设置、墨盖子设置等,如图5-19所示,使用layoutDescription(版式描述)、frameOfPage(版框)、middleOfPage(版心)、columnOfPage(界栏)、figureDefault(图形默认设置)、characterDefault(字符默认设置)、moWeiDefault(墨围默认设置)、moGaiZiDefault(墨盖子默认设置)等标签描述。

图5-19 默认版式结构图

图5-20 集外字数据结构图

(五)集外字数据

集外字数据是头文件的补充说明,包含集外字列表、单个集外字、集外字描述、集外字说明等,如图5-20所示,使用gaijiList(外字列表)、gaiji(外字)、gaijiDescription(外字描述)、gaijiImgLink(外字图像链接)、gaijiNote(外字说明)等标签。