1
古籍文本数据格式比较研究
1.2.3.5 (五)保存信息
(五)保存信息

古籍文本化不能简单理解为介质迁移,即将信息从文献载体移至数据载体。从信息保存的角度考虑,古籍文本化首先是个信息选择的过程,选择一部分信息,而舍弃另一部分,信息选择是造成知识遮蔽的重要原因之一;其次,古籍文本化是一个信息描述过程,按需求将选择的信息描述为某种形式的数据,信息描述的基本要求是保证信息的完整性;最后,古籍文本化还是一个信息生产过程,在古籍原有信息的基础上,按需求加入新的信息,如标点、注释、句子属性、词性标注等。

古籍的产生与当时的知识数量、知识组织方式、知识保存方式、技术条件、社会传统等因素密切相关,而古籍文本化的目的是去除古籍产生时的各种限制,尽可能完整地保存古籍中所蕴含的知识。同时,古籍文本化受技术、学术、文献、成本等诸多因素的限制,只能有条件地保存信息,避免信息不当选择、描述错误造成信息失真,谨慎地加入新的信息,保证信息添加过程是可逆的。