1
古籍文本数据格式比较研究
1.4 第三章 纯文本
第三章 纯文本

纯文本文件是包含没有应用字体或风格格式的普通文本文件[1]。纯文本格式就是没有任何文本修饰,没有任何粗体、下划线、斜体、图形、符号或特殊字符及特殊打印格式的文本,只保存文本,不保存其格式设置,将所有的分节符、分页符、新行字符转换为段落标记[2]。纯文本(pure text)是只包含文字和非修饰性、非格式控制(回车符和换行符除外)符号的文本。