二、符号
除了文字之外,古籍中还有大量的符号。古籍中的符号与文字共同构成复杂的表意系统,各个历史时期的符号和符号的用法在不断地发展变化中。从殷商甲骨文最早使用标点符号起到20世纪20年代新式标点符号发展成熟,整整经历了三千年漫长的发展过程[37]。管锡华在《古代标点符号发展史》[38]中指出,先秦时期是古代标点符号的萌芽期,先秦文献共见到用号八种,包括横线号、钩识号、二短横号、一短横号、近点近横号、朱色填实方框号、黑方号、圆点号。标点符号的用法有分辞、分章,断开句子、短语,标示重文和篇章之名。两汉时期是古代标点符号的发展期,两汉文献共见到新产生的标点符号十三种,包括顿号、逗号、句号、括号、三角号、斜线号、扁方框号、尖角号、竖长点号、节字号、马字号、儿字号、网纹号。标点符号的用法也有发展,从短语间的并列词直到篇章、篇名章名皆有号表示。句号、顿号分工表示“句”“读”已经出现,两号连用已经出现,标点符号校对删略的用法也最早地见到。魏晋至唐五代时期是古代标点符号的保守期,这一时期的文献中见到新产生的标点符号新产生的只有双圈号、圈点号、卜字号以及圆点号的变体省略号四种。标点符号的用法却有不小的发展,句号用于大韵、小纽、书名、人名,四圆点连用表示省略,三圆点连用表示删除衍文,圆点号用于字间表示乙字,方围号、卜字号、竖线号表示删除等。宋元明时期是古代标点符号的成熟期,这一时期出现的新的标点符号有连围号、半圆号、圆围号、阴文号、八卦号、横括复合号、鱼尾号、圆括号等,加上变体,新产生的标点符号就三十多种。还有一些旧有的标点符号的分化体。从标点符号的用法来看,现有的标点符号已基本满足了表示任何一种语言层次、任何一种语言性质的需要。清代是古代标点符号的拓展期,这一时期标点符号在种类、用法上续有拓展,但并无飞跃。
在Unicode字符集中有大量的符号,如表2-3所示。在古籍文本化过程中,字符集内的符号可以直接使用,字符集中未包含的符号要采用与集外字类似的方式处理。
表2-3 Unicode符号表[39]

续表

续表

(一)符号类型
古籍中的符号系统非常复杂,大致可以划分为标点符号、校对符号、版式符号、专类符号等几类。
1.标点符号
依据《标点符号用法》[40](GB/T15834-1995),标点符号是辅助文字记录语言的符号,是书面语的有机组成部分,用来表示停顿、语气以及词语的性质和作用。常用的标点符号有16种,分点号和标号两大类。点号的作用在于点断,主要表示说话时的停顿和语气。点号又分为句末点号和句内点号。句末点号用在句末,有句号、问号、叹号3种,表示句末的停顿,同时表示句子的语气。句内点号用在句内,有逗号、顿号、分号、冒号4种,表示句内的各种不同性质的停顿。标号的作用在于标明,主要标明语句的性质和作用。常用的标号有9种,即:引号、括号、破折号、省略号、着重号、连接号、间隔号、书名号和专名号。除了以上的16种常用标点符号,还有省年号、斜线号、标识号、避讳号、示殁号、注释号、波浪号[41]等。
新式标点符号的概念是在民国时期从西方引入的[42],对照标点符号的定义,古籍中常见的标点符号主要有句读、专名号等,如图2-7所示。
2.校对符号
依据《校对符号及其用法》[44](GB/T14706-1993),校对符号是以特定图形为主要特征的、表达校对要求的符号。校对符号共有21个,分为字符的改动、字符方向位置的移动、字符间空距的改动和其他四类。表示字符改动的校对符号有改正、删除、增补、改正上下角;表示字符方向位置移动的校对符号有转正、对调、接排、另起段、转移、上下移、左右移、排齐、排阶梯形、正图;表示字符间空距改动的校对符号有加大空距、减小空距、空N个字距、分开;其他校对符号还有保留、代替、说明等。
萧世民在《校对符号源流考略》[45]认为,在金文中发现的倒勾号是真正意义上的校对符号,倒勾号有两种形式——横勾和形似括号圆弧,表示两个字的位置颠倒;到了汉代,出现了删略号,表示删除;晋代以后,校对符号日益丰富起来,在敦煌遗书出现的校对符号主要有倒勾号、废读号、划除号、圈除号、界隔号等;到了宋代,官府有了较正规的校书(圈点与校勘相结合)和校书符号,其中包括黄圈、朱圈、侧点、中点、朱抹、倒勾等各种符号及其用法;元代出现了将正字、该补之字及其符号书于天头的方式;明清两朝基本沿用前代的校对符号,最常用的是圈除号、划除号、添入号、转移号、倒勾号等。如图2-8所示。
3.版式符号
版式即古籍版面的样式,版式符号是指与古籍版式或排版有关的符号,常见的版式符号有鱼尾、墨等、空围等。鱼尾是在版心中距上边约四分之一处印有形似鱼尾巴的标记,以便折叠书叶,称为鱼尾。常见的鱼尾符号如图2-9所示。墨等又称墨钉或黑钉,刻版时在有阙文的地方挖以方孔,再嵌补适当的小木片等待校勘正确时另行补刊,刷印后,在版面上呈现为黑色方块,如图2-10所示。空围是指以空白方框表示书中文,源于古书钞本,后世刻本也有采用,如图2-11所示。
【注释】
[1]汝信.社会科学新辞典[M].重庆:重庆出版社,1988:626.
[2]王绍平等.图书情报词典[M].上海:汉语大词典出版社,1990:360.
[3]GB/T12200.1-1990,汉语信息处理词汇01部分:基本术语[S].北京:中国标准出版社,1990:4—5.
[4]王荟、肖禹.汉语文古籍全文文本化研究[M].北京:国家图书馆出版社,2012:26—27.
[5]苗军.Unicode/XML在电子出版物中的实现[D].河北工业大学,2002:3.
[6]Unicode9.0 Character Code Charts[OL].[2016-6-29].http://www.unicode.org/charts/.
[7]CJK Unified Ideographs(Han)[OL].[2016-6-29].http://www.unicode.org/charts/PDF/U4E00.pdf
[8]CJK Extension-A[OL].[2016-6-29].http://www.unicode.org/charts/PDF/U4E00.pdf.
[9]CJK ExtensionB[OL].[2016-6-29].http://www.unicode.org/charts/PDF/U20000.pdf.
[10]CJK ExtensionC[OL].[2016-6-29].http://www.unicode.org/charts/PDF/U2A700.pdf.
[11]CJK ExtensionD[OL].[2016-6-29].http://www.unicode.org/charts/PDF/U2B740.pdf.
[12]CJK ExtensionE[OL].[2016-6-29].http://www.unicode.org/charts/PDF/U2B820.pdf.
[13]中华字库工程介绍[OL].[2016-6-29].http://202.43.153.189/Engineering/index2.html.
[14]新闻出版重大科技工程项目“中华字库”工程申报指南[OL].[2016-1-1].http://www.gapp.gov.cn/cmms/cmms/upload/info/201010/704504/128712755867054132.doc.
[15]中华字库工程进展情况[OL].[2016-1-1].http://202.43.153.189/contents/13/782.html.
[16]肖禹.古籍数字化中的集外字处理问题研究[J].图书馆研究,2013(5):27—30.
[17]国家图书馆数字方志项目始于2002年,先从馆藏旧方志(包括一统志、专类地志书)中选出6800余种各类志书进行扫描,采集图像330余万拍,编制卷目索引数据50余万条,之后分批进行文本化,截至2015年底,已完成3200余种210余万筒子页。目前,已在互联网上发布馆藏1949年以前纂修的各个朝代省、府、厅、州、县志、乡土志等6400余种方志图像,涵盖了除香港地区(无馆藏)以外的全国33个省市自治区,目录数据包含题名、责任者、出版者、出版时间、版本、分类号、文种、册数、描述、索取号等字段,支持简单检索、高级检索、二次检索、关联检索等功能。
[18]尉迟治平.电子古籍的异体字处理研究——以电子《广韵》为例[J].语言研究,2007(3):118—122
[19]吕永进.异体字的概念[A].//张书岩.异体字研究[C].北京:商务印书馆,2004:33—46.
[20]李国英.异体字的定义与类型[A].//张书岩.异体字研究[C].北京:商务印书馆,2004:12—15.
[21]李运富.论汉字数量的统计原则[J].辞书研究,2001(1):71—75.
[22]中国国家图书馆.汉语文古籍机读目录格式使用手册[M].北京:北京图书馆出版社,2001:84—85.
[23]缺字系统整合动态组字之应用[OL].[2016-6-29].http://itech.ntcu.edu.tw/Tanet%202007/2%5C396.pdf.
[24]Decomposition for ISO/IEC10646Ideographic Characters[OL].[2016-6-29].http://acl.ldc.upenn.edu/W/W02/W02-1209.pdf.
[25]《文渊阁四库全书》电子版项目以《景印文渊阁四库全书》为底本,由上海人民出版社和迪志文化出版有限公司合作出版,迪志文化出版有限公司、书同文计算机技术开发有限公司承办全部开发制作工程,清华大学计算机系负责OCR引擎开发,北大方正电子有限公司负责建立专用字库,微软公司(北京)研究开发中心在平台技术等方面提供技术援助。该项目使用CJK+字库(包含符合Unicode标准的CJK和CJK扩A编码,自定义编码4296个,共收字31780个),使用OCR方式进行全文转换。
[26]文渊阁四库全书电子版[EB].上海:上海人民出版社,1999:出版说明.
[27]GB/T12200.2-94,汉语信息处理词汇02部分:汉语和汉字[S].北京:中国标准出版社,1995:4.
[28]董绍克,阎俊杰.汉语知识词典[M].北京:警官教育出版社,1996:729.
[29](清)夏献云.长沙贾太傅祠志[M].清光绪四年刻本.
[30](南朝)周兴嗣.真草隶篆四体千字文[M].民国间石印本.
[31]GB/T12200.2-94,汉语信息处理词汇02部分:汉语和汉字[S].北京:中国标准出版社,1995:4.
[32]王绍平等.图书情报词典[M].上海:汉语大词典出版社,1990:359.
[33]邱沛篁等.新闻传播百科全书[M].成都:四川人民出版社,1998:265.
[34]GB/T12200.2-94,汉语信息处理词汇02部分:汉语和汉字[S].北京:中国标准出版社,1995:4—5
[35](清)黄成章.[雍正]通州新志[M].清雍正间刻本.
[36]毛承霖.续修历城县志[M].民国十三至十五年山东续修历城县志局铅印本.
[37]管锡华.古代标点符号发展史论纲[J].古汉语研究,1997(2):58—63.
[38]管锡华.古代标点符号发展史[M].成都:巴蜀书社,2002.
[39]Unicode9.0 Character Code Charts[OL].[2016-6-29].http://www.unicode.org/charts
[40]标点符号用法[OL].[2016-6-29].http://bianjibu.xupt.edu.cn/punctuse.htm.
[41]倪培森.几种新标点符号的意义和用法[J].阅读与写作,1999(10):24—25.
[42]1919年11月马裕藻、朱希祖、钱玄同、刘复、周作人、胡适六人向教育部提出《请颁行新式标点符号议案》,1920年2月教育部发布第53号训令《通令采用新式标点符号文》,新式标点符号正式颁行。
[43](清)徐继畬.瀛环志略[M].清道光二十八至二十九年刻本.
[44]校对符号及其用法[OL].[2016-6-29].http://www.bzfw.com/soft/sort055/sort066/66104376.html.
[45]萧世民.校对符号源流考略[J].南昌大学学报(人文社会科学版),1996(2):114—118
[46](清)程光滢.[同治]磁州续志[M].清同治十三年刻本.