1
文本自动标引与自动分类研究
1.6.4 后  记

后  记

作为文本挖掘基础与核心技术之一,自动标引和自动分类技术具有重要的理论研究和实际应用价值。在此背景下,受相关的研究项目资助(国家社会科学基金项目:基于知识库的网页自动标引和自动分类研究)和实际应用驱动(上海图书馆合作研究课题:全国报刊索引数据库自动标引与自动分类系统),我们进行了中文文本的自动标引与自动分类研究。此外,本书出版还得到了教育部人文社会科学研究一般项目的资助。

本书研究所涉及的文本自动分类,有别于传统的文本分类,主要体现在两个方面:首先,本研究以科技论文的关键词词串与分类号对应记录为基础,生成关键词词串——分类号对应的分类知识库。其次,本书研究中涉及的多层次分类问题是较大规模的文本分类问题,分类体系为《中国图书馆分类法》,分类体系涉及多个类别层次,多达数万类目数。

本书能够得以出版,首先感谢导师侯汉清教授。我们有幸考入侯汉清老师门下攻读硕士研究生。侯汉清老师淡泊名利的精神、渊博的知识、严谨的治学态度深深地影响着我们。自攻读硕士学位以来,侯老师始终如一地关心着我们的学习、工作和生活。在本书即将付梓之际,我们深深地感谢十余年来侯老师对我们的指导与关心。

感谢南京政治学院上海分院张琪玉教授和大连理工大学林鸿飞教授能在百忙之中为本书拨冗赐序。林鸿飞教授所领导的大连理工大学信息检索研究团队,是国内非常有影响的信息检索研究团队之一。他们严谨的治学态度与高效的团队合作给我们留下了深刻的印象。

感谢所有审稿人给予本书的指导和所提出的建设性意见。

本书是我们在自动标引和自动分类项目研究成果的基础上写成的,我们非常感谢参加项目并为之作出贡献的薛春香博士、何琳博士、刘竟博士、常娥博士,还有参加相关工作的南京农业大学信息管理系的丁璇、郑红、杜友桃、王秀丽、王敏、韩玉君、李研等同学,没有他们的辛勤努力,我们是很难写出本书的。

此外还要感谢同门张雪英老师,她在关键词串-分类号相关度度量上所做的工作,是本书研究的起点之一。感谢同门曹琳博士、衡中青博士、王雅戈博士、李华博士,每次相聚和交流,我们总能从他们那里得到乐趣和收获知识。感谢同门陆勇同学、戴剑波同学、刘华梅同学、杜慧平同学,他们在同义词识别、词表兼容互换、叙词表自动构建等方面的工作都是我们很关注的,与他们的交流,给了我们很多启发。在此,我们对所有同门表示诚挚的谢意。

最后要感谢我的父母家人,在我漫长的求学生涯中给予我莫大的支持,感谢我的爱人顾妍,本书的顺利出版离不开她的支持,正是她无私的关爱,让我可以安心踏实地进行学术研究,并顺利完成本书的写作。

本书修改定稿期间,白振田老师在万里之外的厄立特里亚支教,那里的工作和生活条件都很艰苦,我对白老师勇于奉献的精神表示由衷地佩服,祝愿他一切顺利。

但愿本书能对相关的研究人员有所帮助。限于笔者学术水平和研究能力,书中难免有疏漏、不足乃至不当之处,还有待今后做进一步的研究,敬请各位前辈、同行给予批评指正。

章成志

于北京中国科学技术信息研究所

2009年7月