1
文本自动标引与自动分类研究
1.5.2.5 7.5 本章小结

7.5 本章小结

本章针对基于字面相似度、词素相似度的同义词识别算法的不足之处,提出了基于《同义词词林》语义体系的同义词挖掘方法,给出了具体的计算过程和同义词挖掘系统的设计方案,并将此算法用于文本的自动分类中,以解决传统的字面匹配带来的问题。

对同义词的识别研究涉及到汉语语言学、计算语言学等许多相关知识,文本依据现有的语义分类体系还存在一些问题,如语义排歧问题、义类词词库的更新与维护,需要进行深入研究。