1
文本自动标引与自动分类研究
1.5.1.5.1 6.5.1 数量测评

6.5.1 数量测评

分别对《中分表》和四种规模的分类知识库进行类目总数、对应词串总数的统计,结果如表6-10所示。

由表6-10可以看出,分类知识库的类目数和对应词串数都多于《中分表》中的类目数和对应词串数。随着分类知识库规模的扩大,对应词串总数与类目总数的比值也在增大。类目总数增加的原因是分类知识库中存在大量的仿分和复分情况。这些统计结果表明了分类知识库容量的可扩充性,弥补了《中分表》容量有限的缺陷;同时,分类知识库具有很好的文献保障,更新较《中分表》更为方便。

表6-10 分类知识库数量比较

img70