1
文本自动标引与自动分类研究
1.6.1.4 9.4 双重分类过程

9.4 双重分类过程

双重分类流程如图9-1所示。

首先基于统计模型进行分类,获取当前文本的最优三个分类类别,表示为集合TC(Cc1,Cc2,Cc3)。再按照前述粗糙集规则分类方法,进行二次分类,获得最优分类类别,表示为集合TR(Cr)。

img133

9-1 基于最短距离法与规则匹配法的双重分类过程示意图

进行TC与TR的交集运算,结果会存在以下四种情况:

(1)TR∩TC=Crc:则Crc为最终分类结果。

(2)TR∩TC=Ø:则Cc1为最终分类结果。

(3)TC=Ø,TR≠Ø,则Cr为最终分类结果。

(4)TC=Ø,TR=Ø,则得出无法归类的判断。