1
文本自动标引与自动分类研究
1.3.2.1.3 2.1.3 自动标引的五十年研究历程

2.1.3 自动标引的五十年研究历程

(1)自动标引研究的三个阶段

从Luhn于1957年开始进行自动标引后开始,到目前为止,自动标引研究经历了50年的发展历程。一直到20世纪90年代初,关于关键词自动提取的研究一直就没有停止过。

20世纪90年代初到90年代末,自动标引研究渐渐冷却,原因主要包括:①全文索引逐渐被人们采用,并且基本上能满足用户需要;②传统的自动标引方法的效率到了极限;③网络兴起之初的冲击与信息需求环境的改变。

20世纪90年代末一直到现在,关键词自动提取的研究逐渐升温,尤其是最近几年,关键词自动提取研究进行得如火如荼。上一章已对此作了分析,在此不再赘述。

(2)50年研究的代表方法

根据见诸于报道的自动标引研究情况,结合自动标引研究领域的影响程度和自动标引方法的创新程度,笔者归纳出1957—2008年近50年比较有代表性的自动标引方法,如表2-1所示。

表2-1 近50年比较有代表性的自动标引方法

img5

(续表)

img6

(续表)

img7