1
文本自动标引与自动分类研究
1.4.1.3.1 3.3.1 词汇来源

3.3.1 词汇来源

通过自动方法,笔者初期从相关电子文献库中抽取关键词、主题词进行初始词典的构造,主要来自于《中国科技期刊数据库》、《中文社科报刊篇名数据库》、《中文图书检索系统》、《中国分类主题词表》等国内比较著名的数据库的标引词、词表主题词以及部分综合门户网站的关键词,共有133 747条关键词。