目录
1
文本自动标引与自动分类研究
1.1
丛书总序
1.2
序 言
1.3
第一部分
1.3.1
第1章 引言
1.3.1.1
1.1 研究背景
1.3.1.2
1.2 自动标引与自动分类的作用
1.3.1.2.1
1.2.1 文本挖掘
1.3.1.2.2
1.2.2 信息检索
1.3.1.3
1.3 本书的内容与章节安排
1.3.1.4
参考文献
1.3.2
第2章 文本自动标引与分类研究进展
1.3.2.1
2.1 自动标引研究综述
1.3.2.1.1
2.1.1 概述
1.3.2.1.2
2.1.2 标引对象的界定
1.3.2.1.3
2.1.3 自动标引的五十年研究历程
1.3.2.1.4
2.1.4 自动标引研究路线图与方法分类
1.3.2.1.5
2.1.5 自动标引存在的问题与研究展望
1.3.2.2
2.2 文本分类研究综述
1.3.2.2.1
2.2.1 自动分类方法简介
1.3.2.2.2
2.2.2 国外研究现状
1.3.2.2.3
2.2.3 国内研究现状
1.3.2.2.4
2.2.4 文本分类面临的主要问题
1.3.2.3
2.3 本章小结
1.3.2.4
参考文献
1.4
第二部分
1.4.1
第3章 文本分词技术及抽词词典构造
1.4.1.1
3.1 文本分词技术概述
1.4.1.2
3.2 分词模式设计及其原理
1.4.1.3
3.3 原始抽词词典的构造
1.4.1.3.1
3.3.1 词汇来源
1.4.1.3.2
3.3.2 未登录词补充方法
1.4.1.4
3.4 词典约简算法实验
1.4.1.4.1
3.4.1 算法原理
1.4.1.4.2
3.4.2 算法设计及实验
1.4.1.5
参考文献
1.4.2
第4章 基于多特征选择及权值计算
1.4.2.1
4.1 特征选择方法概述
1.4.2.1.1
4.1.1 频度/逆文档频度法
1.4.2.1.2
4.1.2 信息增益
1.4.2.1.3
4.1.3 互信息
1.4.2.1.4
4.1.4 CHI(x<sub>2</sub>)
1.4.2.2
4.2 算法设计原理
1.4.2.3
4.3 结果分析
1.4.2.4
参考文献
1.4.3
第5章 自动标引中标引源权重方案确定
1.4.3.1
5.1 标引源权重研究综述
1.4.3.2
5.2 标引源权重方案的确定
1.4.3.2.1
5.2.1 抽样调查方案的设计
1.4.3.2.2
5.2.2 抽样数据的统计分析
1.4.3.2.3
5.2.3 标引源权重方案的确定
1.4.3.3
5.3 本章小结
1.4.3.4
参考文献
1.5
第三部分
1.5.1
第6章 分类知识库的制作
1.5.1.1
6.1 概述
1.5.1.2
6.2 关键词串-分类号关联研究综述
1.5.1.2.1
6.2.1 研究综述
1.5.1.2.2
6.2.2 常规方法存在的问题
1.5.1.3
6.3 关键词串-分类号关联方法
1.5.1.3.1
6.3.1 关联规则挖掘概述
1.5.1.3.2
6.3.2 相关度度量方法介绍
1.5.1.4
6.4 分类知识库的制作
1.5.1.4.1
6.4.1 知识库数据来源
1.5.1.4.2
6.4.2 知识库制作步骤
1.5.1.4.3
6.4.3 知识库规模的确定
1.5.1.5
6.5 分类知识库的性能测评
1.5.1.5.1
6.5.1 数量测评
1.5.1.5.2
6.5.2 质量测评
1.5.1.6
6.6 篇名知识库的制作
1.5.1.6.1
6.6.1 篇名的概念及其特征
1.5.1.6.2
6.6.2 建立篇名库的必要性和可能性
1.5.1.6.3
6.6.3 篇名在表达主题时存在的问题
1.5.1.6.4
6.6.4 篇名的规范
1.5.1.6.5
6.6.5 篇名知识库的制作
1.5.1.7
6.7 本章小结
1.5.1.8
参考文献
1.5.2
第7章 基于语义体系的词语相似度计算
1.5.2.1
7.1 概 述
1.5.2.2
7.2 词语相似度研究综述
1.5.2.2.1
7.2.1 基于统计的词语相似度计算方法
1.5.2.2.2
7.2.2 基于本体的词语相似度计算方法
1.5.2.2.3
7.2.3 词语相似度计算的混合方法
1.5.2.3
7.3 基于语义体系的词语相似度算法
1.5.2.3.1
7.3.1 《同义词词林》简介
1.5.2.3.2
7.3.2 语义编码之间的相似度计算
1.5.2.3.3
7.3.3 词汇间的语义相似度计算
1.5.2.3.4
7.3.4 自动分类中语义相似度匹配算法
1.5.2.4
7.4 基于语义相似度的同义词挖掘
1.5.2.4.1
7.4.1 同义词挖掘概述
1.5.2.4.2
7.4.2 同义词挖掘系统设计与实现
1.5.2.4.3
7.4.3 同义词挖掘系统的测评
1.5.2.5
7.5 本章小结
1.5.2.6
参考文献
1.5.3
第8章 基于知识库的文本自动分类
1.5.3.1
8.1 文本自动系统总体设计
1.5.3.1.1
8.1.1 系统结构设计
1.5.3.1.2
8.1.2 系统模块简介
1.5.3.2
8.2 文本自动分类系统的测评
1.5.3.3
8.3 《全国报刊索引》自动标引与自动分类系统介绍
1.5.3.4
8.4 本章小结
1.5.3.5
参考文献
1.6
第四部分
1.6.1
第9章 统计与决策规则双重分类算法
1.6.1.1
9.1 分类器概述
1.6.1.1.1
9.1.1 最小距离分类器(Rocchio算法)
1.6.1.1.2
9.1.2 Na6ve Bayes分类器
1.6.1.1.3
9.1.3 K-NN算法
1.6.1.1.4
9.1.4 支持向量机
1.6.1.1.5
9.1.5 基于粗糙集理论的分类算法
1.6.1.2
9.2 双重分类原理
1.6.1.3
9.3 分类规则提取
1.6.1.4
9.4 双重分类过程
1.6.1.5
9.5 实验结果及分析
1.6.1.6
参考文献
1.6.2
第10章 层次分类算法实验
1.6.2.1
10.1 层次分类原理
1.6.2.2
10.2 层次分类算法设计
1.6.2.3
10.3 实验结果及分析
1.6.2.4
参考文献
1.6.3
第11章 基于统计与规则相结合的文本分类系统的实现
1.6.3.1
11.1 系统实验用语料选择及分析
1.6.3.1.1
11.1.1 实验语料选择
1.6.3.1.2
11.1.2 训练样本数量对自动分类的影响分析
1.6.3.1.3
11.1.3 维数多少对分类效果的影响分析
1.6.3.1.4
11.1.4 训练样本先期分类情况的影响
1.6.3.2
11.2 系统总体框架与模块介绍
1.6.3.2.1
11.2.1 功能模块结构
1.6.3.2.2
11.2.2 系统总体流程
1.6.3.2.3
11.2.3 系统各模块介绍
1.6.3.3
11.3 系统测试分析
1.6.3.4
11.4 本章小结
1.6.3.5
参考文献
1.6.4
后 记
文本自动标引与自动分类研究
章成志、白振田
创建者:第一编辑部
收藏量:
转发