1
模式识别与智能计算的MATLAB实现
1.3.3 1.3 模式识别的主要研究内容

1.3 模式识别的主要研究内容

模式识别的主要研究内容包括三部分:模式分类、模式聚类、特征提取和选择。

模式分类是模式识别的主要内容,即将某个模式分到某个模式类中。在这个过程中首先需要建立样本库,然后根据样本库建立判别函数,这一过程由机器来实现,称为学习过程。然后对一个未知的新对象分析它的特征,并根据判别函数决定它属于哪一类。模式分类是一种监督学习的方法。可用于模式分类的方法有很多,经典的方法有贝叶斯分类、Fisher判据和近邻法等,现代的方法有模糊模式识别、人工神经网络模式识别、支持向量机和基于核的分类方法等。

聚类分析是统计模式识别的另一重要工具。模式聚类时遵循“同一个聚合类的模式比不同聚合类中的模式更相近”的原则。它的基本原理就是在没有先验知识的情况下,基于“物以类聚”的观点,用数学方法分析各模式向量之间的距离及分散情况,按照样本的距离远近划分类别。聚类分析是一种无监督学习的方法。

如何确定合适的特征空间是设计模式识别系统一个十分重要的问题。如果所选用的特征空间能使同类物体分布具有紧密性,即各类样本能分布在该特征空间中彼此分割开的区域内,这就为模式识别成功地提供了良好的基础。当识别对象是波形或数学图像时,模式的特征是通过计算而得到的;当识别对象是实物或某种过程时,模式的特征则是由仪器设备测量而来的。这样产生的特征称为原始特征。一般需要对原始特征进行预处理,有时还需要转换。预处理是为了除去原始特征的噪声等影响模式识别的因素;转换是为了将高维的特征空间降为低维的特征空间而有利于后续的分类计算。