1
模式识别与智能计算的MATLAB实现
1.4.4.1 2.4.1 模式相似度
2.4.1 模式相似度

相似度用于衡量同类样本的类似性和不同类样本的差异性。常用的有:

1.距 离

(1)欧氏距离

对每个样品,把它的第K个因素(变量)的值看作K维空间中的一个点,则n个样品就是K维空间中n个点,那么第i个样品与第j个样品之间的距离为

alt

显然有-1≤Dij≤1,距离D愈小表示两个样品愈相似,反之则疏远。

(2)明考斯基(Minkoski)距离

alt

很明显,当q=2时,此距离即为欧氏距离。

(3)马氏距离

alt

(4)切比雪夫距离

Dij(∞)=max∣Xi-Xj

(5)斜交空间距离

由于变量往往存在程度不同的相关关系,以欧氏距离计算距离会使结果发生偏差,因而对样品i,j之间的距离可用更广泛的斜交空间距离作为分类尺度,即

alt

其中,Rtp为变量t,p间的相关系数;K为变量数。

2.相似性系数

(1)相关系数

alt

其中,altalt分别表示第i个和第j个样本的均值。Rij愈接近1,则此两个变量愈相似;Rij愈接近-1,则关系愈疏远。

(2)相似系数

第i个样品与第j个样品之间的相似系数是用两个向量间的夹角余弦来定义的,即

alt

有-1≤cosαij≤1,且cosαij的值愈大,愈接近于1,则表示两个样品的关系愈相似,当等于1时,表示两样完全相同。