1
模式识别与智能计算的MATLAB实现
1.4.1.1 2.1.1 最小错误率贝叶斯分类
2.1.1 最小错误率贝叶斯分类

假设得到一个待识别量的特征X=(x1,x2,…,xnT后,通过样本库可以计算先验概率P(ωi)及类别条件概率密度函数P(X∣ωi),得到呈现状态X时,该样本分属各类别的概率。显然这个概率值可以作为识别对象判属的依据。基于最小错误概率的贝叶斯决策就是按后验概率的大小判决的。

对于两类分类问题,最小错误率贝叶斯分类的指导思想是:对于模式X,如果它属于模式类ω1的概率大于模式类ω2的概率,则决策模式X属于模式类ω1;反之,决策模式X属于模式类ω2。用数学语言描述为

若P(ω1∣X)>P(ω2∣X),则X∈ω1

若P(ω1∣X)<P(ω2∣X),则X∈ω2

其中,P(ωi∣X)为状态的后验概率。

由贝叶斯公式,并且考虑到P(X)>0,则上述决策规则可写成依据类条件概率密度的形式

若P(X∣ω1)P(ω1)>P(X∣ω2)P(ω2),则X∈ω1

若P(X∣ω1)P(ω1)<P(X∣ω2)P(ω2),则X∈ω2

若两类样本都满足正态分布,则最小错误概率的贝叶斯分类器判别函数为

alt

若两类样本不仅呈正态分布,而且协方差矩阵相等,即S1=S2=S,则贝叶斯分类器可进一步简化为

alt

而对于多类分类问题,若样本分为M类ω1,ω2,…,ωM,各类的先验概率分别为P(ω1),P(ω2),…,P(ωM),各类的类条件概率密度分别为P(X∣ω1),P(X∣ω2),…,P(X∣ωM),M个判别函数,在取得一个特征X后,可以通过比较各个判别函数来确定X的类别。

alt

由于先验概率通常是非常容易求出的,贝叶斯分类器的核心问题就是求出类条件概率密度函数。在大多数情况下,类条件概率密度函数可以采用多维变量的正态密度函数来模拟,此时正态分布的贝叶斯分类器判别函数为

alt

若ω1,ω2,…,ωM均服从正态分布,则判别函数可以写成

alt

若ω1,ω2,…,ωM不仅服从正态分布,而且协方差矩阵相等,则判别函数可以简化为

alt