1
模式识别与智能计算的MATLAB实现
1.16.3 14.3 特征筛选处理

14.3 特征筛选处理

在模式识别的实际应用中,我们只能尽量多列一些可能有影响的因素,然后通过数据处理,筛选出作用较大的特征,删除影响不大的特征,从而建立数学模型。特征筛选的第一步是分析每个特征,考察特征间的相关性以及特征与目标相关性。各特征与目标值之间的相关系数计算式为下式,其中xij和yi分别表示第i个样品的第j个特征值和目标值,altalt分别表示第j个特征和所有样本目标值的均值,可以根据R(y,xj)绝对值的大小来判断各特征的重要性。

alt

要注意的是,对于相关系数小的特征,还需要用其他信息才能决定是否能删除。