1
模式识别与智能计算的MATLAB实现
1.14.1.6 12.1.6 星座图
12.1.6 星座图

星座图就是将n个样品点在一个半圆内表示,一个样品用一颗星表示,同类的样品组成一个星座,不同类的样品组成不同的星座,所以形象地比喻为星座图。

星座图是一种非常直观的方法,在对多个指标的数据在不同的权重下进行汇总时,具有既能体现统计数据的统计结果,还能反映数据的均衡性的优点,因此,使用极其方便。根据样本点的位置可以直观地对各样本点之间的相关性进行分析,利用星座图还可以方便地对样本点进行分类,在星座图上比较靠近的样本点比较相似,可以分为一类,相距较远的点相应样本的差异性较大。

绘制星座图的具体步骤如下:

①为消除量纲的影响,将数据作线性变换,使更换后的数据落在某一线性范围内。常用的线性变换方法为极差标准化,使变换后的数据落在[0,π]闭区间内,其变换公式为

alt

其中,Rj为数据矩阵每列的极差。

②适当选取一组路径权重{ωj},使满足

alt

重要变量相应的权重可以取得大一点,但一般情况下可以取等权,即

alt

③画一个半径为1的上半圆及半圆底边的直径,使每个样本对应半圆内的一个点,称为星,这些星就落在这个半圆内。设有模式X1,首先以O为圆心,ω1为半径,画上一半圆,在圆周上对应弧度为y11的点为O1,然后再以O1为圆心,以ω2为半径画一个半圆,在圆周上对应弧度为y12的点为O2,以此类推,直至Op为止。Op即为X1与对应星座的位置。由O点通过上述作图步骤,到达星的路线称作该星座的路径,由以上可得出与任一模式Xα对应的星座位置坐标为alt

通过星的位置和路径就可以全面地刻画该样本的特征。根据星座图上点的位置及路径判断各样本间的接近程度,进而可以对样本点进行归类分析。在实际工作中,人们往往去掉样本点的路径部分而仅保留其在星座上的位置,并根据各点位置的接近程度分析样本点间的接近程度。

当样本数较大时,数据在一个半圆内显得比较“拥挤”,且易造成“殊途同归”的现象,给分类带来了一定的困难。此时,可以通过适当“拉开”样本距离,即将数据扩充到半径为1的整个圆内(2π区间),就可充分利用原始数据的信息,各样本间的区别与联系将更加清楚,为合理分类提供了方便。