1
模式识别与智能计算的MATLAB实现
1.14.1.2 12.1.2 雷达图
12.1.2 雷达图

雷达图又称蜘蛛网图,是一种能对多变量数据进行综合分析的形象直观的图形表示方法。由于它有多个坐标轴,可以在二维平面上表示多维数据,因此利用雷达图可以很方便地研究各样本点之间的关系。

绘制雷达图的具体步骤如下:

①设原始数据共有n个变量,先画一个圆,由n个点把圆周等分成n个部分。

②将圆心和n个点连接起来,就可以得到n个辐射状的半径,这n个半径就作为n个变量的坐标轴。这里的坐标轴只有正半轴,因此只能表示非负数据,若要表示负数据,则要通过适当的变换。

③为划分刻度方便,在标记坐标轴前需要对原始数据进行归一化处理,然后对归一化后的数据yi用下式作非线性变换,

alt

通过该变换将无限区间(-∞,+∞)变换到有限区间[0,2],并使其在均值附近具有良好线性,而偏离均值越远的压缩性越强。

将n维数据的各个维规范化的数值刻在对应的坐标轴上,依次连接起来得到一个n边形,即得到用平面表示的n维数据的雷达图。

当要分析的多维数据的个数较少时,可以在同一个雷达图中将它们表示出来;当维数较大时,为使图形清晰,每张图形可以只画少数几个样本数据,甚至每张图形只画一个样本值;或者根据数据的相关性将它们分组,同一组的用同一个雷达图表示,其中不同的多维数据可用不同颜色的多边形来区别。同时,为了获得更好的效果,在雷达图中适当地分配变量的坐标轴,并选取合适的尺度是十分重要的。例如,把要进行对比的指标分别放在其坐标轴左和右或正上方和正下方,以便根据图形偏左、偏右或偏上、偏下进行对比和分析。

如果各参数的权重不一样,则可以根据变量权重的大小分配角度。权重系数或者由其他方法确定,或者根据下式求得:

alt

其中,xi为第i变量;ximax为它的最大值。

雷达图表示方法的主要特点是直观,它能将多维数据映射到二维图形中,可以形象地得到样本数据的状况,并可以对数据得出初步的判断。