1
模式识别与智能计算的MATLAB实现
1.14.1.5 12.1.5 散点图
12.1.5 散点图

散点图是将多维数据以平面或空间中的点来表示,最常用的是二维数据在笛卡儿坐标系内表示的情况,称为直角散点图或XY散点图。有时为了更好地描述多维数据的变化趋势,用直线或平滑曲线将各数据点连接起来,而成为折线图和平滑线散点图。XY散点图能描述的是包含两个变量的二维数据,在使用这种方法描述高于二维的多维数据时,常用散点图矩阵来表示。

另一类散点图称为三角散点统计图或XYZ散点统计图,它用等边三角形的三条高为坐标构成的“三角坐标系”内描述三个变量,每一散点代表三个对应的变量值。该方法常用来描述一类称为概率单纯形的数据,这类数据所包含的若干个变量指标之和为一个常数。

(1)直角散点图

直角散点图实际上就是多维数据在多维空间中的坐标点表示,各维坐标对应多维数据中的各变量值。实际上应用最多的是平面直角散点图,即XY散点图。

二维数据的平面散点图表示方法非常简单,实际上就是将二维数据(x,y)在笛卡儿坐标中描点表示。

(2)散点图矩阵

平面直角散点图所能描述的是包含两个变量的二维数据,对于高于二维的多维数据,常用散点图矩阵来表示。散点图矩阵可以看作一个大的图形方阵,其每一个非主对角元素的位置是对应行的变量与对应列的变量的散点图,而主对角元素的位置上是各变量名,这样借助于散点图矩阵能清楚地看到所研究的多个变量两两间的关系。

散点图矩阵的各元素位置散点作图方法和两变量散点图完全相同。

(3)三角形散点图

三角形散点图表示多维数据仍以平面或空间内的一点来表示,应用较多的是三维概率单纯形的数据在平面的表示,即XYZ散点统计图。

三角形散点图中正三角形的三条高分别表示三个变量的坐标轴,高的底为0,顶点为1(即100%)。很明显,三条坐标轴交于坐标为(1/3,1/3,1/3)的一点,同时三角形内任意一点A到三边的距离之和为常数1,这样任何三维概率单纯形的数据均可用等边三角形内的一点表示。