9.3 偏秩相关
当研究两个样本的相关性时,可能计算出来的相关系数并不直接反映两个样本间存在真正的或直接的关系。
这种相关性是因为两个样本都和第三个样本有关系而产生的。这个问题在参数统计中是通过偏相关解决的,在非参数统计中也可以用偏相关的测算方法处理。本节介绍Kendall偏秩相关系数.
若X、Y与第三个样本Z有关,即由于Z的变化对X、Y之间的关系有影响,则考察去掉Z的影响,仅仅研究X、Y之间的相关就是偏相关。在统计上,偏相关就是保持Z恒定下X、Y之间的相关。
若有三个样本X、Y、Z,每个样本有n个数据,且都至少是在定序尺度上测量,Kendall偏秩相关系数:

偏秩相关系数是Z不变时X与Y之间的相关系数,其取值范
围是-1到+1之间,但它的抽样分布迄今未知,因而无法对其进行
显著性检验。
例:社会上普遍认为:取得学士学位以后在工作中继续研究生课程的学习很重要,也就说在职继续学习比单纯地学院式学习更有意义。今调查了7个人的年龄、花在继续学习上的时间以及月收入情况,得到下列数据。试根据上述资料分析收入与继续受教育程度的相关性
序号 年龄(岁) 继续学习时间 月收入
(Z) (X) (Y)
1 40 18 2.5
2 35 0 2.0
3 30 6 1.5
4 36 15 2.4
5 41 24 3.0
6 45 30 2.8
7 48 45 2.9

