非参数统计

王小刚

目录

  • 1 导言
    • 1.1 课程介绍
    • 1.2 非参数统计
    • 1.3 假设检验
  • 2 统计软件R的使用
    • 2.1 R软件下载安装使用
    • 2.2 R外部数据读写
  • 3 单样本检验
    • 3.1 符号检验
    • 3.2 Wilcoxon符号秩和检验
    • 3.3 游程检验
  • 4 两相关样本检验
    • 4.1 两相关样本的符号检验
    • 4.2 两相关样本的秩和检验
  • 5 两独立样本的非参数检验
    • 5.1 MWW检验
    • 5.2 WW检验
    • 5.3 两样本的卡方检验
    • 5.4 两样本的KS检验
  • 6 k个独立样本的非参数检验
    • 6.1 Kruskal-Wallis检验
    • 6.2 k个样本的卡方检验
  • 7 k个相关样本的非参数检验
    • 7.1 Cochran Q检验
    • 7.2 Friedman检验
  • 8 分布检验
    • 8.1 卡方检验
    • 8.2 KS检验
  • 9 两个样本的相关分析
    • 9.1 等级相关
    • 9.2 Kendall相关
    • 9.3 偏秩相关
  • 10 k个样本的相关分析
    • 10.1 Kendall完全秩评定协和系数
  • 11 列链表中的相关测量
    • 11.1 列链表中的卡方检验
    • 11.2 PRE测量
偏秩相关

                  9.3 偏秩相关


当研究两个样本的相关性时,可能计算出来的相关系数并不直接反映两个样本间存在真正的或直接的关系。

这种相关性是因为两个样本都和第三个样本有关系而产生的。这个问题在参数统计中是通过偏相关解决的,在非参数统计中也可以用偏相关的测算方法处理。本节介绍Kendall偏秩相关系数.

XY与第三个样本Z有关,即由于Z的变化对XY之间的关系有影响,则考察去掉Z的影响,仅仅研究XY之间的相关就是偏相关。在统计上,偏相关就是保持Z恒定下XY之间的相关。

若有三个样本XYZ,每个样本有n个数据,且都至少是在定序尺度上测量,Kendall偏秩相关系数:


     偏秩相关系数Z不变时XY之间的相关系数,其取值范

围是-1+1之间,但它的抽样分布迄今未知,因而无法对其进行

显著性检验。


例:社会上普遍认为:取得学士学位以后在工作中继续研究生课程的学习很重要,也就说在职继续学习比单纯地学院式学习更有意义。今调查了7个人的年龄、花在继续学习上的时间以及月收入情况,得到下列数据。试根据上述资料分析收入与继续受教育程度的相关性


序号  年龄(岁) 继续学习时间     月收入

         (Z)               (X)            (Y)

  1      40               18              2.5

  2      35                0              2.0

  3      30                6              1.5

  4      36               15              2.4

  5      41               24              3.0

  6      45               30              2.8

  7      48               45              2.9