非参数统计

王小刚

目录

  • 1 导言
    • 1.1 课程介绍
    • 1.2 非参数统计
    • 1.3 假设检验
  • 2 统计软件R的使用
    • 2.1 R软件下载安装使用
    • 2.2 R外部数据读写
  • 3 单样本检验
    • 3.1 符号检验
    • 3.2 Wilcoxon符号秩和检验
    • 3.3 游程检验
  • 4 两相关样本检验
    • 4.1 两相关样本的符号检验
    • 4.2 两相关样本的秩和检验
  • 5 两独立样本的非参数检验
    • 5.1 MWW检验
    • 5.2 WW检验
    • 5.3 两样本的卡方检验
    • 5.4 两样本的KS检验
  • 6 k个独立样本的非参数检验
    • 6.1 Kruskal-Wallis检验
    • 6.2 k个样本的卡方检验
  • 7 k个相关样本的非参数检验
    • 7.1 Cochran Q检验
    • 7.2 Friedman检验
  • 8 分布检验
    • 8.1 卡方检验
    • 8.2 KS检验
  • 9 两个样本的相关分析
    • 9.1 等级相关
    • 9.2 Kendall相关
    • 9.3 偏秩相关
  • 10 k个样本的相关分析
    • 10.1 Kendall完全秩评定协和系数
  • 11 列链表中的相关测量
    • 11.1 列链表中的卡方检验
    • 11.2 PRE测量
WW检验

4.2 Wald-Wolfowitz 游程检验
 Wald-Wolfowitz Runs Test

Mann-Whitney-Wilcoxon检验主要应用于检验两个样本是否来自具有相同位置的总体,是对两个总体在集中趋势方面有无差异的一种考察,而不研究其它类型方面的差异。 

Wald-Wolfowitz 游程检验则可以考察任何一种差异。 Wald-Wolfowitz Runs Test译为沃尔德-沃尔福威茨连串检验或游程检验简称W-W串检验。

1  基本方法与检验步骤

设有x, y两个总体具有连续分布,其累积分布函数分别为F (x)F (y)。如果想知道两个总体是否存在某种差异,可以用“两个总体分布相同”作为零假设。为此,需要从x中随机抽取m个数据x1,x2,...,xmy中随机抽取n个数据y1,y2,...,yn

数据的测量层次至少要是定序尺度。将两个独立样本的m + n=N个数据混合排序,并确定序列的游程(取自同一样本的一串相连的数据)。如果零假设为真,则两个样本的数据期望能相互混合地排列,游程数会相对较大。若x的游程或y的游程过长,也就是来自同一总体的数据在有序的序列中过多地相互连接,则游程数将会相当少,数据不支持H0。故序列的游程数据可以作为检验统计量。

2 应用

  研究者想知道“问题按难易次序提问是否影响学生正确回答的能力”。今从全校学生中随机抽取一个班的学生,随机地将学生分为两组,让第一组的学生做A卷(问题从易到难),第二组学生做B卷(问题从难到易)。考试被控制在完全相同的条件下进行,评分结果如下:

A  83  82  84  96  90  64  91  71  75  72

B  42  61  52  78  69  81  75  78  78  65

试问在0.05显著性水平下“问题按难易次序提问是否影响学生正确回答的能力”?

解:(1)提出假设

H0:F(X)=F(Y)  (两种提问方式对学生成绩无影响)

H1: F(X)≠F(Y)  (两种提问方式会造成学生成绩的差异)

2)计算检验统计量

u=6

3作出决策

根据m=10,n=10,U=6,alpha=0.05,查附表VIIIP286p=2×0.019<0.05

所以拒绝H0,可以认为提问的顺序对学生正确回答问题的能力有影响。

P79页表4-5.  SPSS结果

注意:

Ø 如果出现同分,分值来自同一样本,游程数u不会受到影响;

Ø 但若同分值来自不同样本,u就可能会受到影响,并影响最后的结论。

Ø 因此,在运用Wald-Wolfowitz游程检验时,若同分值来自两个不同的样本,一般应将各种排序的可能性都进行考察,分别计算每种情况下的游程总数u,并查找相应的P值。如果得出的结论一致,表明同分没有带来什么问题;如果得出的结论不一致,可以将nP值求简单平均数,以此作为是否拒绝H的依据。

Ø 如果同分在两个样本之间多次出现,u实际上是不确定的,不宜采用Wald-Wolfowitz游程检验。

3 练习

某年华北五省市区的GDP指数为:

109.2  114.3   113.5   111.0   112.7  

华东七省的GDP指数为:

113.0  112.2  112.7 114.4  115.4  113.4  112.2

试问:在0.05水平下,利用  Wald-Wolfowitz游程检验法检验华北五省的GDP指数与华北七省的GDP指数分布是否相同?