非参数统计

王小刚

目录

  • 1 导言
    • 1.1 课程介绍
    • 1.2 非参数统计
    • 1.3 假设检验
  • 2 统计软件R的使用
    • 2.1 R软件下载安装使用
    • 2.2 R外部数据读写
  • 3 单样本检验
    • 3.1 符号检验
    • 3.2 Wilcoxon符号秩和检验
    • 3.3 游程检验
  • 4 两相关样本检验
    • 4.1 两相关样本的符号检验
    • 4.2 两相关样本的秩和检验
  • 5 两独立样本的非参数检验
    • 5.1 MWW检验
    • 5.2 WW检验
    • 5.3 两样本的卡方检验
    • 5.4 两样本的KS检验
  • 6 k个独立样本的非参数检验
    • 6.1 Kruskal-Wallis检验
    • 6.2 k个样本的卡方检验
  • 7 k个相关样本的非参数检验
    • 7.1 Cochran Q检验
    • 7.2 Friedman检验
  • 8 分布检验
    • 8.1 卡方检验
    • 8.2 KS检验
  • 9 两个样本的相关分析
    • 9.1 等级相关
    • 9.2 Kendall相关
    • 9.3 偏秩相关
  • 10 k个样本的相关分析
    • 10.1 Kendall完全秩评定协和系数
  • 11 列链表中的相关测量
    • 11.1 列链表中的卡方检验
    • 11.2 PRE测量
Friedman检验

5.2 Friedman检验

若各处理样本重复数据存在区组之间的差异时,必须考虑区组对结果的影响.对于随机区组的数据,可以采用两因素的方差分析方法,但方差分析要求实验误差是正态分布的,当数据不符合方差分析的正态前提时,方差分析方法不再适用。

 Friedman于1937年提出了秩方差分析法。此法对试验误差没有正态分布的要求,仅仅依赖于每个区组内所观察的秩次,因此又称弗利德曼的    检验或弗利德曼双向评秩方差分析(two-way analysis of variance by ranks),后来又被Kendall和Smith发展到多元度量的协同系数相关问题上。  

Friedman检验是对k个样本是否来自同一总体的检验。k个样本是匹配的,可以由k个条件下同一组受试者构成,也可以将受试者分为n组,每组均有k个匹配的受试者,随机地将k个受试者置于k个条件下。在不同受试者匹配的样本中,应尽量使不同受试者的有关因素匹配即相似。

每一个样本代表了一个处理。在实际中,除了处理之外,往往还有别的因素起作用。比如在关于肥料(处理)效能的农业试验中,不同条件的土壤就构成了另一个因素,称为区组。如果随机地把所有处理分配到所有的区组中,使得总的变化可以分解为(1)处理造成的不同;(2)区组内的变化;(3)区组之间的变化。

当区组存在时,代表处理的样本的独立性就不再成立了。为进行与前面类似的检验,就需要应用不同的检验统计量。其构造方法和思路与完全区组试验正态总体条件下的检验统计量类似,只不过是用秩来代替观察值。

区组设计的情形

    在没有区组影响的单因子实验设计的分析中,各样本的观测值是相互独立的。每一个样本代表了一种因素,习惯上称为“处理(Treatment)”。然而,在实践中,往往还有其他因素。这种因素习惯上称为“区组(Block)”。如果完全随机地把所有处理都分配到所有区组中,这就是随机化完全区组设计(Randomized Complete Block Design)。

1 基本思路与检验步骤

Friedman检验就是用来检验各个样本所得的结果在整体上是否存在显著差异。

为对假设作出判定,所分析的数据应是定序尺度测量。获得的数据排出一个b行k列的表,行代表不同的受试者或匹配的受试小组,列代表各种条件,即有b个区组和k个处理。

由于是定序尺度测量的数据,因此可以对每一行的观测结果分别评秩。如果Ho为真,则每一列中秩的分布应该是随机的,即各个秩出现在所有列中的频数应几乎相等。