-
1 教学内容
-
2 练习
-
3 案例
-
4 扩展学习
秩和检验
假设检验分为:参数检验 (parametric test)非参数检验 (nonparametric test)
以特定的总体分布为前提,对未知的总体参数作推断的假设检验方法统称为参数检验。t 检验和方差分析均要求样本来自正态总体,属于参数检验。
非参数检验不以特定的总体分布为前提,也不对总体参数作推断,故也称为任意分布检验(distribution-free test)。
非参数检验具有广泛的适用性。由于总体不必服从特定分布,无论资料总体分布形式如何,一端或两端无界,甚至分布未知,都能适用。
在非参数检验中,一般不直接用样本观察值做分析,统计量的计算是基于原始数据在整个样本中按大小所占的位次。
非参数检验没有利用观察值的具体数值,只利用了其大小次序的信息,信息利用不够充分,故凡适合参数检验的资料,应首选参数检验。
当总体分布不明确时,应采用非参数检验。尤其对于那些难以确定分布又出现少量离群值的小样本数据,非参数检验在剔除这些数据前后所得结论显示出了较好的稳健性。
非参数检验方法很多,有秩和检验(rank sum test)、符号检验、游程检验、等级相关分析等。
秩和检验在非参数检验中占有重要地位且检验功效相对较高。
Wilcoxon 符号秩和检验
1945年Wilcoxon提出的Wilcoxon符号秩和检验(Wilcoxon signed-rank test),亦称符号秩和检验,可用于配对设计计量差值的比较,还可用于单一样本与总体中位数的比较。
一、配对设计的两样本比较
配对设计资料主要是对差值进行分析。
通过检验配对样本的差值是否来自中位数为0的总体,来推断两个总体中位数有无差别,即推断两种处理的效应是否不同。
例8.1某研究用甲、乙两种方法对某地方性砷中毒地区水源中砷含量(mg/L)进行测定,检测10处,测量值如表8.1的(2)、(3)栏。问两种方法的测定结果有无差别?
本例为定量数据配对设计的小样本资料,其配对差值经正态性检验得W=0.717,P=0.001,即差值不服从正态分布,故不宜选用配对t检验,而应使用Wilcoxon符号秩和检验。
表8.1? 甲、乙两种方法测定某地区10处水源中砷含量的结果(mg/L)
测定序号 | 水中砷含量 | 差值di | 正差值秩次 | 负差值秩次 | |
甲法 | 乙法 | ||||
(1) | (2) | (3) | (4)=(2)-(3) | (5) | (6) |
1 | 0.010 | 0.015 | -0.005 | — | 2 |
2 | 0.060 | 0.070 | -0.010 | — | 3 |
3 | 0.320 | 0.300 | 0.020 | 5.5 | — |
4 | 0.150 | 0.170 | -0.020 | — | 5.5 |
5 | 0.005 | 0.005 | 0.000 | — | — |
6 | 0.700 | 0.600 | 0.100 | 8 | — |
7 | 0.011 | 0.010 | 0.001 | 1 | — |
8 | 0.240 | 0.255 | -0.015 | — | 4 |
9 | 1.010 | 1.245 | -0.235 | — | 9 |
10 | 0.330 | 0.305 | 0.025 | 7 | — |
合计 | — | — | — | 21.5(T+) | 23.5(T-) |
1. 建立检验假设,确定检验水准
H0:两种方法测定结果差值的总体中位数等于0
H1:两种方法测量结果差值的总体中位数不等于0
![]()
2. 计算检验统计量 T 值(秩和)
(1) 求差值di
(2) 编秩:依差值的绝对值由小到大编秩。
差值为0,舍去不计;差值的绝对值相等时,若符号不同,求平均秩次;若符号相同,可顺次编秩或求平均秩次,并冠以原差值的正、负号。
本例5号测定点不参与编秩 ,有效对子数为9。差值0.020和-0.020秩次为5、6,符号不同,均取平均秩次(5+6)/2=5.5。
(3) 求正秩和(T+) 、负秩和(T-)。
T+ + T- = n(n+1)/2,T+大, T-小; T+小, T-大。
本例:T+=21.5,T-=23.5,T+ + T- = 9(9+1)/2 = 45,秩和计算无误。
3. 确定 P 值,作出统计推断
(1) 查表法:当n≤50时,根据 n 和 T 查T界值表(配对比较的符号秩和检验用)。
(2) 正态近似法:随着n的增大,T 分布逐渐逼近均数为n(n+1)/4,方差为n(n+1)(2n+1)/24的正态分布。当n>50时,近似程度较满意,用本法(见专业书籍)。
查表法:
在n所在的行,用所得T 值与相邻一栏的界值做比较,若 T 在界值内, 确定P 值大于相应的概率;若T 等于界值,确定P 值等于相应概率;若 T 在界值外, P 值小于相应概率,右移一栏,再做比较,直至较好地估计出 P值。
由T界值表可知,按照
水准,当n≤5时,配对符号秩和检验不能得出双侧概率,故 n 必须大于5。
本例 n=9,T=21.5或T=23.5,查表,得双侧P >0.10。按照
?水准不拒绝 H0,差异无统计学意义,尚不能认为甲、乙两种方法测定水源中砷含量有差别。
Wilcoxon配对符号秩和检验的基本思想:
在配对样本中,由于随机误差的存在,其对差值的影响不可避免。假定两种处理的效应相同,则差值的总体分布为对称分布,并且差值的总体中位数为0。若此假设成立,样本差值的正秩和与负秩和应相差不大,均接近n(n+1)/4;当正负秩和相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝H0。

