医学统计学(2023秋)

中国医科大学 刘红波

目录

  • 1 绪论
    • 1.1 医学统计学概述
    • 1.2 统计学若干基本理念
  • 2 定量资料的统计描述
    • 2.1 频数分布与频数分布图
    • 2.2 集中位置描述
    • 2.3 离散程度描述
    • 2.4 正态分布
    • 2.5 正态分布的应用
  • 3 定性资料的统计描述
    • 3.1 常用相对数
    • 3.2 应用相对数的注意现象
  • 4 总体均数的估计
    • 4.1 均数的抽样误差与标准误差
    • 4.2 t分布
    • 4.3 总体均数估计(1)
    • 4.4 总体均数估计(2)
  • 5 假设检验的基本思想
    • 5.1 假设检验的基本思想
    • 5.2 假设检验的基本步骤
    • 5.3 假设检验的两型错误
    • 5.4 假设检验的注意事项
  • 6 t检验
    • 6.1 t检验
  • 7 卡方检验
    • 7.1 独立样本列联表资料的卡方检验
    • 7.2 独立样本列联表资料的卡方检验
    • 7.3 配对设计资料的卡方检验
  • 8 秩和检验
    • 8.1 Wilcoxon 符号秩和检验(一)
    • 8.2 Wilcoxon 符号秩和检验(二)
    • 8.3 成组设计两样本比较的秩和检验
  • 9 双变量关联性分析
    • 9.1 直线相关的概念与性质
  • 10 直线回归分析
    • 10.1 直线回归方程的建立
    • 10.2 直线回归方程的推断
    • 10.3 直线回归方程的应用
    • 10.4 直线回归分析的注意事项
  • 11 统计表与统计图
    • 11.1 统计表的制表原则与应用
    • 11.2 统计图的制表原则与应用
Wilcoxon 符号秩和检验(一)
  • 1 教学内容
  • 2 练习
  • 3 案例
  • 4 扩展学习

秩和检验
假设检验分为:参数检验 (parametric test)非参数检验 (nonparametric test)
以特定的总体分布为前提,对未知的总体参数作推断的假设检验方法统称为参数检验。检验和方差分析均要求样本来自正态总体,属于参数检验。 
非参数检验不以特定的总体分布为前提,也不对总体参数作推断,故也称为任意分布检验(distribution-free test) 
非参数检验具有广泛的适用性。由于总体不必服从特定分布,无论资料总体分布形式如何,一端或两端无界,甚至分布未知,都能适用。 
在非参数检验中,一般不直接用样本观察值做分析,统计量的计算是基于原始数据在整个样本中按大小所占的位次。 
非参数检验没有利用观察值的具体数值,只利用了其大小次序的信息,信息利用不够充分,故凡适合参数检验的资料,应首选参数检验。 
当总体分布不明确时,应采用非参数检验。尤其对于那些难以确定分布又出现少量离群值的小样本数据,非参数检验在剔除这些数据前后所得结论显示出了较好的稳健性。 
非参数检验方法很多,有秩和检验(rank sum test)、符号检验、游程检验、等级相关分析等。 
秩和检验在非参数检验中占有重要地位且检验功效相对较高。 
Wilcoxon 符号秩和检验 
1945Wilcoxon提出的Wilcoxon符号秩和检验(Wilcoxon signed-rank test),亦称符号秩和检验,可用于配对设计计量差值的比较,还可用于单一样本与总体中位数的比较。


一、配对设计的两样本比较


配对设计资料主要是对差值进行分析。 
通过检验配对样本的差值是否来自中位数为0的总体,来推断两个总体中位数有无差别,即推断两种处理的效应是否不同。 
8.1某研究用甲、乙两种方法对某地方性砷中毒地区水源中砷含量(mg/L)进行测定,检测10处,测量值如表8.1(2)(3)栏。问两种方法的测定结果有无差别
本例为定量数据配对设计的小样本资料,其配对差值经正态性检验得W=0.717P=0.001,即差值不服从正态分布,故不宜选用配对t检验,而应使用Wilcoxon符号秩和检验。


8.1? 甲、乙两种方法测定某地区10处水源中砷含量的结果(mg/L)

测定序号

水中砷含量

差值di

正差值秩次

负差值秩次

甲法

乙法

 (1)

(2)

(3)

(4)=(2)-(3)

(5)

(6)

1

0.010

0.015

-0.005

2

2

0.060

0.070

-0.010

3

3

0.320

0.300

0.020

5.5

4

0.150

0.170

-0.020

5.5

5

0.005

0.005

0.000

6

0.700

0.600

0.100

8

7

0.011

0.010

0.001

1

8

0.240

0.255

-0.015

4

9

1.010

1.245

-0.235

9

10

0.330

0.305

0.025

7

合计

21.5(T+)

23.5(T-)

 

1. 建立检验假设,确定检验水准
H0:两种方法测定结果差值的总体中位数等于0
H1:两种方法测量结果差值的总体中位数不等于0

2. 计算检验统计量 值(秩和) 
(1) 求差值di 
(2) 编秩:依差值的绝对值由小到大编秩。 
差值为0,舍去不计;差值的绝对值相等时,若符号不同,求平均秩次;若符号相同,可顺次编秩或求平均秩次,并冠以原差值的正、负号。 
本例5号测定点不参与编秩 ,有效对子数为9。差值0.020-0.020秩次为56,符号不同,均取平均秩次(5+6)/2=5.5 
(3) 求正秩和(T+) 、负秩和(T-) 
T+ + T- = n(n+1)/2,T+T-T+T-大。 
本例:T+=21.5,T-=23.5,T+ + T- = 9(9+1)/2 = 45,秩和计算无误。 
3. 确定 值,作出统计推断 
(1) 查表法:当n50时,根据  T界值表(配对比较的符号秩和检验用) 
(2) 正态近似法:随着n的增大,分布逐渐逼近均数为n(n+1)/4,方差为n(n+1)(2n+1)/24的正态分布。当n>50时,近似程度较满意,用本法(见专业书籍) 
查表法: 
n所在的行,用所得值与相邻一栏的界值做比较,若 在界值内, 确定值大于相应的概率;若等于界值,确定值等于相应概率;若 在界值外, 值小于相应概率,右移一栏,再做比较,直至较好地估计出 P值。 
T界值表可知,按照 水准,当n5时,配对符号秩和检验不能得出双侧概率,故 必须大于5 
本例 n=9T=21.5T=23.5,查表,得双侧>0.10。按照?水准不拒绝 H0,差异无统计学意义,尚不能认为甲、乙两种方法测定水源中砷含量有差别。 
Wilcoxon配对符号秩和检验的基本思想: 
在配对样本中,由于随机误差的存在,其对差值的影响不可避免。假定两种处理的效应相同,则差值的总体分布为对称分布,并且差值的总体中位数为0。若此假设成立,样本差值的正秩和与负秩和应相差不大,均接近n(n+1)/4;当正负秩和相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝H0