医学统计学(2025春)

中国医科大学 刘红波

目录

  • 1 绪论
    • 1.1 医学统计学概述
    • 1.2 统计学若干基本理念
  • 2 定量资料的统计描述
    • 2.1 频数分布与频数分布图
    • 2.2 集中位置描述
    • 2.3 离散程度描述
    • 2.4 正态分布
    • 2.5 正态分布的应用
  • 3 定性资料的统计描述
    • 3.1 常用相对数
    • 3.2 应用相对数的注意现象
  • 4 总体均数的估计
    • 4.1 均数的抽样误差与标准误差
    • 4.2 t分布
    • 4.3 总体均数估计(1)
    • 4.4 总体均数估计(2)
  • 5 假设检验的基本思想
    • 5.1 假设检验的基本思想
    • 5.2 假设检验的基本步骤
    • 5.3 假设检验的两型错误
    • 5.4 假设检验的注意事项
  • 6 t检验
    • 6.1 t检验
  • 7 卡方检验
    • 7.1 独立样本列联表资料的卡方检验
    • 7.2 独立样本列联表资料的卡方检验
    • 7.3 配对设计资料的卡方检验
  • 8 秩和检验
    • 8.1 Wilcoxon 符号秩和检验(一)
    • 8.2 Wilcoxon 符号秩和检验(二)
    • 8.3 成组设计两样本比较的秩和检验
  • 9 双变量关联性分析
    • 9.1 直线相关的概念与性质
  • 10 直线回归分析
    • 10.1 直线回归方程的建立
    • 10.2 直线回归方程的推断
    • 10.3 直线回归方程的应用
    • 10.4 直线回归分析的注意事项
  • 11 统计表与统计图
    • 11.1 统计表的制表原则与应用
    • 11.2 统计图的制表原则与应用
独立样本列联表资料的卡方检验
  • 1 教学内容
  • 2 练习
  • 3 案例
  • 4 扩展学习

2×2列联表资料的χ2检验 
例7.1
1. 建立检验假设,确定检验水准
H0:π1=π2 ,即两种药物治疗小儿上消化道出血的有效率相同
H1:π1≠π2 ,即两种药物治疗小儿上消化道出血的有效率不同
α =0.05
2. 计算χ2值和自由度



ν= 1
3. 确定 P 值,作出统计推断 
查χ2界值表,得P<0.005,按α =0.05水准,拒绝H0,接受H1,差异有统计学意义,可以认为两种药物治疗小儿上消化道出血的有效率不同,乙药的有效率高于甲药。
四格表专用公式: 

例7.1数据 

四格表χ2统计量的连续性校正 
χ2 分布是一种连续型分布,而原始资料属离散型分布,由此得到的χ2值的抽样分布也是离散的。
为改善χ2统计量分布的连续性,英国统计学家F.Yates提出连续性校正(correction for continuity)的方法,又称Yates校正(Yates’S correction)。 
在所有格子的T≥5,且n≥40时,用Pearson公式或专用公式算得的χ2值近似服从自由度为1 的χ2分布。
当有理论频数小于5时,这种近似程度降低。
在分析独立样本四格表资料时,需根据具体情况作不同处理:
1. 当n≥40,且T≥5时,用Pearson χ2公式或专用公式计算χ2值。
2. 当n≥40,且有1≤T<5时,用校正公式计算校正的χ2值,或用四格表的确切概率法。
3. 当n<40或T<1时,用四格表的确切概率法。

 

例7.2 某研究欲比较甲、乙两药治疗下呼吸道感染的疗效,将66例下呼吸道感染者随机等分为两组,进行随机双盲对照试验,结果见表7.3。两组纳入分析的病例数分别为32和33 人。问两药治疗下呼吸道感染的有效率有无差异?

表7.3 两种药物治疗下呼吸道感染的效果


药物

有效

无效

合计

有效率

24

8

32

75

31

2

80

93.94

合计

55

10

65

84.62


本例中甲药组治疗无效时对应的格子,其理论频数=4.92,1<T12<5,而n>40,故应计算校正的χ2值。
 

查χ2 界值表,得P>0.05,按α=0.05水准,不拒绝H0 ,差异无统计学意义,尚不能认为两种药物治疗下呼吸道感染的有效率不同。

如果本例不校正,χ2 =4.477>3.84,则P<0.05,结论与校正的结果相反。所以,χ2 检验时要注意其应用条件,否则可能会得出错误的统计学结论。

 

R×C 列联表资料的χ2检验


R×C列联表的形式:
① 2×2列联表,即四格表,即两个样本率的比较;
② R×2列联表,即多个样本率的比较;
③ 2×C 或 R×C 列联表,即两个或多个构成比的比较。 

n=k-1-s=(R-1)(C-1)

多个样本率的比较


例7.3 某研究者欲比较A、B、C三种方案治疗轻、中度高血压的疗效,将年龄在50~70 岁的240例轻、中度高血压患者随机等分为3组,分别采用三种方案治疗。一个疗程后观察疗效,结果见表7.4。问三种方案治疗轻、中度高血压的有效率有无差别?

表7.4 三种方案治疗轻、中度高血压的效果


方案

有效

无效

合计

有效率

A

74

6

80

92.5

B

58

22

80

72.5

C

71

9

80

88.75

合计

203

37

240

84.58

H0 : π1=π2=π3三种方案治疗轻、中度高血压的有效率相同
H1 : 三种方案治疗轻、中度高血压的有效率不全相同 
a=0.05



ν=(3-1)(2-1)=2 
P<0.005,按a=0.05水准,拒绝H0,接受H1,差异有统计学意义,可以认为三种方案治疗轻、中度高血压的有效率不全相同。