医学统计学(2024秋)

中国医科大学 刘红波

目录

  • 1 绪论
    • 1.1 医学统计学概述
    • 1.2 统计学若干基本理念
  • 2 定量资料的统计描述
    • 2.1 频数分布与频数分布图
    • 2.2 集中位置描述
    • 2.3 离散程度描述
    • 2.4 正态分布
    • 2.5 正态分布的应用
  • 3 定性资料的统计描述
    • 3.1 常用相对数
    • 3.2 应用相对数的注意现象
  • 4 总体均数的估计
    • 4.1 均数的抽样误差与标准误差
    • 4.2 t分布
    • 4.3 总体均数估计(1)
    • 4.4 总体均数估计(2)
  • 5 假设检验的基本思想
    • 5.1 假设检验的基本思想
    • 5.2 假设检验的基本步骤
    • 5.3 假设检验的两型错误
    • 5.4 假设检验的注意事项
  • 6 t检验
    • 6.1 t检验
  • 7 卡方检验
    • 7.1 独立样本列联表资料的卡方检验
    • 7.2 独立样本列联表资料的卡方检验
    • 7.3 配对设计资料的卡方检验
  • 8 秩和检验
    • 8.1 Wilcoxon 符号秩和检验(一)
    • 8.2 Wilcoxon 符号秩和检验(二)
    • 8.3 成组设计两样本比较的秩和检验
  • 9 双变量关联性分析
    • 9.1 直线相关的概念与性质
  • 10 直线回归分析
    • 10.1 直线回归方程的建立
    • 10.2 直线回归方程的推断
    • 10.3 直线回归方程的应用
    • 10.4 直线回归分析的注意事项
  • 11 统计表与统计图
    • 11.1 统计表的制表原则与应用
    • 11.2 统计图的制表原则与应用
假设检验的基本步骤

假设检验(Hypothesis Test)
基本思想
某医生研究一种新的治疗充血性心力衰竭的方法,对50位心功能在2~3级之间的成年男性患者进行4周的治疗,考察其疗效。评价疗效的一个指标是锻炼持续时间的增加量(min)。以前常规的治疗方法能使患者的锻炼持续时间平均增加3min。该医生通过50位接受新方法治疗的患者的数据算得锻炼持续时间平均增加4min,标准差为1.5 min。该新疗法使患者锻炼持续时间的平均增加量是否多于常规疗法的3 min?
原因:
1.,抽样误差造成 ?;
2.,非同一总体,本质不同。
欲确定原因,需从两种假设中作抉择。
1. 零假设(null hypothesis) / 无效假设 / 无差异假设H0,表示目前的差异由抽样误差引起;
2. 备择假设(alternative hypothesis) / 对立假设H1 ,表示目前的差异不是由抽样误差所致,而是两者存在本质不同。
H0:μ=μ0新疗法使患者锻炼持续时间的平均增加量等于常规疗法的3 min;
H1:μμ0新疗法使患者锻炼持续时间的平均增加量不等于常规疗法的3 min。
包括:μμ0和μμ0两种情形。
P值:指从H0规定的总体中随机抽样,抽得等于及大于或(和)等于及小于现有样本获得的检验统计量值的概率。



Figure 1. Defining areas of acceptance and rejection in hypothesis testing using α = 0.05. 
A: Two-tailed or nondirectional. B: One-tailed or directional lower tail(下侧尾部). 
C: One-tailed or directional upper tail. 

如何确定概率P值? 
假定锻炼持续时间的增加量X服从正态分布N(μσ2),总体标准差σ未知。
在零假设成立的情况下,μ=μ0=3min,则基于t分布的知识,可以得到 
 

P值是ν=49的t分布曲线下当前统计量对应的双侧尾部面积之和,即 

t界值表,自由度近似取50,可得到 P < 0.001。
拒绝零假设,接受备择假设,可以认为“新疗法使患者锻炼持续时间的平均增加量不等于常规疗法的3 min”。
新疗法使患者延长的锻炼持续时间比常规疗法多1 min 是否具有实际的临床意义? 
不是假设检验回答的问题。
假设检验的基本思想:
在假设总体参数相等的前提下,计算出现等于及大于和/或等于及小于现有样本统计量的P值。若P值小于等于检验水准(如5%) ,结论就是拒绝零假设,认为总体参数之间存在差异。若P值大于检验水准,就不能拒绝零假设,尚不能认为总体参数之间存在差异。
假设检验的基本步骤
(1) 建立检验假设,确定检验水准
(2) 计算检验统计量
(3) 确定P值,作出统计推断
一般正常成年男子血红蛋白的平均值为140 g/L,某研究者随机抽取60名高原地区健康成年男性进行检查,测得血红蛋白均数为155 g/L, 标准差为 24 g/L。
可否认为高原地区成年男性居民的血红蛋白平均水平不同于一般正常成年男子? 
(1) 建立检验假设,确定检验水准
H0:μ=μ0高原地区成年男性居民血红蛋白的总体均数等于140 g/L
H1:μμ0高原地区成年男性居民血红蛋白的总体均数不等于140 g/L
α=0.05检验水准(level of significance, level of a test):事先规定的一个小的概率值,常取0.05或0.01。 
(2) 计算检验统计量 
 

(3) 确定P值,作出统计推断 
t界值表,自由度近似取60,可得到双侧< 0.001。
拒绝H0,接受H1,认为高原地区成年男性的血红蛋白平均水平不等于140 g/L。 
P≤α时,拒绝H0,接受H1;
P>α时,不拒绝H0。