医学统计学(2023秋)

中国医科大学 刘红波

目录

  • 1 绪论
    • 1.1 医学统计学概述
    • 1.2 统计学若干基本理念
  • 2 定量资料的统计描述
    • 2.1 频数分布与频数分布图
    • 2.2 集中位置描述
    • 2.3 离散程度描述
    • 2.4 正态分布
    • 2.5 正态分布的应用
  • 3 定性资料的统计描述
    • 3.1 常用相对数
    • 3.2 应用相对数的注意现象
  • 4 总体均数的估计
    • 4.1 均数的抽样误差与标准误差
    • 4.2 t分布
    • 4.3 总体均数估计(1)
    • 4.4 总体均数估计(2)
  • 5 假设检验的基本思想
    • 5.1 假设检验的基本思想
    • 5.2 假设检验的基本步骤
    • 5.3 假设检验的两型错误
    • 5.4 假设检验的注意事项
  • 6 t检验
    • 6.1 t检验
  • 7 卡方检验
    • 7.1 独立样本列联表资料的卡方检验
    • 7.2 独立样本列联表资料的卡方检验
    • 7.3 配对设计资料的卡方检验
  • 8 秩和检验
    • 8.1 Wilcoxon 符号秩和检验(一)
    • 8.2 Wilcoxon 符号秩和检验(二)
    • 8.3 成组设计两样本比较的秩和检验
  • 9 双变量关联性分析
    • 9.1 直线相关的概念与性质
  • 10 直线回归分析
    • 10.1 直线回归方程的建立
    • 10.2 直线回归方程的推断
    • 10.3 直线回归方程的应用
    • 10.4 直线回归分析的注意事项
  • 11 统计表与统计图
    • 11.1 统计表的制表原则与应用
    • 11.2 统计图的制表原则与应用
配对设计资料的卡方检验
  • 1 教学内容
  • 2 练习
  • 3 案例
  • 4 扩展学习

 

两个或多个构成比的比较 
例7.4 为了解新型农村合作医疗对于农村贫困居民住院服务利用的影响,在经济条件相似的甲、乙两个国家级贫困县(其中甲县2006年已开展新型农村合作医疗;乙县2006年尚未开展)分别进行抽样调查,得到2006年应住院者未住院原因,见表7.5。问甲、乙两县应住院者未住院原因构成比是否不同? 
表7.5甲、乙两县应住院者未住院原因构成比(%)

县别

经济困难

没有必要

没有时间

其他

合计

293(87.99)

10(5.11)

17(3.00)

13(3.90)

333(100.00)

282(92.16)

9(2.94)

9(2.94)

6(1.96)

306(100.00)

合计

575

19

26

19

639


:甲、乙两县应住院者未住院原因的总体构成比相同 
:甲、乙两县应住院者未住院原因的总体构成比不同 
=0.05 
 
=(2-1)(4-1)=3 
0.10<P<0.25,按=0.05水准,不拒绝,差异无统计学意义,尚不能认为甲、乙两县应住院者未住院原因的总体构成比不同。 
 R×列联表检验注意事项 
1. 计算值时,必须用绝对数,而不能用相对数,因为值的大小与频数大小有关。 
2.检验要求理论频数不宜太小,否则有可能导致分析的偏性。 
Cochran(1954年)将理论频数太小界定为: 有1/5以上格子的理论频数小于5,或有1个格子的理论频数小于1。 
最小理论频数:最小行、列合计所对应格子的理论频数。 
表7.5的最小行、列合计对应的格子为最后一个格子,相应的理论频数为,则可以直接计算 值。

理论频数太小的处理方法: 
(1) 增大样本含量。 
(2) 用确切概率法。 
(3) 将理论频数太小的行或列与性质相近的邻行或邻列合并, 相应的实际频数相加,使重新计算的理论频数增大。不过, 行或列合并时应注意从专业角度判断其是否合理, 如相邻年龄组可以合并, 但不同血型就不能合并。 
(4) 删去理论频数太小的格子所对应的行或列。 
合并或删除都会损失信息, 损害样本的随机性。 
3. 有序多分类变量资料的R×C列联表,在比较各处理组的平均效应大小是否有差别时,应该用秩和检验或Ridit检验。 

值没有考虑效应的等级顺序

表7.6甲、乙两药治疗尿道感染的疗效


药物

痊愈

显效

进步

无效

合计

46

17

12

9

84

30

15

25

12

82

合计

76

32

37

21

166

表7.6中,甲、乙两药治疗尿道感染的疗效为等级变量,若将表中任意两列频数互换,所得值不会发生改变。 
对于有序多分类变量资料,检验只能说明各处理组效应的构成比是否有差别。若要比较各处理组的效应大小是否有差别,应考虑效应的等级顺序,宜采用秩和检验。 
4. 当多个样本率(或构成比)比较的检验,结论为拒绝时,只能认为各总体率(或总体构成比)之间总的来说有差别,不能说明它们彼此之间都有差别,或某两者间有差别。若想进一步了解哪两者的差异有统计学意义,需要进行多个样本率(或构成比)的两两比较。 
多个样本率(或构成比) 两两比较的方法分3类: 
① 调整检验水准后进行两两比较;
② 分割;
③ 估计两率之差的置信区间。
任何两两比较的方法都存在一定的缺陷,故得出的结论都要结合实际来分析。
 

配对2×2列联表资料的检验 
表7.8配对四格表形式


合计

+

-

+

a

b

a+b

-

c

d

c+d

合计

a+c

b+d

n

研究对象先按某种方式配成对,再按甲、乙两种属性统计,所得结果不是相互独立的,不能用前述的独立样本四格表资料的检验 
配对设计四格表的检验公式
  又称 McNemar检验 ( McNemar’s test ) 
当 b+c < 40 时,需作连续性校正 
 

ad反映的是甲、乙两种属性一致的情况。由于a两个格子不能反映差异,因此,当 a比较大,b比较小时,若得到差异有统计学意义,需结合两样本率差异的大小得出专业结论。 
例7.6某研究者欲比较心电图和生化测定诊断低钾血症的价值,分别采用两种方法对79名临床确诊的低钾血症患者进行检查,结果见表7.9。问两种方法的检测结果是否不同? 
表7.9 两种方法诊断低钾血症的结果


心电图

生化测定

合计

+

-

+

45

25

70

-

4

5

9

合计

49

30

79

 即两种方法的检测结果相同 
即两种方法的检测结果不同

= 29 < 40 

P<0.005,按?水准,拒绝,接受,差异有统计学意义,可以认为两种方法的检测结果不同。由于心电图检测的阳性率为88.61%,生化测定方法的阳性率为62.03%,则心电图的阳性率高于生化测定方法。