医学统计学(2024秋)

中国医科大学 刘红波

目录

  • 1 绪论
    • 1.1 医学统计学概述
    • 1.2 统计学若干基本理念
  • 2 定量资料的统计描述
    • 2.1 频数分布与频数分布图
    • 2.2 集中位置描述
    • 2.3 离散程度描述
    • 2.4 正态分布
    • 2.5 正态分布的应用
  • 3 定性资料的统计描述
    • 3.1 常用相对数
    • 3.2 应用相对数的注意现象
  • 4 总体均数的估计
    • 4.1 均数的抽样误差与标准误差
    • 4.2 t分布
    • 4.3 总体均数估计(1)
    • 4.4 总体均数估计(2)
  • 5 假设检验的基本思想
    • 5.1 假设检验的基本思想
    • 5.2 假设检验的基本步骤
    • 5.3 假设检验的两型错误
    • 5.4 假设检验的注意事项
  • 6 t检验
    • 6.1 t检验
  • 7 卡方检验
    • 7.1 独立样本列联表资料的卡方检验
    • 7.2 独立样本列联表资料的卡方检验
    • 7.3 配对设计资料的卡方检验
  • 8 秩和检验
    • 8.1 Wilcoxon 符号秩和检验(一)
    • 8.2 Wilcoxon 符号秩和检验(二)
    • 8.3 成组设计两样本比较的秩和检验
  • 9 双变量关联性分析
    • 9.1 直线相关的概念与性质
  • 10 直线回归分析
    • 10.1 直线回归方程的建立
    • 10.2 直线回归方程的推断
    • 10.3 直线回归方程的应用
    • 10.4 直线回归分析的注意事项
  • 11 统计表与统计图
    • 11.1 统计表的制表原则与应用
    • 11.2 统计图的制表原则与应用
直线相关的概念与性质
  • 1 教学内容
  • 2 练习
  • 3 案例
  • 4 扩展学习

双变量关联性分析 
双变量关联性:指两个随机变量之间在数量上存在某种协同变化的关系。 
随着凝血酶的升高凝血时间降低。 
关联性只反映变量间数量上的关系或关联,不表示专业上的因果关系。 
双变量关联性分析用于:判断双变量间关联性是否存在?描述关联的方向与密切程度。

直线相关的概念与性质 
9.1 某医师测量了15名正常成年人的体重(kg)CT双肾体积(mL)大小,数据如表9.1所示。据此回答两变量是否有关联,其方向与密切程度如何? 
9.1 15名正常成年人体重和双肾体积的测量值


编号

体重(kg

双肾体积(mL

编号

体重(kg

双肾体积(mL

1

43

217.22

9

67

263.46

2

74

316.18

10

69

276.53

3

51

231.11

11

80

341.15

4

58

220.96

12

48

261.00

5

50

254.70

13

38

213.20

6

65

293.84

14

85

315.12

7

54

263.28

15

54

252.08

8

57

271.73




 


9.1 15名正常成年人体重和双肾体积的散点图


初步判断两变量间关系最直观有效的方法就是在平面直角坐标系中绘图其中一个变量用 表示另一变量用 表示在平面直角坐标系中可绘制这些实测点的分布情况称为散点图 (scatter plot)  
统计学上,两个随机变量之间呈直线趋势的关系,称为直线相关(linear correlation)或简单相关(simple correlation) 



9.2 常见的散点图


直线相关的性质

  1. 正相关(positive correlation):散点近似呈椭圆形分布,其变化趋势接近一直线,两变量同时增大或减小,变化趋势同向。

  1. 负相关(negative correlation):散点近似呈椭圆形分布,其变化趋势接近一直线,其中一个变量随着另一个变量的增大而减小,变化趋势相反。

  2. 完全相关:全部数据点恰好散布在一条直线上。

  3. 无相关或零相关(zero correlation):各点总的趋势杂乱无章或大致呈圆形散布。统计学中提到的相关通常指直线相关,故无相关或零相关是指无直线关系,但可能存在非直线相关。


直线相关系数(linear correlation coefficient)  Pearson积矩相关系数(Pearson product moment coefficient) 是定量描述两个变量间直线关系的方向和密切程度的指标。 
 

正相关 0< <1 
完全正相关 r1
负相关 -1< r <0
完全负相关 r-1
零相关 r 0
9.2 计算例9.1中体重与双肾体积之间的样本相关系数 
 
说明两变量间呈正相关双肾体积随体重增加而增大。需进行假设检验以推断总体上这种相关关系是否存在。

相关系数的假设检验 
用样本计算出来的相关系数 是一个样本统计量存在抽样误差需要对总体相关系数是否为0作假设检验。 
假定随机变量  均服从正态分布可用 检验和查表法进行推断。 
检验法 
 

样本相关系数 的标准误

成立时t服从自由度为 分布。 
查表法 
根据 查相关系数界值表越大P值越小越小P值越大 
以上两种方法 
若得到则拒绝可认为两变量间存在直线相关关系;
则不拒绝尚不能认为两变量间存在直线相关关系。 
9.3 9.2中算得 = 0.875,试检验该相关系数 
是否具有统计学意义。

  1. 建立检验假设,确定检验水准

即体重和双肾体积之间无直线相关关系
即体重和双肾体积之间有直线相关关系
 

(2) 计算检验统计量 

(3) 确定P值,作出统计推断 
 界值表水准拒绝 接受相关系数有统计学意义可认为体重和双肾体积之间有直线相关关系。 
查表法 
直接查相关系数界值表结果与 检验法一致。 
直线相关分析的步骤: 
1. 绘制散点图:若两变量间有直线趋势 
2. 计算样本相关系数 
3. 相关系数的假设检验 ( 检验和查表法)