-
1 教学内容
-
2 练习
-
3 案例
-
4 扩展学习
双变量关联性分析
双变量关联性:指两个随机变量之间在数量上存在某种协同变化的关系。
随着凝血酶的升高, 凝血时间降低。
关联性只反映变量间数量上的关系或关联,不表示专业上的因果关系。
双变量关联性分析用于:判断双变量间关联性是否存在?描述关联的方向与密切程度。
直线相关的概念与性质
例9.1 某医师测量了15名正常成年人的体重(kg)与CT双肾体积(mL)大小,数据如表9.1所示。据此回答两变量是否有关联,其方向与密切程度如何?
表9.1 15名正常成年人体重和双肾体积的测量值
编号 | 体重(kg) | 双肾体积(mL) | 编号 | 体重(kg) | 双肾体积(mL) |
1 | 43 | 217.22 | 9 | 67 | 263.46 |
2 | 74 | 316.18 | 10 | 69 | 276.53 |
3 | 51 | 231.11 | 11 | 80 | 341.15 |
4 | 58 | 220.96 | 12 | 48 | 261.00 |
5 | 50 | 254.70 | 13 | 38 | 213.20 |
6 | 65 | 293.84 | 14 | 85 | 315.12 |
7 | 54 | 263.28 | 15 | 54 | 252.08 |
8 | 57 | 271.73 |

图9.1 15名正常成年人体重和双肾体积的散点图
初步判断两变量间关系最直观有效的方法就是在平面直角坐标系中绘图, 其中一个变量用 x 表示, 另一变量用 y 表示, 在平面直角坐标系中可绘制这些实测点的分布情况, 称为散点图 (scatter plot) 。
统计学上,两个随机变量之间呈直线趋势的关系,称为直线相关(linear correlation)或简单相关(simple correlation) 。

图9.2 常见的散点图
直线相关的性质
正相关(positive correlation):散点近似呈椭圆形分布,其变化趋势接近一直线,两变量同时增大或减小,变化趋势同向。
负相关(negative correlation):散点近似呈椭圆形分布,其变化趋势接近一直线,其中一个变量随着另一个变量的增大而减小,变化趋势相反。
完全相关:全部数据点恰好散布在一条直线上。
无相关或零相关(zero correlation):各点总的趋势杂乱无章或大致呈圆形散布。统计学中提到的相关通常指直线相关,故无相关或零相关是指无直线关系,但可能存在非直线相关。

直线相关系数(linear correlation coefficient) 或 Pearson积矩相关系数(Pearson product moment coefficient): 是定量描述两个变量间直线关系的方向和密切程度的指标。 
正相关 0< r <1
完全正相关 r=1
负相关 -1< r <0
完全负相关 r=-1
零相关 r =0
例9.2 计算例9.1中体重与双肾体积之间的样本相关系数
说明两变量间呈正相关, 双肾体积随体重增加而增大。需进行假设检验, 以推断总体上这种相关关系是否存在。
相关系数的假设检验
用样本计算出来的相关系数 r 是一个样本统计量, 存在抽样误差, 需要对总体相关系数是否为0作假设检验。
假定随机变量 x 和 y 均服从正态分布, 可用 t 检验和查表法进行推断。
t 检验法 
样本相关系数 r 的标准误
当
成立时, tr 服从自由度为
的 t 分布。
查表法
根据
, 查相关系数界值表,
越大, P值越小;
越小, P值越大
以上两种方法
若得到
, 则拒绝
, 可认为两变量间存在直线相关关系;
若
, 则不拒绝
, 尚不能认为两变量间存在直线相关关系。
例9.3 例9.2中算得 r = 0.875,试检验该相关系数
是否具有统计学意义。
建立检验假设,确定检验水准
, 即体重和双肾体积之间无直线相关关系?
, 即体重和双肾体积之间有直线相关关系?
(2) 计算检验统计量 
![]()
(3) 确定P值,作出统计推断
查 t 界值表, 得
, 按
水准, 拒绝
, 接受
, 相关系数有统计学意义, 可认为体重和双肾体积之间有直线相关关系。
查表法
直接查相关系数界值表,
, ![]()
![]()
, 结果与 t 检验法一致。
直线相关分析的步骤:
1. 绘制散点图:若两变量间有直线趋势
2. 计算样本相关系数
3. 相关系数的假设检验 ( t 检验和查表法)


