-
1 教学内容
-
2 练习
-
3 案例
-
4 扩展学习
直线回归分析
相关系数用于:
说明两个变量之间相伴随而呈线性变化的趋势和关联强度。不能用其中一个变量来预测另一个变量的值。
回归分析用于:
通过易测的变量对另一难测的变量进行估测。例如:用腰围、臀围、体重指数来估测腹腔内脂肪含量。
第一节
直线回归方程的建立
一、直线回归的概念
直线回归(linear regression)、简单回归(simple regression) :用于研究两个连续型变量之间数量上的线性依存关系。
因变量(dependent variable)、反应变量(response variable) : y是回归分析中,估测的随机变量;自变量(independent variable)、解释变量(explanatory variable) : x是回归分析中,y所依存的变量。
例14.1 某研究欲探讨男性腰围与腹腔内脂肪面积的关系,对20名男性志愿受试者测量其腰围(cm),并采用磁共振成像法测量其腹腔内脂肪面积(cm2),结果如表14.1所示。
试建立腹腔内脂肪面积(y)和腰围(x)的直线回归方程。
表14.1 20名男性志愿受试者腰围和腹腔内脂肪面积的测量值
编号 | 腰围(cm) | 腹腔内脂肪面积(cm2) | 编号 | 腰围(cm) | 腹腔内脂肪面积(cm2) |
1 | 81.3 | 69.8 | 11 | 93.5 | 108.2 |
2 | 85.6 | 61.2 | 12 | 103.8 | 129.0 |
3 | 85.9 | 80.3 | 13 | 97.5 | 110.4 |
4 | 87.8 | 75.5 | 14 | 98.3 | 123.3 |
5 | 79.0 | 75.7 | 15 | 99.7 | 105.5 |
6 | 82.5 | 85.4 | 16 | 87.2 | ?83.1 |
7 | 95.2 | 102.5 | 17 | 84.1 | ?72.0 |
8 | 96.1 | 99.6 | 18 | 88.0 | 100.0 |
9 | 94.4 | 97.8 | 19 | 101.0 | 105.0 |
10 | 90.6 | 100.9 | 20 | 88.3 | 127.7 |

图14.1 两变量直线回归关系散点图
回归直线上各点的纵坐标是当 x 取某一值时因变量 y 的平均估计值
直线回归方程 / 直线回归模型: (linear regression equation) ![]()
a回归直线的截距/常数项, 表示 x 等于0时,y 的平均估计值;
b回归直线的斜率/回归系数。
回归系数(regression coefficient):
表示 x 改变一个单位时 y 的平均改变量。
b>0,表示回归直线从左下方走向右上方,即 y 随 x 增大而增大;
b<0,表示回归直线从左上方走向右下方,即 y 随 x 增大而减小;
b=0,表示回归直线平行于 x 轴,即 y 与 x 无线性依存关系。
二、回归方程的估计
(一)回归方程估计的最小二乘法
求解a、b就是合理地找到一条能最好地代表数据点分布趋势的直线,使得每个实测值 yi 与这条“理想”的回归直线的估计值 最接近。
最小二乘法(least square method):指
取得最小值这一原则。
二)回归系数的估计方法

![]()
建立直线回归方程的步骤:
1. 绘制散点图(图14.1), 若二者存在 直线趋势,进行直线回归分析。
2. 由样本数据计算如下统计量
![]()
![]()
![]()
3. 计算回归系数 b 及截距 a

![]()
4. 回归方程为 ![]()
在 x 的实测值范围内,任取相距较远且易读数的两个 x 值,代人方程得到两个
值,连接两点即可绘制回归直线。
本例 x 分别取值79和88,得到
分别为70.340和89.335,连接点(79, 70.340)和(88, 89.335)即得回归直线。

