第八节 应用直线回归与相关的注意事项
线性回归和相关分析在生物科学研究领域得到了广泛应用,但在实际工作中很容易被误用或做出错误的解释。为了正确应用线性回归和相关分析的工具,必须注意以下几点:
1.线性回归分析与相关分析变量之间是否存在相关性是一种处理变量之间关系的数学方法,在这些方法在生物科学研究中的应用时应考虑到生物体本身的物理现实,如由于变量之间是否存在线性关系,在什么条件下会发生线性相关,线性回归方程是否有意义,作为自变量的性状还是变量的确定都必须由相关的生物科学专业知识来确定,并且应该在生物科学实践中进行测试。如果没有一定的生物学科学基础的先决条件,不把无关数据放入直线回归分析或相关分析中,这是一个根本的错误。
2.保持其余变量尽可能一致。由于自然界各种事物的相互联系和限制,一个变量的变化通常受许多其他变量的影响,因此,在研究两个变量之间的关系时,其余变量应尽可能保持在同一水平,否则,回归分析和相关分析可能导致完全错误的结果。例如身高和胸围的关系,如果体重固定,人越高,胸围越小,但当体重变化时,结果会相反。
3.在线性回归和相关分析中,观测值应尽可能多,这两个变量应尽可能多,以提高分析的准确性,一般至少有5对观测值。同时,变量x的范围越大越好,因此很容易找到两个变量之间的关系。
4.外推是谨慎的线性回归和相关分析,一般描述两个变量之间在一定的数值范围内的关系。除此之外,变量之间的关系可能会发生变化,所以回归预测必须限制在自变量x的范围内,外推应谨慎,否则我们会得到错误的结果。
5.正确理解一个微不足道的相关系数的回归含义或相关意义并不意味着变量x和Y之间没有关系,只能表明两个变量之间没有显著的线性关系,a显著的相关系数或回归系数并不意味着x和Y之间的关系必须是直线,因为不排除可以更好地描述它们之间关系的非线性方程的存在。
6.一个显著的回归方程并不一定具有实践上的预测意义,如一个资料x、y两个变量间的相关系数r=0.5,在df=24时,r0.01(24)=0.496,r>r0.01(24),表明相关系数极显著。而r2=0.25,即x变量或y变量的总变异能够通过y变量或x变量以直线回归的关系来估计的比重只占25%,其余的75%的变异无法借助直线回归来估计。

