生物统计附试验设计

梅步俊 梁永厚 吴志红

目录

  • 1 绪论
    • 1.1 生物统计学发展史
    • 1.2 学习生物统计学的必要性
    • 1.3 常用术语和基本概念
    • 1.4 R软件的介绍
    • 1.5 进一步阅读的文献
    • 1.6 习题
  • 2 资料的描述性统计分析
    • 2.1 位置测度
    • 2.2 离散性测度
    • 2.3 R软件的应用
    • 2.4 习题
  • 3 随机变量与概率分布
    • 3.1 随机变量
    • 3.2 概率分布
    • 3.3 二维随机变量
    • 3.4 正态分布
    • 3.5 一些重要的概率分布
    • 3.6 R软件的应用
    • 3.7 习题
  • 4 参数估计方法
    • 4.1 估计量的评价准则
    • 4.2 点估计
    • 4.3 区间估计
    • 4.4 R软件的应用
    • 4.5 习题
  • 5 统计假设测验
    • 5.1 假设检验的基本问题
    • 5.2 统计检验的基本步骤
    • 5.3 抽样分布
    • 5.4 样本平均数与总体平均数差异显著性检验
    • 5.5 两个样本平均数的差异显著性检验
    • 5.6 百分数资料差异显著性检验
    • 5.7 总体参数的区间估计
    • 5.8 非参数检验
    • 5.9 R软件的应用
    • 5.10 习题
  • 6 方差分析
    • 6.1 单因素方差分析
    • 6.2 多重比较
    • 6.3 多因素方差分析
    • 6.4 方差分析需要满足的条件
    • 6.5 习题
  • 7 协方差分析
    • 7.1 协方差分析概述
    • 7.2 协方差分析的基本原理
    • 7.3 协方差分析的计算过程
    • 7.4 R软件的应用
    • 7.5 习题
  • 8 相关与回归分析
    • 8.1 变量之间的相互关系
    • 8.2 直线相关
    • 8.3 回归分析的性质
    • 8.4 一元正态线性回归统计模型
    • 8.5 多元线性回归统计模型
    • 8.6 自变量的选择与逐步回归
    • 8.7 曲线回归
    • 8.8 应用直线回归与相关的注意事项
    • 8.9 R软件的应用
    • 8.10 习题
  • 9 实验设计
    • 9.1 实验设计概述
    • 9.2 生物实验计划
    • 9.3 完全随机设计
    • 9.4 随机单位组设计
    • 9.5 拉丁方设计
    • 9.6 交叉设计
    • 9.7 正交设计
    • 9.8 R软件的应用
    • 9.9 习题
  • 10 附件
    • 10.1 复习题
应用直线回归与相关的注意事项

第八节 应用直线回归与相关的注意事项 

线性回归和相关分析在生物科学研究领域得到了广泛应用,但在实际工作中很容易被误用或做出错误的解释。为了正确应用线性回归和相关分析的工具,必须注意以下几点:

1.线性回归分析与相关分析变量之间是否存在相关性是一种处理变量之间关系的数学方法,在这些方法在生物科学研究中的应用时应考虑到生物体本身的物理现实,如由于变量之间是否存在线性关系,在什么条件下会发生线性相关,线性回归方程是否有意义,作为自变量的性状还是变量的确定都必须由相关的生物科学专业知识来确定,并且应该在生物科学实践中进行测试。如果没有一定的生物学科学基础的先决条件,不把无关数据放入直线回归分析或相关分析中,这是一个根本的错误。

2.保持其余变量尽可能一致。由于自然界各种事物的相互联系和限制,一个变量的变化通常受许多其他变量的影响,因此,在研究两个变量之间的关系时,其余变量应尽可能保持在同一水平,否则,回归分析和相关分析可能导致完全错误的结果。例如身高和胸围的关系,如果体重固定,人越高,胸围越小,但当体重变化时,结果会相反。

3.在线性回归和相关分析中,观测值应尽可能多,这两个变量应尽可能多,以提高分析的准确性,一般至少有5对观测值。同时,变量x的范围越大越好,因此很容易找到两个变量之间的关系。

4.外推是谨慎的线性回归和相关分析,一般描述两个变量之间在一定的数值范围内的关系。除此之外,变量之间的关系可能会发生变化,所以回归预测必须限制在自变量x的范围内,外推应谨慎,否则我们会得到错误的结果。

5.正确理解一个微不足道的相关系数的回归含义或相关意义并不意味着变量x和Y之间没有关系,只能表明两个变量之间没有显著的线性关系,a显著的相关系数或回归系数并不意味着x和Y之间的关系必须是直线,因为不排除可以更好地描述它们之间关系的非线性方程的存在。

6.一个显著的回归方程并不一定具有实践上的预测意义,如一个资料x、y两个变量间的相关系数r=0.5,在df=24时,r0.01(24)=0.496,r>r0.01(24),表明相关系数极显著。而r2=0.25,即x变量或y变量的总变异能够通过y变量或x变量以直线回归的关系来估计的比重只占25%,其余的75%的变异无法借助直线回归来估计。