生物统计附试验设计

梅步俊 梁永厚 吴志红

目录

  • 1 绪论
    • 1.1 生物统计学发展史
    • 1.2 学习生物统计学的必要性
    • 1.3 常用术语和基本概念
    • 1.4 R软件的介绍
    • 1.5 进一步阅读的文献
    • 1.6 习题
  • 2 资料的描述性统计分析
    • 2.1 位置测度
    • 2.2 离散性测度
    • 2.3 R软件的应用
    • 2.4 习题
  • 3 随机变量与概率分布
    • 3.1 随机变量
    • 3.2 概率分布
    • 3.3 二维随机变量
    • 3.4 正态分布
    • 3.5 一些重要的概率分布
    • 3.6 R软件的应用
    • 3.7 习题
  • 4 参数估计方法
    • 4.1 估计量的评价准则
    • 4.2 点估计
    • 4.3 区间估计
    • 4.4 R软件的应用
    • 4.5 习题
  • 5 统计假设测验
    • 5.1 假设检验的基本问题
    • 5.2 统计检验的基本步骤
    • 5.3 抽样分布
    • 5.4 样本平均数与总体平均数差异显著性检验
    • 5.5 两个样本平均数的差异显著性检验
    • 5.6 百分数资料差异显著性检验
    • 5.7 总体参数的区间估计
    • 5.8 非参数检验
    • 5.9 R软件的应用
    • 5.10 习题
  • 6 方差分析
    • 6.1 单因素方差分析
    • 6.2 多重比较
    • 6.3 多因素方差分析
    • 6.4 方差分析需要满足的条件
    • 6.5 习题
  • 7 协方差分析
    • 7.1 协方差分析概述
    • 7.2 协方差分析的基本原理
    • 7.3 协方差分析的计算过程
    • 7.4 R软件的应用
    • 7.5 习题
  • 8 相关与回归分析
    • 8.1 变量之间的相互关系
    • 8.2 直线相关
    • 8.3 回归分析的性质
    • 8.4 一元正态线性回归统计模型
    • 8.5 多元线性回归统计模型
    • 8.6 自变量的选择与逐步回归
    • 8.7 曲线回归
    • 8.8 应用直线回归与相关的注意事项
    • 8.9 R软件的应用
    • 8.10 习题
  • 9 实验设计
    • 9.1 实验设计概述
    • 9.2 生物实验计划
    • 9.3 完全随机设计
    • 9.4 随机单位组设计
    • 9.5 拉丁方设计
    • 9.6 交叉设计
    • 9.7 正交设计
    • 9.8 R软件的应用
    • 9.9 习题
  • 10 附件
    • 10.1 复习题
协方差分析的基本原理

第二节  协方差分析的基本原理 

我们以最简单的情况:一个协变量,单因素的协方差分析为例对协方差分析的基本原理加以说明。

一、统计模型:

在协方差分析中,我们认为每一个因变量的观察值可分解为以下各部分的和:

       (7-9)

其中:第水平的第次观察值。

水平的次观察的协变量取值。

的总平均数。

的总平均数。

:第水平的效应。

的线性回归系数。

:随机误差。

需要满足的条件为:

(1)

(2),即Y与X存在线性关系,且各水平回归系数相等,即协变量的影响不随水平的变化而改变。

(3)处理效应之和为0,即:

上述第三个条件说明该因素为固定因素。若为随机因素,则应该为处理效应的方差为0。模型(7-9)式也可写为:

      ,             (7-10)

这种写法看起来简单一点,它的缺点是不再是Y的总平均值,因为。我们以后的讨论针对(7-9)式进行。

二、协方差分析的统计量:

进行协方差分析需计算以下统计量:

             

             

            

其中S,T,E分别代表总的,处理的和误差的(包括协变量的影响)平方和及交叉乘积和。它们的关系可表示为:

这实际是平方和的分解。同学们可自行证明其交叉项为0。

三、协方差分析的原理:

协方差分析的核心思想是通过对因变量Y进行调整,消去协变量X的影响,从而能对另一因素不同水平的影响进行统计检验。在模型中,各参数的估计量为:

                         

其中。误差平方和为:

它的自由度为:dfe = a(n− 1) − 1。这是因为Syy的自由度为an − 1,Tyy的自由度为a − 1,所以Eyy的自由度为an − 1 − a+ 1 = a(n − 1),而b*Exy为一个一元回归平方和,自由度为1,所以SSe的自由度为a(n − 1)− 1。

注意上述计算中用的是E而不是S,即对每一个水平分别计算后再加起来的,因此是排除了影响的回归。

我们希望检验:。在此假设下,统计模型变为:

这是一个一元回归问题,此时的最小二乘估计为:

误差平方和为:

其中为Y对X的回归平方和。

不成立,则中会有的影响,因此会明显偏大。它们的差就是各对总变差的贡献,自由度为。所以我们可用下述统计量对作检验:

         (7-11)

大于查表得到的上单尾分位数,则拒绝,即各水平效应明显不同。

我们可以把协方差分析与方差分析作一比较:

若不存在协变量影响,即=0,模型变为:

这是单因素方差分析。总变差为Syy,误差平方和为Eyy,处理平方和Tyy = Syy − Eyy,我们用

作统计检验。

,我们用它对Syy和Eyy作调整:把Eyy调整为SSe作为误差估计,由于又用了一个估计量b*,又减少了一个自由度,SSe的自由度变为; Syy调整为,它与SSe的差作为处理平方和的估计,它的自由度仍为。因此,调整后的统计量变为(7-11)式。

从上面的分析可见,处理平均数实际上包括了处理效应和协变量的回归效应,经过调整后变为:

已消去了协变量的影响,只有处理效应了。它是模型中的最小二乘估计。可以证明它的标准误差为:

这实际上一元回归中条件均值估计的标准误差。

进行协方差分析应满足的条件有:

(1)

(2)

(3)

在做协方差分析的过程中应对上述条件进行检验。