生物统计附试验设计

梅步俊 梁永厚 吴志红

目录

  • 1 绪论
    • 1.1 生物统计学发展史
    • 1.2 学习生物统计学的必要性
    • 1.3 常用术语和基本概念
    • 1.4 R软件的介绍
    • 1.5 进一步阅读的文献
    • 1.6 习题
  • 2 资料的描述性统计分析
    • 2.1 位置测度
    • 2.2 离散性测度
    • 2.3 R软件的应用
    • 2.4 习题
  • 3 随机变量与概率分布
    • 3.1 随机变量
    • 3.2 概率分布
    • 3.3 二维随机变量
    • 3.4 正态分布
    • 3.5 一些重要的概率分布
    • 3.6 R软件的应用
    • 3.7 习题
  • 4 参数估计方法
    • 4.1 估计量的评价准则
    • 4.2 点估计
    • 4.3 区间估计
    • 4.4 R软件的应用
    • 4.5 习题
  • 5 统计假设测验
    • 5.1 假设检验的基本问题
    • 5.2 统计检验的基本步骤
    • 5.3 抽样分布
    • 5.4 样本平均数与总体平均数差异显著性检验
    • 5.5 两个样本平均数的差异显著性检验
    • 5.6 百分数资料差异显著性检验
    • 5.7 总体参数的区间估计
    • 5.8 非参数检验
    • 5.9 R软件的应用
    • 5.10 习题
  • 6 方差分析
    • 6.1 单因素方差分析
    • 6.2 多重比较
    • 6.3 多因素方差分析
    • 6.4 方差分析需要满足的条件
    • 6.5 习题
  • 7 协方差分析
    • 7.1 协方差分析概述
    • 7.2 协方差分析的基本原理
    • 7.3 协方差分析的计算过程
    • 7.4 R软件的应用
    • 7.5 习题
  • 8 相关与回归分析
    • 8.1 变量之间的相互关系
    • 8.2 直线相关
    • 8.3 回归分析的性质
    • 8.4 一元正态线性回归统计模型
    • 8.5 多元线性回归统计模型
    • 8.6 自变量的选择与逐步回归
    • 8.7 曲线回归
    • 8.8 应用直线回归与相关的注意事项
    • 8.9 R软件的应用
    • 8.10 习题
  • 9 实验设计
    • 9.1 实验设计概述
    • 9.2 生物实验计划
    • 9.3 完全随机设计
    • 9.4 随机单位组设计
    • 9.5 拉丁方设计
    • 9.6 交叉设计
    • 9.7 正交设计
    • 9.8 R软件的应用
    • 9.9 习题
  • 10 附件
    • 10.1 复习题
抽样分布

第三节     抽样分布 

前面提到,在统计检验过程中,我们应该建立统计数据,将样本中我们关心的信息集中在一起以便对其进行检验,并且此检验主要通过计算统计对观测值的概率并将其与此进行比较,具有指定标准(即显著性水平)的可能性。为了计算这种可能性,我们需要知道统计学服从的理论分布。由于这些理论分布的推导需要更多的数学知识,而且它们的分布函数和密度函数的数学表达式也是非常复杂的,对于生物学的学生来说,掌握推导过程及这些表达式几乎没有实际用途,所以本书省略这部分,有兴趣的学生可以参考概率论或数理统计的教科书。

下面我们就介绍一些常用统计量的理论分布。如无特别说明,假设所有样本均抽自正态总体。

(1)样本线性函数的分布:

为一简单随机样本,其总体分布为,统计量为:

其中为常数,则也为正态随机变量,且

                 (5-1)

显然若取=,则为样本均值。此时

(2)分布:

相互独立,且同服从,则称随机变量

                 (5-2)

所服从的分布为分布,记为称为它的自由度。

(3)t分布:

,且X,Y互相独立,则称随机变量

                  (5-3)

所服从的分布为t分布,记为。n称为它的自由度。

(4)F分布

,且互相独立,则称随机变量

                   (5-4)

所服从的分布为F分布,记为称为它的自由度。

(5)正态总体样本均值与方差的分布

这一定理及它的推论构成了本章主要内容的理论基础。

定理:若为抽自总体的简单随机样本,定义样本均值为:,样本方差为:,则有:

(1)相互独立;

(2)                                 (5-5)

(3)                     (5-6)

推论1:统计量

                (5-7)

推论2:若为取自总体的样本,为取自总体的样本,且它们互相独立,则:

               (5-8)

其中S12, S22分别为X1,…,Xm,Y1,…,Yn的样本方差。

推论3:在推论2的条件下,若,则:

        (5-9)

几点说明:

(1)有些书上样本方差定义为:

我们的定义为:

这是因为可证明,而

(2),但。这可用反证法证明如下:

,由方差定义,有:

这意味着是一个常量,永不改变。这显然不可能。所以假设不成立。

(3)(5-3)式和(5-7)式中的有不同的统计学意义。(5-3)式中的的自由度,而(5-7)式中表达式已将它的自由度除掉了,此处除以是因为是总体方差估计值,而的方差为总体方差的倍,因此使用(5-7)式才能将标准化。