生物统计附试验设计

梅步俊 梁永厚 吴志红

目录

  • 1 绪论
    • 1.1 生物统计学发展史
    • 1.2 学习生物统计学的必要性
    • 1.3 常用术语和基本概念
    • 1.4 R软件的介绍
    • 1.5 进一步阅读的文献
    • 1.6 习题
  • 2 资料的描述性统计分析
    • 2.1 位置测度
    • 2.2 离散性测度
    • 2.3 R软件的应用
    • 2.4 习题
  • 3 随机变量与概率分布
    • 3.1 随机变量
    • 3.2 概率分布
    • 3.3 二维随机变量
    • 3.4 正态分布
    • 3.5 一些重要的概率分布
    • 3.6 R软件的应用
    • 3.7 习题
  • 4 参数估计方法
    • 4.1 估计量的评价准则
    • 4.2 点估计
    • 4.3 区间估计
    • 4.4 R软件的应用
    • 4.5 习题
  • 5 统计假设测验
    • 5.1 假设检验的基本问题
    • 5.2 统计检验的基本步骤
    • 5.3 抽样分布
    • 5.4 样本平均数与总体平均数差异显著性检验
    • 5.5 两个样本平均数的差异显著性检验
    • 5.6 百分数资料差异显著性检验
    • 5.7 总体参数的区间估计
    • 5.8 非参数检验
    • 5.9 R软件的应用
    • 5.10 习题
  • 6 方差分析
    • 6.1 单因素方差分析
    • 6.2 多重比较
    • 6.3 多因素方差分析
    • 6.4 方差分析需要满足的条件
    • 6.5 习题
  • 7 协方差分析
    • 7.1 协方差分析概述
    • 7.2 协方差分析的基本原理
    • 7.3 协方差分析的计算过程
    • 7.4 R软件的应用
    • 7.5 习题
  • 8 相关与回归分析
    • 8.1 变量之间的相互关系
    • 8.2 直线相关
    • 8.3 回归分析的性质
    • 8.4 一元正态线性回归统计模型
    • 8.5 多元线性回归统计模型
    • 8.6 自变量的选择与逐步回归
    • 8.7 曲线回归
    • 8.8 应用直线回归与相关的注意事项
    • 8.9 R软件的应用
    • 8.10 习题
  • 9 实验设计
    • 9.1 实验设计概述
    • 9.2 生物实验计划
    • 9.3 完全随机设计
    • 9.4 随机单位组设计
    • 9.5 拉丁方设计
    • 9.6 交叉设计
    • 9.7 正交设计
    • 9.8 R软件的应用
    • 9.9 习题
  • 10 附件
    • 10.1 复习题
多重比较

第二节 多重比较 

F值是显著的或非常显著的,否定了零假设H0,这表明实验的总变化主要来自处理之间的变化,且实验中平均处理平均值之间存在显著或显著差异,但这并不意味着两个平均处理平均值之间的差异是重要的或显著的,也不是说明两者之间的显著或显著差异,哪些差异不显著。因此,有必要对二个平均值进行比较以确定二个处理平均值之间的显著差异。

统计上,二个多个平均值之间的比较称为多重比较(multiple comparisons)。有多种比较方法,下面分别介绍常用的最小显著差分法(LSD法)和最小显著极值偏差法(LSR法)。

(一)最小显著差数法(LSD法,least significant difference)此法的基本作法是:在F检验显著的前提下,先计算出显著水平为的最小显著差数,然后将任意两个处理平均数的差数的绝对值与其比较。若>LSDa时,则水平上差异显著;反之,则在水平上差异不显著。最小显著差数由(6-14)式计算。

                (6-14)

式中:为在F检验中误差自由度下,显著水平为的临界t值,为均数差异标准误,由(6-15)式算得。

                         (6-15)

其中为F检验中的误差均方,n为各处理的重复数。

当显著水平=0.05和0.01时,从t值表中查出,代入(6-14)式得:

                       (6-16)

利用LSD法进行多重比较时,可按如下步骤进行:

(1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列;

(2)计算最小显著差数

(3)将平均数多重比较表中两两平均数的差数与比较,作出统计推断。

对于例6.1,各处理的多重比较如表6-3所示。 

表6-3  四种饲料平均增重的多重比较表(LSD法)                                                 

 

处理

 

 

平均数

 

 

-24.74

 

 

-26.28

 

 

-27.96

 

 

A1

 

 

31.18

 

 

6.44**

 

 

4.90**

 

 

3.22*

 

 

A4

 

 

27.96

 

 

3.22*

 

 

1.68 ns

 

 

A2

 

 

26.28

 

 

1.54ns

 


 

A3

 

 

24.74

 



注:表中A4与 A3的差数3.22用q检验法与新复极差法时,在α=0.05的水平上不显著。

因为,;查t值表得:t0.05(dfe) =t0.05(16)=2.120,t0.01(dfe)=t0.01(16)=2.921,所以,显著水平为0.05与0.01的最小显著差数为

将表6-3中的6个差数与比较:小于者不显著,在差数的右上方标记“ns”,或不标记符号;介于之间者显著,在差数的右上方标记“*”;大于者极显著,在差数的右上方标记“**”。检验结果除差数1.68、1.54不显著、3.22显著外,其余两个差数6.44、4.90极显著。表明A1饲料对鱼的增重效果极显著高于A2和A3,显著高于A4;A4饲料对鱼的增重效果极显著高于A3饲料;A4与A2、A2与A3的增重效果差异不显著,以A1饲料对鱼的增重效果最佳。

关于法的应用有以下几点说明:

1.法实质上就是检验法。它是将检验中由所求得的之绝对值与临界值的比较转为将各对均数差值的绝对值与最小显著差数的比较而作出统计推断的。但是,由于法是利用F检验中的误差自由度查临界值,利用误差均方计算均数差异标准误,因而法又不同于每次利用两组数据进行多个平均数两两比较的检验法。它解决了检验法检验过程烦琐,无统一的实验误差且估计误差的精确性和检验的灵敏性低这两个问题。但法并未解决推断的可靠性降低、犯I型错误的概率变大的问题。

2.有人提出,与检验任何两个平均数之间的差异相比,该方法适合于治疗组与对照组之间的比较。实际上,这种形式更适用的方法是Dunnett(读者可以参考该方法的其他相关统计手册)。

3.由于法本质上是一种检验,有人指出,最适当的比较形式是,在实验的设计中,确定治疗只固定为两项,每项加工平均数仅比较一次。例如,在一个实验中,有4个过程,其被确定为仅与处理2,处理3和处理4(或1和3,2和4;或1和4,2和3)相比处理1流程。因为这种比较形式实际上不涉及多个平均数的极端差异,所以它不会增加I型错误的概率。

综上所述,对于多次处理平均所有可能的两两比较,该方法的优点在于该方法简单地克服了通用实验方法的一些缺点,但是可靠性低并且提交类型的可能性增加我的错误仍然是由于数字大小的数量的排名。为了克服这个缺点,统计人员提出了最小极值差法。

(二)最小显著极差法(LSR法,Leastsignificant ranges)法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)的不同而采用不同的检验尺度,以克服法的不足。这些在显著水平上依秩次距的不同而采用的不同的检验尺度叫做最小显著极差。例如有10个要相互比较,先将10个依其数值大小顺次排列,两极端平均数的差数(极差)的显著性,由其差数是否大于秩次距=10时的最小显著极差决定(≥为显著,<为不显著);而后是秩次距=9的平均数的极差的显著性,则由极差是否大于=9时的最小显著极差决定;直到任何两个相邻平均数的差数的显著性由这些差数是否大于秩次距k=2时的最小显著极差决定为止。因此,有个平均数相互比较,就有-1种秩次距(-1,-2,…,2),因而需求得-1个最小显著极差(),分别作为判断具有相应秩次距的平均数的极差是否显著的标准。

因为法是一种极差检验法,所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。

*法克服了法的不足,但检验的工作量有所增加。常用的法有检验法和新复极差法两种。

1.检验法(q test)此法是以统计量的概率分布为基础的。值由下式求得:

                  (6-17)

式中,ω为极差,为标准误,分布依赖于误差自由度dfe及秩次距k。

利用检验法进行多重比较时,为了简便起见,不是将由(6-17)式算出的值与临界比较,而是将极差与比较,从而作出统计推断。即为α水平上的最小显著极差。

                    (6-18)

当显著水平=0.05和0.01时,从附表5(值表)中根据自由度及秩次距查出代入(6-18)式得

                  (6-19)

实际利用检验法进行多重比较时,可按如下步骤进行:

(1)列出平均数多重比较表;

(2)由自由度、秩次距查临界值,计算最小显著极差0.05,k,0.01,k;

(3)将平均数多重比较表中的各极差与相应的最小显著极差0.05,k, 0.01,k比较,作出统计推断。

对于6.1,各处理平均数多重比较表同表6-3。在表6-3中,极差1.54、1.68、3.22的秩次距为2;极差3.22、4.90的秩次距为3;极差6.44的秩次距为4。

因为,=5.34,故标准误

根据=16,=2,3,由附表5查出0.05、0.01水平下临界值,乘以标准误求得各最小显著极差,所得结果列于表6-4。 

表6-4 q值及LSR值                                           

 

dfe

 

 

秩次距k

 

 

q0.05

 

 

q0.01

 

 

LSR0.05

 

 

LSR0.01

 

 

16

 

 

2

 

 

3.00

 

 

4.13

 

 

3.099

 

 

4.266

 

 

3

 

 

3.65

 

 

4.79

 

 

3.770

 

 

4.948

 

 

4

 

 

4.05

 

 

5.19

 

 

4.184

 

 

5.361

 

将表6-3中的极差1.541.683.22与表5.4中的最小显著极差3.0994.266比较;将极差3.224.903.7704.948比较;将极差6.444.1845.361比较。检验结果,除A4 A3的差数3.22LSD法比较时的差异显著变为差异不显著外,其余检验结果同法。

2.新复极差法(new multiple range method)此法是由邓肯(Duncan)于1955年提出,故又称Duncan法,此法还称SSR法(shortest significant ranges)。

新复极差法与检验法的检验步骤相同,唯一不同的是计算最小显著极差时需查表(附表6)而不是查值表。最小显著极差计算公式为

                  (6-20)

其中是根据显著水平、误差自由度、秩次距,由表查得的临界值,=0.05和=0.01水平下的最小显著极差为:

                 (6-21)

对于例6.1,各处理均数多重比较表同表6-3。已算出=1.033,依=16, =2,3,4,由附表6查临界0.05(16,k)和0.01(16,k)值,乘以=1.033,求得各最小显著极差,所得结果列于表6-5。 

表6-5 SSR值与LSR值                                               

 

dfe

 

 

秩次距k

 

 

SSR0.05

 

 

SSR0.01

 

 

LSR0.05

 

 

LSR0.01

 

 

2

 

 

3.00

 

 

4.13

 

 

3.099

 

 

4.266

 

 

16

 

 

3

 

 

3.15

 

 

4.34

 

 

3.254

 

 

4.483

 

 

4

 

 

3.23

 

 

4.45

 

 

3.337

 

 

4.597

 

将表6-3中的平均数差数(极差)与表6-5中的最小显著极差比较,检验结果与检验法相同。当各处理重复数不等时,为简便起见,不论法还是法,可用(6-22)式计算出一个各处理平均的重复数n0,以代替计算所需的n

                  (6-22)

式中为实验的处理数,(i=1,2,…,k)为第处理的重复数。

以上介绍的三种多重比较方法,其检验尺度有如下关系:

*法≤新复极差法≤检验法

当秩次距=2时,取等号;秩次距≥3时,取小于号。在多重比较中,*法的尺度最小,检验法尺度最大,新复极差法尺度居中。用上述排列顺序前面方法检验显著的差数,用后面方法检验未必显著;用后面方法检验显著的差数,用前面方法检验必然显著。一般地讲,一个实验资料,究竟采用哪一种多重比较方法,主要应根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。如果否定正确的H0是事关重大或后果严重的,或对实验要求严格时,用检验法较为妥当;如果接受一个不正确的H0是事关重大或后果严重的,则宜用新复极差法。生物实验中,由于实验误差较大,常采用新复极差法;F检验显著后,为了简便,也可采用*法。

(三)多重比较结果的表示法各平均数经多重比较后,应以简明的形式将结果表示出来,常用的表示方法有以下两种。

1.三角形法方法是在平均多重比较表上直接标记多重比较,如表6-3所示。由于多重比较表中的每个平均差异形成三角形阵列,因此称为三角形方法。这种方法的优点是简单直观,缺点是占用篇幅较大。

2.标记字母法此法是先将各处理平均数由大到小自上而下排列;然后在最大平均数后标记字母,并将该平均数与以下各平均数依次相比,凡差异不显著标记同一字母,直到某一个与其差异显著的平均数标记字母;再以标有字母的平均数为标准,与上方比它大的各个平均数比较,凡差异不显著一律再加标,直至显著为止;再以标记有字母的最大平均数为标准,与下面各未标记字母的平均数相比,凡差异不显著,继续标记字母,直至某一个与其差异显著的平均数标记;如此重复下去,直至最小一个平均数被标记比较完毕为止。这样,各平均数间凡有一个相同字母的即为差异不显著,凡无相同字母的即为差异显著。用小写拉丁字母表示显著水平=0.05,用大写拉丁字母表示显著水平=0.01。在利用字母标记法表示多重比较结果时,常在三角形法的基础上进行。此法的优点是占篇幅小,在科技文献中常见。

对于例6.1,现根据表6-3所表示的多重比较结果用字母标记如表6-6所示(用新复极差法检验,表6-6中A4与A3的差数3.22在=0.05的水平上不显著,其余的与LSD法同)。 

表6-6 多重比较结果的字母标记(SSR法)                                       

 

处理

 

 

平均数

 

 

=0.05

 

 

=0.01

 

 

A1

 

 

31.18

 

 

a

 

 

A

 

 

A4

 

 

27.96

 

 

b

 

 

AB

 

 

A2

 

 

26.28

 

 

b

 

 

B

 

 

A3

 

 

24.74

 

 

b

 

 

B

 

在表6-6中,先将各处理平均数由大到小自上而下排列。当显著水平=0.05时,先在平均数31.18行上标记字母;由于31.1827.96之差为3.22,在=0.05水平上显著,所以在平均数27.96行上标记字母b;然后以标记字母b的平均数27.96与其下方的平均数26.28比较,差数为1.68,在=0.05水平上不显著,所以在平均数26.28行上标记字母b;再将平均数27.96与平均数24.74比较,差数为3.22,在=0.05水平上不显著,所以在平均数24.74行上标记字母b。类似地,可以在=0.01将各处理平均数标记上字母,结果见表6-6q检验结果与SSR法检验结果相同。

由表6-6看到,A1饲料对鱼的平均增重极显著地高于A2和A3饲料,显著高于A4饲料;A4、A2、A3三种饲料对鱼的平均增重差异不显著。四种饲料其中以A1饲料对鱼的增重效果最好。

应当注意,无论采用哪种方法表示多重比较结果,都应注明采用的是哪一种多重比较法。