生物统计附试验设计

梅步俊 梁永厚 吴志红

目录

  • 1 绪论
    • 1.1 生物统计学发展史
    • 1.2 学习生物统计学的必要性
    • 1.3 常用术语和基本概念
    • 1.4 R软件的介绍
    • 1.5 进一步阅读的文献
    • 1.6 习题
  • 2 资料的描述性统计分析
    • 2.1 位置测度
    • 2.2 离散性测度
    • 2.3 R软件的应用
    • 2.4 习题
  • 3 随机变量与概率分布
    • 3.1 随机变量
    • 3.2 概率分布
    • 3.3 二维随机变量
    • 3.4 正态分布
    • 3.5 一些重要的概率分布
    • 3.6 R软件的应用
    • 3.7 习题
  • 4 参数估计方法
    • 4.1 估计量的评价准则
    • 4.2 点估计
    • 4.3 区间估计
    • 4.4 R软件的应用
    • 4.5 习题
  • 5 统计假设测验
    • 5.1 假设检验的基本问题
    • 5.2 统计检验的基本步骤
    • 5.3 抽样分布
    • 5.4 样本平均数与总体平均数差异显著性检验
    • 5.5 两个样本平均数的差异显著性检验
    • 5.6 百分数资料差异显著性检验
    • 5.7 总体参数的区间估计
    • 5.8 非参数检验
    • 5.9 R软件的应用
    • 5.10 习题
  • 6 方差分析
    • 6.1 单因素方差分析
    • 6.2 多重比较
    • 6.3 多因素方差分析
    • 6.4 方差分析需要满足的条件
    • 6.5 习题
  • 7 协方差分析
    • 7.1 协方差分析概述
    • 7.2 协方差分析的基本原理
    • 7.3 协方差分析的计算过程
    • 7.4 R软件的应用
    • 7.5 习题
  • 8 相关与回归分析
    • 8.1 变量之间的相互关系
    • 8.2 直线相关
    • 8.3 回归分析的性质
    • 8.4 一元正态线性回归统计模型
    • 8.5 多元线性回归统计模型
    • 8.6 自变量的选择与逐步回归
    • 8.7 曲线回归
    • 8.8 应用直线回归与相关的注意事项
    • 8.9 R软件的应用
    • 8.10 习题
  • 9 实验设计
    • 9.1 实验设计概述
    • 9.2 生物实验计划
    • 9.3 完全随机设计
    • 9.4 随机单位组设计
    • 9.5 拉丁方设计
    • 9.6 交叉设计
    • 9.7 正交设计
    • 9.8 R软件的应用
    • 9.9 习题
  • 10 附件
    • 10.1 复习题
拉丁方设计

第五节 拉丁方设计 

“拉丁方”这个名字最初由R.A.Fisher提供。拉丁方设计(latinsquare design)是从水平和垂直两个方向进行的双重局部控制,使水平和垂直两列成为一个单位组,这是一个随机单位组的多个单位组设计。在拉丁方设计中,每行或每列变成一个完整的单位组,并且每个处理每行或每列只发生一次,即在拉丁设计中,实验处理的数量=垂直组中的单位数= 直列单位的数量=实验处理的重复次数。在对拉丁方设计实验结果的统计分析中,拉丁方设计的实验误差小于随机单位组的实验误差,并且实验精度高于随机单位组,因为它可以将来自水平和直排两个单位组的实验误差的变化。

一、拉丁方简介

1.拉丁方  以n个拉丁字母A,B,C……,为元素,作一个n阶方阵,若这n个拉丁方字母在这n阶方阵的每一行、每一列都出现、且只出现一次,则称该n阶方阵为n×n阶拉丁方。

       例如:                         

 

A  B

 

 

B  A

 

 

B  A

 

 

A  B

 

为2×2阶拉丁方,2×2阶拉丁方只有这两个。

A    B     C

B    C     A

C    A     B

为3×3阶拉丁方。

第一行的拉丁方和自然顺序的第一列拉丁字母称为标准拉丁方。3x3标准拉丁方仅有1个以上,4x4标准拉丁方有4种,5x5标准拉丁方有56种。如果您转换标准类型的行或列,则可以获得更多类型的拉丁方格。在拉丁方设计的过程中,我们可以随机选择一个拉丁方格,或者选择一个标准类型,然后随机使用它来改变列的顺序。

2.常用拉丁方  在动物实验中,最常用的有3×3,4×4,5×5,6×6阶拉丁方。下面列出部分标准型拉丁方,供进行拉丁方设计时选用。其余拉丁方可查阅数理统计表及有关参考书。                                                 

 

3×3

 

 

4 × 4

 




 

(1)

 

 

(2)

 

 

(3)

 

 

(4)

 

 

A

 

B

 

C

 

 

B

 

C

 

A

 

 

C

 

A

 

B

 

 

A

 

B

 

C

 

D

 

 

B

 

A

 

D

 

C

 

 

C

 

D

 

B

 

A

 

 

D

 

C

 

A

 

B

 

 

A

 

B

 

C

 

D

 

 

B

 

C

 

D

 

A

 

 

C

 

D

 

A

 

B

 

 

D

 

A

 

B

 

C

 

 

A

 

B

 

C

 

D

 

 

B

 

D

 

A

 

C

 

 

C

 

A

 

D

 

B

 

 

DC

 

B

 

A

 

 

A

 

B

 

C

 

D

 

 

B

 

A

 

D

 

C

 

 

C

 

D

 

AB

 

 

D

 

C

 

BA

 























5 × 5                                                                                                          

 

(1)

 

 

(2)

 

 

(3)

 

 

(4)

 

 

A

 

B

 

C

 

D

 

E

 

 

B

 

A

 

D

 

E

 

C

 

 

C

 

E

 

A

 

B

 

D

 

 

D

 

C

 

E

 

A

 

B

 

 

E

 

D

 

B

 

C

 

A

 

 

A

 

B

 

C

 

D

 

E

 

 

B

 

A

 

E

 

C

 

D

 

 

C

 

D

 

B

 

E

 

A

 

 

D

 

E

 

A

 

B

 

C

 

 

E

 

C

 

D

 

A

 

B

 

 

A

 

B

 

C

 

D

 

E

 

 

B

 

A

 

E

 

C

 

D

 

 

C

 

E

 

D

 

B

 

A

 

 

D

 

C

 

A

 

E

 

B

 

 

E

 

D

 

B

 

A

 

C

 

 

A

 

B

 

C

 

D

 

E

 

 

B

 

A

 

D

 

E

 

C

 

 

C

 

D

 

E

 

B

 

A

 

 

D

 

E

 

A

 

C

 

B

 

 

E

 

C

 

B

 

A

 

D

 























 6 × 6                                           

 

A

 

B

 

C

 

D

 

E

 

F

 

 

B

 

F

 

D

 

A

 

C

 

E

 

 

C

 

D

 

E

 

F

 

A

 

B

 

 

D

 

C

 

F

 

E

 

B

 

A

 

 

E

 

A

 

B

 

C

 

F

 

D

 

 

F

 

E

 

A

 

B

 

D

 

C

 

二、拉丁方设计方法

在牲畜和水产品等动物实验中,如果我们想从两个方面来控制系统误差,并且实验动物的数量很少,那么经常使用拉丁方设计。下面是一个具体的例子来说明拉丁方设计方法。

例9.4为了研究5种不同温度对蛋鸡的影响,将5个鸡舍的温度设定为A,B,C,D,E,将鸡的产蛋期限分为5个鸡,而且不同鸡蛋的产蛋量对生产影响较大,所以采用拉丁方设计,以鸡和鸡蛋生产期为单位设置,以控制这两方面的制度误区。拉丁方的设计步骤如下:

(一)选择拉丁方应根据加工次数和行数和行数选择拉丁方,然后选择标准拉丁方的拉丁方或非标准拉丁方。这种情况是由于实验处理因素的温度,处理数量是5;直单位组数为5个,产蛋期与单位组相同,组数为5个,即实验处理数,直单位数,行中的单位是5,那么应该选择5x5的拉丁方。本例选取前面列出的第2个5× 5标准型拉丁方,即:

A  B   C   D   E

B  A   D   E   C

C  E   B   A   D

D  C   E   B   A

E  D   A   C   B

(二)随机排列 拉丁方被选中后,如果是非标准类型,则可以直接根据拉丁方的信函来安排实验程序。在标准的拉丁方中,水平,直线和实验处理的顺序应按照以下要求随机排列。

3x3标准拉丁方:随机排列的直排,然后随机排列的第二和第三个水平。

4x4标准拉丁方:随机选择4个标准拉丁方格之一,然后随机排列行和列过程。

以下是所选5x5标准拉丁方格的随机排列。先从随机数字表(Ⅰ)第22行,第8列第97行右连续转录3个5位数字,转录为“0”,“大于6”并重复数字,3位数字的转录为: 13542,41523,34521。上面选择的拉丁方格的5x5,行和处理然后随机重排3个五位数的顺序。

1.直排拉丁方在13542顺序排列的直列顺序排列。

2.在41523的顺序重排中,随机再次连续进行横向的拉丁方。                                                               

 

选择拉丁方

 


 

直列随机

 


 

横行随机

 

 

1

 

 

2

 

 

3

 

 

4

 

 

5

 



 

1

 

 

3

 

 

5

 

 

4

 

 

2

 








 

A

 

B

 

C

 

D

 

E

 

 

B

 

A

 

E

 

C

 

D

 

 

C

 

D

 

B

 

E

 

A

 

 

D

 

E

 

A

 

B

 

C

 

 

E

 

C

 

D

 

A

 

B

 


 

1

 

2

 

3

 

4

 

5

 

 

A

 

B

 

C

 

D

 

E

 

 

C

 

D

 

B

 

E

 

A

 

 

E

 

C

 

D

 

A

 

B

 

 

D

 

E

 

A

 

B

 

C

 

 

B

 

A

 

E

 

C

 

D

 


 

4

 

1

 

5

 

2

 

3

 

 

D


A


E


B


C

 

 

E

 

C

 

A

 

D

 

B

 

 

A

 

E

 

B

 

C

 

D

 

 

B

 

D

 

C

 

E

 

A

 

 

C

 

B

 

D

 

A

 

E

 

3.把5种不同温度按第三个5位数34521顺序排列   即:A=3,B=4,C=5,D=2,E=1,也就是说,在拉丁方中的A表示第3种温度,B表示第4种温度等,依次类推。从而得出5×5拉丁方设计,如表9-8所示。 

表9-8  5种不同温度对鸡产蛋量影响的拉丁方设计                         

 

产蛋期

 

 

鸡    群

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D(2)

 

A(3)

 

E(1)

 

B(4)

 

C(5)

 

 

E(1)

 

C(5)

 

A(3)

 

D(2)

 

B(4)

 

 

A(3)

 

E(1)

 

B(4)

 

C(5)

 

D(2)

 

 

B(4)

 

D(2)

 

C(5)

 

E(1)

 

A(3)

 

 

C(5)

 

B(4)

 

D(2)

 

A(3)

 

E(1)

 

注:括号内的数字表示温度的编号 

由表9-8可以看出,第一鸡群在第Ⅰ个产蛋期用第2种温度,第二鸡群在第Ⅰ个产蛋期用第1种温度,等等。实验应严格按设计实施。

三、实验结果的统计分析

拉丁方设计实验结果的分析,是将两个单位组因素与实验因素一起,按三因素实验单独观测值的方差分析法进行,但应假定3个因素之间不存在交互作用。将横行单位组因素记为A,直列单位组因素记为B,处理因素记为C,横行单位组数、直列单位组数与处理数记为r,对拉丁方实验结果进行方差分析的数学模型为:

 (i=j=k=1,2,…,r)       (9-3)                           

式中:μ为总平均数;为第i横行单位组效应;为第j直列单位组效应,                                        为第k处理效应。单位组效应通常是随机的,处理效应通常是固定的,且有为随机误差,相互独立,且都服从N(0,σ2)。

注意:k不是独立的下标,因为i、j一经确定,k亦随之确定。

平方和与自由度划分式为:

                      (9-4)

例9.4 的实验结果如表9-9所示。 

       表9-9  5种不同温度对母鸡产蛋量影响实验结果   (单位:个)                                           

 

产蛋期

 

 

鸡    群

 

 

横行和xi.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D(23)

 

A(22)

 

E(20)

 

B(25)

 

C(19)

 

 

E(21)

 

C(20)

 

A(25)

 

D(22)

 

B(20)

 

 

A(24)

 

E(20)

 

B(26)

 

C(25)

 

D(24)

 

 

B(21)

 

D(21)

 

C(22)

 

E(21)

 

A(22)

 

 

C(19)

 

B(22)

 

D(23)

 

A(23)

 

E(19)

 

 

108

 

105

 

116

 

116

 

104

 

 

直列和x.j

 

 

109

 

 

108

 

 

119

 

 

107

 

 

106

 

 

x..=549

 

注:括号内数字为产蛋量 

表9-10  各种温度(处理)的合计                       

 

温度

 

 

A

 

 

B

 

 

C

 

 

D

 

 

E

 

 

x(k)

 

 

 

116

 

23.2

 

 

114

 

22.8

 

 

105

 

21.0

 

 

113

 

22.6

 

 

101

 

20.2

 

现对表9-9资料进行方差分析。

1.计算各项平方和与自由度

矫正数        C=x2../r2=5492/52=12056.04

总平方和      SST=Σx 2ij(k)-C=232+212+……+192-12056.04

=12157-12056.04=100.96

横行平方和    SSA =Σx 2i./r-C

=(1082+1052+……+1042)/5-12056.04=27.36

直列平方和    SSB =Σx 2.j/ r -C

=(1092+1082+……+1062)/5-12056.04=22.16

处理平方和    SSC=Σx 2(K)/ r -C

=(1162+1142+……+1012)/5-12056.04=33.36

误差平方和    SSe= SS T- SS A- SS B- SSc

=100.96-33.36-27.36-22.16=18.08

总自由度      dfT= r 2-1=52-1=24

横行自由度    dfA= r-1=5-1=4

直列自由度    dfB= r-1=5-1=4

处理自由度    dfC= r-1=5-1=4

误差自由度    dfe=dfT-dfA-dfB-dfC=(r-1)( r-2)=(5-1)(5-2)=12

2.列出方差分析表,进行F检验 

表9-11  表9-9资料的方差分析表                                         

 

变异来源

 

 

SS

 

 

df

 

 

MS

 

 

F

 

 

F0.05

 

 

F0.01

 

 

横行间

 

直列间

 

温度间

 

误  差

 

 

27.36

 

22.16

 

33.36

 

18.08

 

 

4

 

4

 

4

 

12

 

 

6.84

 

5.54

 

8.34

 

1.50

 

 

4.56*

 

3.69*

 

5.56**

 

 

3.26

 

3.26

 

3.26

 

 

5.41

 

5.41

 

5.41

 

 

总变异

 

 

100.96

 

 

24

 




F检验,产蛋期间和鸡群间差异显著,温度间差异极显著。因在拉丁方设计中,横行、直列单位组因素是为了控制和降低实验误差而设置的非实验因素,所以即使显著一般也不对单位组间进行多重比较。下面对不同温度平均产蛋量间作进行多重比较。

3.多重比较

列出多重比较表,见表9-12。

表9-12  不同温度平均产蛋量多重比较表(q法)                       

 

温度

 

 

平均数

 

 

-20.2

 

 

-21

 

 

-22.6

 

 

-22.8

 

 

A

 

B

 

D

 

C

 

E

 

 

23.2

 

22.8

 

22.6

 

21.0

 

20.2

 

 

3.0*

 

2.6*

 

2.4*

 

0.8

 

 

2.2

 

1.8

 

1.6

 

 

0.6

 

0.2

 

 

0.4

 

温度平均数标准误为:

由dfe=12和k=2,3,4,5从q值表查得临界q值:q0.05和q0.01,并与相乘得值,列于表9-13。

表9-13  q值和LSR值表                       

 

dfe

 

 

k

 

 

q0.05

 

 

q0.01

 

 

LSR0.05

 

 

LSR 0.01

 

 

12

 

 

2

 

3

 

4

 

5

 

 

3.08

 

3.77

 

4.20

 

4.51

 

 

4.32

 

5.04

 

5.50

 

5.84

 

 

1.69

 

2.07

 

2.31

 

2.48

 

 

2.38

 

2.77

 

3.03

 

3.21

 

多重比较结果表明:温度A、B、D平均产蛋量显著地高于E,即第3、4、2种温度的平均产蛋量显著高于第1种温度的平均产蛋量,其余之间差异不显著。第1种和第5种温度平均产蛋量最低。

四、拉丁方设计的优缺点

(一)拉丁方设计的主要优点

1.精确性高  拉丁方设计在不增加实验单位的情况下,比随机单位组设计多设置了一个单位组因素,能将横行和直列两个单位组间的变异从实验误差中分离出来,因而实验误差比随机单位组设计小,实验的精确性比随机单位组设计高。

2.实验结果的分析简便

(二)拉丁方设计的主要缺点  因为在拉丁设计中,水平单位组编号,直行单位组编号,实验处理编号和实验处理复制编号必须相等,因此处理编号有一定限制。如果处理次数较少,则重复次数少,实验误差的自由度较小,影响实验的灵敏度;如果处理次数多,重复次数太多,并且有许多组的直接和垂直单位,这导致大量的实验工作,并且初始条件因此,拉丁方设计是一般用于5-8个加工实验。为了使估计误差的自由度不小于12,我们可以使用“复数拉丁方平面设计”,即相同的拉丁平方实验重复多次,并将实验数据合并分析以增加错误项目的自由度。

应该注意的是,在拉丁实验中,一些单位组因素,如奶牛泌乳阶段,每个实验因素的处理都应该在不同的阶段实施,如果前一阶段有残留效应,在实验后期阶段,将会产生系统误差并影响实验的准确性。此时应根据实际情况安排合适的实验间隔以消除残留影响。另外,应该注意的是,横向和纵向单位组因素与实验因素之间没有交互作用,否则拉丁方设计不能使用。