生物统计附试验设计

梅步俊 梁永厚 吴志红

目录

  • 1 绪论
    • 1.1 生物统计学发展史
    • 1.2 学习生物统计学的必要性
    • 1.3 常用术语和基本概念
    • 1.4 R软件的介绍
    • 1.5 进一步阅读的文献
    • 1.6 习题
  • 2 资料的描述性统计分析
    • 2.1 位置测度
    • 2.2 离散性测度
    • 2.3 R软件的应用
    • 2.4 习题
  • 3 随机变量与概率分布
    • 3.1 随机变量
    • 3.2 概率分布
    • 3.3 二维随机变量
    • 3.4 正态分布
    • 3.5 一些重要的概率分布
    • 3.6 R软件的应用
    • 3.7 习题
  • 4 参数估计方法
    • 4.1 估计量的评价准则
    • 4.2 点估计
    • 4.3 区间估计
    • 4.4 R软件的应用
    • 4.5 习题
  • 5 统计假设测验
    • 5.1 假设检验的基本问题
    • 5.2 统计检验的基本步骤
    • 5.3 抽样分布
    • 5.4 样本平均数与总体平均数差异显著性检验
    • 5.5 两个样本平均数的差异显著性检验
    • 5.6 百分数资料差异显著性检验
    • 5.7 总体参数的区间估计
    • 5.8 非参数检验
    • 5.9 R软件的应用
    • 5.10 习题
  • 6 方差分析
    • 6.1 单因素方差分析
    • 6.2 多重比较
    • 6.3 多因素方差分析
    • 6.4 方差分析需要满足的条件
    • 6.5 习题
  • 7 协方差分析
    • 7.1 协方差分析概述
    • 7.2 协方差分析的基本原理
    • 7.3 协方差分析的计算过程
    • 7.4 R软件的应用
    • 7.5 习题
  • 8 相关与回归分析
    • 8.1 变量之间的相互关系
    • 8.2 直线相关
    • 8.3 回归分析的性质
    • 8.4 一元正态线性回归统计模型
    • 8.5 多元线性回归统计模型
    • 8.6 自变量的选择与逐步回归
    • 8.7 曲线回归
    • 8.8 应用直线回归与相关的注意事项
    • 8.9 R软件的应用
    • 8.10 习题
  • 9 实验设计
    • 9.1 实验设计概述
    • 9.2 生物实验计划
    • 9.3 完全随机设计
    • 9.4 随机单位组设计
    • 9.5 拉丁方设计
    • 9.6 交叉设计
    • 9.7 正交设计
    • 9.8 R软件的应用
    • 9.9 习题
  • 10 附件
    • 10.1 复习题
生物统计学发展史

第一章 绪论

学习要求: 

本章简要介绍了生物统计学的主要内容,目的是为了使学生了解生物统计学的发展史、常用术语、基本概念、学习生物统计学的必要性和意义等;同时,介绍了国内外具有代表性的优秀生物统计学参考书,以供学有余力的学生使用。 

      

      生物统计学(biostatistics,biometry,biometrics),一些学者也称其为生物计量学,是以数理统计学原理和方法为基础,或称其为应用于生物学中的数理统计方法。本学科用数理统计的基本原理和方法,分析和解释生命现象的种种原因和数据资料,试图解释其规律和本质特征。现代生物统计学注重其理论和方法在生命科学研究领域的实际应用,并利用现代计算理论和手段,使许多统计计算过程得以简化,并提高其计算速度、效率和结果的可靠性。因为这门属于应用统计学的学科易于广大生物学研究者掌握、注重实践性、借助于计算机软件抽象的统计学方法使用方便,所以该学科逐渐成为生命科学领域的一门重要分支学科,越来越得到广大研究者的重视。

      现代生物统计学包括以下几大任务:收集数据、整理数据、分析数据、解释数据、调查或实验设计、生物统计学计算机程序的开发和利用等。生物科学实验或调查研究的目的是试图从大量的同类生物学观测现象中揭示其内在的规律性,往往需要观测记录大量数据资料,而且“大P小N”数据越来越普遍。经验表明,实验数据往往包含一定程度的变异性,例如,畜牧兽医研究中,在相同条件下饲养的同年龄、同性别的肉羊,它们的身高、体重、生产性能等数值都会有一定程度的变异;同一种饲料、饲喂初始条件相同的仔猪,一段时间内仔猪的增重也不会完全相同;同一种药物治疗若干头患有同一种疾病的家畜、家禽,其药物反应也不一定完全相同等。对这些现象的分析和解释都需要应用生物统计学知识。另一方面,在实验或调查研究中,实验设计方案是否合理直接影响发现的事物规律性的可靠性。只有科学合理的实验设计,才能从所获得的实验观测数据中提取出有用的信息,从而对生命现象得出正确的解释。随着生物学的发展,数据量和数据维数急剧增长,传统生物统计学分析方法已经不能满足实际需要,新的生物数据分析思想、方法和手段层出不穷,很多情况下没有现成的软件可以使用,开发适用于特定生物学问题的计算机软件或程序,也日益成为学习生物统计学的必要内容。

第一节  生物统计学发展史

      在古代,人类的祖先生存下来,因为生活的需要,他们必须了解生命的数量,获得多少猎物,并进行公平分配,从而开始绘制编年史,绳索定型。我们认为它是人类生物统计史上的最初阶段。17世纪初,英国资产阶级革命爆发,伴随着各阶层社会的思想解放,统计方法逐渐融入生命科学研究领域,统计学成为人类认识生命现象的有力武器。英国科学家约翰格兰特(John graunt,1620-1674),威廉派(William patty,1623-1687)和爱德蒙哈雷(Edmund halley,1656-1742)将数理统计方法引入到生物学研究中,被称为生物统计学初始创始人。

      在1733年,阿伯拉罕·迪摩弗(Abraham Demoivre,1667-1754)发现了正态曲线方程,它是由高斯(Gauss)开发的“高斯”曲线,也称为高斯分布,并创建了生物统计学理论的正态分布,生物统计学的创始人是高尔登(Francis Galton,1822-1911)。同时,他在数据收集方面研究非常广泛,为了使他的遗传理论更加准确,引入了中位数(median),百分位数(percentile),四分位数(Quartile),四分位差(Quartile deviation)及分布、重要的统计概念和方法,如分布,相关和回归。1901年,高尔登和皮尔逊在Biometrika期刊首次提出了他们用于的统计方法学术语“生物统计学”(biometry)。由于高尔登的重要贡献,后人推祟他成为生物统计学的创始人。

      1899年,高尔登的学生皮尔逊(Karl pearson,1857-1936)提出了一个指数卡方(),它测量了实际数与理论数之间的偏差,并发明了卡方检验,该方法广泛用于定性统计分析。皮尔逊进一步发展了“关联”和“回归”,这些名词已被推广为一般统计方法论的重要概念。皮尔逊还提出了复相关,总相关和相关比的概念,它不仅发展了高尔登的理论,而且为其建立了数学基础。他还创建了生物统计学期刊(Biometrics)和数理统计学院,为生物统计学的发展作出贡献。神父孟(Gregor Johann Mendel,1822—1884),前身为一位不知名的神父,在邻居眼中是一个整天摆弄豌豆的“怪人”,他的手稿被他的继任者烧毁。1866年,孟德尔在布鲁恩自然科学研究所发表了一篇名为“植物杂交实验”的论文,该论文将遗传学和统计学相结合,为遗传学作出了卓越的贡献。哥塞特(Gregor Johann,1886-1937)是皮尔逊的学生。他发现大样本理论不能用于获得他所关心的一些统计数据。1908年,以“学生”(Student)为笔名在《生物统计学报》上发表“平均概率误差”,提出了“学生T检验”的基础。这种测试方法已经成为生物统计的基本工具,并且被广泛使用。

      在20世纪20年代,英国统计学家费希尔·艾菲(Ronald a Fisher,1890-1962)在伦敦附近的Rothamsted农业实验站建立了实验设计方法和统计分析技术。他创建了一个抽样分布,假定了无限的总体,一些重要的理论和方法,如随机实验设计和方差分析,已经找到了许多抽样统计量的准确分布,并提出了最大似然法并将其用于假设检验,提出“假设无限集体”这一重要概念,为小样本统计方法作出贡献,被誉为现代统计学的奠基人之一。在实验研究中统计方法专著首次发表后,提出了现场实验的基本原理和主要设计方法,并成为实验设计的经典之作。

      J.纳耶曼(J Neyman)和E.S.皮尔逊(E S Pearson)分别在1936和1938年提出了统计假设检验的理论,对于促进理论研究和实验研究的结论具有重要的现实意义。

      英国计算机学会主席耶茨(Yates,1902-1994)发明了“Yates校正”公式进行测试。他强烈主张统计人员使用计算机,他说:“好的理论统计学家必须学会计算并需要最好的计算工具。”

      早在20世纪30年代,生物统计学和田间实验已成为农学的必修课程。最早出版的书籍是王经的《实用生物统计法》(1935年出版,1953年再版)。1945年,吴仲贤教授在成都讲授高级遗传学,同时将生物学统计学作为研究变异的统计方法。在饲养研究中,设计并分析了饲养实验。随后将测试用于兽药测试。进入20世纪70年代后,新的教学计划设置了《生物统计附实验设计》已成为畜牧兽医学两专业的必修课。