生物统计附试验设计

梅步俊 梁永厚 吴志红

目录

  • 1 绪论
    • 1.1 生物统计学发展史
    • 1.2 学习生物统计学的必要性
    • 1.3 常用术语和基本概念
    • 1.4 R软件的介绍
    • 1.5 进一步阅读的文献
    • 1.6 习题
  • 2 资料的描述性统计分析
    • 2.1 位置测度
    • 2.2 离散性测度
    • 2.3 R软件的应用
    • 2.4 习题
  • 3 随机变量与概率分布
    • 3.1 随机变量
    • 3.2 概率分布
    • 3.3 二维随机变量
    • 3.4 正态分布
    • 3.5 一些重要的概率分布
    • 3.6 R软件的应用
    • 3.7 习题
  • 4 参数估计方法
    • 4.1 估计量的评价准则
    • 4.2 点估计
    • 4.3 区间估计
    • 4.4 R软件的应用
    • 4.5 习题
  • 5 统计假设测验
    • 5.1 假设检验的基本问题
    • 5.2 统计检验的基本步骤
    • 5.3 抽样分布
    • 5.4 样本平均数与总体平均数差异显著性检验
    • 5.5 两个样本平均数的差异显著性检验
    • 5.6 百分数资料差异显著性检验
    • 5.7 总体参数的区间估计
    • 5.8 非参数检验
    • 5.9 R软件的应用
    • 5.10 习题
  • 6 方差分析
    • 6.1 单因素方差分析
    • 6.2 多重比较
    • 6.3 多因素方差分析
    • 6.4 方差分析需要满足的条件
    • 6.5 习题
  • 7 协方差分析
    • 7.1 协方差分析概述
    • 7.2 协方差分析的基本原理
    • 7.3 协方差分析的计算过程
    • 7.4 R软件的应用
    • 7.5 习题
  • 8 相关与回归分析
    • 8.1 变量之间的相互关系
    • 8.2 直线相关
    • 8.3 回归分析的性质
    • 8.4 一元正态线性回归统计模型
    • 8.5 多元线性回归统计模型
    • 8.6 自变量的选择与逐步回归
    • 8.7 曲线回归
    • 8.8 应用直线回归与相关的注意事项
    • 8.9 R软件的应用
    • 8.10 习题
  • 9 实验设计
    • 9.1 实验设计概述
    • 9.2 生物实验计划
    • 9.3 完全随机设计
    • 9.4 随机单位组设计
    • 9.5 拉丁方设计
    • 9.6 交叉设计
    • 9.7 正交设计
    • 9.8 R软件的应用
    • 9.9 习题
  • 10 附件
    • 10.1 复习题
随机变量

 第三章 随机变量与概率分布

学习要求: 

本章主要讲述随机变量,离散型随机变量及其分布律,连续型随机变量及其概率密度,分布函数,二维随机变量,边缘分布,条件分布,随机变量函数的分布及其应用等内容。 


为了研究随机现象并理解随机现象的统计规律,我们需要引入随机变量的概念及其分布。随机变量和概率分布是概率论的主要内容,是统计学的重要基础。随机变量的引入使得概率论向前迈进了一大步。随机变量可以量化随机实验产生的样本空间和随机事件,使概率论的数学工具更加丰富和强大。概率论的发展进入了一个新时期。在本章中,我们将讨论一维随机变量和多维随机变量及其分布,并讨论几种常用的分布。

第一节        随机变量 

随机变量(random variable)表示各种结果变量(所有可能的采样点)的随机现象(在某些情况下,并不总是出现相同的结果称为随机现象)。它的值是不可预测的,因为它受很多随机因素的影响,但这并不是说随机变量毫无规律,它的规律性就是其值的概率,也就是说,它的值服从某种特定的概率分布,所以我们也可以说随机变量是变量值的一定概率分布。随机变量的所有可能值构成一个总体。随机变量可以分为两类:连续随机变量(continuous random variable)和离散随机变量(discrete randomvariable)。连续的随机变量是一个随机变量,可取一定的范围内的任意值,而一个离散的随机变量是有限数量的可能值的一个随机变量。

例3.1 将一枚硬币抛三次,用X表示出现正面的次数。       

 

样本点

 

 

HHH    HHT   HTH   THH    HTT   THT   TTH   TTT

 

 

X的值

 

 

  3      2      2      2      1      1      1      0

 

例3.2 一射手连续射击4次,观察他是否击中目标的情况。用“1”表示击中,“0”表示未击中,X表示击中的次数。

S = {(x1,x2,x3,x4)| xi= 0,1;i = 1,2,3,4}

X = X(e)= x1 + x2 + x3 + x4

函数X = X(e)称为随机变量,它的定义域为S,值域为RX = {x1,x2,x3,x4}。

例3.3 对100头病畜用某种药物进行治疗,其可能结果是“0头治愈”、“1头治愈”、“2头治愈”、“…”、“100头治愈”。若用x表示治愈头数,则x的取值为0、1、2、…、100。

 例3.4 孵化一枚种蛋可能结果只有两种,即“孵出小鸡”与“未孵出小鸡”。若用变量x表示实验的两种结果,则可令x=0表示“未孵出小鸡”,x=1表示“孵出小鸡”。

例3.5 测定某品种猪初生重,表示测定结果的变量x所取的值为一个特定范围(a,b),如0.5-1.5kg,x值可以是这个范围内的任何实数。

事实上,随机变量是随测试结果而变化的量。所以可以说随机变量是随机测试结果的函数。

随机变量和普通实函数这两个概念是相互联系和有区别,它们都是从一个集合到另一个集合的映射,其主要区别在于:不做实验的普通实函数可以基于自变量的值确定函数的值,而在做实验之前随机变量的值是不确定的,只有在实验之后,才出现的结果。  

今后,在不必强调e时,常省去e,简记X = X(e)为X。常用大写字母X,Y,Z等表示随机变量,用小写字母x,y,z等表示随机变量的值。

随机变量有以下特征:

(1)随机变量的取值有一定的概率。

    如例3.1中

2)用随机变量可以方便地表示任何事件和事件的概率。

    如例3.1中{X = 2}表示事件A = {HHT,THH,HTH},

    {X≥3}表示事件B = {HHH},

例3.2中{X≤1}表示事件

    C = {X≤1} = {(0,0,0,0),(1,0,0,0),(0,1,0,0),(0,0,1,0),(0,0,0,1)}

    P{X≤1} = (1 – p)4+ 4(1 – p)3(p为射手的射中率)

引入随机变量后,我们可以用数字来描述随机现象,这样我们就可以用数学分析的结果进行更广泛的实验研究。