课程门户-章节详情

梅步俊梁永厚吴志红

1 绪论
- 1.1 生物统计学发展史
- 1.2 学习生物统计学的必要性
- 1.3 常用术语和基本概念
- 1.4 R软件的介绍
- 1.5 进一步阅读的文献
- 1.6 习题
2 资料的描述性统计分析
- 2.1 位置测度
- 2.2 离散性测度
- 2.3 R软件的应用
- 2.4 习题
3 随机变量与概率分布
- 3.1 随机变量
- 3.2 概率分布
- 3.3 二维随机变量
- 3.4 正态分布
- 3.5 一些重要的概率分布
- 3.6 R软件的应用
- 3.7 习题
4 参数估计方法
- 4.1 估计量的评价准则
- 4.2 点估计
- 4.3 区间估计
- 4.4 R软件的应用
- 4.5 习题
5 统计假设测验
- 5.1 假设检验的基本问题
- 5.2 统计检验的基本步骤
- 5.3 抽样分布
- 5.4 样本平均数与总体平均数差异显著性检验
- 5.5 两个样本平均数的差异显著性检验
- 5.6 百分数资料差异显著性检验
- 5.7 总体参数的区间估计
- 5.8 非参数检验
- 5.9 R软件的应用
- 5.10 习题
6 方差分析
- 6.1 单因素方差分析
- 6.2 多重比较
- 6.3 多因素方差分析
- 6.4 方差分析需要满足的条件
- 6.5 习题
7 协方差分析
- 7.1 协方差分析概述
- 7.2 协方差分析的基本原理
- 7.3 协方差分析的计算过程
- 7.4 R软件的应用
- 7.5 习题
8 相关与回归分析
- 8.1 变量之间的相互关系
- 8.2 直线相关
- 8.3 回归分析的性质
- 8.4 一元正态线性回归统计模型
- 8.5 多元线性回归统计模型
- 8.6 自变量的选择与逐步回归
- 8.7 曲线回归
- 8.8 应用直线回归与相关的注意事项
- 8.9 R软件的应用
- 8.10 习题
9 实验设计
- 9.1 实验设计概述
- 9.2 生物实验计划
- 9.3 完全随机设计
- 9.4 随机单位组设计
- 9.5 拉丁方设计
- 9.6 交叉设计
- 9.7 正交设计
- 9.8 R软件的应用
- 9.9 习题
10 附件
- 10.1 复习题

估计量的评价准则

第四章参数估计方法

学习要求：

理解点估计的概念，掌握矩法、最小二乘法、极大似然法。了解估计量的评选标准（无偏性、有效性、一致性）。理解区间估计的概念，会求单个正态总体的均值与方差的置信区间，会求两个正态总体的均值差与方差比的置信区间。

参数估计（parameter estimation）方法主要适用于我们所知的总分布类型，但一个或几个重要参数是未知的。因此，只要我们通过对样本进行抽样来得到这些参数的估计值，我们就可以确定总体分布。如血球计数或水样中细菌计数，我们知道它的分布应该是泊松分布，所以问题是通过样本确定其参数λ；例如，如果我们想研究某个种群的高度，一般来说这个高度服从正态分布，我们需要从样本中确定两个参数μ和σ2。当然，也有一些我们对整体分布不感兴趣的情况，只要我们知道它的一个或两个重要参数，如均值和方差当然也可以使用参数估计。

参数估计可以分为两种，一种称为点估计(point estimation)，另一种是利用样本构造一个统计量，作为总体参数的估计。因此，只要测量一组样本的值，就可以通过代入统计公式来获得总体参数的估计值。另一种方法称为区间估计（interval estimation），它给出了一系列值，并给出了我们关心的整体参数落入该范围的概率。这个值的范围称为置信区间，并且总体参数落入该范围的概率称为置信度。

第一节估计量的评价准则

估计参数估计的准则（Evaluation Rule of Estimator）：参数估计可以以不同的方式使用，后文引入矩法，最小二乘法和最大似然法，并且不同的参数估计量（parameter estimator）可以是通过使用不同的方法获得。各种估计各有其优点。对于均匀分布的Ｕ[]，参数的矩估计与最大似然估计的矩估计不同，即使同样的方法也可能得到不同的统计量。

例4.1设总体服从参数为的泊松分布，即

则易知，，分别用样本均值和样本方差取代和，于是得到的两个矩估计量。

由于估算结果往往不是唯一的，各估计值各有什么优势？首先有一个标准问题。评估标准主要是无偏性、有效性、最小方差性等。

1.无偏性（Unbiased）

定义4.1 设=是的一个估计量，若对任意的，都有，则称是的无偏估计量（Unbiased estimator），如果

则称是的渐近无偏估计量（Approximationunbiased estimator），其中称为是的偏差（affect）。

无偏性体现了估计量在真相周围摆动的程度，显然我们希望估计值具有无偏性。

例4.2 是总体期望值的无偏估计，因为

例4.3 不是总体方差的无偏估计，因为注意到

．

故

但

因此是渐近无偏估计。在的基础上，我们适当加以修正可以得到一个的无偏估计，这个估计量也和样本方差一样是经常被采用的：

由此例也可以看出，例4.1中关于的两个矩估计量中，是无偏的，；而是有偏的，.

评估的利弊评估，一般是站在概率论的基础上，在实际应用中包括多次使用这种方法的效果的问题。对于无偏性，情况也是如此，即在实际应用问题中，如果使用此估计值计算多个估计值，则其平均值可能接近估计参数的值。这有时是有意义的，例如，如果制造商长时间向供应商提供产品，并且在产品的测试方法中，双方同意使用样品来估计缺陷产品。如果这个估计是没有偏差的，那么双方都应该能够接受它。例如，这次估计的不合格率很高，制造商遭受损失，但下一次估计可能较低，制造商的损失可以弥补，因为双方之间的交易次数很多，采用无偏估计，一般而言，是相互排斥的。但不幸的是，无偏性有时几乎没有什么实际意义。有两种情况，一种情况是在没有多重抽样的一类实际问题中，比如前面的例子，供应商和分销商没有长期的合作关系，纯粹是一次性的商业行为，双方都不能承担损失，没有什么“平均”说。另一个原因是估计量实际上没有相互补偿，因此“平均”没有实际意义，例如，通过测试某种导弹的系统误差来估计，即使这个估计是无偏的，但如果估计这组导弹的系统误差实际上估计是偏左的，下一批导弹估计是右边的，结果，两批导弹在使用中无法击中预定目标，也没有“左”和“右”，“正确性的”相互抵消或“平均命中”的问题。

我们也可以举出统计数字的例子来说明无偏性的局限性。

例4.4 设服从参数为的泊松分布，为的样本，用作为的估计，则此估计是无偏的。因为