-
1 教学内容
-
2 练习
-
3 案例
-
4 扩展学习
第四章 总体均数的估计
第一节 均数的抽样误差与标准误
抽样误差(sampling error)
由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。是不可避免的,但其大小可以通过样本统计量的抽样分布进行估计。
一、样本均数的抽样分布
计算机模拟实验1:
从m=4.5,s=0.2的正态总体中作随机抽样, 规定样本含量分别为5、10、20、50,各样本含量均重复抽取1 000次,得到4个不同样本含量的样本均数的抽样分布图。
当n=20时,随机抽取100个样本, 见以下两表。


图4.1 正态分布总体中样本均数的抽样分布


表4.2 100个样本均数的频数分布
组段 | 频数 | 频率(%) | 累计频率(%) |
4.38- | 1 | 1 | 1 |
4.40- | 1 | 1 | 2 |
4.42- | 3 | 3 | 5 |
4.44- | 7 | 7 | 12 |
4.46- | 10 | 10 | 22 |
4.48- | 26 | 26 | 48 |
4.50- | 22 | 22 | 70 |
4.52- | 13 | 13 | 53 |
4.54- | 8 | 8 | 91 |
4.56- | 3 | 3 | 94 |
4.58- | 5 | 5 | 99 |
4.60-4.62 | 1 | 1 | 100 |
合计 | 100 | 100 |
样本均数抽样分布的特点:
1. 各样本均数未必等于总体均数;
2. 样本均数之间存在差异;
3. 样本均数的分布很有规律,围绕着总体均数中间多两边少, 左右对称, 基本服从正态分布;
4. 样本均数的变异范围较原变量变异范围小;
5. 随着样本含量的增加,样本均数的变异范围逐渐缩小。
模拟实验2:从非正态总体中抽样,观察其样本均数的抽样分布。

图4.2 非正态总体的分布



图4.3 非正态总体中样本均数的抽样分布
从非正态总体中抽样,样本均数的抽样分布也基本具有上述特点,随着样本含量增大,样本均数的分布逐渐近似正态分布。
二、均数的标准误(
)
样本均数的标准差称为均数的标准误(standard error of mean,SEM),说明各样本均数围绕总体均数的离散程度,可用来描述样本均数的抽样误差大小。
样本均数的标准误:![]()
越大,样本均数的分布越分散,样本均数与总体均数的差别越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之,
越小,样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。
实际工作中,可通过适当增加样本含量来减少标准误,降低抽样误差。
均数标准误的估计值:![]()
仅进行一次抽样,得到一个样本均数和样本标准差,即可估计样本均数的抽样误差大小。
随机抽取某地正常成年男性200名,测得其血清胆固醇的均数为3.64 mmo1/L,标准差为1.20 mmol/L,试估计其抽样误差。


