第三节 总体平均数的估计
一、总体参数估计的基本原理
根据样本统计量对相应总体参数所作的估计称为总体参数估计。
1、点估计
用某一样本统计量的值来估计相应总体参数的值称为总体参数的点估计。
无偏性
样本平均数就是总体平均数μ的无偏估计量。而样本标准差就是总体标准差的有偏估计量。但是将样本标准差乘以贝塞耳氏校正值之后,所得S就变成了总体标准差的无偏估计量。
有效性
方差小者有效性高,方差大者有效性低。、Md、Mo都是总体的无偏估计量,但是只有的一切可能样本值的方差最小。所以是总体有效性最高的估计量。
一致性
当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,这种统计量是总体参数的一致性估计量。样本平均数就是总体平均数的一致性估计量。样本标准差与S也都是总体标准差的一致性估计量。
2、区间估计
以样本统计量的抽样分布为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。
在一定置信水平上求出总体参数置信区间的上下限。
当总体标准差已知时,一切可能各样本平均数的标准记分
若以样本平均数对总体平均数的估计达到95%的可靠性,则Z在-1.96至1.96之间变动。有P(-1.96<Z<1.96)=0.95可得:
经过变形:
总体平均数μ有95%的可能性出现在至之间。或者说平均数不在这一范围的可能性只有5%。
这个区间称为平均数相对应于0.95概率的置信区间。
0.95称作平均数落在这一区间的置信水平。
补充:显著性水平就是对总体参数作估计时,可能犯错误的概率(用α表示)。
置信水平越高,Z值越大,置信区间越宽。但在一定置信水平的前提下,可以通过降低数据的离散程度(减小σ)或增大样本容量n来减小标准误的方法达到缩短置信区间的距离。
二、ρ已知条件下总体平均数的区间估计
当总体σ已知,总体呈正态分布,样本容量n无论大小,
或当总体σ已知,虽总体不呈正态分布,但样本容量较大(n>30)时。
样本平均数标准记分呈标准正态分布,总体平均数的置信区间可按Z分布,用已知σ计算。
例题:某种零件的长度服从正态分布。已知总体标准差σ=1.5厘米。从总体中抽取100个零件组成样本,测得它们的平均长度为10.00厘米。试估计在99%置信水平下,全部零件平均长度的置信区间。
解:因为总体标准差σ=1.5已知,所以的分布服从正态分布,即可用Z估计。所以,
所以,全部零件平均长度99%的可能在(9.61,10.39)范围内。
三、ρ未知条件下总体平均数的区间估计
当总体σ未知,总体呈正态分布,样本容量n无论大小,
或当总体σ未知,虽总体不呈正态分布,但样本容量较大(n>30)时。
样本平均数标准记分呈标准t分布,总体平均数的置信区间可按t分布,用已知σ的估计量S计算。
t(df)0.05 和t(df)0.01是某种自由度及显著性水平t的临界值。
所谓显著性水平就是对总体参数作估计时,可能犯错误的概率(用α来表示)
1、小样本的情况
例,从某校高一年级随机抽取11名学生,其计算机期末考试成绩分别为92、94、96、66、84、71、45、88、90、67、78。试估计该校高一学生计算机期末考试成绩总体平均数95%与99%的置信区间。
解:由原始数据可计算出:
则
又查表可得,
代入公式可得,
2、大样本的情况
当总体呈正态分布,总体σ未知时,无论样本容量大小,样本平均数的标准记分都呈t分布。
若样本容量较大(n>30),样本平均数的标准记分t分布接近标准正态分布。在这种抽样条件下对总体平均数进行区间估计时,可用正态分布近似处理。
例1,从某校抽取62名初二年级男生参加立定跳远,计算得平均成绩4514.75px,标准差为547px,试估计该校初二年级男生立定跳远成绩总体平均数的95%与99%的置信区间。

