【延伸】
什么是无偏估计?
•简单地说就是,样本均值的期望等于总体均值。
例子:现在甲市有一万名学生,进行了一次统考,考试成绩服从1~100的均匀分布:1号学生得1分,2号学生得1.01分…10000号学生得100分。那么他们的平均分是多少?(1+1.01+1.02+....+100)/10000=50.5,这个值叫做总体平均数。
现在假定你是教委的一个基层人员,教委主任给你一个早上时间,让你估算一下全市学生的平均成绩,你怎么办?把全市一万名学生都问一遍再计算时间显然是来不及了,因此在有限的时间里,你找到了一个聪明的办法:给全市的78所小学每一所学校打了一个电话,让他们随机选取一名学生的成绩报上来,这样你就得到了78个学生的成绩,这78个学生就是你的样本。
你现在的任务很简单了,拿这78个学生的成绩相加并除以78,你就得到了样本平均数。
你把这个数报告给教委主任,这个数就是你估算出来的全市平均成绩。
这个样本平均数会不会等于总体平均数50.5?很显然这和你的“手气”有关——不过大多数情况下是不会相等的。
那么问题来了:既然样本平均数不等于总体平均数,要它还有用吗?有!因为样本平均数是总体平均数的无偏估计。你这种估算方法没有系统上的偏差,而产生误差的原因只有一个:随机因素(也就是你的手气好坏造成的)。