第二节 抽样分布
一、抽样分布的概念
总体分布是指总体内个体数值的频数分布
样本分布是指样本内个体数值的频数分布
抽样分布是指某种统计量的概率分布
二、平均数抽样分布的几个定理
1、从总体中随机抽取容量为n的一切可能样本的平均数之平均数等于总体平均数。
2、容量为n的样本平均数在抽样分布上的标准差,等于总体标准差除以n的平方根。
3、从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。
4、虽然总体不呈正态分布,如果样本容量较大,反映总体μ和ρ的样本平均数的抽样分布,也接近于正态分布。
以上四条定理,反映了样本平均数抽样分布的形态,一切可能样本平均数与总体平均数之间的关系,一切可能样本平均数的标准差与总体标准差的关系。
当总体标准差已知时,平均数抽样分布的标准差与样本容量n的平方根成反比,即样本容量n越大,平均数抽样分布的标准差越小,当样本容量n确定时,平均数抽样分布的标准差与总体标准差成正比,即总体内个体数值离散程度越大,平均数抽样分布的标准差越大。
三、样本平均数抽样分布的形态
总体标准差已知:
从正态总体中随机抽取的容量为n的一切可能样本平均数为中心呈正态分布。当总体标准差已知时,将样本平均数转化为标准记分,则一切可能样本平均数的标准记分呈标准正态分布。
总体标准差在一般情况下是未知:
这是需要用样本标准差来估计。数理统计已证明,样本标准差往往低估了总体标准差σ。
总体标准差σ的无偏估计量S等于样本统计量σx乘以贝赛耳氏校正数,公式。
从正态总体中随机抽取容量为n的一切可能样本平均数的抽样分布呈正态分布。当总体标准差σ未知,需用估计值S来代替,于是平均数标准误也被平均数标准误的估计值所代替,这时一切可能样本平均数的标准记分呈t分布(公式4.6)。
当用S去估计σ时,样本平均数的抽样分布服从t 分布。
(样本平均数的抽样分布)
t分布是一簇分布, 当自由度df 不同,则t分度就不同. 当df 趋于无限大时, t分布就与正态分布重合了。t分布的峰狭窄尖峭,尾长且翘的高,在基线上分布的范围广。自由度越小,分布范围越大。当自由度逐渐增大时,t分逐渐接近正态分布。
df:指所抽取的样本中能独立变化的数据个数,随限制因子的个数而变化。
t分布表的使用:t分布表见教材附表 , 它有单侧与双侧之分。
中央面积为0.95不同自由度t的临界值
自由度 | 2 | 4 | 6 | 20 | 30 | 无穷大 |
t值 | ±4.30 | ±2.78 | ±2.45 | ±2.09 | ±2.04 | ±1.96 |

