

关于t 分布的早期理论工作,是英国统计学家威廉 西利 戈塞特(WillamSealy Gosset)在1900年进行的。
t分布是小样本分布,小样本分布一般是指n<30。t分布适用于当总体标准差R未知时用样本标准差s代替总体标准差R,由样本平均数推断总体平均数以及2个小样本之间差异的显著性检验等。
从平均值为L、方差为R2的正态总体中抽取容量为n的一个样本,其样本平均数 t分布、2分布和F分布服从平均值为L,方差为R2 /n的正态分布,因此,t分布、2分布和F分布 。但是总体方差R2总是未知的,从而只能用s2来代替,
(1)如果n很大,那么,s2就是R2的一个较好的估计量, t分布、2分布和F分布仍然是一个近似的标准正态分布;
(2)如果n较小, s2常常与R2的差异较大,因此,统计量 t分布、2分布和F分布就不再是一个标准正态分布,而是服从t分布。
(一)t分布的性质
1、t分布是对称分布,且其均值为0。
2、当样本容量n较小时,t分布的方差大于1;当n增大到大于或等于30时,t分布的方差就趋近于1,t分布也就趋近于标准正态分布。
3、t分布是一个分布族,对于不同的样本容量都对应不同的分布,且其均值都为0。
4、与标准正态分布相比,t分布的中心部分较低,2个尾部较高。
5、变量t的取值范围在 t分布、2分布和F分布与t分布、2分布和F分布的博客之间。
(二)t分布的自由度
样本中独立观察值的个数(即样本容量)n减去1(由于样本要估计的总体参数的个数为1,即R2)。
如果用一个样本容量为n=20的样本估计总体平均数,那就要用14个自由度,以便选择适当的t分布。
(三) t分布表的使用
在使用t分布表时,必须同时具备置信度和自由度2 个条件。
置信度表示被估计的总体参数落入置信区间的概率。然而,t分布给出的是A值,即表示所估计的总体参数不落入置信区间的概率,或落入置信区间以外的可能性。 A的数值是由100%减去给定的置信度后得到的。查表时还要指定自由度。
t分布表使用的一个例子:
在99%的置信度下,对容量为14的样本作出一个估计。

