目录

  • 1 绪论
    • 1.1 什么是教育统计学
    • 1.2 新建课程目录
    • 1.3 教育统计学中的几个基本概念
    • 1.4 练习题
  • 2 常用的统计表与统计图
    • 2.1 数据来源
    • 2.2 统计表
    • 2.3 统计图
  • 3 数据分布的特征量
    • 3.1 集中量
    • 3.2 差异量
    • 3.3 形态量
  • 4 概率与概率分布
    • 4.1 概率的一般概念
    • 4.2 二项分布
    • 4.3 正态分布
  • 5 抽样分布及总体平均数的推断
    • 5.1 抽样的基本概念及其方法
    • 5.2 抽样分布
    • 5.3 总体平均数的估计
    • 5.4 假设检验的基本原理
    • 5.5 总体平均数的显著性检验
  • 6 方差分析
    • 6.1 方差分析的基本原理
    • 6.2 独立样本的方差分析
    • 6.3 相关样本的方差分析
  • 7 χ2检验和非参数检验
    • 7.1 卡方检验
  • 8 相关与回归
    • 8.1 相关与回归
  • 9 实践项目1 SPSS数据文件的建立与编辑
    • 9.1 SPSS概述
    • 9.2 数据文件的建立
    • 9.3 数据文件的编辑
    • 9.4 数据文件的整理
  • 10 实践项目2 应用SPSS统计分析特征量
    • 10.1 Frequencies过程
    • 10.2 Descriptives过程
    • 10.3 crosstabs过程
  • 11 实践项目3 Reports和Tables菜单详解及实例应用
    • 11.1 Reports过程与Tables过程
  • 12 实践项目4 Compare Means菜单详解及实例应用
    • 12.1 One-Sample T Test
    • 12.2 Paired Sample T Test
    • 12.3 Independent Sample T Test
    • 12.4 ANOVA
  • 13 实践项目5 Correlate相关分析菜单详解及案例分析
    • 13.1 Correlate过程
    • 13.2 Crosstabs过程
  • 14 实践项目6  Regression菜单详解及案例分析
    • 14.1 线性回归
    • 14.2 曲线拟合
  • 15 统计学与SPSS
    • 15.1 认识统计学与SPSS
      • 15.1.1 课程介绍
      • 15.1.2 什么是统计学
      • 15.1.3 为什么要学习统计
      • 15.1.4 社会学研究的科学性
      • 15.1.5 社会调查资料的特性
      • 15.1.6 概率抽样的方法
      • 15.1.7 变量及变量层次
    • 15.2 单变量的统计描述
      • 15.2.1 分布、统计表、统计图
      • 15.2.2 集中趋势测量法
      • 15.2.3 离散趋势测量法
    • 15.3 概率及其运算
      • 15.3.1 概率
      • 15.3.2 概率分布、数学期望
      • 15.3.3 概率分布方差计算
    • 15.4 正态分布与极限定理
      • 15.4.1 正态分布
      • 15.4.2 标准正态分布
      • 15.4.3 标准正态分布表
      • 15.4.4 大数定理
      • 15.4.5 章节知识回顾
    • 15.5 参数估计
      • 15.5.1 统计推论之核心概念
      • 15.5.2 参数点估计
      • 15.5.3 区间估计之抽样分布
      • 15.5.4 区间估计
      • 15.5.5 区间估计的实际应用
      • 15.5.6 区间估计的实际应用2
    • 15.6 假设检验
      • 15.6.1 统计假设
      • 15.6.2 统计检验的相关概念
    • 15.7 单总体假设检验
      • 15.7.1 大样本总体均值检验步骤
      • 15.7.2 单总体的假设检验例题
      • 15.7.3 单总体假设检验课后练习
    • 15.8 二总体假设检验
      • 15.8.1 二总体假设检验(独立样本)
      • 15.8.2 二总体假设检验(配对样本)
    • 15.9 列联表(定类-定类)
      • 15.9.1 列联表/卡方检验/关联强度
总体平均数的估计

第三节 总体平均数的估计

一、总体参数估计的基本原理

根据样本统计量对相应总体参数所作的估计称为总体参数估计。

1、点估计

用某一样本统计量的值来估计相应总体参数的值称为总体参数的点估计。

无偏性

样本平均数就是总体平均数μ的无偏估计量。而样本标准差就是总体标准差的有偏估计量。但是将样本标准差乘以贝塞耳氏校正值之后,所得S就变成了总体标准差的无偏估计量。


有效性

方差小者有效性高,方差大者有效性低。Md、Mo都是总体的无偏估计量,但是只有的一切可能样本值的方差最小。所以是总体有效性最高的估计量。

一致性

当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,这种统计量是总体参数的一致性估计量。样本平均数就是总体平均数的一致性估计量。样本标准差S也都是总体标准差的一致性估计量。

2、区间估计

以样本统计量的抽样分布为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。

在一定置信水平上求出总体参数置信区间的上下限。

 

当总体标准差已知时,一切可能各样本平均数的标准记分

 

若以样本平均数对总体平均数的估计达到95%的可靠性,则Z在-1.96至1.96之间变动。有P(-1.96<Z<1.96)=0.95可得:


经过变形:


总体平均数μ有95%的可能性出现在之间。或者说平均数不在这一范围的可能性只有5%。

这个区间称为平均数相对应于0.95概率的置信区间

0.95称作平均数落在这一区间的置信水平

补充:显著性水平就是对总体参数作估计时,可能犯错误的概率(用α表示)。

 

置信水平越高,Z值越大,置信区间越宽。但在一定置信水平的前提下,可以通过降低数据的离散程度(减小σ)或增大样本容量n来减小标准误的方法达到缩短置信区间的距离。

二、ρ已知条件下总体平均数的区间估计

当总体σ已知,总体呈正态分布,样本容量n无论大小,

或当总体σ已知,虽总体不呈正态分布,但样本容量较大(n>30)时。

样本平均数标准记分呈标准正态分布,总体平均数的置信区间可按Z分布,用已知σ计算。

例题:某种零件的长度服从正态分布。已知总体标准差σ=1.5厘米。从总体中抽取100个零件组成样本,测得它们的平均长度为10.00厘米。试估计在99%置信水平下,全部零件平均长度的置信区间。

解:因为总体标准差σ=1.5已知,所以的分布服从正态分布,即可用Z估计。所以,


所以,全部零件平均长度99%的可能在(9.61,10.39)范围内。

三、ρ未知条件下总体平均数的区间估计

当总体σ未知,总体呈正态分布,样本容量n无论大小,

或当总体σ未知,虽总体不呈正态分布,但样本容量较大(n>30)时。

样本平均数标准记分呈标准t分布,总体平均数的置信区间可按t分布,用已知σ的估计量S计算。

 

t(df)0.05 和t(df)0.01是某种自由度及显著性水平t的临界值。

所谓显著性水平就是对总体参数作估计时,可能犯错误的概率(用α来表示)

1、小样本的情况

例,从某校高一年级随机抽取11名学生,其计算机期末考试成绩分别为92、94、96、66、84、71、45、88、90、67、78。试估计该校高一学生计算机期末考试成绩总体平均数95%与99%的置信区间。

解:由原始数据可计算出:

        则

又查表可得,                                        

代入公式可得,

   

 

2、大样本的情况

当总体呈正态分布,总体σ未知时,无论样本容量大小,样本平均数的标准记分都呈t分布。

若样本容量较大(n>30),样本平均数的标准记分t分布接近标准正态分布。在这种抽样条件下对总体平均数进行区间估计时,可用正态分布近似处理。

 

例1,从某校抽取62名初二年级男生参加立定跳远,计算得平均成绩4514.75px,标准差为547px,试估计该校初二年级男生立定跳远成绩总体平均数的95%与99%的置信区间。