目录

  • 1 绪论
    • 1.1 课前学习要求
    • 1.2 什么是统计学
    • 1.3 为什么要学习统计学
    • 1.4 描述性统计和推断性统计
    • 1.5 无处不在的统计学
    • 1.6 第一章课后作业
  • 2 数据产生
    • 2.1 课前学习要求
    • 2.2 基本概念
    • 2.3 数据来源
    • 2.4 随机性和抽样误差
    • 2.5 数据类型
    • 2.6 数据还能“撒谎”?
    • 2.7 第二章课后作业
    • 2.8 统计报告案例阅读
  • 3 数据展示
    • 3.1 课前学习要求
    • 3.2 数据预处理
    • 3.3 数据整理
    • 3.4 数据展示
    • 3.5 统计图表的使用
    • 3.6 数据可视化
    • 3.7 第三章课后作业
  • 4 数据描述
    • 4.1 课前学习要求
    • 4.2 数据分布特征描述
    • 4.3 相关和因果
    • 4.4 第四章课后作业
  • 5 概率论
    • 5.1 课前学习要求
    • 5.2 什么是概率
    • 5.3 离散型随机变量
    • 5.4 连续性随机变量
    • 5.5 中心极限定理的百年
  • 6 统计推断
    • 6.1 课前学习要求
    • 6.2 抽样分布
    • 6.3 大数定律和中心极限定理
    • 6.4 数值型数据统计推断
    • 6.5 假设检验
    • 6.6 品质数据统计推断
  • 7 统计指数
    • 7.1 课前学习要求
    • 7.2 基本概念
    • 7.3 总指数
    • 7.4 指数体系
    • 7.5 常用经济指数
假设检验

如果一个人说他是素食者。如何证明?这是非常困难的。反之,如果要证明这个人不是素食者,这就很容易了,只要证明他吃过一次肉就够了。肯定一个事情很难,而否定就相对容易的多。同样,在假设检验中也用到了这个思想。

假设是对总体参数的数值所作的一种陈述,总体参数包括总体均值、总体比例、总体方差等等;比如均值是否为0,均值是否大于0,两个总体的均值是否相等,这些都是一种陈述。

假设检验:事先对总体参数或分布形式做出某种假设,然后利用样本信息来判断原假设是否成立。假设检验有参数检验和非参数检验之分;它采用逻辑上的反证法,依据统计上的小概率原理。在假设检验中,假设有原假设和备择假设。

原假设是待检验的假设,又称零假设,是研究者想收集证据予以反对的假设,通常用H0来表示。在原假设中总是有等号原假设表示没有差异或者没有改变,或变量间没有关系等等。

备择假设是与原假设对立的假设,也称为研究假设。是研究者想收集证据予以支持的假设,常用H1来表示。假设中总是有不等号

1.两类错误

2.单侧检验和双侧检验

在做假设检验时,假设检验的基本流程为:

(1)提出假设;

(2)确定适当的检验统计量;

(3)规定显著性水平;

(4)计算检验统计量的值;

(5)做出统计决策。

需要说明的是,检验统计量是用于假设检验决策的统计量,选择统计量的方法与参数估计相同,需考虑是大样本还是小样本,总体方差是已知还是未知。



单总体假设检验


检验的内容不同,需要不同的检验统计量,在单个总体参数的检验中,用到的检验统计量主要有三个:z统计量、t统计量和卡方统计量z统计量和t统计量常常用于均值和比例的检验,卡方统计量则用于方差的检验。选择统计量还需要考虑一些样本量的大小,方差是已知还是未知等等。

1.正态总体均值的检验


2.  方差未知总体均值的检验



3.大样本总体比例的检验


双总体假设检验

1.独立、大样本

假定条件

(1)两个样本是独立的随机样本

(2)正态总体或非正态总体大样本

2.独立、小样本

(1)假设条件:是两个独立的小样本,两个总体都是正态分布,而且方差已知。

3.两个总体比率之差的检验

假定条件

1)两个总体都服从二项分布;

2)可以用正态分布来近似


4.两个总体方差比的检验

假定条件

1)两个总体都服从正态分布,且方差相等;

2)两个独立的随机样本



非参数假设检验

之前我们讲的都是有关总体参数的检验,但其实统计推断中还有一部分相当重要的内容是非参数检验。参数检验是在总体分布形式已知的情况下,对总体分布的参数如 均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,非参数统计是指那些推断不依赖总体分布的具体函数形式,或推断假设与总体参数无关的推断方法,也就是说在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。

非参数检验的情形众多,我们这里重点介绍一下两个独立样本的非参数检验。两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法。独立样本是指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。两独立样本的非参数检验方法也很多种,相关的统计软件操作起来也很简单,其中包含了曼-惠特尼U检验、K-S检验、W-W 游程检验、极端反应检验等方法。

1.Mann- Whitney-Wilcoxon检验(曼-惠特尼U检验)

基本思想:

两独立样本的曼-惠特尼U检验可用于对两总体分布的比例判断。其原假设:两组独立样本来自的两 总体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现判断。秩简单说就是变量值排序的名次,可以将数据按升序排列,每个变量值都会有一个在整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩。

2.W-W 游程检验

基本思想:

单样本游程检验是用来检验变量值的出现是否随机,而两独立变量的游程检验则是用来检验两独立样本来自的两总体的分布是否存在显著差异。其原假设是:两组独立样本来自的两总体的分布无显著差异。

两独立样本的 游程检验与单样本游程检验的思想基本相同,不同的是计算游程数的方法。两独立样本的游程检验中,游程数依赖于变量的秩。


3.卡方检验