非参数统计

王小刚

目录

  • 1 导言
    • 1.1 课程介绍
    • 1.2 非参数统计
    • 1.3 假设检验
  • 2 统计软件R的使用
    • 2.1 R软件下载安装使用
    • 2.2 R外部数据读写
  • 3 单样本检验
    • 3.1 符号检验
    • 3.2 Wilcoxon符号秩和检验
    • 3.3 游程检验
  • 4 两相关样本检验
    • 4.1 两相关样本的符号检验
    • 4.2 两相关样本的秩和检验
  • 5 两独立样本的非参数检验
    • 5.1 MWW检验
    • 5.2 WW检验
    • 5.3 两样本的卡方检验
    • 5.4 两样本的KS检验
  • 6 k个独立样本的非参数检验
    • 6.1 Kruskal-Wallis检验
    • 6.2 k个样本的卡方检验
  • 7 k个相关样本的非参数检验
    • 7.1 Cochran Q检验
    • 7.2 Friedman检验
  • 8 分布检验
    • 8.1 卡方检验
    • 8.2 KS检验
  • 9 两个样本的相关分析
    • 9.1 等级相关
    • 9.2 Kendall相关
    • 9.3 偏秩相关
  • 10 k个样本的相关分析
    • 10.1 Kendall完全秩评定协和系数
  • 11 列链表中的相关测量
    • 11.1 列链表中的卡方检验
    • 11.2 PRE测量
卡方检验

2.1  卡方检验

卡方检验属于拟合优度检验。

用于检验样本内每一类别的实际观察数目与某条件下的理论期望数目是否有显著差异。

常用于定类尺度数据;期望频率小于5时,需合并类别。

基本思路与检验步骤

    卡方检验是以卡方分布为基础的一种常用假设检验方法,主要用于分类变量,它的原假设:

Ø H0:行分类变量与列分类变量无关联

Ø H1:行分类变量与列分类变量有关联

统计量为:

,其中fi是样本资料的计数,ei是在H0为真的情况下的理论数(期望值)

H0为真时,实际观察数与理论数之差fiei 应该比较接近0。所以在H0为真时,检验统计量服从自由度为k-1的卡方分布。


上述卡方检验由此派生了不同应用背景的各种问题的检验,最常用的是检验某

种已知比例、是否为同一分布等问题。