轻松学统计

罗良清 平卫英 李燕辉 郭露

目录

  • 1 绪论
    • 1.1 统计应用:无处不在
    • 1.2 统计实践史:漫漫长路
    • 1.3 统计学科史:博采众长
    • 1.4 基本研究方法:统计的利器
    • 1.5 基本概念:统计的基石
  • 2 数据的搜集
    • 2.1 统计调查:挖掘原矿的利刃
    • 2.2 方案设计:统计调查的前奏
  • 3 数据的描述
    • 3.1 统计分组:从原生态到系统化
    • 3.2 频数分布:初显总体分布特征
    • 3.3 统计图表:展现数据最佳拍档
    • 3.4 计算平均数(一):集中趋势之充分表达
    • 3.5 计算平均数(二):集中趋势之充分表达
    • 3.6 位置平均数:集中趋势之稳健表达
    • 3.7 注意事项:平均数使用说明
    • 3.8 方差与标准差(一):离中趋势之常用指标
    • 3.9 方差与标准差(二):离中趋势之常用指标
  • 4 时间数列分析
    • 4.1 时间数列(一) :指标的过去现在未来
    • 4.2 时间数列(二):指标的过去现在未来
    • 4.3 水平分析:时间数列分析的基础
    • 4.4 速度分析:时间数列的相对变动
    • 4.5 平均发展速度:水平法和累积法
    • 4.6 构成因素分析:抽丝剥茧寻真相
    • 4.7 修匀法:平滑整理显趋势
    • 4.8 方程法:模型拟合测趋势
    • 4.9 季节变动分析:同期平均法
  • 5 统计指数
    • 5.1 指数概览:定义与分类
    • 5.2 综合指数:先综合后对比
    • 5.3 指数体系:因素分析
    • 5.4 平均数指数:先对比后综合(一)
    • 5.5 平均数指数:先对比后综合(二)
    • 5.6 平均指标指数:先平均后对比
    • 5.7 CPI:前世今生
    • 5.8 股票价格指数:大家庭
  • 6 抽样与抽样分布
    • 6.1 抽样调查:定义与几组概念
    • 6.2 概率抽样:常用组织形式
    • 6.3 非概率抽样:常用抽取方法
    • 6.4 常见概率分布:随机变量的基本刻画
    • 6.5 抽样分布:抽样推断理论的基石
  • 7 参数估计
    • 7.1 点估计:方法与应用
    • 7.2 估计量:选择与评价
    • 7.3 区间估计:基本原理(一)
    • 7.4 区间估计:基本原理(二)
    • 7.5 均值的区间估计:大样本情形
    • 7.6 均值的区间估计:小样本情形
    • 7.7 区间估计:总体比例和方差
    • 7.8 样本容量的确定:抽样的前奏(一)
    • 7.9 样本容量的确定:抽样的前奏(二)
  • 8 假设检验
    • 8.1 假设检验:提出假设
    • 8.2 假设检验:基本思想
    • 8.3 假设检验:基本步骤
    • 8.4 例题解析:单个总体均值检验
    • 8.5 例题解析:单个总体比例及方差检验
    • 8.6 P值:另一个检验准则
  • 9 相关与回归分析
    • 9.1 相关分析:初探事物的联系
    • 9.2 相关系数:量化相关程度
    • 9.3 回归分析:应用一暼
    • 9.4 回归分析:方程建立
    • 9.5 回归分析:基本思想
    • 9.6 回归分析:系数估计
    • 9.7 回归分析:模型评价
  • 10 阅读
    • 10.1 阅读
方差与标准差(二):离中趋势之常用指标
  • 1 视频
  • 2 章节测验

cet


一、Z分数

1.概念:z分数通常被称为标准化数值。 Z表示观察值偏离平均数的标准差个数。

2.对数据进行标准化处理。

3.作用:了解变量值在整个分布中的地位并可直接进行对比。

二、切贝谢夫定理与经验法则

1.切贝谢夫定理:

在任意一组数据中,至少有(1-1/k2)个数据落在k倍标准差范围内,k是大于1的任意数值。

切贝谢夫定理可以确定在偏离平均数某一指定倍数标准差范围内的数据所占的百分比。

当k取值2,3,4时,切贝谢夫定理分别得出如下一些推论:

★ 至少75%的数据落在平均数加减2倍标准差范围内。

★ 至少89%的数据落在平均数加减3倍标准差范围内。

★ 至少94%的数据落在平均数加减4倍标准差范围内。

特点:具有普遍性但比较保守。

2.经验法则

对于呈对称分布的数据来说,大约68%的数据落在平均数加减1倍标准差的范围内;大约95%的数据落在平均数加减2倍标准差的范围内;大约99%的数据落在平均数加减3倍标准差的范围内。

一般来说,一组数据中落在平均数加减3倍标准差的范围之外的数据是很少见的。


3.异常值检测   

异常值,是指一组数据中出现的一个或几个非正常大或正常小的极端值。一般把Z分数小于-3或大于+3的数据都作为异常值。

异常值如果是被错误记录,在进一步分析之前能改则改,否则删除;如果是正常记录,则应保留。