轻松学统计

罗良清 平卫英 李燕辉 郭露

目录

  • 1 绪论
    • 1.1 统计应用:无处不在
    • 1.2 统计实践史:漫漫长路
    • 1.3 统计学科史:博采众长
    • 1.4 基本研究方法:统计的利器
    • 1.5 基本概念:统计的基石
  • 2 数据的搜集
    • 2.1 统计调查:挖掘原矿的利刃
    • 2.2 方案设计:统计调查的前奏
  • 3 数据的描述
    • 3.1 统计分组:从原生态到系统化
    • 3.2 频数分布:初显总体分布特征
    • 3.3 统计图表:展现数据最佳拍档
    • 3.4 计算平均数(一):集中趋势之充分表达
    • 3.5 计算平均数(二):集中趋势之充分表达
    • 3.6 位置平均数:集中趋势之稳健表达
    • 3.7 注意事项:平均数使用说明
    • 3.8 方差与标准差(一):离中趋势之常用指标
    • 3.9 方差与标准差(二):离中趋势之常用指标
  • 4 时间数列分析
    • 4.1 时间数列(一) :指标的过去现在未来
    • 4.2 时间数列(二):指标的过去现在未来
    • 4.3 水平分析:时间数列分析的基础
    • 4.4 速度分析:时间数列的相对变动
    • 4.5 平均发展速度:水平法和累积法
    • 4.6 构成因素分析:抽丝剥茧寻真相
    • 4.7 修匀法:平滑整理显趋势
    • 4.8 方程法:模型拟合测趋势
    • 4.9 季节变动分析:同期平均法
  • 5 统计指数
    • 5.1 指数概览:定义与分类
    • 5.2 综合指数:先综合后对比
    • 5.3 指数体系:因素分析
    • 5.4 平均数指数:先对比后综合(一)
    • 5.5 平均数指数:先对比后综合(二)
    • 5.6 平均指标指数:先平均后对比
    • 5.7 CPI:前世今生
    • 5.8 股票价格指数:大家庭
  • 6 抽样与抽样分布
    • 6.1 抽样调查:定义与几组概念
    • 6.2 概率抽样:常用组织形式
    • 6.3 非概率抽样:常用抽取方法
    • 6.4 常见概率分布:随机变量的基本刻画
    • 6.5 抽样分布:抽样推断理论的基石
  • 7 参数估计
    • 7.1 点估计:方法与应用
    • 7.2 估计量:选择与评价
    • 7.3 区间估计:基本原理(一)
    • 7.4 区间估计:基本原理(二)
    • 7.5 均值的区间估计:大样本情形
    • 7.6 均值的区间估计:小样本情形
    • 7.7 区间估计:总体比例和方差
    • 7.8 样本容量的确定:抽样的前奏(一)
    • 7.9 样本容量的确定:抽样的前奏(二)
  • 8 假设检验
    • 8.1 假设检验:提出假设
    • 8.2 假设检验:基本思想
    • 8.3 假设检验:基本步骤
    • 8.4 例题解析:单个总体均值检验
    • 8.5 例题解析:单个总体比例及方差检验
    • 8.6 P值:另一个检验准则
  • 9 相关与回归分析
    • 9.1 相关分析:初探事物的联系
    • 9.2 相关系数:量化相关程度
    • 9.3 回归分析:应用一暼
    • 9.4 回归分析:方程建立
    • 9.5 回归分析:基本思想
    • 9.6 回归分析:系数估计
    • 9.7 回归分析:模型评价
  • 10 阅读
    • 10.1 阅读
注意事项:平均数使用说明
  • 1 视频
  • 2 章节测验




(一)三者间的关系

1.数量关系

(1)对称分布:此处三者均等于35。

(2)偏态分布


2.卡尔•皮尔逊经验公式:

适度偏斜情况下,众数与中位数之间的距离,大约为中位数到算术平均数之间距离的两倍。

(二)众数、中位数和均值的应用场合

众数一般用来描述分类变量(定性数据),特别是那些有许多个值的分类变量,例如学历、对事物的态度等。例如,在某一地区学历的众数是硕士生,对事物的态度的众数是中立。

当一组数据的直方图显示出非对称或非正态分布时,常常使用中位数是,例如房价和收入数据。

由于均值容易受到极大值或极小值的影响,因此,当数据集有极端值时,最好不使用均值。如果数据的分布是不对称的,最好使用中位数(或众数)而不是均值,因为中位数对极端值不敏感。

总之,如果分布的偏斜程度很高,均值将不能作为一个很好的度量。相对而言,中位数和众数的代表性更强。



  1.注意观察总体的同质性;

  2.应用组平均数补充说明总体平均数;

  3.注意极端值的影响。