轻松学统计

罗良清 平卫英 李燕辉 郭露

目录

  • 1 绪论
    • 1.1 统计应用:无处不在
    • 1.2 统计实践史:漫漫长路
    • 1.3 统计学科史:博采众长
    • 1.4 基本研究方法:统计的利器
    • 1.5 基本概念:统计的基石
  • 2 数据的搜集
    • 2.1 统计调查:挖掘原矿的利刃
    • 2.2 方案设计:统计调查的前奏
  • 3 数据的描述
    • 3.1 统计分组:从原生态到系统化
    • 3.2 频数分布:初显总体分布特征
    • 3.3 统计图表:展现数据最佳拍档
    • 3.4 计算平均数(一):集中趋势之充分表达
    • 3.5 计算平均数(二):集中趋势之充分表达
    • 3.6 位置平均数:集中趋势之稳健表达
    • 3.7 注意事项:平均数使用说明
    • 3.8 方差与标准差(一):离中趋势之常用指标
    • 3.9 方差与标准差(二):离中趋势之常用指标
  • 4 时间数列分析
    • 4.1 时间数列(一) :指标的过去现在未来
    • 4.2 时间数列(二):指标的过去现在未来
    • 4.3 水平分析:时间数列分析的基础
    • 4.4 速度分析:时间数列的相对变动
    • 4.5 平均发展速度:水平法和累积法
    • 4.6 构成因素分析:抽丝剥茧寻真相
    • 4.7 修匀法:平滑整理显趋势
    • 4.8 方程法:模型拟合测趋势
    • 4.9 季节变动分析:同期平均法
  • 5 统计指数
    • 5.1 指数概览:定义与分类
    • 5.2 综合指数:先综合后对比
    • 5.3 指数体系:因素分析
    • 5.4 平均数指数:先对比后综合(一)
    • 5.5 平均数指数:先对比后综合(二)
    • 5.6 平均指标指数:先平均后对比
    • 5.7 CPI:前世今生
    • 5.8 股票价格指数:大家庭
  • 6 抽样与抽样分布
    • 6.1 抽样调查:定义与几组概念
    • 6.2 概率抽样:常用组织形式
    • 6.3 非概率抽样:常用抽取方法
    • 6.4 常见概率分布:随机变量的基本刻画
    • 6.5 抽样分布:抽样推断理论的基石
  • 7 参数估计
    • 7.1 点估计:方法与应用
    • 7.2 估计量:选择与评价
    • 7.3 区间估计:基本原理(一)
    • 7.4 区间估计:基本原理(二)
    • 7.5 均值的区间估计:大样本情形
    • 7.6 均值的区间估计:小样本情形
    • 7.7 区间估计:总体比例和方差
    • 7.8 样本容量的确定:抽样的前奏(一)
    • 7.9 样本容量的确定:抽样的前奏(二)
  • 8 假设检验
    • 8.1 假设检验:提出假设
    • 8.2 假设检验:基本思想
    • 8.3 假设检验:基本步骤
    • 8.4 例题解析:单个总体均值检验
    • 8.5 例题解析:单个总体比例及方差检验
    • 8.6 P值:另一个检验准则
  • 9 相关与回归分析
    • 9.1 相关分析:初探事物的联系
    • 9.2 相关系数:量化相关程度
    • 9.3 回归分析:应用一暼
    • 9.4 回归分析:方程建立
    • 9.5 回归分析:基本思想
    • 9.6 回归分析:系数估计
    • 9.7 回归分析:模型评价
  • 10 阅读
    • 10.1 阅读
位置平均数:集中趋势之稳健表达
  • 1 视频
  • 2 章节测验


(一)中位数

1.定义:

将变量值按大小次序排列,处于中间位置的变量值即为中位数 => Me

[例]某科室由9人组成,其年龄分别为:24,25,25,26,26,27,28,29,55

2.计算

(1)当资料未分组时,中点位置=(n+1)/2;

     当n为奇数时, Me =中间位置的那个变量值;

     当n为偶数时,如24,25,25,26,26,27,28,29

      Me =中间位置两侧的两个变量值的简单平均。

(2)当资料已分组且形成单项式变量数列时,中点位置=∑f/2


(3)资料已分组且形成组距式变量数列

    (A)L为中位数所在组的下限,U为上限;

    (B)i为中位数所在组的组距;

    (C)Sm-1 为小于中位数的各组次数之和;

    (D)Sm+1为大于中位数的各组次数之和;

    (E)fm为中位数所在组的次数。

3.注意的问题

(1)不受极端值的影响,比较稳健。

(2)中位数的取值只与中间位置的一或两个数值有关,利用信息不充分,忽略了其它数据的大小,并且不适合于代数运算。 

(二)众数

1.定义:

出现次数最多的变量值。用Mo表示。

A. 20,15,18,20,20,22,20,23; 

        n=8     Mo=20

B.20,20,15,19,19,20,19,25;      

  n=8    Mo=20      Mo=19

C. 10,11,13,16,15,25,8,12;

     n=8,但没有众数


2.计算

(1)当资料为单项式数列时。先确定众数组;再确定众数:Mo=18

(2)当资料为组距式数列时。先确定众数组;再用下述公式计算:

符号含义:

(A)L为众数组的下限,U为上限;

(B)i为众数组的组距;

(C)1=fm-fm-1,即众数组的次数与前一组次数之差;

   2=fm -fm+1,即众数组的次数与后一组次数之差。

3.注意问题

(1)优点:不受极端值的影响。

(2)缺点:未利用所有信息,缺乏敏感性和不适合代数运算。