轻松学统计

罗良清 平卫英 李燕辉 郭露

目录

  • 1 绪论
    • 1.1 统计应用:无处不在
    • 1.2 统计实践史:漫漫长路
    • 1.3 统计学科史:博采众长
    • 1.4 基本研究方法:统计的利器
    • 1.5 基本概念:统计的基石
  • 2 数据的搜集
    • 2.1 统计调查:挖掘原矿的利刃
    • 2.2 方案设计:统计调查的前奏
  • 3 数据的描述
    • 3.1 统计分组:从原生态到系统化
    • 3.2 频数分布:初显总体分布特征
    • 3.3 统计图表:展现数据最佳拍档
    • 3.4 计算平均数(一):集中趋势之充分表达
    • 3.5 计算平均数(二):集中趋势之充分表达
    • 3.6 位置平均数:集中趋势之稳健表达
    • 3.7 注意事项:平均数使用说明
    • 3.8 方差与标准差(一):离中趋势之常用指标
    • 3.9 方差与标准差(二):离中趋势之常用指标
  • 4 时间数列分析
    • 4.1 时间数列(一) :指标的过去现在未来
    • 4.2 时间数列(二):指标的过去现在未来
    • 4.3 水平分析:时间数列分析的基础
    • 4.4 速度分析:时间数列的相对变动
    • 4.5 平均发展速度:水平法和累积法
    • 4.6 构成因素分析:抽丝剥茧寻真相
    • 4.7 修匀法:平滑整理显趋势
    • 4.8 方程法:模型拟合测趋势
    • 4.9 季节变动分析:同期平均法
  • 5 统计指数
    • 5.1 指数概览:定义与分类
    • 5.2 综合指数:先综合后对比
    • 5.3 指数体系:因素分析
    • 5.4 平均数指数:先对比后综合(一)
    • 5.5 平均数指数:先对比后综合(二)
    • 5.6 平均指标指数:先平均后对比
    • 5.7 CPI:前世今生
    • 5.8 股票价格指数:大家庭
  • 6 抽样与抽样分布
    • 6.1 抽样调查:定义与几组概念
    • 6.2 概率抽样:常用组织形式
    • 6.3 非概率抽样:常用抽取方法
    • 6.4 常见概率分布:随机变量的基本刻画
    • 6.5 抽样分布:抽样推断理论的基石
  • 7 参数估计
    • 7.1 点估计:方法与应用
    • 7.2 估计量:选择与评价
    • 7.3 区间估计:基本原理(一)
    • 7.4 区间估计:基本原理(二)
    • 7.5 均值的区间估计:大样本情形
    • 7.6 均值的区间估计:小样本情形
    • 7.7 区间估计:总体比例和方差
    • 7.8 样本容量的确定:抽样的前奏(一)
    • 7.9 样本容量的确定:抽样的前奏(二)
  • 8 假设检验
    • 8.1 假设检验:提出假设
    • 8.2 假设检验:基本思想
    • 8.3 假设检验:基本步骤
    • 8.4 例题解析:单个总体均值检验
    • 8.5 例题解析:单个总体比例及方差检验
    • 8.6 P值:另一个检验准则
  • 9 相关与回归分析
    • 9.1 相关分析:初探事物的联系
    • 9.2 相关系数:量化相关程度
    • 9.3 回归分析:应用一暼
    • 9.4 回归分析:方程建立
    • 9.5 回归分析:基本思想
    • 9.6 回归分析:系数估计
    • 9.7 回归分析:模型评价
  • 10 阅读
    • 10.1 阅读
统计学科史:博采众长
  • 1 视频
  • 2 章节测验





统计学的创始人威廉.配第(1623-1687)在17世纪英国发表的《政治算术》一书,大量使用数字对英、法、荷三国的经济实力进行比较,以论证“英格兰的情况和各种问题,并非处于可悲的状态”。该书采了不同于以往的方法,而是“用数字重量和尺度来表达他自己想要说明的问题”。因而马克思称其为“政治经济学之父,在某种程度上也可以说是统计学的创始人。”

(马克思恩格斯全集23卷P302《资本论》)


和配第同期,还有一个英国统计学家叫约翰•格兰特(John Graunt)(1620~1674)1662年出版《关于死亡率的自然观察和政治观察》。分析了60年多年伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别比例具有稳定性和不同死因的比例等人口规律;并且第一次编制了“生命表”,对死亡率与人口寿命作了分析,使人口统计学成为一门相对独立的学科。他的研究清楚地表明了统计学作为国家管理工具的重要作用。

格朗特研究人口发展的规律,观察到出生婴儿中男婴比女婴多十三分之一。但是在现实生活中,出生的男子即使多于女子,由于男子遭遇奇祸或死于航海居多,在婚姻年龄上男女数量大致相同。

他在比较了出生人数和死亡人数后得出结论:伦敦市区的人口出生数超过死亡数,而伦敦郊区农村的情况则相反,死亡数超过出生数。他还根据对出生率和死亡率的分析,对当时服兵役年龄的男子数、育龄妇女人数、伦敦居民家庭数等作出估计。

格兰特最重要的贡献是编制了世界上第一个死亡表(即生命表的基础)。死亡表的编制为经营人寿保险业务奠定了科学的数理基础,是计算人身保险的保险费、责任准备金、退保金的主要依据。


统计学之所以称为近代意义上科学的统计学,就是从引进概率论开始的。引进概率论的统计学家叫凯特勒(Lambert Adolphe Jacques Quetelet,1796~1874)。

凯特勒在19世纪做过一个类似原力、智商这样的数据,是士兵的胸围。他测量了5738名苏格兰士兵的胸围,看他们是不是够强壮。结果发现,士兵胸围的测量值和测量值出现的频数服从正态分布。这条正态分布的曲线,就叫钟形曲线。

凯特勒还进一步运用这个规律,检查出自己国家新兵身高频率曲线与理论正态分布曲线不相吻合的不正常情况,推测这可能是征兵工作中出了问题。调查结果发现,果真有几个征兵机关从中作弊。凯特勒的统计工作实际上是拉普拉斯等人概率论中正态分布曲线、误差法则等理论的运用。

卡尔·皮尔逊(Karl Pearson,1857-1936),他是现代统计科学的创立者。皮尔逊认为,正态分布只是一种分布形态,他在高尔登优生学统计方法的启示下,在1894年发表了《关于不对称曲线的剖析》,1895年发表了《同类资料的偏斜变异》等论文,得到包括正态分布、矩形分布、J型分布、U型分布等13种曲线及其方程式。他的这一成果,打破了以往次数分布曲线的“唯正态”观念,推进了次数分布曲线理论的发展和应用,为大样本理论奠定了基础。 

皮尔逊一直很关注遗传和环境、先天和后天在人类进化中的重要性,他的实验室曾做过一个掀起轩然大波的研究,经济学家马歇尔、凯恩斯、庇古,医生霍斯利、优生学家高尔顿(达尔文的表弟)都卷入其中。那这个研究是什么呢?埃尔德顿和皮尔逊在爱丁堡收集了超过600个家庭的数据,发现父母的饮酒嗜好和后代任何可度量的健康和智力指标完全不相关。