目录

  • 1 绪论
    • 1.1 课前学习要求
    • 1.2 什么是统计学
    • 1.3 为什么要学习统计学
    • 1.4 描述性统计和推断性统计
    • 1.5 无处不在的统计学
    • 1.6 第一章课后作业
  • 2 数据产生
    • 2.1 课前学习要求
    • 2.2 基本概念
    • 2.3 数据来源
    • 2.4 随机性和抽样误差
    • 2.5 数据类型
    • 2.6 数据还能“撒谎”?
    • 2.7 第二章课后作业
    • 2.8 统计报告案例阅读
  • 3 数据展示
    • 3.1 课前学习要求
    • 3.2 数据预处理
    • 3.3 数据整理
    • 3.4 数据展示
    • 3.5 统计图表的使用
    • 3.6 数据可视化
    • 3.7 第三章课后作业
  • 4 数据描述
    • 4.1 课前学习要求
    • 4.2 数据分布特征描述
    • 4.3 相关和因果
    • 4.4 第四章课后作业
  • 5 概率论
    • 5.1 课前学习要求
    • 5.2 什么是概率
    • 5.3 离散型随机变量
    • 5.4 连续性随机变量
    • 5.5 中心极限定理的百年
  • 6 统计推断
    • 6.1 课前学习要求
    • 6.2 抽样分布
    • 6.3 大数定律和中心极限定理
    • 6.4 数值型数据统计推断
    • 6.5 假设检验
    • 6.6 品质数据统计推断
  • 7 统计指数
    • 7.1 课前学习要求
    • 7.2 基本概念
    • 7.3 总指数
    • 7.4 指数体系
    • 7.5 常用经济指数
离散型随机变量

1.随机试验的结果数量化

为了更深入地研究随机试验的结果,揭示其相应的随机现象的统计的规律性,从本节起,将引入随机变量的概念。其主要目的是把随机试验的结果数量化,用一个变量X来描述试验的结果,方便做数学上的处理,把不采用数量标识化为采用数量标识表示。

2.随机变量的定义


 3.随机变量的分类

按照随机变量的特性,通常可把随机变量分为两类,即离散型随机变量(discrete random variable)连续性随机变量(continuous randomvariable)

(1)离散型随机变量

随机变量所取的可能值是有限多个或无限可列个,叫做离散型随机变量。例如,观察掷一枚骰子出现的点数,随机变量的可能值是1,2,3,4,5,6.骰子出现的点数就是离散型随机变量。

(2) 连续性随机变量

随机变量所取的可能值可以连续地充满某个区间,叫做连续性随机变量。例如一批灯泡的寿命、测量某零件尺寸时的测量误差等都是连续性随机变量。

 离散型随机变量的分布列

1.二项分布

离散型随机变量有许多重要的分布,其中二项分布和泊松分布是最常见的概率分布。

假如你想知道硬币连续两次正面着地的概率是多少,是否需要整天坐在屋子里,不停地抛硬币,然后找出连续两次正面着地这一概率是多少呢?也许不需要,如果你知道(1)出现一次正面的概率是0.5;(2)只有两种可能值(正面和反面);(3)每一次扔硬币都是独立的。

2.泊松分布

泊松分布(Poisson distribution)是用来描述在一指定时间范围内或指定的面积或体积之内某一事件出现的次数的分布。泊松分布只有一个参数,它既是泊松分布的均值,也是泊松分布的方差。在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客、显微镜下某区域中的白血球等等,以固定的平均瞬时速率随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布。