一、数理统计的基本概念
1. 总体:在数理统计中,把研究对象的全体称为总体。
2. 个体:组成总体的每一个基本单位称为个体。
3. 样本和样本容量:总体中抽出的一部分个体称为这个总体的一个样本(或称子样),一个样本中所含的个体数目称为样本容量.
4. 简单随机抽样
(1)随机性:总体中每一个个体都有同等机会被选入样本;
(2)独立性:样本中每一样品的取值不影响其它样品的取值。
5. 简单随机样本:与总体X具有相同的分布,并且每个个体X1,X2,…,Xn之间是相互独立。
二、样本数据的整理与显示
1.经验分布函数的定义和计算;
2.直方图的定义和绘制
(1)频数、频率的计算,组间距的选择;
(2)由直方图判断出随机变量的近似分布。
3.茎叶图
(1)单片茎叶图;
(2)双片茎叶图;
(3)由茎叶图判断出随机变量的近似分布。
教学内容
数理统计的基本概念、经验分布函数。直方图和茎叶图可在实验课讲。
教学目的
(1)了解数理统计学的任务、性质和应用领域;
(2)理解数理统计的基本概念,深刻理解样本的随机性;
(3)理解经验分布的定义,了解经验分布与理论分布的关系,掌握直方图的作法,了解直方图在判断数据分布中的意义;
教学过程
一、数理统计的基本概念
很多实际问题中的随机现象可以用随机变量来描述,而要全面了解一个随机变量,就必须知道它的概率分布,至少也要知道它的某些数字特征(数学期望、方差等),怎样才能知道或大体上知道一个随机变量的概率分布或数字特征呢?这类问题在实际应用中是很重要的。 通常我们只能在所研究的对象中选取一部分进行研究测试,利用所得到的部分数据来推断整个研究对象的情况。 先介绍在这一统计分析过程中,几个常用的基本概念。
1. 总体:在数理统计中,把研究对象的全体称为总体。
2. 个体:组成总体的每一个基本单位称为个体。
例:研究某城市人口年龄的构成,可以把该市所有居民的年龄看作一个整体,若该市有1000万人口,那么该总体就是由1000万个表示年龄的数字构成。 每一个人的年龄即是一个个体。
3.样本和样本容量:总体中抽出的一部分个体称为这个总体的一个样本(或称子样),一个样本中所含的个体数目称为样本容量。
4.简单随机抽样:
(1)随机性:总体中每一个个体都有同等机会被选入样本。
(2)独立性:样本中每一样品的取值不影响其它样品的取值。
5.简单随机样本:用简单随机抽样方法得到的样本。
二、样本数据的整理与显示
1. 经验分布函数
在样本容量较大时,我们用的比较多的是样本的经验分布和频率直方图。
经验分布定义:设总体X的分布函数为F(x),从该总体中抽取样本,设X1,X2, …Xn是样本的一个观察值,排序为
,令

称Fn(x)为该样本的经验分布函数.它可以用来描述总体分布函数的大致形状。性质:右连续的非降,且0≤Fn(x) ≤1 ,具有分布函数的性质。
定理(格里汶科定理):对任给的自然数n,设X1,X2, …是取自总体分布函数为F(x)的一个样本的观测值,Fn(x)为样本的经验分布,则有:

该定理说明,对于连续总体X而言,随样本的增大,经验分布函数也将在概率意义下越来越“靠近”总体分布函数F(x)。
2.直方图(Histogram)
直方图是频数分布的图形表示,它的横坐标表示所关心变量的取值区间,纵坐标有三种表示方法:频数,频率,最准确的是频率/组距,它可使得诸长条矩形面积和为1。凡此三种直方图的差别仅在于纵轴刻度的选择,直方图本身并无变化。
3.茎叶图
把每一个数值分为两部分,前面一部分(百位和十位)称为茎,后面部分(个位)称为叶,然后画一条竖线,在竖线的左侧写上茎,右侧写上叶,就形成了茎叶图。
单项选择题
1.设X1,X2,…,Xn为来自N(0,4)的一个样本,Xbar和N分别为样本均值和样本方差,其中X2bar用M表示,则( )
A M/N~F(1,n-1)
B (n-1)M/N~F(1,n-1)
C nM/N~F(1,n-1)
D (n-1)M/N~F(1,n-1)
2.设总体X~N(μ,4),μ未知,而X1,X2,…,Xn为它的一个简单随机样本,设样本均值为Xbar,则下列量中( )不是统计量:
A Xbar
B (Xi-μ)2的样本平方
C (Xi-Xbar)2的均值
D (Xbar-3)/σ
填空题
1.为了解统计学专业本科毕业生的就业情况,我们调查了某地区30名2000年毕业的统计学专业本科生实习期满后的月薪情况,则总体是 ,样本是 ,样本量是 。
问答题
1.对大学生进行一项住宿情况的调查,估计本学期住在家里的大学生的百分数。总体是什么?参数是什么?
谁能被选中呢?
现在要调查某校高中学生喜欢打篮球的情况时,可以先编下学号,然后利用随机数表找到该学号对应的学生进行调查,谁能被选中呢?
提示:简单随机抽样