第一节 抽样的基本概念及其方法
一、基本概念
1、总体与样本
总体是具有某种共同特征的一类事物的全体,总体中的每个基本单元称为个体。
总体包含的个体数目称为总体规模,一般用字母N表示;样本包含的个体数目称为样本容量,一般用字母n表示。
2、统计量与参数
参数(Parameter):──描述总体分布特征的量数,总体上的各种数字特征。
总体平均数(μ)——反映总体的集中趋势
总体标准差(σ)——反映总体的离中趋势
总体相关系数(ρ)——反映在总体内某两种特征之间的变化关系
统计量( Statistic ):──描述样本分布特征的量数,样本上的数字特征。
样本平均数(X)—— 描述某一样本数据的集中趋势
样本标准差(σX)——描述该样本数据的分散程度
样本相关系数(r)——描述两个样本之间的相关关系
二、抽样方法
样本代表性影响因素:总体的离散程度;样本容量的大小、抽样方法。
随机抽样的类型:
单纯随机抽样
总体中每个个体被抽到的机会均等,并且任何个体之间彼此被抽取的机会是独立的。抽签法和随机数字标法。
2、机械抽样
将总体内的个体按一定顺序编号,然后按固定的间隔取样,这种抽样方法称为机械抽样。
3、分层抽样
按与研究内容有关的因素先将总体分成若干不同的部分(每一部分做一个层),然后在各部分中按单纯随机抽样或机械抽样获得入样个体。
4、整群抽样
从总体中抽取研究对象,不是以个体为单位,而是以“群”为单位,一旦抽中某个“群”,该群的所有个体都入样。
三、样本容量
估计总体平均数时的必要样本容量
一般来说:
教育调查的样本容量大些,教育实验则可以小些;
总体内个体的离散程度大的,样本容量应该大些;
实验条件控制较差,样本容量应该大些;
指标之间差异(两平均数之间)小的,样本容量应该大些;
相关程度低的,样本容量应该大些。
若σ已知: 若σ未知
σ:标准差 δ:估计最大允许误差
例题:拟估计上海市高校四级英语考试的总体平均数,根据历次考试成绩的标准差为13,这次估计的最大允许误差为2分,可信度为95%,问应当抽多少人?(163)
补充:统计推断概述
1、统计推断的意义——对不可能获得的总体,能对其各种分布性质作出一定可靠程度的估计和推测。
(1)总体不能直接观测,通过统计推断可对其进行估计和推测。
(2)统计推断与演绎推理的区别。
(3)统计推断的可靠性程度非常高。
2、统计推断的前提——随机取样
(1)抽样范围
(2)抽样方法(简单随机取样、分层随机取样等)
(3)样本容量——确保样本的代表性(间接指标:样本的标准误)
3、统计推断的内容
(1)参数估计:根据样本统计量去估计总体参数
1)点估计:直接用样本统计量的值作为总体参数的估计值
2)区间估计:在一定的可靠性程度上估计总体参数所在的范围
(2)假设检验——利用样本统计量或样本分布,在一定的可靠性程度上,对关于总体参数或总体分布的某一假设做出拒绝或保留的决断。
1)参数检验:总体参数、连续变量、正态分布;灵敏度高
2)非参数检验:总体参数或分布、任意变量、任意分布;灵敏度低

