1
社会统计学
1.11.1.1 9.1.1 基本概念
9.1.1 基本概念

(1)试验指标

在一项试验中,用来衡量试验效果的特征量称为试验指标,有时简称指标,也称试验结果,通常用y 表示。 它类似于数学中的因变量或目标函数。 试验指标用数量表示称为定量指标,如速度、温度、压力、重量、尺寸、寿命、硬度、强度、产量和成本等。 不能直接用数量表示的指标称为定性指标。 如颜色、人的性别等。 定性指标也可以转化为定量指标,方法是用不同的数表示不同的指标值。

(2)试验因素

试验中,凡对试验指标可能产生影响的原因都称为因素(factor),也称因子或元,类似于数学中的自变量。 需要在试验中考察研究的因素,称为试验因素,有时也称为因素,通常用大写字母A,B,C,……表示。 在试验中,有些因素能严格控制,称为可控因素;有些因素难以控制,称为不可控因素。 试验因素是试验中的已知条件,能严格控制,所以是可控因素。 通常把未被选作试验因素的可控因素和不可控因素都称为条件因素,统称为试验条件。

(3)因素水平

因素在试验中所处的各种状态或所取的不同值,称为该因素的水平(level),也简称为水平或位级,通常用下标1,2,3,……表示。 若一个因素取K 种状态或K 个值,就称该因素为K 水平因素。 因素的水平,有的可以取得具体值,如6 kg、10 cm;有的只能取大致范围或某个模糊概念,如软、硬、大、小、好、较好等;但也有无法用数值表征的,如履带的不同形式,轮胎花纹的不同种类,机器的不同操作方式,大豆的不同品种等。

(4)处理组

所有试验因素的水平组合所形成的试验点称为处理组(treatment group),也称组合处理。 三因素试验中,A1B2C3 是一个组合处理,它表示由A 因素1 水平、B 因素2 水平和C因素3 水平组合而形成的一个试验点。

为了更好地说明一元方差分析能解决什么问题,可以考虑如下现实问题。 为寻求适应本地区气候的高产油菜品种,现选取5 种不同的品种进行试验,每一品种在4 块实验田上试种,得到每一块试验田上的亩产量如下:

要研究的问题是:不同品种的平均亩产量是否有显著差异。 在该问题中只考虑品种这一因子(用A 表示)对亩产量的影响,5 种不同的品种就是该因子5 个不同的水平(分别记为A1,A2,A3,A4,A5)。

由于同一品种在不同田块上的亩产量不同,可以认为一个品种的亩产量就是一个总体,在方差分析中总假定各总体独立地服从同方差的正态分布,即第i 个品种的亩产量是一个随机变量,它服从分布N(μi,σ2),i=1,2,3,4,5。 那么,试验的目的就是要检验假设H0:μ1 =μ2 =μ3 =μ4 =μ5 是否成立。 若拒绝H0:μ1 =μ2 =μ3 =μ4 =μ5,那么就认为这5 个品种的平均亩产量之间有显著差异;反之,就认为各品种间产量的不同是由随机因素引起的。方差分析就是检验这类假设的一种方法。

实际上,方差分析是检验同方差的若干个正态母体均值是否相等的一种统计分析方法。

由上述引例发现,在进行单因素方差分析时,往往需要整理出以下数据结构,如表9.1所示。

表9.1 单因素方差分析数据结构

为叙述方便,因素为考察的定类变量,水平1,水平2,……,表示因素的k 个水平,x11,x12,…,xnk表示每一个观察值。

【例9.1】 表9.2 是某厂抽样41 名职工的职业和家庭子女数的统计表。

表9.2 某厂41 名职工的职业和家庭子女数的统计表