1
社会科学方法论
1.10.5.2 二、实验设计的基本类型

二、实验设计的基本类型

研究者用不同方式把随机分配、变量、前测、后测、实验组、控制组等实验要素进行组合,就构成不同类型的实验设计。有时研究设计包含了所有的实验要素,这种设计就是经典实验设计。然而,在实际研究中,由于条件限制,许多实验设计包含了不同的实验要素,比如有的设计可能没有前测,有的研究可能没有控制组,还有的设计可能使用了多个实验组。根据上述实验要素的不同组合大致可以把实验设计分成:前测—后测控制组设计、仅有后测控制组设计、所罗门四组设计和多因素研究设计等四种基本类型。

(一)前测—后测控制组设计(pretest-posttest control group design)

在实验研究中,前测—后测控制组设计是使用最多的一种设计。该设计也称为经典实验设计或传统实验设计。经典设计使用了的目的是为了排除其他变量的影响,弄清干预的效果。该设计涉及下列一些步骤:①将被试随机分配到实验组和控制组;②对两组被试同时进行前测;③对实验组但不对控制组施加实验处理;④对两个组进行后测。这里值得注意的是,应该尽可能平等地对待实验组和控制组,必须对两个组施加同样的前测和后测,并在同一个时间里对它们进行检测。

如图9.4所示,研究者将被试随机分配(R)到实验组(第一组)和控制组(第二组),对每个实验组进行观察或测量(O1),再对第一组进行实验处理(X),随后对被试进行第二次观察或者测量(O2)。最后将第一组前测(O1)和后测(O2)之间差异与第二组前测(O1)和后测(O2)之间差异进行对比。如果二者之间存在着统计上的显著差异,那么就可以判定,实验处理(X)是导致这种差异的主要原因。

img15

图9.4 前测—后测控制组设计

例如,前测—后测控制组设计可用来检验餐厅服务员的优质服务对小费数量的影响。研究者对40位新入职的服务员进行完全相同的两小时培训,让他们不要自我介绍名字,也不要在客人用餐时再回来询问确认。然后将服务员随机分为两组,每组20人,分别在两家餐馆工作。研究者记录下一个月内所有被试收到的小费数(前测值),然后再对第1家餐馆的被试(实验组)进行再培训,让他们先介绍自己的名字,并在饭菜上桌8~10分钟后询问顾客“一切都满意吗?”(处理)。研究者对第二家餐馆被试(控制组)进行再培训,继续教导他们不要介绍自己的名字,也不要在客人用餐时询问确认。研究者记录下两个月内两个组收到的小费数(后测值)。

这种实验设计的优点是:①在排除外部因素(如被试熟练度、测试方式)影响的同时,可以有效地确定自变量的影响。②可以排除前测所造成的干扰性影响。被试经过一次前测,后测成绩通常会高于前测,但是由于两个组都同样受到这个因素的影响,因而不会影响实验的内部效度。实验设计的不足是,前测可能会造成被试对后测的敏感,这会降低实验的内部效度。

(二)仅有后测控制组设计(posttest-only control group design)

如果研究者想要避免前测可能会造成被试对后测的敏感,就可以使用仅有后测控制组设计。该设计与前测—后测控制组设计基本相似,唯一不同的是,没有对实验组和控制组进行前测。该设计涉及以下步骤:①将被试随机分配到实验组和控制组;②对实验组进行实验处理,而对控制组不施加实验处理;③对两个组进行后测;④将两组后测的结果进行比较,以确定结果是否有统计上的显著差异。(图9.5)

img16

图9.5 仅有后测控制组设计

仅有后测控制组设计有着广泛的应用。在研究者无法找到合适的前测时,或者当前测可能对实验处理有影响时,它是一种最佳的实验设计。例如,为了弄清敏感性训练课程能否提高教师的士气,研究者可以从该校随机选择100位教师,并将他们随机分配,编成两组,对其中一组进行实验处理(参加敏感性培训工作坊),而另外一组则没有施加实验处理。在工作坊结束后,再用问卷调查来测量两组教师的士气高低。

仅有后测控制组设计的主要优点是:①实验组和控制组都是随机分配的,因此被试的特征、成熟和统计回归都受到较好的控制。②每位被试只接受一次后测,因此测试本身不会对内部效度产生影响。该实验设计的主要缺点是:①被试的流失问题。两组被试由随机分配而成,两组被试的性质相似,但是两组被试的流失率并不相同,因为实验组的流失率可能高于控制组。②由于缺少前测,无法确定两个组的自变量从一开始就是相等的。

(三)所罗门四组设计(Solomon four-group design)

如果将前测—后测控制组设计与仅有后测控制组设计简单相加,就是所罗门四组设计。这种设计是由心理学家所罗门(Solomon,1949)在20世纪40年代提出来的。该设计共分四组,其中有两个实验组和两个控制组,对两个实验组要施加相同的实验处理。该设计的主要步骤如下:①将被试随机分配到四个组中;②其中有一个实验组(第一组)和一个控制组(第二组)接受前测,另一个实验组(第三组)和控制组(第四组)则没有前测;③第一、三组要接受实验处理,而第二、四组则没有实验处理;④四组要同时接受后测。(图9.6)

img17

图9.6 所罗门四组设计

不妨举个例子来说明,为了弄清报纸阅读对大学生时事知识的影响,研究者使用了所罗门四组设计。实验被试是80名大学高年级学生,这些大学生被随机分为4组,每组有20名学生。对第一组和第二组中的40名学生同时进行时事知识测试(前测O1和O3),随后第一、三组(实验组)的40名学生开始阅读报纸(实验处理X)。三个月后再对所有实验组和控制组的80学生进行时事知识测试(后测O2、O4、O5、O6)。如果报纸阅读有效果的话,第一组后测成绩(O2)应当与第一组前测成绩(O1)和第二组后测成绩(O4)均有统计上的显著差异。此外,第一组后测成绩(O2)应当与第二组前测成绩(O3)和第四组后测成绩(O6)也有显著差异。如果这些显著差异确实存在,那么就可以断定,大学生阅读报纸确实对他们的时事知识有影响。值得注意的是,该设计还能用于一系列有价值的比较。比如,要评估前测影响,可以将O4和O6进行比较;要考察随机分配的影响,可以将O1和O3进行比较;通过对比O2和O5,可以了解前测与实验处理之间的交互作用。

当然,也应该看到,设计实验或多或少存在着工具性反应。只要使用了前测和后测,哪怕没有施加任何干预,也会引起测量对象的一些变化。所罗门四组设计有助于弄清这种变化究竟出自工具性反应还是源于实验干预。如果没有工具性反应,两个实验组的后测结果就应该是一致的,两个控制组也是如此。两个实验组或者控制组在后测结果上的任何差异都可以归结为工具性反应的影响。

所罗门四组设计的最大优点是,具有较高的内部效度,能够精准测量干扰因素和交互作用的影响。不过它的缺点也不容忽视:①该设计共有四个组,需要耗费更多的人力、时间、物力和财力;②该设计可以进行拓展包含更多的实验干预,但是每增加一次干预,就要另外增加两个组;③该设计本来是一种单变量实验,但是所得结果必须进行复杂的统计分析。单变量实验结果的统计分析相对简单,两组比较时采用t检验,三组比较时采用F检验,而四组比较时,就要使用更复杂的方差要素分析法(2×2 factorial analysis of variance),这使得本来简单的问题复杂化了。

(四)多因素实验设计(factorial design)

上述三种实验设计各有特色,但都有一个共同点:只处理一个自变量。然而,在实际研究中经常要评定多个自变量的影响。对此,有两种解决办法,其一,为每一个自变量分别设计一种实验来找出影响最大的自变量。但是,逐一进行实验,既不经济也不现实。更重要的是,逐一实验无法弄清多个自变量是如何交互作用而产生影响的。其二,采用多因素实验设计。这种方法不仅节约成本,而且有助于弄清多个自变量(因素)之间的交互作用。

所谓多因素实验设计就是同时考察多个自变量对因变量影响的一种研究设计。该设计的目的在于,同时考察多个自变量的直接影响,以及这些变量是如何相互作用而共同产生一个独特影响的。该设计的最简化形式是2×2因素设计,它以两个自变量为基础,每个自变量有两个取值水平。这种2×2设计形式可以直接套用到多个变量或变量有多个取值水平的情境。从理论上讲,可以有任意数量的自变量,每个自变量可以有任意数量的取值水平。3×3因素实验设计意味着有三个自变量,每个自变量有三个取值水平。而2×3×3因素实验设计则意味着有三个自变量,第一个自变量有两个取值水平,后两个自变量有三个取值水平。

下面举例来进行说明。为了弄清哪一种广告手段对电影推介最有效,研究者采用2×3因子实验设计,比较广播广告、彩色报纸广告和黑白报纸广告三者的相对效果。研究者将被试随机分配到2×3因素设计的每个分组中(图9.7)。该设计有两个变量:广播广告和报纸广告。其中广播广告有两个取值水平:广播广告和无广播广告;报纸广告有三个取值水平:彩色报纸广告、黑白报纸广告和无报纸广告。这样该研究就有六个实验分组:①阅读彩色报纸并收听广播,②阅读彩色报纸但不收听广播,③阅读黑白报纸并收听广播,④阅读黑白报纸但不收听广播,⑤收听广播但不阅读报纸,⑥既不读报也不听广播。第六组是实验的对比组。在六个实验分组分别接受实验处理后,研究者向每位被试进行问卷调查。研究者对问卷数据进行分析,就可以知道哪一种媒体(或媒体组合)的广告效果最佳。

img18

图9.7 2×3因素实验设计

与简单设计相比,多因素实验设计的优点是:①无需对每个变量进行实验设计,只需做一次实验设计,经济又方便。②不仅可以评估自变量的单独影响,而且还可以揭示各个变量之间的交互关系和交互作用。实验中的交互作用是自变量之间的交互影响,一个自变量的变化会对另一个自变量的水平产生影响,例如,不同能力水平的学生会从不同教学内容中获益不同,这里的能力水平和教学内容是自变量。多因素实验设计的不足是:①随着自变量和变量取值水平的增加,实验设计成本会成倍增加,数据分析的难度也会加大。②考虑到前测的敏感影响,多因素设计通常采用无前测设计。由于缺少前测,无法确定各个自变量从一开始就是相等的。