1.10 第七章 教育实验研究法

第七章 教育实验研究法

实验,是此处所要强调的一种最主要的科学方法,用最简单的话来说,是指对处于不同的环境下的团体或个人进行比较。——萨克斯和法恩(Leonard Saxe and Michelle Fine)
 理解教育实验研究法的含义及特点,了解教育实验研究法的类型
 掌握实施教育实验研究法的一般程序
 掌握教育实验变量的种类及变量的控制方法
 理解教育实验效度,掌握实验效度的类型及影响实验内外效度的因素 理解教育实验设计的原则,掌握良好实验设计的标准
 掌握教育研究中常用的教育实验设计模式教育实验;自变量;因变量;教育实验效度;教育实验设计教育实验研究法虽然是与调查研究法、观察法并列的方法,但是在使用过程中,并非是完全独立的,需要与其他研究方法结合使用。为了凸显教育实验研究法的独特性,本章探讨了如下问题:在界定教育实验研究法内涵的基础上,阐述教育实验变量的控制方法,并分析了教育实验效度含义,探讨了影响教育实验内在效度和外在效度的影响因素;为了使学习者能够初步地进行教育实验设计,阐述了教育实验设计的原则、良好教育实验设计的标准,并详细叙述了教育研究中常用的教育实验设计模式。
班杜拉关于儿童攻击性行为习得的实验①班杜拉认为,攻击性的社会化是一种操作性反应,如果攻击性是采取社会允许的方式表达,如打球、射击等运动,就得到成年人的鼓励。如果攻击性是采用社会不允许的方式来表达,如打人、骂人、破坏财产等,就会受到制止、批评,甚至惩罚。所以儿童在观察攻击的模式时,会注意什么样的攻击行为会被强化。凡是得到强化的模式便会增强模仿。为了验证上述假设,20世纪50~60年代,班杜拉利用“充气娃娃”做了一系列的实验。其中有一个实验较为精致。班杜拉让4岁儿童个别观看一个男人坐在充气娃娃身上并拳击娃娃的电影。电影中攻击行为的结果分三种,第一种是攻击—奖赏型,即攻击者受到“勇敢的优胜者”赞扬并奖给巧克力、汽水等。第二种是攻击—惩罚型,即攻击者被斥为“大暴徒”,畏缩地逃走。第三种无结果,即未得到奖赏,也未得到惩罚。观看三种不同结果的电影的儿童被安置在实验室中,室内有充气娃娃和其他玩具,主试透过单向玻璃观察儿童的行为。结果发现,观看攻击—惩罚电影的儿童,其攻击性行为比其他两组少得多,几乎没有发生攻击性行为;而观看攻击—奖励型和无结果型电影的儿童都进行了模仿,即攻击充气娃娃。当主试回到房间里告诉儿童,凡能再一次模仿榜样行为的人可以得到果汁和一张美丽的图片时,所有的儿童,不论观看哪一种电影结尾的被试都模仿榜样行为,攻击充气娃娃,其模仿行为的过程是一样的。从上述班杜拉所做实验的简要介绍中,我们得知教育实验研究法实施过程中要有明确的研究主题,并清晰地确定研究变量,为了确保实验效度,教育实验研究要根据良好实验设计的标准进行设计,且对变量加以严格控制。在进行教育实验研究法学习之前,我们需要思考如下几个问题。1.什么是教育实验研究法,它具有哪些特点?2.如何进行教育实验设计才能确保实验的内在效度和外在效度?3.实施教育实验研究时,控制无关变量的方法有哪些?4.教育研究中常用的教育实验模式有哪些?第一节 教育实验研究法概述一、教育实验研究法的含义及特点教育实验研究法注重理论假设,强调严格控制,关注假设检验,从而主动地揭示教育① 王振宇.儿童心理发展理论[M].上海:华东师范大学出版社,2000:96 97.题目是编者加的,引述过程中作了细微改动。
活动的规律性,它是一种综合性的研究方法。
所谓教育实验研究法,是指在人为的严密控制的条件下,有计划地逐步操纵实验变量,观测与这些实验变量相伴随的现象的变化,在一定时间内,将收集到的教育效果资料进行比较分析,反复验证,揭示教育的因果关系,揭示教育与人的发展规律。阅读资料7 1适于实验法的议题实验法特别适合于范围有限、界定明确的概念与假设……实验法特别适用于假设检验。实验法更适合于解释,而不适于描述。例如,假定我们试图研究对黑人的偏见,并想找出解决的办法。我们假设了解黑人对美国历史的贡献会减少对他们的偏见,我们就能通过实验来验证。首先,我们可以测出一组实验对象对黑人的偏见程度。然后,我们可以放映一部描绘黑人对美国科学、文学、政治以及社会发展做出卓越贡献的纪录片。最后,我们重新测量他们的偏见水平,看看这部影片是否有效果。
用实验法来研究小群体互动也很适合,并相当成功。我们可以把一小组受试者聚在一起,分给他们一项工作,诸如为推广使用停车场,然后观察他们如何自行组织并处理问题。这种实验做过几次之后,我们可以尝试改变工作的性质或奖励措施,然后观察在各种条件下,小群体如何以不同方式自我组织、运作,这样我们就可以对小群体互动的特性有更多的了解。资料来源:[美]艾尔·巴比.社会研究方法(第8版·上)[M].邱泽奇,译.北京:华夏出版社,2000:295 296.教育实验研究法特点表现在如下方面。
(一)由“因”追“果”,是描述“未来事件”的研究
教育实验研究法把在一定条件下将产生什么结果的因果关系作为焦点。它是为了解决某一教育问题,根据一定的教育理论,组织有计划的教育实践,到规定的时间以后,就实验效果进行比较分析,从而得出科学的结论。教育实验研究法更加关注“未来”的实验结果。
(二)有目的地控制研究变量
有目的地控制研究变量是教育实验研究法的精髓,没有控制,就无所谓实验。控制研究变量就是指研究者主动操纵自变量,客观地测量因变量,严格地控制有机变量、控制变量及减缓变量。自变量是实验者操纵的假定的原因变量;因变量是一种假定的通过自变量的作用而发生变化的结果变量;有机变量、控制变量、减缓变量是指除自变量以外一切可能影响因变量,并对实验可能起干扰作用的变量。
(三)能够致物以变
研究者不用被动地等待所要观察研究被试心理、行为现象的发生,而是创造条件主动地引起被试的反应,以此来考察被试的反应与条件之间的关系,探讨事物的本质联系。
这样就可以扩大研究的范围与深度,使研究者在自然教育情境中难以观察到的现象也可以进行研究。
由于教育实验研究法能够致物以变,只要我们能够提出理论假设,又具备主客观条件,不管现实中能不能直接观察到,我们都可以研究,扩大研究范围。此外,也能通过实验研究确定某种特定变量的效果。
(四)具有教育性
教育实验研究法既是实验性的教育实践活动,又是教育性的实验研究活动,是实验性和教育性的统一。教育实验的教育性主要体现在如下方面:(1)一个教育实验工作者不仅是实验的设计者、组织者、实施者,同时又必须是一个教育者,必须在教育人的过程中研究教育,实验者与教育者的角色要融为一体。(2)教育实验研究法更多的是在真实的社会环境和学校环境里进行,而不是在专门的实验室中进行,这种真实的环境本身就是一种教育情境和教育手段。(3)教育实验研究法既要确认教育现象之间的因果联系,即旨在求真;又要探索有效的教育内容、教育方法、教育途径,旨在求善。它既要有求真做基础和前提条件,又要以至善为出发点和归宿,即要受到真理标准和价值规范的双重制约。
(五)具有可重复性
教育实验研究是能够以相同方式重复进行的,如此就可以验证实验研究结果的信度和效度。凡是通过理论假设正确,设计严密,操作严谨所得到的实验结果,重复验证一定能够成功。由于实验研究法可以重复验证,人们就可以通过大量的重复实验,以验证理论假设的正确。
(六)可精确记载实验的结果
在教育实验研究过程中,按照实验设计的程序和要求,研究者能够主动操纵自变量和有效地控制无关变量,运用测量及统计等手段对自变量和因变量的关系进行分析,以精确的数据记录实验结果,因而能够有效推断自变量和因变量是否具有因果关系。二、教育实验研究法的类型按照不同的分类标准,教育实验研究法可以分成不同类型。给教育实验予以恰当的分类,其目的主要是为了揭示教育实验的本质属性,明确教育实验的外延,并对不同类型教育实验的实施与操作、评价及进一步科学化问题提供依据。
(一)根据对实验变量的控制程度划分为前实验、准实验、真实验
前实验可以进行观察和比较,但对无关因素的干扰和混淆因素则缺乏应有的控制,因而无法验证自变量与因变量之间的因果关系,也很难将实验结果推论到实验以外的其他情形。
准实验是不能随机分派实验对象的,无法像真实验那样完全控制误差来源,只能尽可能地予以条件控制。准实验是在教育的实际情境中进行的,因而具有推广到其他教育
实际中去的可行性。之所以说教育实验大多属于准实验,是因为教育实验的情境和教育实验对象的特殊性。教育实验难以满足一般科学实验的规范要求,在许多教育实验中,实验对象是处于正常的自然状态下接受实验的。
真实验是能随机分派被试,完全控制无关干扰源,系统地操作自变量的实验。真实验相对于前实验和准实验,是最规范的。
(二)根据教育实验中自变量因素的多少划分为单因素实验、双因素实验、多因素实验单因素实验,又称作单一变量实验,是指在实验中只施加一种实验变量的实验。如在进行某学科教学时,对实验班和对照班,同一位教师将课时、教材、大纲等各种因素控制不变,仅将教法这一因素作为自变量,看是否会影响学习效果,这种实验即为单因素实验。
双因素实验,又称双变量实验,是指在实验中施加两种实验变量的实验。双因素实验较单因素实验对变量控制的要求更加严格,实验的结果也更加多样化。
多因素实验,又称组合变量实验,是指在实验中施加两种以上实验变量的实验。
(三)根据教育实验的目的划分为探索实验、改革实验、验证实验
探索实验是把教育研究放在第一位,按预先的研究目的操纵实验变量,目的是清楚地认识所要研究的某个问题的状况,即把某个教育问题弄个水落石出,探索教育规律。例如,如果要研究造成幼儿园分离焦虑的原因,就需要对各种可能引起幼儿园分离焦虑的因素进行探索性实验。
改革实验的做法是按实现制订的改革计划进行实验,看改革的方案是否可行。如进行幼儿园课程改革实验。
验证实验是对已经取得的实验结果进行重复实验,从而对已经取得的认识成果进行检验、修订和完善。
(四)根据实验的范围划分为单项单科实验、综合实验和整体实验
单项单科实验是针对学校教育中的某一方面、某一课题或教学科目范围内某门学科的教材教法而进行的单一实验。
综合实验是从多角度或多方面同时开展几项有关课题的实验,旨在探索有内在联系的多项教育因素的相互关系情形,以便对教育进行综合性的改革和治理。
整体实验是在系统论思想指导下,对学校教育的各阶段和各种因素进行系统设计和全面改革,以期达到整体最佳效果的实验。三、实施教育实验研究法的一般程序教育实验研究的全过程可分为准备—实施—总结与评价三个基本阶段。这是一个相对稳定的、有序的结构序列。
(一)教育实验的准备
教育实验准备阶段的总体任务是制定实验研究的实施方案,其具体任务包括如下方面。
1.确定实验研究课题,明确实验研究目的
研究者要研究什么问题,试图达到什么样的目的,是进行教育实验之前必须明确的。教育实验研究课题的语言表述应该明确且具有操作性,对课题中涉及的基本概念应该含义清晰,避免模棱两可产生歧义。
2.明确教育实验的理论基础,提出实验研究的理论假设
任何一个教育实验课题,都应该明确其理论基础。理论基础是提出研究假设的依据,也是实验过程的指导性理论,对实验研究的方向、范围乃至实验资料的收集都会产生影响。如“小学生主体性素质发展与培养的实验”,其理论基础是马克思主义关于人的全面发展理论和主体哲学思想,这种理论基础要求该实验探讨小学生主体性发展的内在机制和培养途径,实验资料的收集也要围绕这一方面来进行。
课题选定、理论基础明确之后,就要着手提出研究假设。教育实验研究假设是在经验总结、理论演绎或初步研究获得某些认识的基础上提出并完成的,它是有根据的推测。研究假设往往是把实验变量与因变量的关系用文字或数学模型表达出来。
3.选择被试,分解实验变量,进行实验设计
选择、分解、进行,这是准备阶段的核心工作。实验课题、理论假设提出后,就要明确和分解实验变量。实验的自变量是什么?有多少个自变量?因变量是哪些?有哪些无关变量?这些问题都应该在实验开始之前确定。变量分解后,还需要对变量的操纵、控制,以及变量呈现顺序、实验的辅助手段、条件等方面进行规定,根据教育实验课题的性质、任务和类型,选择实验设计类型,进行合理的教育实验设计。实验设计过程中,还要考虑被试的选择方法,是用随机抽样法,还是用非随机抽样法,如果选择随机抽样法,还要考虑是用简单随机抽样法,还是随机数据表法或者其他。
4.选择或者编制合适的统计测量工具和手段
教育实验研究中采用哪些统计和测量工具或量表观测因变量是实验开始之前要准备好的。统计和测量工具及手段,应根据教育实验研究课题的要求选择已有的合适的量表,或者重新编制有关量表,如调查问卷、观测指标、学业成绩测试量表,从而准确地描述和评价因变量的状况。
(二)教育实验的实施
实施阶段是教育实验的实质阶段,能否按照实验设计有条不紊地展开实验过程,是决定能否得出可靠的实验结论的关键。实施阶段的具体任务主要有三个方面。
1.按照实验设计,操纵自变量。即进行实验处理,有步骤地改变所要研究的实验条件,向被试呈现自变量。
2.控制无关变量。采取有效方法,消除无关变量对被试的影响,或者使无关变量对被试的影响相对稳定,甚至恒定。
3.随时观察和测量因变量,收集实验数据和其他重要实验资料。在实验前、实验中、
实验结束时,分阶段收集被试和因变量的数据等资料。
(三)教育实验的总结与评价
教育实验的总结与评价是实验的结束阶段。其任务主要体现在如下方面。
1.对实验数据和有关资料进行统计分析,在统计分析的基础上,对变量做相关分析、因果分析,得出实验结论。
2.评价实验结论。通过检验实验误差,分析实验的效度。必要时还需要进行小规模的重复实验。
3.撰写教育实验报告。标准的教育实验报告通常由7个部分组成。(1)题目。题目必须简洁明了。它应该是对实验报告的主要观点的概括性总结,包括所研究的变量(即自变量和因变量)以及它们之间的相互关系。(2)摘要。摘要是对实验报告内容的简短而全面的概括,能够让读者迅速总览全文的内容;并且,与题目一样,摘要也是各种数据库中常见的检索对象。一篇好的摘要应该具备以下特点:①准确性。摘要应能准确反映研究报告的目的和内容,不应包含文中没有出现的信息。②独立性。摘要应自成一体,独立成篇,对所有的缩写、省略语和特殊术语做出说明。③简练而具体。摘要中的每个句子都要能最大限度地提供信息,并尽可能的简洁。(3)引言。引言往往包括提出问题、说明研究背景、阐明研究目的和理论基础等3部分内容。(4)方法。方法部分要详细描述研究是如何进行的,说明你对变量的处理过程。这样的描述可以使读者对你的方法的适当性以及你的结果的可靠性和有效性(即信度和效度)进行评价。通常方法部分被分成三个带标题的层次,这些层次包括被试、仪器(或材料)及程序。(5)结果。对数据的收集过程及所使用的统计或数据分析处理进行总结,这是结果部分的任务。在该部分中,你要向读者说明主要的结果或发现,尽量详细报告数据以验证结论。要报告所有相关的结果,包括那些与假设相矛盾的结果。个案设计或单样本研究,一般不需要报告单个被试的数据或原始数据。(6)讨论。讨论是一篇文章中最富创造性的部分。在这里可以对研究结果进行评价,并解释研究结果的意义,特别是与你的初始假设有关的结果。你可以自由地检验、解释和描述结果,并对结果进行推论。要强调对结果的理论分析以及所得结论的有效性,这一点很重要。(7)参考文献。参考文献写在文章的结尾处。文中凡是引用前人或他人的观点、数据和资料等,都要对它们在文中出现的地方予以注明,并列入参考文献表中;而且,参考文献表中的文章或著作也必须是在文中引用过。第二节 教育实验变量控制及实验效度一、教育实验变量控制控制是教育实验的最本质的特征。研究者要提高实验研究的质量,就应加强对教育
实验中变量控制的研究。变量的控制,从广义上讲,它包括实验进程中自变量、因变量及无关变量的控制,以及对因变量的观察、记录和测量。从狭义上讲,控制仅仅是指对无关变量的控制,而对自变量则使用“操纵”一词。
(一)自变量的控制
自变量的控制,就是实验者对自变量的操作和具体处理。控制时,要令其有系统地变化,而且变化的差异要尽可能大。如,要研究时间(自变量)与遗忘(因变量)的关系,实验者怎么控制“时间”这个自变量呢?正确的控制方法是:时间的选择应采用1、3、5、7、9等日期的变化顺序,而不宜采用1、2、3、4、5、6等小时的变化顺序,因为后者变化差异太小,所产生的效果不易辨别。又如,以教学方法作为自变量时,则两种(或两种以上)教学方法应有显著的不同,实验效果才便于比较。譬如,要检验教学中启发式教学法的效果,比较组(即控制组)应采用讲授式教学法,而不应采用提问式或暗示式教学法,因为讲授法与启发式差异明显,而提问式或暗示式均与启发式有相似之处,若采用后两种方法,效果不容易进行比较。
此外,控制自变量还可以从如下方面着手。其一,对自变量进行明确界定,并写出操作性定义,令其重复不走样,推广不失实;其二,实验者严格按照预先界定的自变量的含义和要求去实施。如“用活动教具教大班幼儿画人物不同姿态的实验研究”课题,“活动教具”就是这个实验的自变量,研究者给“活动教具”下了操作性定义,即指用吹塑纸剪成一个长圆形、一个大长方形、四个小长方形,连接成正面、侧面两种模拟人形,连接处用针线订好,可以活动。实施实验时,如果实验者能够严格按照上述操作性定义对自变量进行操纵,那么就是对自变量的控制。
(二)因变量的控制
因变量的控制主要包括指导语和指标的确定,其目的就是全面、客观地对因变量进行测量。
对指导语的控制,就是指必须使导语标准化,即对所用的词语、主试者的表情、语言、声调等方面都做统一化处理。指导语设计应具有指向明确、简洁明了、易于理解的特点,让被试清楚明白,并做出相应的反应。
指标是指对被试反应的观测或对因变量的度量指标。一般而言,在教育实验研究中,作为因变量的观测指标主要有如下几类。
1.准确性方面的指标
正确率或错误率,它常用在观测被试的知识和能力等方面的发展状况。
2.速度或敏捷度方面
这个方面通常有两种情况:一是工作量一定,完成工作所需要的时间;二是时间一定,所完成的工作量的多少。如搭建某一造型作品所需要的时间、每分钟阅读的速度等。
3.概率或频率
某些反应出现的概率或频率,也常被用作反应变量的指标。
4.各种成就测验与心理测验的量表分数及评价者的评定分数等
在教育实验研究中,究竟应该如何选用恰当的因变量指标,研究者要根据研究的需要及有关的研究经验确定。阅读资料7 2确定因变量的指标的基本要求1.关联性。它是指选择的指标必须与研究目的和研究对象的特殊性相适应,指标能够度量某刺激引起的真实反应,而不是其他别的什么。
2.灵敏性。它要求因变量的指标对于自变量的变化有较高的分辨能力。指标的灵敏性主要取决于指标变量范围大小。范围越大,指标越灵敏。
3.客观性。它要求指标的解释不以研究者或被试的主观意志为转移。根据指标的来源,指标可以分为客观指标和主观指标两类。用客观方法确定的指标为客观指标,如测量分数、身高、体重、呼吸、脉搏等;用主观方法规定的指标就是主观指标,如课堂气氛活跃程度、学生的喜欢与否等。
在测验中,若光凭主观指标下结论是不能令人信服的,因为不同的研究者,对同一个问题的主观感觉是不同的。所以,确定因变量应以客观指标为主,主观指标只能作为参考。此外,用测验成绩作为因变量的指标时,测验应尽量选用客观型测试题。问答题应根据事前拟定的详细、明确的评分标准评分。
4.稳定性。它要求在进行重复实验的时候,指标的数值接近。为了提高指标的稳定性,测量因变量的测验要有信度,要尽量设法减少实验误差。
指标的稳定性和灵敏性常常不能兼得;追求指标的稳定性,常须以牺牲指标的灵敏性为代价。反之,也是一样。资料来源:吴振东.学前教育科研方法[M].北京:教育科学出版社,2012:185 186. (三)无关变量的控制
无关变量是指那些在教育实验研究中研究者操纵的自变量外一切能影响实验结果的变量。对于无关变量,研究者难以一一加以控制,通常的控制是指尽可能地将其中最明显的无关变量、对实验效果有重大影响的无关变量挑选出来,加以控制。控制的方法主要有消除法、恒定法、平衡法、随机法、抵消法、纳入法等。
1.消除法。研究者设法排除或隔离教育实验中的无关变量,使自变量简化,从而突出自变量与因变量的因果关系。消除法虽然能很有效地控制无关变量,但是由此得出的实验结果会缺乏普遍的推论性。例如,只用男生为研究对象,将来结果就不适用于女生。因此,在实验设计中,消除法并不是很常用的方式。
2.恒定法。研究者在教育实验研究中,尽量使无关变量恒定地作用于实验,从而不影响实验效果的推断。
3.平衡法。在分组比较实验中,尽量使实验组和对照组(控制组)受到同等变化的其他变量影响。在教学方法的实验中,实验者经常使各实验组的教师水平和被试数目、智力水平、知识基础相当,使自变量均衡地作用于各组,最后把各组因变量之差合乎逻辑地归结为自变量的作用。
4.随机法。在选择被试、安排实验处理顺序等许多实验环节上不受实验人员主观意图的影响,而由偶然机遇来决定。教育实验研究中,实际使用这种方法时,可以划分成两个步骤:第一步使用随机的方法将参加实验的所有人员进行均等分组;第二步是再以随机的方法决定哪个组是实验组,哪个组为控制组(对照组)。随机控制的方法,虽然在事实上未必各方面都完全相等,但理论上他们相等的机会是比较多的。
5.抵消法。让同样的被试先后接受几种不同的实验处理,使每一种实验处理以不同的次序出现,列成机会均等的组合,并随机分派接受各个顺序的组合。
6.纳入法。就是把影响实验结果的某种(或某些)因素也当作自变量来处理,将其纳入实验设计中,成为多因素实验设计。这样,不但可以收到控制效果,而且还可以进一步了解变量间的交互作用的结果。二、教育实验的效度(一)如何理解教育实验效度
教育实验效度是指一个教育实验的有效性,它是衡量教育实验成败优劣的关键性质量指标。教育实验效度分为内部效度和外部效度。
内部效度是指在实验中自变量和因变量之间存在的关系的明确程度。内部效度用于理解数据,并从中得出结论。它对自变量是否能真正与因变量区分开来提出疑问。为回答这个问题,研究者需要确信能控制诸如无关变量,并且不会将产生的效应错误地作为实验处理效应。
外部效度是指设计实验结果的可推广度。实验可以推广到怎样程度的总体、变量、情境等。一般来说,内部效度越充分,结果推广度越大,研究越有用。阅读资料7 3实验外部效度的构成美国教育实验研究专家布拉切特和格拉斯(Bracht C.H.&Glass C.V.)于1968年发表《实验的外部效度》,对实验的外部效度的性质作了区分,提出了两种性质的外部效度:总体效度和生态效度。
总体效度是指实验的结果能推论到何种总体。实验结果可以从实验样本推论到既定总体。例如,从一个特定的学区随机抽取100名小学生进行活动教学的实验,实验结果显示活动教学比常规教学法效果为佳。这一实验结果,一般只能推广到作为样本来源
的总体,即那个特定的学区。布拉切特和格拉斯称这一有限群体为“实验切近总体”。如果样本是随机抽样的,实验结果就完全可以推论到“实验切近总体”。有时,我们想把实验结果从“实验切近总体”进一步推广到更大的群体,如上例,进一步推广到全国的小学生,“全国小学生”这一更大群体称为“目标总体”。但如果做这样的推广,就需要比较“实验切近群体”与“目标总体”之间的相同程度。如果“实验切近总体”与“目标总体”的重要特征相类似,那么,由“实验切近总体”推广到“目标总体”也是可以的。
生态效度是指一种情境或条件下的实验结果推广到其他情境或条件的程度。如果实验结果受实验情境或条件限制,那么它的推广也要受到同样的限制。要提高生态效度,应注意如下问题:(1)应完整地描述实验所涉及的操作和实验背景。(2)推广实验结果时应考虑实验安排,尽量减少霍桑效应。(3)应考虑变量的代表性。(4)避免相互作用的效果影响,如前测提高实验对象的敏感性,其所获结果就难以推广到无前测的总体。(5)测量工具的影响。资料来源:杨小微.教育研究的原理与方法[M].上海:华东师范大学出版社,2011:147.尽管进行教育实验设计时,研究者都希望实验的两种效度保持在较高水平,但是有些情况下,确保一种效度,就会削弱另一种效度。随着实验的控制越来越严格,在实验中可发生的和在自然教育条件下可发生的两者间的一致性就越小。
当内部效度与外部效度相矛盾时,我们应该注重外部效度。正如莱瑞(Leary,1995)指出的,科学更注重理论的推广性,而不是个别实验的结果,后者却普遍地被用来检验理论。如果我们知道理论已经被严格的实验所支持,我们就可以试探性地探究它的实践意义。
(二)影响教育实验效度的因素
1.影响教育实验内部效度的因素
(1)偶然事件
偶然事件是指研究者在实验进展过程中没有预测到的影响因变量的事件的发生。例如,在相对较短的教学实验中,一组被试因学校停电而不能对其进行正常教学。
(2)成熟
成熟是指在实验期间,实验对象的身心发生变化也会影响实验变量对因变量的作用。例如,实验对象在实验期间变得更成熟、健壮、疲劳、饥饿、分心、没兴趣等,这些改变均会影响实验结果。又如,教育工作者要测试一种新的阅读方法的效果,在一年的新的阅读方法教学过程中,实验对象因年龄增长而在认知能力方面自然发展和成熟或词汇的自然增长,都可能干扰自变量的效果,所以阅读能力的提高,就难以单纯归因于新的阅读教学法。
(3)测验
测验是指测验的暗示对实验结果的影响。有些教育实验,为了比较实验前后的情
况,往往在自变量之前进行测验,这时的测验称前测。被试在接受前测时产生的经验常常有助于自变量之后的测验(称后测)成绩的提高,尤其是前后测的题型基本相同时。这是因为实验对象在经过前测后,会熟悉测验的题型,掌握应对测验的技巧。所以,即使没有自变量的效果,也可能因前测经验的影响,而导致后测成绩的提高。
(4)工具
工具是指测试手段对实验因变量的影响。测试手段是指由于测评者本身的疲劳、有单调感、注意分散以及其他主观因素和测试工具本身的变化,使测定和评级的精确性受到影响,从而降低内在效度。例如,两个主考官对同一项教学实验进行后测所用的程序和方法不同,从而导致实验结果的差异。
(5)统计回归
数理统计学的基本原理告诉我们,在进行重复测量时,初测时获高、低极端分数者会在重测时倾向于向平均值偏移,即发生“统计回归效应”。如,在一项阅读教学的实验中,前测中阅读成绩差者组成的组,较之于成绩一般、好的组进步大得多。再如,我们对200个人进行数学推理的标准测验,这一测验有两个相等的形式,或我们知道的两个相等的版本。这一测验的平均分数值是100分里的60分。我们选出15个分数最高的和15个分数最低的,两组的平均分数分别为95分、30分,然后我们用另一个版本重新测验。现在我们可以发现两组的平均分数分别是87分、35分。在第二次测验时,这两个极端组的分数向平均数回归了:高分组的得分比第一次低些,低分组的得分比第一次高些。统计回归带来的危险在于,由于被试原先处于极端的位置,他们发生的变化会让人误判为实验刺激的效果。
(6)选择的差异
所选择的两组或几组被试,在未受实验处理之前,本来各方面的能力就有所偏差或不相等,那么实验结果的差异,就不能说是单纯由实验处理所造成的。例如,进行英语教学实验,在实验方案要实施之前,实验组学生的英语基础就明显地高于对照组的学生。在实施实验方案后,测量的结果如果显示实验组成绩显著高于对照组成绩,这种差异可能并非完全由实验处理所造成,而是由实验组和对照组原来的英语基础的差异所导致。所以,在采用两组或多组的实验中,实验者必须考虑不同组别实验对象在各项特质上是否一致。如果组别之间实验对象的特质不一样,实验效果可能是原来实验组之间所存在的差异,而非实验处理的结果。
(7)实验对象的流失
实验对象在实验期间的流失,如择校、转学、迁居、退学、死亡等,则可能使实验结果难以解释。
(8)对照组成员的自暴自弃
在实验中,对照组(控制组)觉得受到差别待遇,就有可能因此自暴自弃。在教育实
验中,自甘堕落的对照组成员可能会停止读书学习,寻衅滋事,而且愤愤不平。因为对照组成员的上述行为,将会导致实验的内部效度受到影响。
2.影响教育实验外部效度的因素
(1)测验的反作用或交互作用效果
测验的反作用指前测对后测的作用;测验的交互作用,指前测与后测的交互作用。有前测经验会造成后测成绩好。在有前测和后测的实验设计中,前测的经验往往会限制研究结果的推论性。因为,由于实验对象对实验处理具有敏感性,平常情境下未曾注意到的问题或现象,这时变得更加敏感和警觉,以至实验效果可能部分来自于前测的实验所产生的敏感性。因此,前测的实验结果,只能推论到有前测经验的情境,而不能推论到其他没有前测经验的团体中去。
(2)被试取样的代表性
被试的代表性是影响实验结果推广的一个重要因素。只有参与实验的被试具有代表性,从样本推论总体才可靠。从抽样理论可见,只有从总体中随机取样,才能保证样本的代表性,但在实际中很难做到,特别是当总体非常大甚至达到无限的情况下。例如,“幼儿”是一个无限总体,包括中国的、外国的幼儿,过去、现在、将来的幼儿,就无法对其进行随机取样。
同样,由于取样的方法不当或取样错误,研究者选择参与实验的样本具有某种心理特征,这种特征与实验处理发生作用共同对实验结果产生消极或积极的影响,导致该样本的实验结果难以推论到总体。例如,如果选择一些智力水平较高的学生,进行发现学习和接受学习的比较,实验结果发现前一种学习方法优于后一种学习方法,但这一结果不能推论到实验外的其他智力水平的学生中去。
(3)实验处理的多重性
同一被试多次接受实验处理时,由于前一实验处理通常不会很快消失,从而会对后一实验处理产生积极或消极的影响,发生重复处理的干扰,使被试产生练习或疲劳效应。有多重处理的实验结果难以推广到没有重复实验处理的情境。例如,坎贝尔和斯坦利证实,艾宾浩斯的遗忘曲线受到多重处理的干扰,因为他的发现只对已经学习了多列无意义音节的被试来说是正确的,而不能运用到只学习了一列无意义音节的被试。再如,比较集中学习法、分散学习法、整体学习法和部分学习法的效率时,让每位被试重复采用这四种学习方法,如果发现其中的整体学习法效果最好,研究者并不能将这种结果推论到仅仅接受一种整体学习法的处理情境,因为整体学习法之所以取得良好的效果,可能是和其他三种方法共同交互作用的结果。①
(4)特异性效应
在教育实验研究中,由于实验和研究采用了新异的方法、特殊的材料和情景,或者使① 杨小微.教育研究的原理与方法[M].上海:华东师范大学出版社,2011:147.
被试改变自己已经习惯了的活动、工作方式和环境,因而产生暂时的新异性反应,影响研究的效度。例如,学生知道自己被选择参加一项新的教学方法的实验,因而在实验期间表现出比平时更高的兴趣和动机,更强烈的学习主动性和积极性结果使实验结果发生很大的改变。
(5)实验者效应
在教育实验研究中,实验者本身的个性特征、动机、情绪或其他细微而无意的行为均会把实验目的、结果的期望等也无意中传递给被试,从而影响被试的反应,使自变量与因变量之间的关系变得模糊不清,进而限制了实验的外部效度。例如,津古伯等人发现,当观察者在场时,母亲表现出了更多的耐心、温柔和关注。布罗迪等人也发现,当观察者在场时,兄弟(或姐妹)之间很少互相取笑、威胁和争吵。实验者可能并没有意识到他在被试出现正确反应时点了点头以示肯定,而对错误则皱了皱眉以示否定。实验者的性别、种族和伦理观念也是潜在的实验者效应。第三节 教育实验设计教育实验设计,一般以教育实验方案的形式表现出来。教育实验方案的形成,实际上是对教育实验的总体构想,是一个从明确研究目的,形成假设,确定实验研究变量,确定取样的方法和安排实验处理的一系列活动过程,而不仅限于对教育实验类型的选择。实验设计是教育实验研究的主体工作,也是整个教育实验研究关键的一环。教育实验设计的科学性是教育实验达到实验目的的重要保证。一、教育实验设计的原则(一)确定变量关系
在教育实验研究中,一定有三种变量,即自变量、因变量和无关变量。任何一项实验,都是根据研究目的,操纵自变量,使其对被试产生影响,控制无关变量,使它们保持恒定,观察因变量以便揭示自变量与因变量之间的因果关系。
(二)取样在量上和质上都要有代表性
取样就是从一个总体中选出一部分被试作为研究对象,抽取出来的那一部分被试叫做样本。由于研究范围的不同,抽取的样本容量存在差别。研究个别问题,取样每组为30人即可;研究带有普遍性问题,人数要更多一些。取样要考虑被试的年龄、性别、文化背景、心理水平的代表性,使样本能够真正代表全体,使结果具有真实性和全面性。
(三)教育实验分组
在教育实验研究中,我们把接受自变量刺激的一组对象叫做实验组,而把不接受自
变量刺激的一组叫做控制组(或对照组)。设置控制组的主要目的,是为了将研究本身对实验对象的影响与实验刺激(即自变量)的影响区分开来。为了达到这种目的,就要求实验开始前,实验组和控制组成员的各方面条件和状况相差无几,即基本上不存在大的差别。
针对实验组或控制组,研究者在进行样本分组时要考虑如下方面:(1)便于体现实验要求;(2)有利于限制无关因素的影响;(3)用尽可能少的实验次数取得最好效果。
教育实验研究中的分组一般存在三种情况。(1)单组。同一组被试先后接受所要研究的自变量的影响。(2)等组。就是把被试按相似条件分成两组或几组,分别接受自变量的影响,等组可以是两组也可以是3组或更多组。(3)轮组。就是以不同的顺序,使各组被试轮流接受所要研究的自变量的影响。
(四)科学安排前测和后测
由于任何实验的关注点总是在于自变量(实验处理)的效果,所以,证明这种自变量确实产生了某种效果,就显得非常重要了。正是这种证实自变量在产生效果中的中心地位的需要,使得前测、后测设计在教育实验研究中具有重要地位。实际上,实验者所寻求的并不是自变量实施后的结果,而是因变量的变化——从自变量实施前的某个时间点到自变量实施后的某个时间点的变化。在实施实验处理以前对实验对象进行的测量成为前测;而在实施自变量后对实验对象的测量称作后测。二、良好教育实验设计的标准(一)充分的实验控制
这个标准是指对实验条件有足够的控制,以便研究者能解释结果。实验设计被高度结构化,如果实验变量产生效应,就可被观察到。
(二)不加人为修饰
教育研究的对象是以育人为目的的教育活动,因此,教育实验设计不可能像自然科学那样进行精确的控制与操纵。为了使研究成果能够在更大范围内得到使用,确保实验结果推广到非实验设计的教育情境中,研究者倾向于不对实验情境进行过多的人为修饰。
(三)比较的基础
需要通过某种方式进行比较以确定是否有实验效果。在一些实验中,我们使用控制组——即不受实验处理的组。教学实验中的控制组常包含用传统方法施教的一组学生。比较还可以在两个或多个实验处理中进行,偶尔采用一些外在标准。
(四)通过数据获得充足的信息
数据必须足以检验实验假设,应有对假设做出判断的足够的精度。
(五)非污染数据
数据应充分反映实验效应,但不应被实验中出现的蹩脚的测量或误差所影响。来自
不同组的个体不应互相影响而削弱实验效果,或导致实验效果不具代表性。
(六)无相关变量间的干扰
这一准则与充分的实验控制密切相关。可能存在其他正在操作的对因变量有影响的变量。如果这样,这些影响不应被错误地理解为实验效应。我们分离、控制这些效应的途径就是实验设计。
(七)代表性
研究者常希望将实验的结果推广到一些个体、条件、方法等中去。为了获得具有代表性的实验结果,研究者常采用某种随机方式,或者通过对实验被试的选择,或者通过对接受实验处理的被试的分配。
(八)省力原则
省力原则是指如果所有其他特征相同,我们更倾向于采用较简单的设计而非较复杂的。三、教育研究中常用的教育实验设计在阐述各种实验设计之前,我们首先把实验设计模式中所采用的符号及其含义做一简单说明。
X:表示一种实验处理,即研究者操纵的实验变量(自变量);在比较不同的实验处理时,以不同的下标来表示不同的实验处理,如X0、X1、X2……
O:表示实验处理前或实验处理后的一种测量数据或观察结果,或评估结果。
 自左向右:表示时间的次序或先后。
 同一横行的X或O,表示X或O作用于同一组被试。
R:表示对被试进行随机化的选择和分配。
G:表示组,即实验分组,不同的组用不同的下标表示,如G1、G2、G3……
 ——:表示没有实验处理。
(一)真实验设计
1.仅施后测控制组设计
仅施后测控制组设计最简单的形式包含两个组,即接受实验处理的组和控制组。被试在实验前被随机分到两个组,实验组接受实验处理,控制组不接受实验处理。在实验结束时,测量两个组的数据并以此作为研究的因变量。这种测量最好在实验一结束就进行,特别是当因变量可能随时间而改变时更需如此。
仅施后测控制组设计对教育行政工作者来说是有效的设计,它不需要进行在很多情况下并不理想亦不实用的事前测试。仅施后测控制组设计只需要根据所在组被试确定,其他变量也可能在设计之中。
两个组的简单形式可以用符号表示如下:
RG1 X RG2 ——  O2  O1仅施后测控制组设计还可以扩展到更多的组,也就是说,可以对两个或更多的组进行实验处理,增加组数至3个或者更多。从总体中抽取的被试应随机分组,各种不同实验处理的效应可以通过比较组间的行为表现来研究。从更广泛的意义上说,仅施后测控制组设计用符号表示如下:RG1 X1
O1 RG2 X2
O2  RGk Xk
Ok RGk+1 ——  Ok+1案例7 1 PBL教学模式对幼儿元认知、合作水平及提问能力的影响研究①深圳市某幼儿园为了验证“基于问题式学习”(Problem-Based Learning,简称PBL)教学模式对幼儿元认知、合作水平以及提问能力的影响,进行了为期1年的实验研究。
他们根据随机取样原则,在大班中选择了一个实验班、一个控制班,并从愿意担任实验任务的教师中挑选了两位业务素质、教学水平、工作年限都相近的教师组织两个班的科学活动。实验班采用PBL教学方法,控制班采用传统教学方法活动。整个实验期间,除了教学方法不同外,幼儿园对这两个班的其他各项活动一视同仁,在大班下学期期末进行测验作为或后测成绩。
这个实验设计由于在实验前进行了随机取样,幼儿、教师的水平大体相当,况且在整个实验过程中对其他无关变量进行了控制,使无关变量对两个班的影响效果基本相同,因此可将实验班幼儿元认知水平、合作能力以及提问能力的显著提高归因于PBL教学方法所产生的效应。2.前测—后测控制组设计
在实施实验处理之前加上测量的话,仅施后测控制组设计就被扩展为前测—后测控制组设计了。增加的前测要得到什么信息呢?前测得分可能会作为分析中的一项统计控制量。在一些实验中,尤其是在教学领域,要分析得分(即后测与前测得分)的差异。
从最简单的形式来看,前测—后测控制组设计包含两个组——一组接受实验处理,另一组不接受实验处理。这种实验设计形式可用符号表示如下:① 吴振东.学前教育科研方法[M].北京:教育科学出版社,2012:193.题目是编者加的。
RG2 RG1 O3 ——O1 X O2 O4在前测—后测控制组设计中,Os增加了一倍,所以用奇数做下标的Os表示前测,用偶数作下标的Os表示后测。
前测—后测控制组设计可扩展到包含两个以上的组。总体上用符号表示如下:RG2 RG1 O3
X2 O1
X1O2 O4   RGk+1 RGk O2k+1 ——O2k-1
XkO2k O2(k+1)上述符号表示有k个接受实验处理的组和作为控制组的一个比较组。如果使用两个或更多的实验处理,而不需要控制组,我们称该设计为前测—后测随机分组设计。
3.所罗门4组设计
以最简单的形式把前测—后测控制组设计和仅施后测控制组设计组合起来可以得到一个新的实验设计,这是由所罗门提出的。所罗门4组设计包含控制组、实验组各2组,而实验组接受的实验处理是相同的。两种类型的组中各有1组接受前测,实验结束后对4个组均进行后测,每组被试都是随机分配的。
所罗门4组设计用符号表示如下:RG1 RG2 O1 X O3 ——RG3 —— X RG4 —— —— O2 O4  O5 O6因为是4组设计,实验包含4个组,只有一个实验处理。比较实验组和控制组后测得分可以确定实验效果。只有一个实验处理,X就没有下标。组1和组3是实验组,组2和组4是控制组(图示中没有X)。
因为对一些组进行了前测,而一些组没有前测,所罗门4组设计的优点在于能使研究者检验前测带来的可能效应。前测影响后测得分,前测与实验处理相互作用都是可能的。也就是说,实验处理的效应对有前测和没有前测的组是不同的。因为在实际的课堂实践中前测不是规定要做的,所以它经常是效度所要考虑的问题。
4.多因素实验设计
多因素实验设计(也称因素设计)是操纵两个或两个以上自变量,以探讨每个自变量对因变量的影响,自变量之间的交互作用及其对因变量的综合影响。
多因素实验设计的基本构造在于,每一自变量的所有水平与其他自变量的水平结合使用。设计中至少需要2个自变量,每一个自变量至少有2种水平。这种最低限度的因素设计称为2×2因素设计。从理论上讲,可以有任意数目的自变量,而且每一自变量可以有任意数目的水平。因素设计可以用数字来命名设计,如2×4因素设计,阿拉伯数字的个数表示自变量数目,数字的值表示自变量的水平。自变量数目不必与其水平完全相同。在2×3×5因素设计中,有3个自变量,相应的变量水平为2、3、5。
在多因素设计中,随着自变量和水平的增加,分组的数目也迅速增加。2×2因素设计有4个组。但是若增加一个具有2个水平的自变量,就会使组数增加到(2×2×2)个即8个。如果一个2×2因素设计,每个自变量增加一个水平,则成了3×3因素设计,使组数增加到9个。由于水平必须包含在所有的组合中,故而组的数目就是指定的因素设计中所有阿拉伯数字的连乘积。
多因素实验设计的优点在于:多因素设计只需要一个设计,经济方便,并非要对每一自变量都提供不同的设计,且可以研究变量间的交互作用。案例7 2多因素实验设计举例①要探讨两种不同教学方法对两种不同能力水平儿童学业成绩的影响,研究涉及两个自变量,一个自变量是教学方法(X),它有两种水平X1、X2;另一个自变量为儿童的学习能力(Y),它也有两种水平Y1、Y2。这个实验设计是(2×2)因素设计。基本模式如下:RG1 RG2 RG3 RG4 X1 Y1
O1 X2 Y1
O2 X1 Y2
O3 X2 Y2
O4  5.重复测量设计
在一些实验中,被试要接受多次相同的测量。例如在学习实验中,被试常常完成一系列任务,如解决一系列问题,以了解学习是否已经发生了。重复测量设计最简单的形式是对所有的被试进行实验处理。如果有k个实验处理和n个被试,则设计可以用如下形式表示:S1 S2 X1 O——X2……Xk O X1 O——X2……Xk O   SnX1 O——X2……Xk O① 郑金洲,陶保平,孔企平.学校教育研究方法[M].北京:教育科学出版社,2003:225.题目是编者加的。
S表示特定的被试,所有被试接受相同方法的实验处理。O表示每一实验处理之后都对因变量进行的测量。
重复测量设计特点如下:(1)对被试测试产生大量的数据。(2)所有观察结果并不是独立的。对不同被试的观察结果是相互独立的,但是对于同一个被试的几个观察结果则是相互联系的,这是因为它们来自同一名被试。在分析数据时,必须考虑这一点。
重复测量设计的缺点在于多次重复测量容易使人们熟悉这一特定的特征。解决这一问题的途径是均衡设计,即打乱问题的排列顺序,对实验处理进行平衡。
6.时间延长设计
有时候,在研究教育变量和行为科学的其他变量时,把握显示变量影响需要的时间可能是困难的。对某些变量,影响的持续时间是未知的。实验的设计可扩展为核实可能的滞后影响或核实影响持续的时间。这些可以通过额外的观察,即时间延长来实现。如果研究者以这样的方式扩展仅施后测控制组设计,则可能的设计形式用符号表示如下:RG1 X O1——O2——O3 RG2 —— O4——O5——O6在这个实验设计中,对G1进行了实验处理后观察2个组。然后,在没有进行额外的实验处理的情形下,对2个组进行规定的、固定的、连续的观察。时间间隔的长短根据研究的变量而定。
(二)准实验设计
在进行教育研究时,被试的挑选和组合不可能总是随机的。在教育领域中,有许多被试是既定的,如一个班级里的学生自然而完整地形成被试群体。当这种保持原样的组运用于一个实验中时,我们就称之为准实验设计。下面介绍几种典型的准实验设计。
1.非对等仅施后测控制组设计
除了不是随机地将被试组成实验组外,许多准实验设计看起来与前述真实验设计很相像。
当运用“非对等”这个术语时,它意味着随机意义上的非对等,但并不是说实验组间不可能在相关变量或特征上具有相似点。对于准实验设计来说,其结果效度的可信性,很大程度上取决于保证实验组间的相似性。
非对等仅施后测控制组设计包含与实验处理次数一样多的实验组,再加上一个控制组。研究中使用现成的实验组进行,仅在实验处理实施后测量被试一次。
非对等组仅施后测控制组设计的最简单的形式用符号表示如下:G1 X—O1 G2 —O2这种设计表示:一个实验组接受实验处理,同时另一个实验组作为控制组不接受实验处理。对实验组G1完成实验处理不久,同时对两个实验组进行后测。这种设计可推广
为包括任意次的实验处理。对于k次实验处理,这种设计需要k+1个实验组。G1 G2 X1——O1 X2——O2  GkXk——Ok  Gk+1 ——Ok+1任何实验的效度均依赖于特定的实验条件,采用非对等仅施后测控制组设计的实验效度一般都是较低的。这个难点可能产生于实施实验处理前挑选被试的偏差和缺少前测。除非能获得可以提供有关各实验组相似程度这样的现成资料,否则不应该采用这种实验设计。这些资料虽然不能消除被试挑选上的偏差,但它们提供的信息可以避免对实验结果的错误解释。
2.非对等前测—后测控制组设计
非对等前测—后测控制组设计除了对被试也施加前测外,其他方面与非对等仅施后测控制组设计相似。加入有k次实验处理,其一般形式可以用符号表示如下。G1 G2 O1——X1——O2 O3——X2——O4   Gk Gk+1  O2k-1——Xk——O2k  O2k+1 ——O2(k+1)这种实验设计的最简单形式仅需要两个实验组:一个实验组和一个控制组。
前测的结论对核实各实验组的相似性是非常有帮助的,因为前测的分数是与因变量有密切关系的变量。这种前测是在进行实验前在同样的条件下对所有被试都进行的测试,其分数也可用于统计控制。案例7 3幼儿园进行的两种新的阅读教学方案实验研究者在幼儿园中进行两种新的阅读教学方案的实验。同一学区幼儿园的30个中班按原编制参加实验,不进行随机取样,随机结合。每种方案有10名教师报名参加教学,即两种新方案和一种传统方案由10名教师来执行。当然,每个教师只能执行一种方案。教学时间为18周。实验前进行前测,学习结束后对全体幼儿进行后测。3.轮组实验设计
轮组实验设计,也称平衡设计,是对不同的组以不同的顺序,轮流施加不同实验处理
的实验设计。操作时要使每一个组接受实验组合的影响,即让每组被试同时接受不同的实验处理。第一轮实验以后,测量两组的教学效果,再将两种处理轮换对调,进行第二轮实验,再次测量两组的教学效果,然后将测量结果进行比较。其基本模式用符号表示如下。G1 G2 O1——X1——O2——X2——O3 O4——X2——O5——X3——O6案例7 4轮组实验设计举例①某幼儿园进行比较分组教学和集体教学的效果实验。选定中班两个班做实验班(假设是1班、2班)。实验开始时,先测量两班幼儿的智力,即进行前测。然后实验组进行分组教学,对照组进行集体教学。经过一学期后,进行第一次后测,分别求出每个班后测与前测成绩之差(假设分别为S11、S12)。然后1班进行集体教学,2班进行分组教学。经过一学期再测量两班的智力,即进行第二次后测。再分别求出第二次后测与第一次后测成绩之差,分别为S21、S22,然后把S11±S22与S12±S21进行比较,如果前者高则说明分组教学效果好,反之则说明集体教学效果好。
在轮组设计中,主要无关因子对反应变量的影响在对调轮换过程中相互抵消了,因而实验设计较为可靠。但因对两组实验对象分别进行处理,实验时间延长了一倍,花费的人力、物力也相应增加了一倍,比较麻烦。况且途中轮换教材、教法不易保证学习的系统性,因此轮组实验在教学中用的不是很多。课堂讨论7 1一项教育实验获得组别的最理想的方法是随机选择和随机分配被试。然而,采用原始的小组进行准实验设计有时也是必需的。当我们采用原始被试组时,可能会带来一些什么样的困难?本 章 小 结教育实验研究法主要探讨了如下内容:
1.教育实验研究法的内涵、教育实验研究法的特征以及教育实验研究法的一般程序。① 吴振东.学前教育科研方法[M].北京:教育科学出版社,2012:195.题目是编者加的。
2.分析了教育实验中涉及的变量类型、变量的控制,尤其是无关变量的控制方法。
3.阐述了教育实验研究的效度及影响实验研究内部效度、外部效度的因素。
4.叙述了良好教育实验设计的标准,介绍了真实验研究、准实验研究的典型设计模式。拓 展 阅 读1.张宝臣,李兰芳.学前教育科学研究方法(第2版)[M].上海:复旦大学出版社,2012. 
2.王彩凤.学前教育研究方法[M].北京:北京师范大学出版社,2011. 
3.[美]艾尔·巴比.社会研究方法(第8版·上)[M].邱泽奇,译.北京:华夏出版社,2000. 
4.威廉·维尔斯马.教育研究方法导论(第9版)[M].袁振国,译.北京:教育科学出版社,2010.思考与探索1.什么是教育实验研究法?
2.请确定一个教育实验研究课题,根据实验研究程序,撰写一份实验研究计划。3.控制教育实验研究中无关变量的方法有哪些?
4.影响教育实验研究效度的因素有哪些?
5.什么样的设计是良好的教育实验研究设计?
6.在教育研究中,常用的教育实验设计模式有哪些?