教材内容
第二节学习的联结理论
学习的联结理论认为,一切学习都是通过条件作用,在刺激和反应之间建立直接联结的过程。强化在刺激——反应联结的建立中起着重要作用。在刺激——反应联结之中,个体学到的是习惯,而习惯是反复练习与强化的结果。习惯一旦形成,只要原来的或类似的刺激情境出现,习得的习惯性反应就会自动出现。联结学习理论的代表人物主要有桑代克、斯金纳和班杜拉等。
一、桑代克的联结—试误学习理论
(一)桑代克的经典实验
(二)试误学习的学习原则
桑代克认为,学习的实质就是在情境与反应间形成了一定的联结,而联结形成的过程是一个不断地盲目尝试,不断地淘汰错误反应、保留正确反应的渐进过程。在试误学习过程中,遵循三条重要的学习原则,这就是:
1.准备律
是指学习者在学习开始时的准备状态。学生有准备,进行学习活动就感到满意;如果有准备而不进行学习就会感到失望;若无准备而强制进行学习就会感到烦恼。
2.练习律
是指学会了的反应,经过多次重复练习后,会增加刺激和反应之间的联结,否则这种联结就会减弱。后来,桑代克发现没有奖励的练习是无效的,于是修改为只有通过有奖励的练习才能增强联结。
3.效果律
是指一种行为后面如果跟随着一种满意的变化,在类似的情境中,这个行为重复的可能性将增加;如果跟随的是一种不满意的变化,这个行为重复的可能性将减少。这说明,当前行为的后果对未来行为起着关键的作用。桑代克认为奖励是影响学习的主要因素,认为学习是通过行为受到奖励而进行的。
桑代克的学习理论对美国教育心理学产生了重要影响,并直接影响到斯金纳的操作条件作用理论。
二、斯金纳的操作条件作用理论
斯金纳的操作条件作用理论是在批判性继承巴甫洛夫、华生和桑代克的研究成果的基础上建立起来的,尤其是桑代克的联结—试误学习理论更是斯金纳的操作条件作用理论的基础。
(一)斯金纳的经典实验
图5-2斯金纳箱
斯金纳的整个学习理论是根据他在特制的实验装置——斯金纳箱(见图5-2)中的一系列动物实验结果提出的。斯金纳箱内有一个伸出的杠杆,下面有一个食物盘,只要箱内的动物按压杠杆,就会有一粒食丸滚到食物盘内,动物即可得到食物。斯金纳将饥饿的白鼠关在箱内,白鼠便在箱内不安地乱跑,活动中偶然压到了杠杆,就有一粒食丸滚到食物盘内,白鼠便吃到了食丸。以后白鼠再次按压杠杆,又可得到食物。由于食物强化了白鼠按压杠杆的行为,白鼠后来的反应速率迅速上升。由此斯金纳发现,有机体作出的反应与其随后出现的刺激条件之间的关系对行为起着控制作用,它能影响以后反应发生的概率。通过更为复杂的设计,动物还可以学会分化行为。例如,当灯亮时按压杠杆可以得到食物,而灯灭时按压杠杆得不到食物,由此动物就学会了只在灯亮时才按压杠杆。
(二)操作条件作用的基本规律
1.强化
在斯金纳的操作性条件反射学说中,强化是最重要和最基础的部分。他认为任何学习(行为)的发生、变化都是强化的结果,因而可以通过控制强化物来控制行为。其强化理论可高度概括为:有机体行为的结果(刺激)提高了该行为以后的发生概率。斯金纳所指的强化是一个客观中性的概念,在条件作用中,凡能使个体操作性反应的概率增加的一切刺激和事件都叫强化。他区分了两种类型的强化——正强化和负强化。当环境中某种刺激增加而行为反应出现的概率也增加时,这种刺激的增加就是正强化,如给予食物或奖励;当环境中某种刺激减少而行为反应出现的概率增加时,此种刺激的减少就是负强化,如回避电击或处罚。
斯金纳强调及时强化。他认为强化不及时是不利于孩子行为的发展。教育者要及时强化希望在儿童身上看到的行为。比如父亲在他的儿子给他拿鞋子后立刻表示高兴,这孩子大约第二天会重复这一行为。可是如果父母正在干别的事情,强化延迟了时间,那么孩子的这一行为得不到巩固。如果他在堆积木才表示对儿子取鞋的高兴,那么得到强化的不是取来鞋,而是堆积木。采取及时强化,有利于强化反应和强化刺激的联系,有利于辨认和统一复杂行为环境中的强化刺激作用。
正强化的技术在现实的教育教学过程中,已经得到了广泛的应用。在日常生活中,人们常在自觉或不自觉地运用奖励对他人的行为进行正强化。例如,教师对上课守纪律的学生进行表扬,家长对考试成绩好的孩子给予物质奖励,公司老板为努力工作的雇员增加薪水等等。奖励虽然是塑造行为的有效手段,但是奖励的运用必须得当,否则便会强化不良行为。
2.负强化
当厌恶刺激或不愉快情境出现时,有机体作出某种反应,从而逃避了厌恶刺激或不愉快情境,则该反应在以后的类似情境中发生的概率便增加。这类条件作用称为逃避条件作用,它揭示了有机体是如何学会摆脱痛苦的。在日常生活中,逃避条件作用也不乏其例。如看见路上的垃圾后绕道走开,感觉屋内人声嘈杂时暂时离屋等。
然而,当预示厌恶刺激或不愉快情境即将出现的刺激信号呈现时,有机体也可以自发地作出某种反应,从而避免厌恶刺激或不愉快情境的出现,则该反应在以后的类似情境中发生的概率便增加。这类条件作用则称为回避条件作用,它是在逃避条件作用的基础上建立的,是个体在经历过厌恶刺激或不愉快情境的痛苦之后,学会对预示厌恶刺激或不愉快情境的信号作出反应,从而免受痛苦。如过马路时听到汽车喇叭声后迅速躲避,违章骑车时遇到警察时赶快下车等。回避条件作用与逃避条件作用都是负强化的不同形式。
3.消退
有机体作出以前曾被强化过的反应,如果在这一反应之后不再有强化物相伴,那么,此类反应在将来发生的概率便降低,称为消退。在操作性条件作用中,无论是正强化的奖赏,还是负强化的逃避与回避条件作用,其作用都在于增加某种反应在将来发生的概率,以达到塑造行为的目的,而消退则不然。消退是一种无强化的过程,其作用在于降低某种反应在将来发生的概率,以达到消除某种行为的目的。
4.惩罚
当有机体做出某种反应以后,呈现一个厌恶刺激或不愉快刺激,以消除或抑制此类反应的过程,称作惩罚。惩罚与负强化有所不同。负强化是通过厌恶刺激的排除来增加反应在将来发生的概率,而惩罚则欲通过厌恶刺激的呈现来降低反应在将来发生的概率。但是,以不愉快刺激作用动物的实验表明,惩罚对于消除行为来说并不一定十分有效,厌恶刺激停止作用以后,原先建立的反应会逐渐恢复。故而,惩罚并不能使行为发生永久性的改变,它只能暂时抑制行为,而不能根除行为。因此,惩罚的运用必须慎重,惩罚一种不良行为应与强化一种良好行为结合起来,方能取得预期的效果。
(三)操作条件作用的主要应用
学习的操作性条件作用理论在实际的教学和教育工作中有着非常广泛的应用。影响最大的是程序教学及行为塑造。
1.程序教学
程序教学是20世纪第一个具有全球影响的教学改革运动,深刻地影响了当时美国及世界其他国家的教学实践。简单地说,程序教学是通过教学机器呈现程序化教材而进行自学的一种方法。把一门课程的学习总目标分为几个单元,再把每个单元分成许多小步骤。学生在学完每一步骤的课程后,就会马上知道自己的学习结果,即能得到及时强化,然后按顺序进入下一步的学习,直到学完一个个单元。在学习过程中,学生可按自己的学习能力和学习习惯,自定学习步调,自主进行反应,逐步达到总目标。
程序学习的关键是编制出好的程序。为此,斯金纳提出了编制程序的五条基本原理(原则):
(1)小步子原则:把学习的整体内容分解成由许多片段知识所构成的教材,把这些片段知识按难度逐渐增加排成序列,使学生循序渐进地学习。
(2)积极反应原则:要使学生对所学内容作出积极的反应,否认“虽然没有表现出反应,但是,的确明白”的观点。
(3)及时强化(反馈)原则:对学生的反应要及时强化,使其获得反馈信息。
(4)自定步调原则:学生根据自己的学习情况,自己确定学习的进度。
(5)低的错误率:使学生尽可能每次都作出正确的反应,使错误率降到最低限度。斯金纳认为程序教学有如下优点:循序渐进;学习速度与学习能力一致;及时纠正学生的错误,加速学习;利于提高学生学习的积极性;培养学生的自学能力和习惯。
2.行为的塑造
所谓塑造,就是通过小步反馈帮助学生达到目标。斯金纳认为“教育就是塑造行为”,如何通过强化去塑造行为,斯金纳采用连续接近的方法,对趋向于所要塑造的反应的方向不断地给予强化,直到引出所需要的新行为。例如,家长为了训练儿童的社交技能,开始可以对儿童给客人开门的行为予以强化;然后,当孩子与客人打招呼后,才予以强化;再后,当孩子与客人主动交流时,才予以强化。这样一来,家长就可以教会孩子与他人有效的交流。这时,新的行为就塑造成了。
通过逐步强化可以塑造儿童的良好行为,通过消退则可以消除儿童的不良行为,即通过不予强化来减少某类行为出现的可能性。例如,小孩许多无理取闹的行为实际上是学习的结果,因为他们通过哭闹能得到诸如玩具、冷饮等强化物。为矫正这种行为就不应再给予强化,因为父母的无端让步实际上正起着强化不正确行为的作用。不去强化而去淡化,既可消除不正确行为,又不会带来诸如惩罚等导致的感情受挫之类的副作用。
在塑造行为时要注意这样一条原则:学生必须在他们能力所及的范围内得到强化,同时这些行为又必须能向新的行为延伸。学生能在15分钟内解10道数学题目,如果能在12分钟之内解出就应强化,但不要要求必须在8分钟之内予以强化。但是,一个能做20个题目的学生必须做24题后强化,不能在少于20题时就予以强化。
下面介绍两种行为塑造的技术:[1]
(1)链式塑造
当学生迅速从成功迈向成功时,使用塑造非常有效。这就要将任务分成学多小步子,当学生完成每一步都予以强化。这一过程称为链式塑造,其步骤如下:
① 选择目标,越具体越好。(终点行为)
② 了解学生目前能做什么,已经知道什么。(起点行为)
③ 列出一系列阶梯式的步子,让学生从他们目前状态迈向新的目标。步子的大小因学生的能力而异。(步调划分)
④ 对学生的每一进步都予以反馈,材料越新,学生要求反馈就越多。(及时反馈)
在课堂教学中,塑造是一个重要工具。假设我们想让学生写一段含有一个主题句和一句总结的英文段落(终点行为)。那么,这一任务包括许多部分:能识别并能写出主题句,佐证材料和总括句;能写出一个完整的句子;能正确使用大小写、标点符号和语法;能正确拼写。如果教师在一节课里教所有这些技能,要求学生写出一段文字,并且根据他们的内容、语法、标点和拼写而评分,那么大多数学生将会失败,学生从练习中学不到什么。
反之,教师可以一步一步教这些技能,逐步塑造出最终的技能(步调划分)。学生可以先学习如何写主题句,然后写佐证材料,然后写总括句,在此之前可能专门谈论过如何选题立意。然后,对段落和标点也提出要求。最后,拼写也作为一条标准。在每一阶段,学生都有机会获得强化(及时反馈),因为强化的标准都是他们可能达到的。
(2)逆向链式塑造
应用于教学中的另一种塑造形式是逆向链式塑造,就是“倒序”教授复杂的技能,我们以作文教学的例子来加以说明。
首先,我们可以给学生提供一段没有总括句的段落,要求学生补充,使之成为一篇完整的段落。
然后,我们可以提供一段不完整的文字,要求学生加上一个佐证材料和总括性句子。
再后,只提供一个主题句,要求学生写出几个佐证材料和总括句。
这种教学策略的优势在于,每一次练习的都是一段完好的文字,以这种方式,学生能更好地看见全貌,并且强化的路线较短。
因此,根据操作性条件学说,在教育过程中,教师应多用正强化的手段来塑造学生的良性行为,用不予强化的方法来消除消极行为,而应慎重地对待惩罚,因为惩罚只能让学生明白什么不能做,并不能让学生知道什么能做和应该怎么做。
三、班杜拉的社会学习理论
按照条件作用理论,学习是在个体的行为表现基础上,经由奖励或惩罚等外在控制而产生的,即学习是通过直接经验而获得的。而班杜拉(A. Bandura)则认为,这种观点对动物学习来说也许成立,对人类学习而言则未必成立。因为人的许多知识、技能、社会规范等的学习都来自间接经验。人们可以通过观察他人的行为及行为的后果而间接地产生学习,班杜拉称这种学习为观察学习。
(一)观察学习的经典实验
班杜拉的观察学习理论是建立在他与合作者所进行的大量实验研究的基础之上的。在早期的一项研究中,他们首先让儿童观察成人榜样对一个充气娃娃拳打脚踢,然后把儿童带到一个放有充气娃娃的实验室,让他们自由活动,并观察他们的行为表现。结果发现,儿童在实验室里对充气娃娃也会拳打脚踢。这说明,成人榜样对儿童行为有明显影响,儿童可以通过观察成人榜样的行为而习得新行为。
在稍后的另一项实验中,他们对上述研究作了进一步的延伸,试图了解两个问题:①榜样攻击性行为的奖惩后果是否影响儿童攻击性行为表现;②儿童是否能不管榜样攻击性行为的奖惩后果而习得攻击性行为。在实验中,把儿童分为三组,首先让儿童看电影中成年男子的攻击性行为。在影片结束后,第一组儿童看到成人榜样被表扬,第二组儿童看到成人榜样受批评,第三组儿童看到成人榜样的行为既不受奖也不受罚。然后,把三组儿童都带到一间游戏室,里面有成人榜样攻击过的对象。结果发现,榜样受奖组儿童的攻击性行为最多,榜样受罚组儿童的攻击性行为最少,控制组居中。这说明,榜样攻击性行为所导致的后果是儿童是否自发模仿这种行为的决定因素。
但这是否意味着榜样受奖组的儿童比榜样受罚组的儿童习得了更多的攻击性行为呢?为了回答这个问题,他们在上述三组儿童看完电影回到游戏室时,以提供糖果作为奖励,要求儿童尽可能地回忆榜样行为并付诸行动。结果发现,三组儿童的攻击性行为水平几乎一致。这说明,榜样行为所导致的后果,只是影响到儿童攻击性行为的表现,攻击性行为的学习几乎没有影响。
在大量实验研究事实的基础上,班杜拉认为,人类的大多数行为都是通过观察而习得的。人们通过观察他人的行为,可获得榜样行为的符号性表征,并能由此引导观察者在今后作出与之相似的行为。班杜拉认为,这一过程受到注意、保持、动作再现和动机四个子过程的影响。注意过程调节着观察者对示范活动的探索和知觉;保持过程使得学习者把瞬间的经验转变为符号概念,形成示范活动的内部表征;动作再现过程是以内部表征为指导,把原有的行为成分组合成信念的反应模式;动机过程则决定哪一种经由观察习得的行为得以表现。
(二)观察学习的主要影响因素
1.榜样与示范
社会学习理论认为,榜样的行为对学生的影响很大。一般而言,教师向学生传递社会道德规范主要有两条途径:一条是言语教诲,一条是身体力行。米契尔(W. Mischel)等在要求儿童按规则进行游戏的实验中,把儿童分成两组:第一组的成人要求儿童遵守规则,自己也遵守规则;第二组的成人要求儿童遵守规则,但自己不遵守规则。研究发现,当成人在场时,第二组儿童基本上能严格按规则进行;但当成人不在场时,他们就不按规则游戏了。而第一组儿童自始至终是比较严格遵守规则的。这一结果表明,教育者仅仅对学生进行口头教育是难以奏效的,必须言行一致才能取得良好的教育效果,而且“身教重于言教”。这样,学生才能通过观察学习获得道德行为。
观察学习是通过观察榜样的示范行为而进行的,榜样的特点、示范的形式及榜样所示范行为的性质和后果都会影响到观察学习的效果。研究表明,榜样在年龄、性别、兴趣爱好、社会背景等方面与观察者愈相似,愈容易引起个体的观察学习。这些主客观条件的相似,可以给观察者提供一种可接近感,不致产生“可望而不可及”的感觉。同时,人们倾向于注意那些受人尊敬、地位较高、能力较强、拥有权力且具有吸引力的榜样,而社会地位较低、能力较弱、权力很小且缺乏吸引力的榜样则难以成为模仿的对象。这就是俗话说的“人往高处走”,个体希望通过学习榜样来自我发展、自我完善。
示范行为的独特性、复杂性、流行性和功能性价值等也影响着观察学习的速度和水平。一般而言,独特而简单的活动容易成为观察的对象。榜样行为越流行,越容易被模仿,如各种大众传播媒介中的榜样行为极易成为“时尚”,尤其是电视、电影明星更容易成为学习的对象。同时,敌对的、攻击性的行为远较亲社会行为易于模仿,榜样行为被奖励比被惩罚更能引起模仿的倾向。这一点已在前面的实验中得到了证明。
榜样行为的示范方式主要有五种,它们对于观察学习的效果具有不同的影响。
(1)行为示范:直接通过榜样的表现传递行为方式,如教师的一举一动对学生都会起到示范作用。这种示范方式真实可信,主要通过潜移默化的方式进行,实际效果较好。
(2)言语示范:通过言语描述传递行为方式,如教师的讲解、小说中人物行为的描述。相对而言,这种方式的效果较差。
(3)象征性示范:通过广播、电视、电影等媒介物呈现榜样的行为方式。这种示范在现代社会应用很广,可反复呈现,可多人观察,也可突出某一部分,但可信性较差。
(4)抽象示范:通过榜样的各种行为事例,传递隐含其中的原理或规则。例如,通过一些实例使学生了解到只有尊重他人,才会受到他人的尊重。
(5)参与性示范:学习者在观察榜样行为后马上采取行动,然后再观察再行动。这种方式把直接学习和观察学习相结合,有利于道德行为方式的养成。
2.替代强化和自我强化
班杜拉认为强化包括外部强化、替代强化和自我强化三种形式。首先,如果按照榜样行为去行动会导致有价值的结果,而不会导致无奖励或惩罚的后果,人们倾向于展现这一行为。这是一种外部强化,也就是操作条件作用理论所说的“强化”。
其次,观察到榜样行为的后果与自己直接体验到的后果,是以同样的方式影响观察者的行为表现的,即学习者的行为表现是受替代强化影响的。替代强化的效果主要表现在:①通过观察他人行为的结果,可以了解到哪些行为会受到社会的认可或反对;②使学习者容易模仿受到奖赏的行为,抑制受到惩罚的行为;③看到榜样的行为结果,会产生如果这样做也会得到同样强化的心理期待;④榜样受到奖赏或惩罚而出现的情绪反应,会唤起学习者的情绪反应,并影响相应行为的表现。事实上,在通过观察而习得的无数反应中,看到他人获得积极效果的行为,比看到他人得到消极结果的行为,更容易表现出来。
最后,人们对自己的行为所产生的评价反应,也会调节他们将表现出哪些可观察到的习得行为,他们倾向于作出自我满意的行为,拒绝那些个人厌恶的东西,这实际上是一种自我强化。自我强化实质上是指人们能够自发地预测自己行为的结果,并依靠信息反馈进行自我评价和调节。班杜拉特别强调替代强化及自我强化的作用,这无疑是强调学习中的认知性和学习者的主观能动性。
班杜拉认为,由于大量因素会影响观察学习,因此即使提出最引人注目的榜样,也不会使观察者产生相同的行为。如果要使观察者最终表现出与榜样相匹配的反应,就要反复示范榜样行为,指导他们如何去再现这种行为;并当他们失败时从客观上给予指点,当他们成功时给予奖励。
总之,观察学习在人类学习中具有重要的作用。它不但可以使我们超越经由赏罚控制来学习直接经验的限制,而且可以使我们超越事先设计的学习情境的限制,随时随地进行学习。人的许多社会性行为都是通过观察学习获得的,所以,观察学习是我们对小学生进行品德教育的重要基础。在实际的德育工作中,教师应注意为学生提供良好的可供学习和借鉴的榜样,引导学生学习和保持榜样行为,并为学生创造再现榜样行为的机会,对好的行为给予及时的表扬和鼓励,对错误的行为则给予批评和教育。
[1] 陈琦、刘儒德编:《当代教育心理学》,北京师范大学出版社2000年版,第72页。

