第二节 动物的行为塑造:斯金纳的操作性条件反射理论
日常生活中我们常常会发现一旦某人的一种行为得到奖赏,那他的这种行为就会更多地表现出来,而这种表现往往是主动的。也就是说,人并不是总是对环境刺激做出被动的反应,更多的时候表现出一种主动的行为。这似乎超越了经典条件作用的解释范围,这究竟是怎么回事呢?我们可以从斯金纳(见图6-5)的操作性条件反射理论中找到答案。

图6-5 斯金纳(B.F.Skinner,1904—1990)
率先对此进行研究的是美国心理学家桑代克,他通过迷笼实验对动物的学习行为进行了研究,创立了试误说。该理论中,行为的后果对后继行为再次发生与否起着重要的影响作用,即那些经过行为后果强化
的行为会保留下来,反之则会消退,即效果律。动物会为了达到某种特定的目的而做出适宜性行为,又称作工具性条件反射。美国心理学家斯金纳,新行为主义的主要代表人之一,和早期行为主义者一样,斯金纳将他的理论建立在可观察的外显行为反应上,他继承并发展了桑代克的工具性条件反射,提出了不同于经典条件作用的操作性条件反射理论。
一、操作性条件反射的基本观点
通过研究,斯金纳认为所有的行为可以分为两类:应答性行为和操作性行为。应答性行为是由已知的刺激引发的,如在巴甫洛夫的经典条件作用实验中,狗被动的对食物及条件刺激铃声做出反应。操作性行为则不是由已知刺激引起的,而是由机体自身发出的。如学生成绩优异,受到嘉奖等。相应的,他提出了操作条件作用。如表6-1所示,为经典条件作用与操作条件作用的不同之处。所谓操作条件作用是指在某种情境中,由于个体的自发反应产生的结果而导致反应概率的提高,并最终与某一刺激情境建立起联系的过程。他称为R类条件作用,他认为反应的后果影响进一步的行动,这些后果产生于外部环境,环境引起行为的变化,一个人将来做什么或不做什么,都与他自己与众不同的经历直接相关。强化理论是斯金纳理论的核心内容,行为的习得正是由于具有强化才成为可能。
表6-1 经典条件作用与操作条件作用比较

经典实验6-2
20世纪30年代,斯金纳改进了桑代克的迷笼,设计了一种学习装置“斯金纳箱”(见图6-6)。箱内设一杠杆,当动物压杠杆时,就会有一粒食物丸掉进箱子下方的盘中,动物就能吃到食物。实验时把饥饿的老鼠置于箱内,老鼠可以在箱内自由活动,他在活动的过程中,偶然踏上操纵杆,就会得到一粒食丸。老鼠经过几次尝试,就会不断按压杠杆以得到食丸。

图6-6 斯金纳箱
(一)强化与强化物
1.强化
在斯金纳看来,行为之所以发生,皆因强化。所谓强化是指促使某一操作反应再次发生的概率增加的过程。
2.强化物
能够使反应发生的概率增加或维持某种反应水平的任何刺激皆为强化物。强化物在相应的操作反应之后出现一次,我们就说这一操作反应得到了一次强化。因此,强化是针对反应而言的,而不是针对有机体而言的,例如,我们可以说食物丸强化了老鼠压杠杆的行为,而不能说食物丸对老鼠进行了强化。其次,强化物并不一定是令人愉快的刺激,强化物的作用只在于提高有机体某项行为出现的概率。
(二)强化的类型
斯金纳依据呈现或撤销强化物把强化区分为正强化和负强化;根据强化物的性质把强化物分为一级强化物和二级强化物。
1.正强化
所谓正强化是指在行为之后呈现某种积极的刺激以使行为发生的概率提高,比如儿童会因为老师表扬他作业认真而更加认真地做作业。
2.负强化
负强化是指在行为之后通过撤销某种消极刺激以提高行为发生的概率,比如,在闷热的教室里打开窗户可以使闷热的环境消失,从而提高开窗户这一行为的发生率。
3.强化与惩罚的关系
正强化与负强化都是为了增加某一行为发生的概率。与强化不同的是惩罚,惩罚是为了降低某一行为发生的概率,比如通过打骂而消除孩童的不良行为。相应的惩罚也可以分为两种类型,即正惩罚和负惩罚。正惩罚通过呈现某种消极刺激来降低行为发生的概率,负惩罚则通过取消某种积极刺激来降低反应发生的概率。如表6-2所示为不同类型强化与惩罚的比较。
表6-2 不同类型强化与惩罚的比较

4.一级强化物和二级强化物
一级强化物可以满足人和动物的基本生活需要,无需学习,它包括所有在没有任何学习发生的情况下也起强化作用的刺激,如食物、水等。二级强化物是指任何一个中性刺激如果与一级强化物反复联合,它就能获得强化的性质,是一种习得的强化,如激励、表扬等。二级强化物即那些在开始时不起强化作用,但后来作为与一级强化物配对出现后起强化作用的刺激。斯金纳认为,对于人类来讲,二级强化物包括对大量行为起强化作用的许多社会性强化物(如声誉、地位等)、信物(如钱、奖品、级别等)和活动(如玩游戏、旅游等),这些大多是由社会文化所决定的,它们构成了决定人类行为的极有力的二级强化物。父母和教师有时可以用一级强化物如糖果等强化学生的正确行为,但是教师更多地应该使用二级强化物强化学生的正确行为,如好的分数、赞赏、鼓励、表扬等。
强化原理中,有这样一个原则——普雷马克原理(祖母原则),即用高频的活动作为低频活动的强化物,或者说用那些学生更喜爱的活动奖励他们从事那些他们不太喜欢的活动,注意顺序不可颠倒。例如:学生必须先完成作业,然后才可以出去玩;或者先把玩过的玩具整理好,才可以拿新玩具玩。
(三)强化的安排
强化的安排指强化出现的时机和频率。斯金纳认为在行为实验中,强化方式是最容易控制的、最有效的变量。在精确控制的实验情境中,实验者可以精确地决定使用什么类型的强化、怎样给予强化,以及何时给予强化。

图6-7 强化程序安排
>如图6-7所示。强化的类型很多,包括连续强化(即时强化)和间隔强化(断续强化)、定比强化和变比强化、定时强化和变时强化等。其中,如果在每一个适当反应之后呈现一个强化,这叫连续强化;间隔强化是指间隔一定时间或一定比例进行强化。定比强化是指间隔一定的次数然后给予强化,例如每隔5次强化一次,而变比强化是指两次强化之间间隔的次数是不同的。定时强化是指强化的时间间隔是固定的,变时强化是指强化之间间隔的时间是变化的。强化既能影响行为的习得速度与反应速度,也能影响行为的消退速度(彭聃龄,2005)。
间隔强化程序与连续强化程序相比具有更高的反应率和更低的消退率。间隔强化程序由于有一个时间差,开始为较低的反应率,但在时间间隔的末尾反应率上升,出现一种扇贝效应,学生在期终考试前临时抱佛脚就证明了这一点。定比强化对稳定的反应率比较有益,而变比强化则对维持稳定的和较高的反应率最为有效。现实生活中我们往往巧妙运用不同的强化安排来强化人的某些行为。
斯金纳通过严格的实验对操作条件作用进行了深入细致的研究,他提出了操作性条件反射理论,并以此为基础建立了操作性条件反射的学习理论,在一定程度上克服了桑代克的试误说的局限,以及巴甫洛夫和华生的经典条件作用理论用联结观解释学习现象的局限,将学习理论推向了一个新的高度。他的理论在西方学习理论中占有极重要的地位。他对强化进行的研究既深入,又具体,系统性很强,揭示出的强化规律客观可靠,在多个领域得到广泛应用。
二、斯金纳的人格理论及应用
斯金纳还将操作性条件反射应用于对人的研究,他指出人根本不可能有绝对的自由与尊严,人只可能是环境的产物;人们是否做出某种行为,只取决于一个因素,那就是行为的后果;人的内部心理过程也只能是环境产生行为时的副产品;人不能自由选择自己的行为而只能根据奖惩来决定自己是否作为以及如何作为。机体正是通过操作性条件反射形成与特定情境相适宜的行为的,而个体行为的综合即是人格。人格是逐步塑造的结果,正常人格和异常人格都是人在与环境的相互作用过程中习得的,有的人会因为他们的经历而形成一套异常的独特的反应模式。在斯金纳看来,正常的个体和异常的个体,从本质上讲并无二异,不必用不同的强化原则解释他们的行为,同样的强化原则适用于所有个体的行为。我们来看一下生活中,家长是如何在不知不觉中塑造了孩子的不良行为的:平心而论,家长都希望孩子是礼貌、亲和的,但现实中家长有时会专注于自己的事情,即使孩子多次发出某种请求依旧充耳不闻,于是孩子就会变得恼怒、暴躁、摔东西,以发泄怨气,这时家长才会对孩子的需求进行关注并予以满足,时间久了,孩子就会变得粗暴无礼,甚至暴力。
当然,现实生活中有一些异常的个体并非无药可治,他们的不良行为可以通过行为矫正得以改变,行为矫正可以通过代币管制法和使用厌恶刺激两种技术来实现。