《別斃了那隻狗》

下载本书

添加书签

別斃了那隻狗- 第6部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
所以出现问题,通常是因为人们把它用在没有经验、不明白人们想要什么的狗儿身上,这时人们很容易把这个讯号比照P字链使用:叫狗儿坐下,牠没坐下,立刻喊:「错!」如果这个讯号确实带有「不会获得增强物」的意义,那么「没有坐下」的行为即遭到处罚。但是这并不代表坐下的行为现在即将发生,事实上它的后果很可能与其它处罚一样无可预料,狗儿可能完全不再反应并低头怯怯地偷偷溜走,或者牠会放弃你,开始自己寻求增强物,因而出现不当行为,例如吠叫、暴冲、嗅闻地面或抓痒,把注意力移到他处。

无法预料的奖励更具吸引力变化的强化 (p。56)

(Schedules。of。Reinforcement。–。p。20)。

有个广为流传的错误观念是,当开始以正增强训练某个行为时,便必须在训练对象的余生里一直使用正增强物,如果不这么做,这个行为将会消失。这个说法并不正确,事实上只有在学习的阶段才需要持续使用增强物。你可能会经常称赞幼儿使用马桶的行为,但是一旦这个行为完成学习,它将自行获得增强。我们应该常常给予初学者增强物,例如教小孩骑自行车时可能需要不断告诉他:「那就对了,现在骑稳,你做到了,很好!」如果当他学会骑车而你却仍不断称赞他,这时你就很蠢了(小孩也会以为你发神经了)。

为了使学成的行为维持一定的可靠程度,非但没有必要每次都增强这个行为,而且极为重要的是,不可以经常增强这个行为,而要改为偶尔增强,而且是随机性(无法预测)的增强。

心理学家称这种增强方式为「变化性增强时制」(variable schedule of reinforcement),它维持行为的效果比起持续性、可预测的增强方式更好。一位心理学家曾跟我这么解释:假设你的新车总是很容易岭动,某天当你坐上车后把车钥匙一转,它却没发动,你可能会再试着发动几次,但是你很快就会判断这辆车出了问题而打电话给修车厂,由于转动车钥匙的行为没有立即带来期待的增强结果,这个转动钥匙岭动车子的行为很快便会消失。相反地,如果这是台老旧的破车,几乎很少在第一次就发动,而且通常还得花很久时间发动,这时候你便可能花上半个小时不断试图启动,因为这个转动车钥匙的行为长期以来一直受到变化性增强,因而能稳定维持着这个行为。

如果海豚每次跳跃都一定有鱼吃,牠跳跃的动作将很快变得马虎敷衍,过得去就好,然后要是不给鱼了,海豚跳跃的动作很快就会消失。不过,如果在牠学会跳跃就有鱼吃的概念后,我现在开始只增强第一次跳跃、第三次跳跃,接着便随机增强牠的跳跃动作,这个行为就会稳定维持下来,当动物没获得奖励时,牠们反而会更常跳跃,期盼下次中奖的机会,而且跳跃时甚至可能变得更有活力。如此一来,我便能够选择增强较具活力的跳跃动作。

利用变化性增强时制可以塑造出较佳的表现。不过即使是专业动物训练师,有些人仍法善用变化时制的正增强方法,它对许多人似乎都是个特别难以理解与接受的概念,我们都知道当错误行为停止时,我们就不必再继续处罚,可是我们往往无法理解为何没有必要继续奖励好的行为或甚至不应该这么做。这其实是因为我们想以正增强训练出进退有礼的良好行为时,我们自己也不太确定应该怎么做。

变化性增强时制的威力正是赌博的本质,要是每次投一块硬币到吃角子老虎里就会有十块硬币掉出来,你很快就会丧失兴趣,虽然你的钱会越来越多,但是这种方式实在很无趣。人们之所以爱玩吃角子老虎正是因为他们无法预料将出现什么:可能空空如也、可能掉下一些钱、也可能掉下很多钱。我们不在这里讨论为什么有些人会沉迷赌博,而有些人能够拍拍袖子走人,不过对于那些好赌成瘾的人来说,变化性增强的作用就是让他们上瘾的原因。

变化性增强出现的时间间隔越长,它所维持行为的效果就越强,不过如果你想设法消除某项行为,把时间间隔拉长的变化性增强就对你很不利。所有未获增强的行为都有自行消失的倾向,但是如果它不时获得增挂,尽管只是偶发事件  抽根烟、喝杯酒或者对不断唠叨或哀求的人梢事让步  这个行为不仅不会消失,事实上它可能反而被这种间隔拉长的变化性增强时制维持得更好,这就是为什么已经戒烟的人若偶尔偷偷抽根烟,在一天内即可能又变回大烟枪。

我们都看过一些遭配偶或情人施虐的人,难以理解他们为何依然留在这些人身边,这种爱上恶劣、毫不体贴、自私甚至很残忍的人却执迷不侮的情况,传统以为只发生于女性,但实际上这也发生于男性。大家都认识这类人,如果他们以离婚或其它方式离开恶劣的另一半,他们旋及又会找到同类型的对象重蹈覆辙。

这些长期成为受害者的人是否具有严重的心理问题呢?有这个可能,不过他们也可能是长间隔变化性增强时制的受害者。常你刚开始与对方交往时,认为对方迷人、性感、风趣你的钱会越来越多,但是这种方式实在很无趣又无微不至,即使这个人日后逐渐变得难以相处,甚至施暴,但偶尔还是会对你展现好的一面,即使获得这些美好增强物的时光变得越来越罕见,它却成了你的人生寄托。从常理来看,这似乎是十分反常的现象,但是从训练观点的角度看来却显而易见:这些美好时光出现得越少、越无可预测,它的增强作用越强大,而且你的基本行为也将越为持久。此外,也不难理解为什么曾经有过这类关系的人会再度寻求同类对象,因为他们与和善正派的正常人交往时可能就是少了那种增强物极少出现、令人渴盼、因而增强效果加倍所带来的快感。

从操纵者的角度来看,想任意使唤某个人、并且让他随时言听计从,只要偶尔给他他想要的东西就可以达到目的了,这便是皮条客管理手下妓女的手法之一。它的确是个极为有效的方法,但是一旦受害者理解到操纵者的强烈「魅力」至少有部分来自这种变化性增强时制,他们通常便能冷静离开这种关系,找寻不同的对象。

不适用变化性增强的情况 (p。59)

(Exceptions。to。Variable。Reinforcement。–。p。23)。

在行为学成后不应该采用变化性增强的情况只有一种,那就是当这个行为牵涉到解答问题的时候。高级服从训练要求狗儿从一堆杂七杂八的东西里找出主人摸过且带有气味的对象,每当狗儿选对对象时都必须让牠知道,这样牠才知道下次该怎么做。进行分辨测验(例如找出两个声音之频率较高者)时,动物每次答对都必须获得增强,这样牠才能一直获知要求牠回答的问题是什么(当然,这时可以使用制约增强物)。我们在玩填字游戏或拼图时,每次猜对就会被增强,因为只有正确的字或拼图片才能放入对应的空格或位置里,如果每个空洞都可放入多片拼图,你便得不到因正确选择带来的正增强,这种回锁对于多数选择性测验的情境都是必要的。

如何打破「起头最难的障碍」 (p。60)

(Long〥uration。Behaviours。–。p。24)。

除了变化性增强时制之外,我们也可以采用「固定增强时制」(fixed schedules of reinforcements),这意谓动物必须在预定时间内持续某项行为,或者必须完成预定次数的行为之后才会获得增强。举例来说,我可以安排海豚连续跳跃,每跳完六次就增强一次,于是连跳六次的行为很快就会经常出现。但固定增强时制的问题是,连续行为当中较早出现的行为永远得不到增强,于是常会变得越来越马虎,过得去就好。以海豚跳跃为例,除了最后一次实际获得增强的跳跃动作以外,其它跳跃动作将逐渐变得越来越小。固定增强时制的缩减效应或许是影响人类许多任务的一项因素,以工厂装配线为例,人们通常必须工作一段固定时间才能获得增强,与工作表现优劣无关,人们当然只想尽量少花力气,只要足以让他们待下来就好,而且每次刚开始工作时的表现可能会特别糟。以海豚来说,偶尔随机增强第一次或第二次跳跃对于维持行为的效果与增强第六次跳跃一样有帮助。对人类来说,如果各式奖励津贴或其它形式增强物(例如颁奖)与工作量或工作表现有直接关系,并且不与平常的增强物同时出现,它的增强效果将会很好。

无论采取固定或变化性增强时制,都可以训练出一长串的连续行为,小鸡可以为了一粒玉米猛啄钮扣一百次以上,人类也有许多久候增强的例子,有位心理学家开玩笑地说,自人类存在以来,等待时问最久、一直未获增强的行为就是念研究所。

间隔极长的增强时制有时会因为超过极限而失效,小鸡的忍受极限与代谢有关,如果小鸡花在啄东西的能量高于一粒玉米提供的能量时,啄东西的行为通常会消失,因为做这件事所获得的好处太少,变得不值得做。这种情形当然也常岭生在人类身上。

间隔极长的增强时制也可能产生另一个现象,小鸡一旦开始啄东西以后即会毫不间断地持续啄,因为每啄一次将更接近获得增强的机会,不过研究人员注意到,增强间隔拖得越长,小鸡开始啄东西的行为就会越晚出现,这种情形称为「长时间行为的延迟启始现象」(delayed start of longduration behavior),这是每个人在日常生活中都非常熟悉的现象。

遇到任何耗时很长的工作时,无论是报所得税或整理车库,每个人都想得出许多无法立即开始进行的理由。写作(有时甚至只是写封信)是个花时问的行为,虽然一旦开始写了之后通常会进行顺利,但是要叫人坐下来开始写真的很难! 作家詹姆斯·索伯 (James Thurber)发现,要他开始着手写稿真的非常困难,他

小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架