《別斃了那隻狗》

下载本书

添加书签

別斃了那隻狗- 第9部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!

实际应用这个原则时,它意谓当你提高行为标准时,你应该把要求定在动物已经可以达到的行为范围内。如果你的马匹能够跳过两呎高的障碍,有时还高出一呎,你便可以试着把一些障碍调高到两呎半,但是把所有障碍都调高到三呎就是自找麻烦,虽然动物有能力做到,但是牠还无法经常出现这个行为,如果把障碍调高到三呎半,当然肯定是彻底失败。

无论现在或未来,调高增强标准的快慢与动物的实际能耐无关,不管牠是否是只可能跳高八呎的长腿大马,也不管牠是否惯常跳过四呎高的牧场围栏,调高增强标准的快慢与你透过塑形过程达到的沟通效果有关,如果动物清楚你的增强原则,就可以早点调高标准。。

。。。。每次调高增强标准时,你便改变了规则,所以你必须让训练对象有机会发现:虽然规则改变了,只要牠多费点儿劲表现,仍然可以轻易获得增强物,而且继续维持旧标准的行为有时已经不管用了。然而牠只有在达到新的增强标准时获得增强,才能够学会这一点。。

。。。。如果你把增强标准调得过高,要求牠出现超乎过往能力的行为。┅。不管牠自己平常是否出现这个行为。┅。你都是在冒险,因为牠的行为可能因此完全瓦解,牠在跳跃过程中也很可能学会不良习慎,例如临阵拒跳或撞掉跳杆,你必须耗时费力才能根除这些不良习惯。所以塑造行为最快的方法。┅。有时也是唯一的方法。┅。就是调整增强标准时,调高幅度必须很容易让动物持续进步,即使每次进步只有一点点,持续的进步仍然比强求快速进步、可能失去所有良好表现的冒险作法更能快速达到你的终极目标。。

。。。。我曾经见过一位父亲犯下这种严重错误。他青春期的儿子功课很差,于是他没收了儿子最爱的机车,等到功课变好时才会还他。他儿子真的因此努力念书,功课日渐进步,从不及格进步到丁等,又从丁等达到丙等。但是,这位父亲不但没有增强他的进步,反而认为进步不够,继续禁止他骑车。这个突然提高标准的要求太困难了,最后他儿子完全放弃念书,而且变得非常不信任人。

2) 每

次只针对行为的某项特性进行训练,不要企图同时塑形两项特性。

我的意思并不是指在同一段练习时间内不能训练多种不同行为,这当然可以。在任何一种课程里,我们可能先练习动作,然后再练习速度;以网球练习为例,我们可能先练习反手拍,然后再练正手拍,之后再练习步法及其他,这么做可以减少单调无聊的情形。好的指导老师会一直变化练习项目,当一项有些进步之后就换到下一项。

不过,训练每项行为时,你应该每次只针对一项增强标准作练习。假如我想训练海豚溅水,这次因为水溅得不够高而不给增强物,下次又因为牠溅错方向而不给,海豚将因此无法领悟出我到底希望牠做什么。一份增强物无法传达两种讯息,我应该先对溅水的高度进行塑形直到满意为止,然后再针对溅水的方向(不管溅水的高度)进行塑形!直到牠学会了溅水的方向。等到两项增强标准都能个别达成之后,我才能要求牠同时达到这两项标准。

第二条原则有很多可以实际运用的地方,如果一件事可以分解成个别的小单元,然后再针对每个小单元各自塑形,学习的速度将会加快许多。以高尔夫球的推杆进洞为例,这个动作取决于球推出后的适当距离,不可太短、不可从洞口经过或跳过,而且推杆的方向必须很正确,没有偏向洞口的某一边。如果想教自己推杆,你或许可以在草地上拉起一条几呎长的胶带,先练习从两呎处推杆,让球压过胶带就停下来,再从四呎、六呎、十呎处推杆,依此类推;你也可以把胶带贴成一圈,从一定距离练习瞄准圈圈推杆,再逐渐把圈圈缩小,直到能够稳定打中非常小的标的物为止。等到自己对推杆距离和方向控制技巧都很满意时,再合并两项同时练习,先使用大目标物并变化距离,然后缩小目标物并改变距离,直到能够从不同距离打中小目标物为止。最后才加入新项目的增强标准(例如往上坡推杆),但是每次只加入一个。

如果你投入的心力够多,以及个人的眼手协调够好,这样一来,你的推杆技巧会变得很棒或甚至技艺超群。任何打高尔夫球的人只要按照这种单一目标的塑形计划练习几个周末就会有很大的进步,这好过整个夏天漫无目标地练习,只期待每一球刚好打出适当距离和方向。

我们学习技能时经常遇到无论练习再多似乎都无法进步的情形,其实原因在于我们老想一次同时修正很多地方,这样的练习并没有塑形作用,而且一直重复动作或许能够进步,但也可能轻易增强错误的地方。你必须思考,这个行为的特性是否不只一项?能否把这个行为分解成更小的动作,再依各项特性个别训练?当你注意到这两件事,许多训练的问题自然会迎刃而解。

3) 进

行塑形时,先「变化性增强」目前符合增强标准的行为,然后再提高增强标准

许多人至始至终就反对在训练时使用正增强物的概念,他们认为这么一来,他们可能一辈子都得给零食才能获得好行为。但事实正好相反,利用增强物的训练方法其实可以使你解脱,不再需要时时留意这个行为是否发生,这是(变化性增强)发挥的作用。

变化性增强的意思是指一个行为有时会被增强,但有时不会,当我们教导行为时,我们通常采取无变化增强时制,意思是我们增强所有符合要求的行为,但是如果我们只是想要维持行为的出现,我们偶尔才会给予增强,例如一旦建立起分担家务模式后,你的室友或配偶回家时可能会顺便去拿干洗衣物,不需要你每次都给他增强物,但是遇到你生病或天候不佳让他特别多跑一趟时,你便可能需要表达一下谢意。

然而,当我们利用厌恶刺激作训练时(多数人刚开始训练时都会这么做),我们通常会学习到一个原则:每当动物出错或行为不佳时务必进行纠正,如果不这么做的话行为就会越变越糟。许多狗儿被牵绳牵着时,因为可能会被猛抽处罚而表现得很乖,但是只要一放开牵绳,牠们的行为就变得极不稳定。许多青少年和朋友出去时会做一些不敢在父母面前做的事,这是因为他们完全明白在什么环境下处罚不会出现,这就是「阎王不在,小鬼作怪」的道理,可是这也是以厌恶刺激作训练时的副作用之一,既然处罚意谓「不可以这么做!」 缺乏厌恶刺激的意思就是「现在可以做了!」

相反地,正增强的训练方法不仅不必一辈子增强每个正确反应,而且在学习过程中还必须偶尔忽略反应不作增强。为何会如此呢?

塑形法的重点在于选择性增强某些反应,如此一来动物的反应才会一点一滴地改善,直到达到新目标。所有行为都非一成不变,常预期出现的增强物被跳过省略时,接下来出现的行为将会有些不同,因此偶尔省去增强物的作法可以让你挑选出表现较强烈或较佳的反应,这种作法称为「区别性增强时制」(differential schedule of reinforcement),只选择某类反应作增强,例如增强符合较快、较长或面朝左等等要求的反应。

但是对经验不多的学习者而言,牠原本一直能够获得预期的增强物,现在却突然得不到了,这个情况可能让牠大感吃惊;例如你的幼犬坐下来,你按下响片就给零食,牠坐下的动作越来越迅速,也出现越开心的样子  「你看!我坐下了!按响片吧!」突然间,有时候坐下却不管用了!如果你的幼犬尚未学习接受偶尔不会出现增强物的状况,牠很可能会失望地放弃,或者退步回到原来表现较差或较为迟疑的反应。

虽然讨论行为学习的教科书并未提及这个作法,但如果你正训练一个毫无经验的学习生手,在你开始挑选更强烈或更佳的反应之前,事先刻意教导牠学习容忍增强时制的小小变化将会很实用。你的训练对象必须能够容忍你偶尔出现的「失误」才不会完全不反应,或者以专业术语来解释,这代表你必须先建立起变化性增强时制,然后名能藉由区别性增强时制增强较佳的表现。

90年代时,我在训犬讲座里把变化性增强时制(短期使用的间歇性增强时制)称为「买一送一」(twofers,百老汇行话),作法是让狗儿做两次动作,例如让牠以鼻子碰标的物两次,才按响片给赏,这样可以让动物学习容忍间歇性增强时制,让当前行为及日后的其他行为更不容易消失。

在学习阶段短期使用这种间歇性增强时制有另外一个好处,如果你的训练对象能够容忍偶尔不给增强物的情形,当你不增强某个原本足以增强的行为时,学习者不但会重复这个行为,而且第二次的行为很可能会更为剧烈。「嘿!我做到了,你没看到吗?你看,我又做了一次!」这个加剧后的行为称为「消弱突破现象」(extinction burst),可以让你更快达到目标行为。精通塑形法的人为了激发更不同或更强烈的反应,甚至可能刻意不给增强物,犬类行为学家盖瑞·威尔克斯(Gary Wilkes)称此技巧为「借机利用消弱突破」。

当训练对象学习到增强物跳过一次没给并不代表行为做错了,只是代表牠可能需要再试一次时,塑形过程便由连续增强时制(continuous reinforcement,新行为刚出现时使用)转为区别性增强时制(挑选更好的动作、更长的时间、越快达成行为的反应等等),然后再转回连续增强时制(当「完美」行为出现时,专有名词称此为「符合增强标准」的行为),这时已没必要故意采取间歇性增强时制,因为训练对象已经能够忍受变化性增强时制了。

最后,当行为的各项特性都达到满意程度时,它通常已经变成动物能够自然出现的行为之一。你

小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架