响片训练

响片训练是一种训练动物的方式,它使用制约增强的方法来“表示”(标记)动物当下正在做的行为是正确的。响片训练原本用在不适合传统服从训练的动物身上,如海豚鸽子。由于动物训练者使用这个小型会发出声音被称作“响片”的东西来做训练,所以尽管它使用的是操作制约的方式,但人们还是使用“响片训练”这个名词。响片训练普遍运用于犬只训练中,且同样被成功运用在其他驯化动物和野生动物身上。[1]

一只正在接受响片训练的狗。

共同创立者

美国行为学家B·F·斯金纳Burrhus Frederic Skinner)是第一位定义和描述操作制约原理的学者,而斯金纳的两位学生玛蕊安·卜利廉英语Marian Breland Bailey凯勒·卜利廉英语Keller Breland夫妇两人观察出将之应用在动物训练的可能性,并发展出如今为人们所熟知的正增强方式和塑型法。

其发展开始于二次大战的鸽子计划,卜利廉夫妇开办了一间公司名为“动物行为企业”。 他们在海军和公开展览中举办了第一次海上哺乳动物训练计划,并首创鸟儿自由飞翔秀,举办商业动物展览,其内容包括乳猪竞赛和鸡只玩圈叉游戏等,可说是一整个“IQ动物园”。

1965年凯勒过世后,玛蕊安嫁给首位参予研究海军海豚科学专家贝里·鲍伯。 在海洋中,海豚可以找到离训练者好几哩以外的目标物。带着相机的可以沿着城市行走进入建筑物,载着相机借由激光光导向的渡鸦或其他鸟类可以飞到某座某摩天楼的特定窗户并且照摄里面的人。海鸥——大自然的海洋搜寻专家,可以找到并且回报救生艇和远离岸边的游泳者。[2]

优点

训练动物的挑战之一,就是要跟动物沟通如何让牠们准确地知道所发生的行为正是训练者尝试要去加强的。举一个简单的例子,训练狗儿退后,正当狗儿要往后移动的同时训练者马上就要让狗儿知道牠目前所做的事是正确的。 然而,以往传统的口头鼓励方式“乖狗儿!”会花掉太多时间,在称赞的同时狗儿可能已经继续其他的行为了。而当狗儿了解牠正在被奖励时,这行为可能又重复了一次或甚至是坐下和搔痒。另外,不精准的时间点和训练者音调所传达的讯息也会让实际接受的信号意思因而有所不同。在同一段训练时间当中,训练者的声音、发音、音调、音量和重音可能都会有所改变,这会使训练进度减慢,因为动物必须要去理解某些变化(例如训练者的音量或是热忱)是不重要的,而某些变化却是需要去注意的(例如“好乖”或“不对”)。 制约加强法可以解决这些问题,它使用的可以是任何一种动物可以察觉的信号,只要这信号是简短(避免不准确的时间点)而且是一致的(避免动物对信号的变换产生混淆)。通常都是用响片或是信号器这种压下和放掉时会发出“喀喀”的小型金属片来训练狗或马,至于海豚,在制约加强法当中通常是使用口哨。然而并非都是使用声音来操作制约加强法,我们使用手电筒快速闪光来取代响片训练金鱼,使用会震动的项圈来训练耳聋的狗儿。

操作问题

响片训练当中有几点常见的问题,依赖使用响片给狗儿信号便是其中之一,响片主要是使用在教导新的行为,或是给予稳定的音调奖励,等过了这个阶段以后响片便不需要了(或是不用依赖)。 有时候狗儿发生期望中的行为时响片正好不在手边,这时候仍然可以用其他的“喀喀”声来代替,尽管奖励效果不如响片,但当下发生的行为仍然还是需要被标记。

另一个会遇到的问题是,当团体上课时狗儿会无法辨别哪一个响片发出来的声音是属于牠的,然而每年有上百个响片团体课程在举办,这证明了此忧虑是多余的。 在某些情况当中响片音量可能不够大声,例如狗儿离开操作者去做狩猎或拾回动作,也有些狗儿对于声音敏感或是害怕响片。针对这类状况可以转换标记工具来解决问题,像是操作者在做远距离训练时可以使用口哨来代替,对声音敏感的狗儿可以使用圆珠笔盖或是订书机取代。同样地,当响片训练已经进行后,也可以使用这技巧来解决很多上述提到的问题。

操作方法

响片训练第一步是让狗儿知道响片声音代表牠们将会得到奖励。为了这么做,训练者会先将响片“充电”或是“装满料”。当训练者按下响片后,立即地或同时地给予动物奖励,这奖励通常是少见的、美味的零食,大小必须是可以小到可以一口立即吃掉。(有些训练者会用动物最喜爱的玩具来代替零食,然而这个作法会干扰要对动物这加强物保持高度兴趣的主要目的。)在每段训练时间内最多重复二十次。 有些动物比较快知道这个联结,例如狗儿,通常在可以在一段训练时间内约五到十次的重复就会知道响片和奖励的联结。在训练进行当中,可以借由测试等待狗儿的注意力在其他地方时按下响片得知牠们是否将响片和奖励做连结,若狗儿立即看训练者并期待奖励代表狗儿已经知道。 之后便可以使用响片来标记训练者期望发生的行为。在动物发生期望中的行为同时训练者按下响片并立即给予奖励。响片训练重点在于训练者时间点的掌握,若按下响片的时间稍微太早或太迟都可能会加强到按下当时正在发生的行为。另一重点是如何制造机会让动物可以频繁地赢得奖励,通常专业的狗儿训练者按下响片和给予奖励的频率为两到三秒一次。最后就算是要完成的目标很简单也必须要把它切割成更小范围,或是从最容易达到标准开始慢慢往前推进。

例子

当狗儿要学习如何去碰触特定目标物时,大部分一开始期望的行为都是从鼻子碰触开始,像是用鼻子碰触一小片塑胶,而这训练可以转换成实用的任务或是有趣的把戏,像是开关灯或是想到户外的时候摇铃当。

训练鼻子碰触的方法从让狗儿用鼻子去碰触目标物开始,有些训练者使用引导法,例如将花生奶油酱轻涂在小碟子或是塑胶目标物上,而有的训练者偏爱使用雕塑法,也就是将目标物放在容易碰触的地方,像是手握着放在训练者和狗儿中间,当狗儿一往目标物靠近或真正碰触就给予奖励。

当狗儿可以不断地碰触目标物后,训练者就可以将奖励食物去除并变换目标物位置。 最后训练者可以将此行为转换成摇铃当,举例来说,把铃铛放在目标物前面,每次狗儿都必须要先碰触铃铛才会碰触到目标物,这时候奖励每次碰触到铃铛的行为。当狗儿可以确实碰触铃当后,训练者加入开门的动作来当作奖励狗儿每次碰触铃当的行为。

训练马儿的标的物法: 对马儿来说,通常不用先将响片“充电”或是“装满料”,因为对马儿来说最好的方法就是清楚的标记让马儿不要期待“尚未获得”的零食。

参考文献

  1. ^ Weaver, Sue. Sheep: small-scale sheep keeping for pleasure and profit. 3 Burroughs Irvine, CA 92618: Hobby Farm Press, an imprint of BowTie Press, a division of BowTie Inc. 2005. ISBN 1-931993-49-1. 
  2. ^ The Don't Shoot the Dog! News, (1996, November), p. 1.

延伸阅读

  • Karen Pryor。黄薇菁译。《别毙了那只狗!》(Don't Shoot The Dog !)。商周出版,ISBN 9789861248615

外部链接