Az operáns tanulásról és kiképzésről Nyomtatás
Olvasóink értékelése: / 30
ElégtelenKitűnő 
Írta: Hornig Rudolf   

Operáns kondicionálás. Ezzel a két szóval egyre gyakrabban találkozhatunk mostanság. Noha sokakban ijesztő, szinte túlzottan tudományoskodó benyomást kelt, mégis érdemes egy pillanatra megállnunk és elgondolkodnunk, mit is jelent valójában, honnan jött és van-e egyáltalán haszna számunkra, ha megértjük a működését? Miért kell, hogy azokat a módszereket – melyeket nap mint nap használunk a kutyák és más állatok tanítása, kiképzése során – mindenféle tudományos elméletekkel próbáljuk magyarázni?

Az embereket mindig is foglalkoztatta az ismeretlen megismerése és megértése. Ez az a mozgató erő, amely civilizációnkat az elmúlt évezredek során előre vitte és amely mára sem hagyott alább. A nagy felfedezések és felismerések azonban a legritkább esetben érkeztek váratlanul. Ezeket általában hosszú évek megfigyelései és tapasztalatai érlelték, míg egyszer csak valaki hirtelen összefoglalta a bennük felismert rendszert. Egy ilyen felismerés nagyon fontos hatással lehet, hiszen összeköthet olyan megfigyeléseket és tapasztalásokat melyeket eddig egymástól függetlennek hittünk. Az apró részletek – melyek önmagukban sokszor igen bonyolultnak tűnnek – ezek segítségével állnak össze egyetlen nagy – és általában szinte nevetségesen egyszerű – egésszé. Az összefüggések ismeretében, utólag gyakran csak derűsen mosolygunk korábbi önmagunkon és hajdani „tudatlanságunkon”. Számos hasonló eset történt már az emberiséggel. Ki gondolta volna, hogy annak, hogy az elejtett tárgyak a földre esnek, bármiféle köze lehet ahhoz, hogy a bolygók milyen úton róják pályájukat? Mégis ez a felismerés – és az ennek kapcsán megfogalmazott igen egyszerű törvények – tettek minket képessé arra, hogy eljussunk ezekre az idegen világokra.

Ezen kis kitérő után a válasz talán ez lehet: Igen, érdemes egy kis időt szánnunk annak megértésére, hogy amit csinálunk az miért működik (ha működik egyáltalán), hisz ez olyan tudáshoz juttathat minket, amit jelenleg el sem tudunk képzelni. Sajnos azonban a tudományos szakirodalom igazán száraz és sokszor érthetetlen. A következőkben azon fontos fogalmak találhatók, melyek pontos ismerete fontos lehet a kiképzési módszerek – különösen a klikker kiképzés – megértésében.

 

Akkor kezdjük néhány „száraz” definícióval:

  • viselkedés: Bármely dolog amit a kutya tesz. (pl. ül, pórázon sétál, ugat, szagol stb.)
  • Kiképzés: Azon folyamat, mely során azt szeretnénk elérni, hogy a kutya – különféle jelekre – számunkra szükséges, hasznos viselkedéseket produkáljon, illetve nekünk nem tetsző viselkedéseket pedig egyáltalán ne produkáljon.
  • megerősítés: A kutya környezetében egy inger megjelenése vagy eltűnése, melyek hatására az ingert közvetlenül megelőző viselkedés jövőbeni gyakorisága NÖVEKSZIK.
  • büntetés: A kutya környezetében egy inger megjelenése vagy eltűnése, melyek hatására az ingert közvetlenül megelőző viselkedés jövőbeni gyakorisága CSÖKKEN.
  • Jutalom: Valami – a kutya számára kellemes – amit szeretne megszerezni vagy elérni.
  • Averzív inger: Valami – a kutya számára kellemetlen – amit el akar kerülni.

Fontos észrevennünk, hogy a fenti definíciók – különösen a büntetésé – jelentősen eltér a szó köznapi értelmétől. Mind a megerősítést mind a büntetést az definiálja, hogy a vele kapcsolódó cselekvés később sűrűbben, vagy ritkábban történik és nem az, hogy a kutya számára az kellemes vagy kellemetlen. Fordítva is igaz. A jutalom illetve averzív inger jelenléte nem feltétlenül jelenti, hogy a kutya bármilyen jövőbeni viselkedése változni fog.

Az operáns kondicionálás „öt” negyede

Mint az előzőekben láttuk, a viselkedés módosítására több lehetőségünk van, melyeket csoportosíthatunk egyrészt a szerint, hogy egy adott viselkedés előfordulását csökkentik-e (büntetés) vagy növelik (megerősítés), másrészt az alapján, hogy az adott viselkedés hatására egy inger megjelenik (+) vagy éppen eltűnik (-) az alany környezetéből. Ennek megfelelően négy kategóriát állíthatuk fel:

  • pozitív megerősítés (+M): Ebben az esetben a cselekvés hatására a kutya környezetébe valami olyan dolog, inger kerül ami növeli a cselekvés későbbi előfordulását. Erre példa, ha a kutyának jutalomfalatot adunk, vagy eldobjuk a labdáját ha leült, vagy ha egy kisgyereket megjutalmazunk ha jó jegyeket hozott az iskolából, vagy jól viselkedett. (Megjegyezném, hogy a pozitív szó itt nem valamilyen morális értékre utal, hanem inkább mint a matematikai hozzáadást kell tekinteni)
  • negatív megerősítés (-M): Ez esetben a cselekvés hatására a kutya környezetéből valami számára kellemetlen inger tűnik el melynek hatására az adott cselevés gyakorisága növekszik. Ha például a kutyát úgy tanítjuk feküdni, hogy a fejét a pórázzal lefelé kényszerítjük, akkor ha fekvő pozícióba kerül a kellemetlen feszítés megszűnik, ezzel megerősítve a fekvést mint cselekvést a jövőben. A pórázon vezetés hasonló elven működik: ha a kutya kitér, apró, számára kellemetlen rántásokkal próbáljuk a helyes pozícióba hozni, majd amikor visszatért láb mellé, a póráz rángatása abbamarad, megerősítve ezzel a láb mellett menetet mint viselkedést.
  • pozitív büntetés (+B): A cselekvés hatására a kutyát valami kellemetlenség éri, melynek hatására a jövőben e viselkedés kevésbé fog előfordulni. A láb mellől kiugró kutya pórázát megrántjuk, kellemetlen ingert okozva ezzel a kutyának, csökkentve ezzel a kiugrás későbbi valószínűségét.
  • negatív büntetés (-B): Ez esetben a cselekvés hatására, valami – kutya számára kívánatos – tűnik el, csökkentve ezzel a cselekvés későbbi előfordulását. Például, ha a kutya kéreget, vagy ugat míg az asztalnál esznek és mi kizárjuk ilyenkor a szobából, vagy ha a nyafogó kisgyerektől megvonjuk a fagylaltot.

Ehhez a négy csoporthoz még hozzávehetünk egy „ötödiket” ami igazából mindtől független, nevezetesen:

  • A viselkedés elhalása: Amennyiben egy adott viselkedés az alany számára nem vezet semmilyen – se kellemes, se kellemetlen – eredményre, gyakorisága csökkenni fog. Például ha egy jutalomfalat a kerítés túloldalára esik, a kutya megpróbál átnyúlni érte, aztán ha az nem vezet eredményre megpróbál mondjuk átugrani a kerítésen, de ha magas a kerítés ez sem működik így megpróbál ásni, de beleütközik a kerítés betonalapjába. Végül feladja a próbálkozást, mert nem éri meg a belefektetett energiát. Legközelebb hasonló esetben már sokkal hamarabb fel fogja adni a próbálkozást. Természetesen ez csak akkor működik, ha az adott cselekvés nem önmagában is megerősítő a kutya számára. Például egy csont rágcsálását hiába próbálnánk megvárni, hogy mikor múlik el magától, hiszen a kutya számára itt a rágás folyamata önmagában is megerősítő jellegű.

Ezen módszerek mindegyike akár önállóan, akár kombinálva is alkalmasak viselkedések kialakítására vagy eltüntetésére. Bizonyos kombinációk hatásosak, bizonyosak „humánusabbak”, mások pedig komoly stresszt okozhatnak az alanynak. Íme néhány variáció például a pórázon követés tanítására:

  1. A kutya kitér a helyes pozícióból, mire egy jót rántunk rajta, büntetve ezzel a tőlünk való eltávolodást. (+B)
  2. A kutya kitér, mire apró rángatással büntetjük (+B) a kitérést, majd amikor visszakerült a helyes pozícióba abbahagyjuk a rángatás (-M), esetleg meg is jutalmazzuk dicsérettel vagy egy jutalomfalattal (+M).
  3. Ha a kutya a lábunk mellett van jutalmazzuk (+M), míg ha kitér egyszerűen figyelmen kivül hagyjuk (viselkedés elhalása), vagy egyszerűen megállunk a pórázzal mint egy fa és addig nem mozdulunk amíg a kutya helyes pozícióba nem kerül. Persze ez csak akkor működik, ha a környezet megfelelően ingerszegény és a gazda elhagyását nem erősíti meg. Pl. nincsenek más kutyák illetve érdekesebb ingerek,melyek felderítése kellemes élményt adna.
  4. Ha a kutya laza pórázon közlekedik, mi is folyamatosan mozgunk a célunk (és a kutya célja) felé, ami lehet pl. élelem vagy másik kutya stb (+M). Ha a kutya megfesziti a pórázt, néhány lépést hátrálunk távolodva a végső céltól ezzel büntetve a póráz megfeszítését (-B).

Mint látható számos lehetőség és kombináció létezik és a különféle kiképzési irányzatok igazából abban különböznek, hogy melyik milyen arányokban alkalmazza a felsorolt módszereket. Természetesen észre kell vennünk, hogy ezen összetevők mindegyikének vannak mind előnyei, mind pedig hátrányai, mellyel szembe kell néznünk a kiképzés során. Fontos azt is látni, hogy sikeresen tanítani csak valamilyen megerősítés segítségével lehet, azaz kizárólag büntetés alkalmazásával nem lehet eredményt elérni, hiszen a büntetés – definíciójából adódóan – csak viselkedések megszüntetésére használható. Érdekes az is, hogy ahhoz, hogy negatív megerősítést tudjuk alkalmazni, azaz egy averzív ingert meg tudjunk szüntetni, valamiféleképpen azt először be is kell vezetni. Ez azt jelenti, hogy a negatív megerősítést (-M) (a póráz rángatás megszűnését) mindig megelőzi valamilyen pozitív büntetés (+B) (a póráz rángatása maga). Azaz ilyenkor mindig kell számolnunk a büntetés okozta káros hatásokkal. Az egyes módszerek előnyeiről és hátrányairól a későbbiekben még lesz szó, most azonban vizsgáljuk meg egy kicsit részletesebben mit tudunk a megerősítésekről és járjuk körül milyen lehetőségeink vannak ezek alkalmazására.

A megerősítés értéke és a jutalom viszonylagossága

Látható, hogy a megerősítés mennyire fontos alapeleme a kiképzésnek, ezért érdemes elgondolkodnunk, hogy mi is az valójában?

Az első és legfontosabb szabály, amit mindig érdemes észben tartanunk: Azt, hogy mi számít megerősítésnek, soha nem a kiképző, hanem mindig az alany határozza meg. Hiába gondoljuk, hogy bizonyos dolgoknak működniük kellene, ha az az alany számára mégsem annyira jó, vagy kívánatos a valóságban. Például, hiába döntjük el, hogy márpedig mi simogatással fogjuk jutalmazni a kutyát, ha a kutya számára az adott körülmények között ez nem jelent megerősítést. A másik érdekes tény, hogy az alany számára a megerősítés és a jutalom viszonylagos.

Ugyanaz a fizikai inger:

  • különféle élőlényekre fajtájuktól függően másként hathat. Az eső például a kacsák számára kellemes élmény, míg a macskáknak kifejezetten büntetés számba megy.
  • ugyanazon fajon belül az egyes egyedek között is jelentős különbségek lehetnek. Pl. bizonyos kutyák szívesen labdáznak, míg mások nagyon szeretnek enni.
  • ugyanazon egyed esetén is nagyban különbözhet az aktuális fizikai állapottól. Pl. egy jóllakott kutya már nem akar annyira enni, vagy egy elfáradt nem akar már annyira labdázni.
  • ugyanazon egyed, ugyanolyan fizikai állapotban is viselkedhet különbözően az adott ingerre, ha a külső fizikai környezet különböző. Pl. a lakás nyugalmában egy jutalomfalat komoly megerősítés lehet, ugyanakkor ugyanez a falat az utcán, amikor más kutyák játszanak a közelben már lehet, hogy semmit sem ér.

A hatékony kiképzés első kulcsa tehát az, hogy a kiképző nagyon jól ismerje az alanyt és annak igényeit, és a mindenkor alkalmazott megerősítéseket annak állapotához és a külső körülményekhez igazítsa. Másrészt az is fontos, hogy az érdeklődést a lehető leghosszabb időn át fenntartsuk, azaz nem szabad túlzásokba se esni. Olyan megerősítést érdemes mindig használni, amely az adott környezetben még éppen jól működik.

Elsődleges és másodlagos megerősítések

Mind a megerősítések, mind a büntetések – definíciójuknál fogva – akkor működnek, ha az alany a hatásukra valamely viselkedését módosítani tudja. Ez csak akkor lehet, ha fel tudja ismerni a viselkedés és a következmény közti kapcsolatot, vagyis a viselkedés és a következmény időben a lehető legközelebb van egymáshoz. Ideális esetben éppen akkor kellene jutalmazni, amikor az adott viselkedés megtörténik.

Felmerül azonban a kérdés, hogy hogyan lehet a jutalmazást ennyire pontosan időziteni, hiszen ha a kutya távolabb van tőlünk, vagy éppen nem felénk néz akkor nem tudunk neki még jutalomfalatot sem adni a kellő időben. Erre ad lehetőséget a kondicionált megerősítés.

  • elsődleges megerősítés (EM): Bármi, amit a kutya ösztönösen szeret vagy kellemesnek talál, és nem szükséges tanulás ahhoz, hogy ezen ingereket „értelmezze”. Ez lehet élelem, játék, szabadság, szex, szociális figyelem, fizikai kapcsolat stb.
  • Kondicionált megerősítés (KM): Valami – kezdetben semleges külső inger – amit megtanítunk a kutyának, hogy szeressen, az által, hogy valamilyen elsődleges megerősítéssel kötjük össze. Az összekötés klasszikus (pavlovi) kondicionálással történik egyszerűen olyan módon, hogy az elsődleges megerősítést mindig megelőzzük az adott ingerrel, míg végül a jel maga is hasonló értékűvé válik mint az elsődleges megerősítés maga.

Emberi viszonylatokban erre legjobb példa a pénz, amely önmagában egy egyszerű papírdarab, melynek nincs biológiai értéke, mégis az által, hogy megtanultuk, hogy nagy biztonsággal beváltható olyan dolgokra, melyek számunkra tényleg közvetlen értékkel bírnak (élelem, ruházat, fedél, szórakozás stb.), kondicionált megerősítéssé válik. Hajlandóak vagyunk pénzért dolgozni, sőt egyesek addig jutnak, hogy annyi pénzt „termelnek”, melynek ellenértékét egész életükben nem tudnák felélni (náluk a kondicionált megerősítés már erősebb, mint az elsődleges). Persze ehhez ténylegesen szükséges a „biztonságos beválthatóság”. Gondoljunk csak bele, hogy mi történik, ha a pénz nem váltható be biztonsággal: megindul a cserekereskedelem...

Kutyák esetében például az „okos kutya” vagy „jól van” is egy kondicionált megerősítés, hiszen kezdetben semmit nem jelentenek a kutyának, viszont mivel rendszeresen kötődtek valamilyen elsődleges megerősítéshez (jutalomfalat, simogatás stb.), ezért már önmagukban is „jutalommá” váltak. A klikker hangja szintén egy szándékosan és tudatosan kialakított másodlagos megerősítés, melyet a kiképzés során a helyes viselkedések megjelölésére használunk. A kondicionált megerősítés azért használható nagyon hatékonyan a tanításban, mivel sokkal gyorsabban el tudja juttatni a jutalmat/megerősítést az alanyhoz, mintha elsődleges megerősítéssel próbálkoznánk. A második kulcsfontosságú tapasztalat tehát, hogy:

Minél pontosabban tudjuk időzíteni a megerősítéseket, annál hatékonyabban, gyorsabban tudunk tanítani.

A tanulás hármas egysége

Vizsgáljuk most meg egy kicsit alaposabban, hogy mi is a kiképzés célja: Bizonyos jól meghatározott ingerekre (hang, test vagy kézjelek, illetve egyéb környezeti ingerek), az általunk kívánt cselekvésekkel válaszoljon a kutya, a lehetőségek szerint minél nagyobb megbízhatósággal. Ez roppant szárazon hangzik, kicsit hasonló mintha azt mondanám, hogy zongorázni úgy kell, hogy a megfelelő billentyűket a megfelelő időben ütjük le... Ha jobban belegondolunk, világos, hogy minden cselekvésnek van előzménye illetve következménye is. Az előzmény, a cselekvés, és a következmény egy olyan hármast alkot, melyek szorosan kötődnek és hatnak is egymásra. A következményekről (megerősítés illetve büntetés) már beszéltünk az előzőekben. Lássuk mit tudunk az előzményekről:

Az élőlényeket életük során folyamatosan különféle ingerek érik. Amennyiben egy viselkedést – mely megerősítést nyer – mindig megelőz egy adott inger vagy ingerek halmaza, a viselkedés ezen ingerhez kezd kötődni. Ez azt jelenti, hogy egyre gyakrabban és gyakrabban fog ismétlődni az adott inger jelenlétében, ugyanakkor ha, az inger hiányában a cselekvés nem vezet soha eredményre – azaz nem lesz megerősítve, az alany megtanulja, hogy ilyenkor felesleges próbálkozni. Végeredményben kialakul, hogy a szóban forgó inger megjelenése gyakorlatilag megindítja a cselekvést. Erre a legjobb példa talán, az asztalnál kunyeráló kutya viselkedése. Ha néhányszor sikerült egy-egy falatot kicsikarnia, már az evéshez készülődő család látványa is kiváltja belőle a viselkedést, ugyanakkor biztosak lehetünk benne, hogy napközben, ha senki nincs otthon, soha nem bámul bánatos szemmel az asztal mellett ülve.

A külső ingerek tehát – úgy is mondhatjuk – tippeket adnak a kutyának, hogy az adott pillanatban milyen viselkedés biztosítana számára kedvező következményt, azaz megerősítést. A kedvező következmény viszont – mint a korábbiakban láttuk – növeli a viselkedés gyakoriságát és annak a kiváltó ingerekkel való összefonódását.

A jó kiképzőnek tehát nem a kutya viselkedését kell az ellenőrzése alatt tartani, hanem a környezeti ingereket illetve a kutya viselkedésének következményei.

Az operáns kondicionálás és a klikker kiképzés

Bármilyen módszerrel is tanítjuk a kutyánkat, az eddig leírt szabályok valamelyikét biztosan felfedezhetjük a módszereinkben. Ezek szerint mindenki, aki kutyát képez, „operáns kiképzőnek” számít?

Nos, nem teljesen így áll a helyzet. Noha a kutyánk valóban „operáns tanuló”, ahhoz, hogy mi is „operáns kiképzőnek” számítsunk, nem elég a munkánk eredményét, illetve a kutya viselkedését egyszerűen ezen szabályokkal magyarázni. E szabályokat tudatosan és előre megfontoltan kell alkalmaznunk. Ez képessé tehet minket arra, hogy olyan problémákat is megoldjunk, melyekkel korábban nem találkoztunk, így gyakorlati tapasztalatunk sincs benne.

Miért fontos mindez a klikker kiképzéshez? A klikkerrel való tanításnál különösen lényeges, hogy ismerjük és jól alkalmazzuk a fenti szabályokat. Itt sajnos sokkal nehezebb előre megírt receptkönyvek alapján dolgozni vagy „jól bevált” módszereket előhúzni. Az elveket kell megértenünk és alkalmaznunk.

Mindezek után, hogyan definiáljuk a „klikkeres kiképzést”?

Olyan kiképzési módszer, mely a tanítás során pozitív megerősítést, a viselkedés spontán elhalását, kisebb mértékben negatív büntetést használ, valamint a helyes viselkedések megjelölésére kondicionált megerősítést alkalmaz.Az úgynevezett „hagyományos” képzési módoktól abban tér el, hogy nem alkalmaz negatív megerősítést vagy pozitív büntetést, míg a pusztán motivációs módszerektől (ha létezik egyáltalán ilyen) abban, hogy nem kizárólag elsődleges, hanem kondicionált megerősítést alkalmaz a viselkedések kialakítására. Érdemes még megjegyezni, hogy a klikker (mint eszköz) használata nem követelmény, hiszen a kondicionált megerősítés lehet bármilyen inger – valamint attól, hogy valaki „klikkert használ”, még nem minősül klikker kiképzőnek amennyiben negatív megerősítést vagy pozitív büntetést is alkalmaz kiképzés során.