Az operáns tanulásról és kiképzésről |
Írta: Hornig Rudolf | |||
Operáns kondicionálás. Ezzel a két szóval egyre gyakrabban találkozhatunk mostanság. Noha sokakban ijesztő, szinte túlzottan tudományoskodó benyomást kelt, mégis érdemes egy pillanatra megállnunk és elgondolkodnunk, mit is jelent valójában, honnan jött és van-e egyáltalán haszna számunkra, ha megértjük a működését? Miért kell, hogy azokat a módszereket – melyeket nap mint nap használunk a kutyák és más állatok tanítása, kiképzése során – mindenféle tudományos elméletekkel próbáljuk magyarázni? Az embereket mindig is foglalkoztatta az ismeretlen megismerése és megértése. Ez az a mozgató erő, amely civilizációnkat az elmúlt évezredek során előre vitte és amely mára sem hagyott alább. A nagy felfedezések és felismerések azonban a legritkább esetben érkeztek váratlanul. Ezeket általában hosszú évek megfigyelései és tapasztalatai érlelték, míg egyszer csak valaki hirtelen összefoglalta a bennük felismert rendszert. Egy ilyen felismerés nagyon fontos hatással lehet, hiszen összeköthet olyan megfigyeléseket és tapasztalásokat melyeket eddig egymástól függetlennek hittünk. Az apró részletek – melyek önmagukban sokszor igen bonyolultnak tűnnek – ezek segítségével állnak össze egyetlen nagy – és általában szinte nevetségesen egyszerű – egésszé. Az összefüggések ismeretében, utólag gyakran csak derűsen mosolygunk korábbi önmagunkon és hajdani „tudatlanságunkon”. Számos hasonló eset történt már az emberiséggel. Ki gondolta volna, hogy annak, hogy az elejtett tárgyak a földre esnek, bármiféle köze lehet ahhoz, hogy a bolygók milyen úton róják pályájukat? Mégis ez a felismerés – és az ennek kapcsán megfogalmazott igen egyszerű törvények – tettek minket képessé arra, hogy eljussunk ezekre az idegen világokra.
Ezen kis kitérő után a válasz talán ez lehet: Igen, érdemes egy kis időt szánnunk annak megértésére, hogy amit csinálunk az miért működik (ha működik egyáltalán), hisz ez olyan tudáshoz juttathat minket, amit jelenleg el sem tudunk képzelni. Sajnos azonban a tudományos szakirodalom igazán száraz és sokszor érthetetlen. A következőkben azon fontos fogalmak találhatók, melyek pontos ismerete fontos lehet a kiképzési módszerek – különösen a klikker kiképzés – megértésében.
Akkor kezdjük néhány „száraz” definícióval:
Fontos észrevennünk, hogy a fenti definíciók – különösen a büntetésé – jelentősen eltér a szó köznapi értelmétől. Mind a megerősítést mind a büntetést az definiálja, hogy a vele kapcsolódó cselekvés később sűrűbben, vagy ritkábban történik és nem az, hogy a kutya számára az kellemes vagy kellemetlen. Fordítva is igaz. A jutalom illetve averzív inger jelenléte nem feltétlenül jelenti, hogy a kutya bármilyen jövőbeni viselkedése változni fog. Az operáns kondicionálás „öt” negyedeMint az előzőekben láttuk, a viselkedés módosítására több lehetőségünk van, melyeket csoportosíthatunk egyrészt a szerint, hogy egy adott viselkedés előfordulását csökkentik-e (büntetés) vagy növelik (megerősítés), másrészt az alapján, hogy az adott viselkedés hatására egy inger megjelenik (+) vagy éppen eltűnik (-) az alany környezetéből. Ennek megfelelően négy kategóriát állíthatuk fel:
Ehhez a négy csoporthoz még hozzávehetünk egy „ötödiket” ami igazából mindtől független, nevezetesen:
Ezen módszerek mindegyike akár önállóan, akár kombinálva is alkalmasak viselkedések kialakítására vagy eltüntetésére. Bizonyos kombinációk hatásosak, bizonyosak „humánusabbak”, mások pedig komoly stresszt okozhatnak az alanynak. Íme néhány variáció például a pórázon követés tanítására:
Mint látható számos lehetőség és kombináció létezik és a különféle kiképzési irányzatok igazából abban különböznek, hogy melyik milyen arányokban alkalmazza a felsorolt módszereket. Természetesen észre kell vennünk, hogy ezen összetevők mindegyikének vannak mind előnyei, mind pedig hátrányai, mellyel szembe kell néznünk a kiképzés során. Fontos azt is látni, hogy sikeresen tanítani csak valamilyen megerősítés segítségével lehet, azaz kizárólag büntetés alkalmazásával nem lehet eredményt elérni, hiszen a büntetés – definíciójából adódóan – csak viselkedések megszüntetésére használható. Érdekes az is, hogy ahhoz, hogy negatív megerősítést tudjuk alkalmazni, azaz egy averzív ingert meg tudjunk szüntetni, valamiféleképpen azt először be is kell vezetni. Ez azt jelenti, hogy a negatív megerősítést (-M) (a póráz rángatás megszűnését) mindig megelőzi valamilyen pozitív büntetés (+B) (a póráz rángatása maga). Azaz ilyenkor mindig kell számolnunk a büntetés okozta káros hatásokkal. Az egyes módszerek előnyeiről és hátrányairól a későbbiekben még lesz szó, most azonban vizsgáljuk meg egy kicsit részletesebben mit tudunk a megerősítésekről és járjuk körül milyen lehetőségeink vannak ezek alkalmazására. A megerősítés értéke és a jutalom viszonylagosságaLátható, hogy a megerősítés mennyire fontos alapeleme a kiképzésnek, ezért érdemes elgondolkodnunk, hogy mi is az valójában? Az első és legfontosabb szabály, amit mindig érdemes észben tartanunk: Azt, hogy mi számít megerősítésnek, soha nem a kiképző, hanem mindig az alany határozza meg. Hiába gondoljuk, hogy bizonyos dolgoknak működniük kellene, ha az az alany számára mégsem annyira jó, vagy kívánatos a valóságban. Például, hiába döntjük el, hogy márpedig mi simogatással fogjuk jutalmazni a kutyát, ha a kutya számára az adott körülmények között ez nem jelent megerősítést. A másik érdekes tény, hogy az alany számára a megerősítés és a jutalom viszonylagos. Ugyanaz a fizikai inger:
A hatékony kiképzés első kulcsa tehát az, hogy a kiképző nagyon jól ismerje az alanyt és annak igényeit, és a mindenkor alkalmazott megerősítéseket annak állapotához és a külső körülményekhez igazítsa. Másrészt az is fontos, hogy az érdeklődést a lehető leghosszabb időn át fenntartsuk, azaz nem szabad túlzásokba se esni. Olyan megerősítést érdemes mindig használni, amely az adott környezetben még éppen jól működik. Elsődleges és másodlagos megerősítésekMind a megerősítések, mind a büntetések – definíciójuknál fogva – akkor működnek, ha az alany a hatásukra valamely viselkedését módosítani tudja. Ez csak akkor lehet, ha fel tudja ismerni a viselkedés és a következmény közti kapcsolatot, vagyis a viselkedés és a következmény időben a lehető legközelebb van egymáshoz. Ideális esetben éppen akkor kellene jutalmazni, amikor az adott viselkedés megtörténik. Felmerül azonban a kérdés, hogy hogyan lehet a jutalmazást ennyire pontosan időziteni, hiszen ha a kutya távolabb van tőlünk, vagy éppen nem felénk néz akkor nem tudunk neki még jutalomfalatot sem adni a kellő időben. Erre ad lehetőséget a kondicionált megerősítés.
Emberi viszonylatokban erre legjobb példa a pénz, amely önmagában egy egyszerű papírdarab, melynek nincs biológiai értéke, mégis az által, hogy megtanultuk, hogy nagy biztonsággal beváltható olyan dolgokra, melyek számunkra tényleg közvetlen értékkel bírnak (élelem, ruházat, fedél, szórakozás stb.), kondicionált megerősítéssé válik. Hajlandóak vagyunk pénzért dolgozni, sőt egyesek addig jutnak, hogy annyi pénzt „termelnek”, melynek ellenértékét egész életükben nem tudnák felélni (náluk a kondicionált megerősítés már erősebb, mint az elsődleges). Persze ehhez ténylegesen szükséges a „biztonságos beválthatóság”. Gondoljunk csak bele, hogy mi történik, ha a pénz nem váltható be biztonsággal: megindul a cserekereskedelem... Kutyák esetében például az „okos kutya” vagy „jól van” is egy kondicionált megerősítés, hiszen kezdetben semmit nem jelentenek a kutyának, viszont mivel rendszeresen kötődtek valamilyen elsődleges megerősítéshez (jutalomfalat, simogatás stb.), ezért már önmagukban is „jutalommá” váltak. A klikker hangja szintén egy szándékosan és tudatosan kialakított másodlagos megerősítés, melyet a kiképzés során a helyes viselkedések megjelölésére használunk. A kondicionált megerősítés azért használható nagyon hatékonyan a tanításban, mivel sokkal gyorsabban el tudja juttatni a jutalmat/megerősítést az alanyhoz, mintha elsődleges megerősítéssel próbálkoznánk. A második kulcsfontosságú tapasztalat tehát, hogy: Minél pontosabban tudjuk időzíteni a megerősítéseket, annál hatékonyabban, gyorsabban tudunk tanítani. A tanulás hármas egységeVizsgáljuk most meg egy kicsit alaposabban, hogy mi is a kiképzés célja: Bizonyos jól meghatározott ingerekre (hang, test vagy kézjelek, illetve egyéb környezeti ingerek), az általunk kívánt cselekvésekkel válaszoljon a kutya, a lehetőségek szerint minél nagyobb megbízhatósággal. Ez roppant szárazon hangzik, kicsit hasonló mintha azt mondanám, hogy zongorázni úgy kell, hogy a megfelelő billentyűket a megfelelő időben ütjük le... Ha jobban belegondolunk, világos, hogy minden cselekvésnek van előzménye illetve következménye is. Az előzmény, a cselekvés, és a következmény egy olyan hármast alkot, melyek szorosan kötődnek és hatnak is egymásra. A következményekről (megerősítés illetve büntetés) már beszéltünk az előzőekben. Lássuk mit tudunk az előzményekről: Az élőlényeket életük során folyamatosan különféle ingerek érik. Amennyiben egy viselkedést – mely megerősítést nyer – mindig megelőz egy adott inger vagy ingerek halmaza, a viselkedés ezen ingerhez kezd kötődni. Ez azt jelenti, hogy egyre gyakrabban és gyakrabban fog ismétlődni az adott inger jelenlétében, ugyanakkor ha, az inger hiányában a cselekvés nem vezet soha eredményre – azaz nem lesz megerősítve, az alany megtanulja, hogy ilyenkor felesleges próbálkozni. Végeredményben kialakul, hogy a szóban forgó inger megjelenése gyakorlatilag megindítja a cselekvést. Erre a legjobb példa talán, az asztalnál kunyeráló kutya viselkedése. Ha néhányszor sikerült egy-egy falatot kicsikarnia, már az evéshez készülődő család látványa is kiváltja belőle a viselkedést, ugyanakkor biztosak lehetünk benne, hogy napközben, ha senki nincs otthon, soha nem bámul bánatos szemmel az asztal mellett ülve. A külső ingerek tehát – úgy is mondhatjuk – tippeket adnak a kutyának, hogy az adott pillanatban milyen viselkedés biztosítana számára kedvező következményt, azaz megerősítést. A kedvező következmény viszont – mint a korábbiakban láttuk – növeli a viselkedés gyakoriságát és annak a kiváltó ingerekkel való összefonódását. A jó kiképzőnek tehát nem a kutya viselkedését kell az ellenőrzése alatt tartani, hanem a környezeti ingereket illetve a kutya viselkedésének következményei. Az operáns kondicionálás és a klikker kiképzésBármilyen módszerrel is tanítjuk a kutyánkat, az eddig leírt szabályok valamelyikét biztosan felfedezhetjük a módszereinkben. Ezek szerint mindenki, aki kutyát képez, „operáns kiképzőnek” számít? Nos, nem teljesen így áll a helyzet. Noha a kutyánk valóban „operáns tanuló”, ahhoz, hogy mi is „operáns kiképzőnek” számítsunk, nem elég a munkánk eredményét, illetve a kutya viselkedését egyszerűen ezen szabályokkal magyarázni. E szabályokat tudatosan és előre megfontoltan kell alkalmaznunk. Ez képessé tehet minket arra, hogy olyan problémákat is megoldjunk, melyekkel korábban nem találkoztunk, így gyakorlati tapasztalatunk sincs benne. Miért fontos mindez a klikker kiképzéshez? A klikkerrel való tanításnál különösen lényeges, hogy ismerjük és jól alkalmazzuk a fenti szabályokat. Itt sajnos sokkal nehezebb előre megírt receptkönyvek alapján dolgozni vagy „jól bevált” módszereket előhúzni. Az elveket kell megértenünk és alkalmaznunk. Mindezek után, hogyan definiáljuk a „klikkeres kiképzést”? Olyan kiképzési módszer, mely a tanítás során pozitív megerősítést, a viselkedés spontán elhalását, kisebb mértékben negatív büntetést használ, valamint a helyes viselkedések megjelölésére kondicionált megerősítést alkalmaz.Az úgynevezett „hagyományos” képzési módoktól abban tér el, hogy nem alkalmaz negatív megerősítést vagy pozitív büntetést, míg a pusztán motivációs módszerektől (ha létezik egyáltalán ilyen) abban, hogy nem kizárólag elsődleges, hanem kondicionált megerősítést alkalmaz a viselkedések kialakítására. Érdemes még megjegyezni, hogy a klikker (mint eszköz) használata nem követelmény, hiszen a kondicionált megerősítés lehet bármilyen inger – valamint attól, hogy valaki „klikkert használ”, még nem minősül klikker kiképzőnek amennyiben negatív megerősítést vagy pozitív büntetést is alkalmaz kiképzés során.
|