mojpes.net

Operantno (instrumentalno) pogojevanje in nekaj pogledov nanj

Datum 24.7.2004 9:21:37 | Rubrika: Vzgoja

Operantno (instrumentalno) pogojevanje in nekaj pogledov nanj

Naši psi imajo majhne & relativno nenagubane možgane, podobne limonam, s katerimi se učijo le skozi operantno (instrumentalno) in klasično pogojevanje.

Keller in Marian Breland sta vodila prve tečaje za trenerje živali v letih 1947 in 1948. Za modele sta uporabljala piščance. Brelandova sta mnogo let iskala boljše vedenjske modele od piščancev, toda vedno sta se vrnila k domači perutnini. Bob in Marian Bailey sta nadaljevala z uporabo piščancev pri učenju novincev in izkušenih trenerjev. Po Marianini smrti Bob nadaljuje z Bailey & Bailey tradicijo.

Filozofsko stališče Boba Baileya pri poučevanju učenja živali je, da je učenje mehanska veščina in da sta razumevanje in vešča vadba nekaj preprostih vedenjskih principov ključa do trenerjevega uspeha.

Večina delovnih seminarjev poteka v hotelu Velda Rose, v mestu Hot Springs (zvezna država Arkansas). Občasno potekajo delavnice tudi drugje po ZDA.
Marian (Breland) Bailey (1920 - 2001) je študirala pri znanem psihologu B. F. Skinnerju od leta 1938 do 1943. Leta 1942 se Marian in njen prvi mož, Keller Breland, pridružita Skinnerju pri učenju golobov: voditi bombe v 2. svetovni vojni. Ta izkušnja je pripomogla, da sta Brelandova ustanovila podjetje Animal Behavior Enterprises (ABE) v letu 1943. ABE je bilo prvo podjetje, ki je uporabljalo operantno pogojevanje. Do 1947 so ABE piščanci oglaševali krmila. ABE trenerji so učili več kot 140 različnih živalskih vrst in deset tisoče živali. Heretični pogled Brelandovih na vedenje je opisan v njunem prelomnem delu iz leta 1961 z naslovom THE MISBEHAVIOR OF ORGANISMS (Slabo vedenje organizmov), v katerem sta predložila medsebojno vplivanje in nepretrgano zvezo med operantnim in odzivnim vedenjem.

Keller je umrl leta 1965, Marian pa je nadaljevala delo pri ABE. ABE je napredovalo, število zaposlenih se je povzpelo čez 43. Bob in Marian sta se v l. 1976 poročila. Marian nato doktorira v 1978 in začne poučevati na Henderson State University l. 1980. Podjetje ABE se zapre leta 1990, ko se Baileyeva upokojita. Marian konča z univerzitetnim poučevanjem l. 1998. Njena življenjska pot se zaključi v septembru 2001.

Robert E. Bailey se je že kot majhen otrok zanimal za znanost in predvsem živali. Njegova mati je morala živeti s klopotačo v hladilniku in raketnim gorivom v njeni kuhinji. Pri študiju rib, plazilcev in ptičev na univerzi UCLA, leta 1958, se je Bob prvič srečal z vedenjsko analizo in etologijo. Po izkušnjah iz bio-kemijskega laboratorija postane Bob prvi vodja učenja živali ameriške mornarice. Ko se leta 1965 pridruži podjetju ABE, postane najprej vodja raziskav, nato pa glavni direktor. V vseh letih je Bob učil več kot 120 vrst živali, ki so zajemale na tisoče posameznih osebkov, vključno s prosto živečimi primerki, ki so jih učili s sistemi vodenja z velikim dometom.
Bob je tudi iznajditelj, oblikovalec, pisec, učitelj, potapljač, fotograf in video urednik.

Bob nadaljuje Bailey & Bailey učno tradicijo.

Bailey & Bailey - PREDLOGI ZA BOLJŠE UČENJE

Učenje je mehanska veščina: Vadi učne postopke brez živali. Vadi klikanje. Vadi podeljevanje hrane, igrače ali pohvale. Vadi premikanje in učenje istočasno. Vadi, vadi, vadi. Nato uči žival.

Misli -- Načrtuj -- Naredi (tri ločena vedenja, ne mešaj jih!): Najprej pusti domišljiji prosto pot, upoštevaj vsako učno idejo, ne glede na njeno praktičnost. Nato izlušči vse divje, nepraktične sheme in zgradi podrobno, izvedljivo pot do želenega vedenja. Končno, izpelji načrt.

Učenje je preprosto, vendar ni lahko: Učenje bi moralo biti odsev preprostih principov. Tvoje zahteve do živali, plus želje in potrebe, ki jih ima žival, lahko zelo zapletejo učenje. Bolj kot je zapletena vedenjska naloga in bolj kot je nejasna vaša pot do določenega vedenja, toliko bolj zapleteno postane učenje. Poenostavi vsako stopnjo učenja, dajaj nedvoumne, jasne usmeritve in precizne okrepitve. Večina trenerjev bi morala biti bolj vedenjskih "cepilcev", kot "zbiralcev".

Reševanje vedenjskih problemov: Išči preproste rešitve raje kot kompleksnejše – najprej preuči probleme časovnega usklajevanja, kriterijev, stopnje okrepitve.

ČASOVNO USKLAJEVANJE (ang. TIMING): Pri vsakdanjem učenju je kliker-timing popustljiv. Pri preciznem učenju, kliker-timing NE odpušča! Dobil boš, kar klikneš, ne kar hočeš! Netočno časovno usklajevanje okrepitve (klikanja) je po izkušnjah Breland in Bailey najpogostejša napaka trenerjev živali.

MERILA (ang. CRITERIA): Preden se vedenje pojavi, bi se moral trener odločiti, kaj bo okrepil in česa ne bo okrepil. Če trener čaka, dokler se vedenje ne pojavi, potem bo klik nenehno pozen in neskladen.

STOPNJA OKREPITVE /NAGRAJEVANJA (ang. RATE OF REINFORCEMENT): Učenje mora biti za vse udeležence vredno vloženega truda – tako za žival kot za trenerja. Žival mora dobiti nekaj, kar želi ali potrebuje. Trener pa mora dobiti vedenje ali kako drugo zadovoljstvo iz tega učenja. Okrepitve morajo biti pogoste, še posebno na začetku učenja.

RAZMERJA (ang. RATIOS): Ne uporabljaj razmerij pri učenju, razen če jih nujno rabiš – trener lahko izbira. Razmerja se preveč uporabljajo in pogosto jih nepravilno rabijo. Razmerja se pogosto uporabljajo neustrezno in v preveliki meri. Pravilna uporaba nepretrgane okrepitve, skupaj s spretnim in lahkotnim treningom, vodi do zmerno močnega in zelo natančnega vedenja. Prihrani razmerja za visoko ponavljajoča se, dolgotrajna ter druga specifična vedenja.

PRIMARNA OKREPITEV IN OJAČEVALCI (ang. PRIMARY REINFORCEMENT AND REINFORCERS): hrana, igra in drugi dražljaji, ki zadostijo neki potrebi; vse to je lahko pri treningu uporabno. Primarni ojačevalec vedenje okrepi, pomembno pa je tudi, kdaj in kako ga uporabimo ter kaj sploh uporabimo kot primarni ojačevalec. Enako moramo paziti na uporabo primarne okrepitve kot tudi na sekundarno okrepitev, ki predstavlja "most" med določenim vedenjem in primarnim ojačevalcem, npr. hrano. Posplošitev: Klikni za dejanje, hrani za položaj.

ZANIMIVOSTI IZ SVETA OPERANTNEGA POGOJEVANJA

Baileyjeva nista objavljala svojih rezultatov, čeprav sta Brelandova (in kasneje Baileyeva), vsi v prvi vrsti znanstveniki, v skoraj 50. letih (15.000+ živali 150. različnih vrst), ko je delovalo podjetje Animal Behavior Enterprises, vodila izčrpne zapiske o vsaki živali.

Čeprav so bili v tem podjetju vodilni v načelu humanega ravnanja z živalmi, pa se niso tako odločili zaradi moralnih obvez. Te metode so izbrali, ker so dale rezultate v kratkem času. Izbrali so jih, ker so delovale.

Mnogo teh živali so trenirali za komercialne namene – razstave, reklame, sejmi ... Veliko dela pa so opravili za vlado. Začeli so z "golobjim bombnim projektom" v 2. svetovni vojni, nato pa so imeli vse do Hladne vojne veliko zanimivih učnih izzivov.

• Trenirali so golobe, da so leteli pred četami v džungli in iskali zasedo.

• Trenirali so krokarje, da so, vodeni z laserjem, ponoči leteli na sovražnikov teritorij in da so ob pravi stavbi fotografirali s pomočjo drobnega fotoaparata okrog njihovega vratu.

• Trenirali so prosto živeče, odrasle delfine, da so opravljali naloge v odprtem morju. Nekatere naloge so zahtevale, da so bile živali oddaljene 8 ali več ur – in ladje niso bile z njimi. Ladje so le čakale, da so delfini opravili svoje naloge in se vrnili. Zanimivo, njihovi delfini so se z večjo naglico vračali kot odplavali na delo (okrepitve so močna stvar!) Nikoli niso izgubili delfina. Nekoč so morali zaradi nevihte zapustiti delfine za 36 ur. Ko so se vrnili, so bili vsi delfini tam in zanesljivo opravljali svoje izostalo delo.

• Trenirali so pse za odkrivanje min in sprožilnih žic in kar je še pomembneje, za zavarovanje vojakov pred sprožitvami min.

• Trenirali so hišne mačke "vohunjenja" za sovražnikom. Predstavljajte si človeka, ki skoči pred mačko in ustreli s puško – ali norega psa prav pred mačkinim nosom – in mačko, ki ostane mirna. Takšne so namreč bile zahteve tovrstnega treninga mačk.

Delo na daljavo je bilo nujno. Divje ptice so svobodno letele ure in ure v sto kvadratnih miljah. Divji delfini so plavali – sami – 4 ure od ladje. Mačke so bile s pomočjo zvoka vodene z velikih razdalj.

Tako pri komercialnih kot vladnih projektih sta Baileyeva zahtevala zanesljivost. Ne le približne zanesljivosti. Niti vedenj, ki so bila večino časa zanesljiva. Zanesljivost. Ni se jima šlo za točke ali pokale. V njihovih situacijah so bila od zanesljivosti vedenja teh živali odvisna mnoga človeška življenja.

In metoda, ki so jo uporabljali, je bila enaka kot ta, ki jo uporabljajo trenerji s klikerjem. Uporabljali so pozitivne okrepitve (R+), ugasnjenje vedenja (E) in občasno negativno kazen (P-). Pozitivne kazni (P+) so se poslužili le približno 12-krat v 50. letih in pri 15.000 živalih – pa še tedaj na zahtevo stranke.

O KAZNI
Ta članek je preveden v slovenščino in objavljen na mojpes.netu z dovoljenjem avtorja.

V preteklih letih sem v svojih postih največ govoril o pozitivnih okrepitvah (R+). Bile pa so priložnosti, ko sem uporabljal druge postopke. Kot večina ostalih, bi se raje posluževal premorov ("time-outs"), vendar se vedno vprašam: "Ali sem jaz ustvaril ta problem s premajhno, ali celo slabo časovno usklajeno okrepitvijo?"

Strinjam se, da je večina vedenjskih težav povzročenih s strani trenerja in sam sem popolnoma pripravljen oditi do zidu in se trikrat butniti z glavo vanj, ko zagrešim napako. NIKOLI nisem prenašal svojih frustracij na živali pri delu z njimi in enako zahtevam od svojih ljudi. Trenerji morajo sprejeti odgovornost za vsa svoja dejanja.

Ko sem resnično kaznoval, in to pomeni RESNIČNO pozitivno kazen (P+), je bilo to vedno povezano z reševanjem življenj, imetja ali česa podobnega. Nikoli ne bi pomislil na uporabo pozitivne kazni pri učenju živali standardne poslušnosti. Prvič zato, ker ni nobene potrebe po tem in ker obstajajo boljše poti za dosego takega nivoja vedenja, vključno z zanesljivostjo.

Če pa govorimo o psih, ki tvegajo svoja življenja in življenja vodnikov v vojnih razmerah, potem ne bi odlašal s kaznovanjem napake in se ne bi zanašal samo na pozitivne okrepitve. V začetku sem pridobil vedenje z uporabo pozitivne okrepitve (R+) in zmanjšal nezaželjeno vedenje na minimalen nivo z uporabo ugasnjenja vedenja, VENDAR bi zavoljo psa in vodnika na koncu dodal še končno, ZELO močno kazen, da bi bil popolnoma prepričan, da žival ne bo pod nobenim pogojem zagrešila napake.

Ko jaz kaznujem, uporabim kazen MAKSIMALNO trikrat in ponavadi je že prvič dovolj. Pri tem vas opozarjam, da smo pri veliko tisočih živalih, ki smo jih trenirali v stotinah učnih programov, uporabili kazen približno dvanajstkrat. Zaradi dejstva, da sem jaz v teh določenih okoliščinah kazen uporabil, se ne morem uvrščati med ljudi, ki učijo s klikerjem (clicker trainers). Nič zato. Moja vest je čista. Verjamem, da sem storil, kar je bilo najboljše za živali in ljudi.

Nikjer v priročnikih naših delavnic ali v naših postih ne boste našli podrobnih navodil za kaznovanje. Prepričan sem, da se kaznovanje pretirano uporablja. Ko se uporabi, mislim, da se napačno uporabi (čudno, moj drugi ugovor je, da je kazen premila. Seveda je moj prvi ugovor ta, da po kazni sploh kdaj posežemo. Sem rekel, da se čudno sliši.) Ljudi ne učim kaznovalnih tehnik, ker nočem biti udeležen pri napačni uporabi sicer dobre tehnike. Če nekdo napačno uporabi pozitivno okrepitev, žival verjetno ne bo prizadeta. Tega istega pa ne moremo trditi za kaznovanje.

V naravi se živali pogosto soočajo z neprijetnimi (averzivnimi) situacijami, najbrž še pogosteje takrat, ko imajo priložnost za okrepitev. Pogosto se poudarja, da se živali hitro naučijo izogniti averzivnim stimulom in da se averzivi generalizirajo bolj kot okrepitve – najbrž res.

Toda, če se z rečenim strinjamo, živali pridejo opremljene z določenim nivojem vgrajene odpornosti na vplive odvračalnih dražljajev (averzivnih stimulov). Mladič, ki je kaznovan, ker je preveč stisnil mamin sesek, ne izpusti seska. Tak mladič bo morda začasno malo popustil pri sesanju in bo navadno manj stiskal sesek. Opazoval sem mladiča kojota, ki je padel v mrzel potok in tresoč se ter cvileč zlezel ven. Vsekakor je ta mladič kmalu spet prežal na ribe, ki so ga privabile k potoku.

Divja žival se v življenju sreča z mnogimi averzivi, ko mora preživeti, najti partnerja in pri vseh drugih opravilih, ki so normalna za divjo žival. Trenerji niso iznašli averzivov. Je pa tako, da ko mi ali drug organizem uporabimo averziv, pravimo temu kazen.

Pojavi se veliko filozofskih vprašanj, ko govorimo o kaznovanju. Ko je eden od kojotov končno ujel ribo pri potoku, je riba zelo verjetno občutila bolečino, preden jo je kojot prebavil. Bi lahko rekli, da je kojot z grizenjem ribo kaznoval? Kaj pa, če bi kojot celo ribo pogoltnil. Mislim, da je cela riba v želodcu ne bi odnesla veliko bolje kot pod zobmi.

Nekateri bi lahko rekli, da kojot ni skušal spremeniti vedenja ribe, niti je ni nameraval "kaznovati", zato averziv v tem primeru ni kazen. To bi pomenilo, da je razlika med averzivom in kaznijo v nameri uporabljenega averziva.

Morda bi nekateri rekli, da imamo ljudje neko etiko in ne bi nikoli smeli uporabiti kazni pri nobenem bitju. A tu se pojavi problem: naša družba in vsaka družba ima določeno število članov, ki kršijo zakone. Takšni razpuščeni člani družbe se pogosto ne odzivajo na to, kar ostali imenujemo okrepitev, zato nam preostane kaznovanje.

Lahko bi se poglobili v etiko našega kaznovalnega sistema, njegovo poštenost, vendar to ni moj namen. Želim le povedati, da po mojem mnenju averzivi in kaznovanje igrajo veliko vlogo tako v naravi kot v naši družbi. Če je družba nagnjena k uporabi kazni pri svoji lastni vrsti, zakaj se potem poraja etično vprašanje k odpravi kaznovanja živali? Tu se ne govori veliko o kaznovanju v naravi. Veliko pa je govora o kaznovanju znotraj naše družbe. Postopoma, skozi mnogo stoletij, se je naše skupno zaznavanje vloge kazni za živali in ljudi razvilo do stopnje, ki jo imamo danes. Kot družba še vedno razpravljamo o teh vprašanjih in verjetno se bo razprava nadaljevala še v prihodnjih stoletjih. Dokler bomo nadaljevali z odprto debato, obstaja verjetnost, da bomo prišli do soglasja, s katerim bomo lahko živeli.

Kot trenerji živali se soočamo z mikrokozmosom splošnih načel definicije in etike kaznovanja. Naj kaznujemo ali ne? Če smo absolutno proti vsakemu kaznovanju, potem se moramo vprašati, kaj sploh je kaznovanje. Menim, da moramo biti zelo pazljivi pri izjavi o absolutni prepovedi kakršnega koli kaznovanja v vsakih okoliščinah. Bodite zelo previdni pri svojih zahtevah; kajti prav lahko se te zahteve uresničijo.

Moje osebno mnenje je, da lahko celotno učenje živali uspešno izpeljemo z uporabo pozitivnih okrepitev. Obstajajo zelo redke okoliščine pri učenju živali, v katerih je kaznovanje po mojem osebnem mnenju izjemno koristno, morda celo bistvenega pomena. Potem je tu še nekaj redkih situacij, kjer bi bil dodatek kazni verjetno zelo koristen. V teh redkih okoliščinah, kjer kazen lahko pomeni potencialno korist, uporabimo kazen vedno z namenom ustaviti določeno vedenje, ki bi lahko povzročilo škodo živali, človeku ali ogrožalo imetje. Iz mojega stališča zato sledi, da popolnoma izključujem uporabo pozitivne kazni iz učenja kinoloških športov in poslušnosti ter da drastično omejujem kazen pri treningu službenih psov.

V tej, včasih filozofski in svobodomiselni diskusiji o kaznovanju, bi rad poudaril, da bi politično lahko nastale neprijetne posledice zaradi družbene odločitve o popolni prepovedi kaznovanja. Predlagam, da sledimo našemu lastnemu prepričanju o "misli pozitivno" in porabimo manj časa pri napadanju tistih, ki verjamejo, da imajo vso pravico in upravičenost za kaznovanje. Zmagali bomo vojno idej, če se bomo izkazali z učnimi uspehi. Lahko pa izgubimo pravico bodočih trenerjev nasploh, če prepričamo družbo, da bi morala obsoditi in prepovedati to, kar sami poimenujemo tradicionalni trenerji in tradicionalne metode šolanja.

Oprostite mi zaradi moje dolge razprave. Čeprav sem napisal ta prispevek v naglici, sem o problematiki veliko razmišljal. Kot ste najbrž že pomislili, sva z ženo Marian zelo poglobljeno razpravljala o teh in mnogih podobnih problemih. Spoznala sva, da so to vse čustvena vprašanja. Ponavadi sva zaključila, da je večina trenerjev, vključno z nama, političnih "Jankov in Metk".

Če poskušamo spremeniti naše občutke v akcijo, tako znotraj profesionalnih organizacij kot v politični areni, si lahko dolgoročno škodujemo. Sklepala sva, da sta tehnologija in čas na naši strani, vendar le, če se trenerji naučijo, kako pravilno uporabiti vedenjske metode in predvsem jih uporabljati etično. ZATO ljudje – pojdite ven in trenirajte in pustite opozicijo ob strani. Boriti se proti njej pomeni dolgoročen boj proti nam samim in našemu delu.

Bob Bailey
copyright 2002 Robert Bailey
Prevedli in priredili: Manja Žiberna in Jelena Cvetkovič

Razlaga pojmov

*Averziv: nekaj neprijetnega, čemur se žival skuša izogniti.

*Pozitivna okrepitev (R+): nekaj za žival dobrega, kar dodamo z namenom povečati pojav določenega vedenja. Npr.: psa nagradimo za 'Sedi' s priboljškom.

*Negativna okrepitev (R-): nekaj za žival slabega, kar odvzamemo z namenom povečati pojav določenega vedenja. Npr.: pri učenju psov s prisilo (kar NI tehnika učenja s klikerjem) so učili pse prinašanja prinosila tako, da so psa uščipnili v uhelj, da je odprl gobec in prijel prinosilo. Ko je pes odprl gobec – to je bilo želeno vedenje – je ščipanje prenehalo.

*Pozitivna kazen (P+): nekaj za žival slabega, kar dodamo z namenom zmanjšati pojav določenega vedenja. Npr: potege s povodcem (NI tehnika učenja s klikerjem) uporabimo, da bi zmanjšali vlečenje psa.

*Negativna kazen (P-): nekaj za žival dobrega, kar odvzamemo z namenom zmanjšati pojav določenega vedenja. Npr: ko se obrnemo stran (odvzamemo pozornost) od psa, ki skače na nas.

*Ugasnjenje vedenja (E): oslabimo določeno vedenje tako, da ga ne krepimo več. Npr: naš pes se uči, kaj pomeni povelje 'Sedi'. Zato nagrajujemo psa za vsak 'Sedi', ki sledi našemu povelju, vendar ignoriramo – ne nagradimo=okrepimo – nobenega drugega vedenja. Zato je zelo verjetno, da se druga vedenja ne bodo pojavljala, ker jih nismo krepili.

Prispevek natisnjen s spletne strani mojpes.net
//www.mojpes.net

URL za ta prispevek je:
//www.mojpes.net/article.php?storyid=633