Kliker trening za telebane III.
piše: Silvia Trkman
V prejšnjem članku (Kliker trening za telebane – II.) smo pojasnili prednosti in pomanjkljivosti štirih različnih načinov, kako do različnih vedenj, ki bi jih radi naučili svojega psa. Tukaj pa še beseda ali dve o tem, kako naprej.
Proces učenja se namreč ne zaključi s tem, da vedenje izzovemo. Treba ga je še izpiliti, poimenovati in nato vzdrževati, saj izgine vsako vedenje, ki ni samo-nagrajujoče, če ga kdaj pa kdaj še vedno ne nagradimo.
Naj na kratko ponovim nekaj najpomembnejših dejstev, ki smo jih razložili v prejšnjih dveh člankih:
- klik psu pove, da si je z vedenjem v času klika zaslužil nagrado;
- klik vedenje konča, nagrada je namreč že zaslužena in pes lahko vedenje prekine;
- kliku VEDNO sledi nagrada: tudi če smo kliknili po pomoti, psa nagradimo in poskusimo znova.
Klik vedenje torej vedno zaključi. Klikerja zato ne morete uporabljati za označevanje vedenja, ki ga ne želite prekiniti. Če psu klikamo za hitro usedanje, ga moramo nagraditi, čeprav ob kliku vstane. Če psu klikamo za pravilen vhod v slalom, ga moramo nagraditi, čeprav slaloma ne dokonča. Če nočemo, da pes vstane iz položaja sedi, skoči iz slaloma ali zaključi katerokoli vedenje, lahko uporabimo premostitveno besedo tipa "še", ki psu pove zgolj to, da je na pravi poti, nagrada pa še ni zaslužena; lahko pa ga kako drugače spodbujamo, toda NE kliknimo, če ne želimo prekiniti vedenja.
Vedeti pa moramo, da bo pohvala po opravljeni vaji (po vaji "sedi" ali po izvedbi celotnega slaloma), pomenila nagrado za dokončanje vaje in NE za njen začetek, torej za sedenje in ne za hitro usedanje oziroma za dokončanje slaloma in ne za pravilen vhod za slalom. Hitro usedanje ali pravilen vhod v slalom lahko nagradimo le, dokler se pes še useda oziroma vstopa v slalom: nagrajujemo namreč vedno to, kar pes počne v trenutku klika. Klikati zato ne smemo PO tem, ko pes opravi želeno. Če kliknete PO želenem vedenju, utrjujemo vedenje PO želenem vedenju in NE želenega vedenja! Če smo zaželeno vedenje zamudili, NE kliknemo, lahko pa nagradimo in nato poskusimo znova.
Klikerja tudi NE smemo uporabljati za pridobivanje pozornosti – kar je najbolj pogost način zlorabe klikerja. Nič kolikokrat sem že morala poslušati navdušene klikeraše, ki so svojega psa, ki je ravno hotel skočiti v drugega psa, ali pa jim je navdušeno uničeval pohištvo, kopal luknje po vrtu ali počel karkoli drugega, kar si pač ne bi želeli, uspešno priklicali s klikerjem in mi zagotavljali, da so zdaj pa dokončno prepričani v to metodo … In prav tolikokrat sem jim morala na to pojasnjevati, da metode očitno sploh še ne poznajo, saj jo uporabljajo tako, da z njo učijo psa prav tistih stvari, ki ga želijo odvaditi… Prav ti ljudje bodo zato že čez nekaj tednov razlagali, da metoda ne deluje!
No, prav to, da njihovi psi vedno bolj besno skačejo v druge pse, vedno bolj vztrajno obdelujejo pohištvo in razkopavajo vrtove, dokazuje, da metoda deluje. Saj smo že na začetku poudarili, da lahko psa na ta način naučimo česarkoli. Njihovi psi so se tako uspešno naučili, kako priti do klika, in vedenja, ki jih do klika pripeljejo, ponujajo čedalje pogosteje in vedno bolj intenzivno… Na grozo svojih skrbnikov …
Trenutni učinek pri klikanju v takih nezaželenih situacijah je morda res zaželen, toda ne pozabimo, kaj smo s tem pravkar naučili psa! Če kliknemo, ko pes ni pozoren na nas, bomo pri psu, pogojenem na kliker, s tem sicer res pritegnili pozornost, vendar ga bomo hkrati naučili, da naj ne bo pozoren na vas, saj je to najlažji način, kako priti do nagrade. Če si s klikerjem pomagamo preusmeriti pasjo pozornost, ker se kuža za nas ne zmeni, ker pravkar gloda naš najnovejši par čevljev, ste ga s tem pravkar naučili idealnega načina, kako priti do nagrade: glodanje čevljev. Zato – NIKAR! Psi se po tej metodi učijo veliko prehitro, da bi si lahko privoščili takšno zlorabljanje.
Odpravljanja nezaželenega vedenja se moramo zato lotiti na drug način. Kako? Preprosto: namesto nezaželenega vedenja psa naučimo alternativnega vedenja.
Pes skače po ljudeh?
Prav, prosimo pomočnika, da mirno stoji, medtem ko pes skače vanj. V trenutku, ko se utrudi in ima vsaj za trenutek vse štiri tačke na tleh, kliknemo in nagradimo. Počasi zahtevajmo, da vse štiri tačke na tleh ostanejo več kot le trenutek, naučite ga lahko tudi, da se usede. In kuža bo kmalu nehal skakati po ljudeh, saj smo ga pravkar naučili boljšega načina, kako pridobiti pozornost in priboljške: da se mirno usede pred prišlekom.
Pes začne divje vleči, ko zagleda drugega psa?
Dobro, umaknite se na razdaljo, kjer še lako pritegnete njegovo pozornost in nato njegovo pozornost na vas nagradimo s tem, da ga spustite k drugemu psu. Nato postopoma zmanjšujemo razdaljo in se vsakič, ko se pasja pozornost preusmeri od nas na psa, obrnemo za 180 stopinj, in počakamo, da je pes spet pozoren na nas in se zato spet obrnemo proti drugemu psu. Če naš pes ostane pozoren na nas, ga za nagrado spustimo. In tako naprej, dokler pes ne ugotovi, da gre lahko k drugemu psu zgolj tako, da nas prej pogleda in nam namenja vso svojo pozornost, vse dokler si s tem ne zasluži sprostitvenega povelja in igre z drugim psom.
Psi namreč delajo, kar deluje: vlečejo, ker se njihovi lastniki pustijo privleči k drugemu psu in jih tako s tem nagradijo za vlečenje. Skačejo in lajajo, ker tako lahko pripravijo svojega vodnika, da jim nameni pozornost in ga s tem za tako vedenje nagradi itd. Psi so namreč sila bistre živali in ko gre za njihovo korist, hitro ugotovijo, kako do tega priti.
To pasjo lastnost pa lahko obrnemo v svoj prid. Moramo pa biti ves čas pozorni kaj nagrajujemo, in na pasje vedenje odreagirati tako, da bodo nagrajena zgolj želena vedenja. Kot smo že večkrat povedali, se nagrajena vedenja namreč okrepijo, nenagrajena pa počasi izginejo.
Zato nikar ne skoparimo z nagradami. V procesu učenja je nagrada za psa nujno potrebna informacija o tem, kaj sploh hočemo, zato je treba nagrajevati VSELEJ, kadar dobimo od psa to, kar hočemo, na začetku celo vse, kar je vsaj približno podobno temu, kar hočemo. Če na začetku ne nagrajujete pogosto, to pomeni, da ste si zastavili previsok kriterij za nagrajevanje. Vedenje, ki ga želimo naučiti, razdelimo na najmanjše možne delce in za začetek nagrajujemo vsak trzljaj mišic v pravo smer, nato pa višamo kriterij dovolj počasi, da še vedno lahko nagrajujemo kar najbolj pogosto, saj sicer tvegamo, da bo pes po fazi prve frustracije, ko vedenja ponuja še bolj intenzivno, prešel v drugo fazo resignacije in nehal ponujati vedenja.
Kasneje začnemo nagrajevati SELEKTIVNO, samo za najboljše (najbolj natančne, anjhitrejše, itd.) odzive. Ko pa vedenje izpilimo do zadnje podrobnosti, nagrajujemo zgolj še OBČASNO.
V tej zadnji fazi kliker ni več potreben, saj pes že ve, za kaj je nagrajen. Občasna nagrada pa je potrebna za ohranjanje kateregakoli vedenja, ki za psa ni samo po sebi nagrajujoče. Seveda pa je nagrada lahko karkoli, kar je za psa nagrajujoče: poleg hrane in igračke tudi božanje, besedna pohvala, lahko mu za nagrado odpremo vrata, ga spustimo s povodca, mu pustimo, da se igra z drugimi psi … Vsakič, ko si pes kaj zaželi, lahko to izkoristimo za utrjevanje naučenih vedenj.
In kdaj natančno v tem procesu začnemo poimenovati določeno vedenje? To je odvisno od tega, ali je vedenje, ki ga učimo, preprosto ali bolj kompleksno. Enostavna vedenja tipa "sedi" in "prostor" lahko poimenujemo že prvič in vedno, ko jih kuža izvaja. Bolj kompleksna vedenja pa poimenujemo šele takrat, ko smo prišli do končne, želene oblike vedenja. "Poleg" je torej "poleg" šele tedaj, ko kuža hodi v točno določenem položaju.
Pred tem si lahko pomagamo s "prehodnimi" povelji: prvo fazo učenja vaje "poleg" npr. lahko poimenujemo "glej me", ki nato, ko je psu popolnoma jasen tudi želeni položaj, postane "poleg". Preden dosežemo vedenje v končni obliki, pa ga ne moremo poimenovati s končnim imenom preprosto zato, ker dveh različnih vedenj (tj. prve, ohlapne oblike vedenja, ki ga učimo, in končne, natančne oblike vedenja) ne moremo poimenovati z istim imenom, sicer tvegamo nesporazume.
Pa veliko veselja ob šolanju n ne pozabite: psi se radi učijo!