wtorek, 15 grudnia 2015

Kończenie treningu "sukcesem". Na pewno robisz to dobrze?


"Kończ sukcesem, aby pies się nie zniechęcił."
"Nieważne, czy zadanie zostało wykonane czy nie, pamiętaj, aby psa nagrodzić."
"Nie zniechęcaj psa trudnymi zadaniami-każda inicjatywa z jego strony zasługuje na pochwałę."

Mogłabym w nieskończoność przywoływać tego rodzaju cytaty. Sęk w tym, że choć jest w nich ziarno prawdy, nie zawsze nagradzanie jest rozsądnym zachowaniem. Chyba, że chcemy przyhamować szybkość nauki naszego zwierzaka-i to bez względu na jego gatunek czy rozmiar mózgownicy...



Post odnosi się do świętej i jedynej prawdy, jaką jest zakańczanie każdej sesji szkoleniowej nagrodą, bez względu na to co pies zrobił.

Aby zrozumieć istotę nagradzania, warto zacząć od początku.
Czyli od tego, czym jest proces uczenia się?
Regułki i definicje podrzuci wam google, ja skupię się na praktyce. Czy ktokolwiek z nas rodzi się z umiejętnością zawiązywania sznurowadeł? Przychodząc na świat umiemy trzymać łyżkę, używać alfabetu, rozróżniać lewy but od prawego albo korzystać z lustra, żeby wyjąć rzęsę spod powieki?

Wszystkiego MUSIMY się nauczyć. Jedni wolniej, inni szybciej. Z pewną dozą frustracji i łez wylanych na podwórku, gdy inne dzieci potrafią się już huśtać a my wciąż nie wiemy, jak rozbujać wredną machinę (tak, to właśnie moja trauma z dzieciństwa). Jednak wszyscy UCZYMY SIĘ NA BŁĘDACH, ponieważ nasz mózg (i każdego stworzenia) nie znosi błędów. Logicznym jest więc, że musimy posiadać wrodzoną umiejętność rozpoznawania czym jest błąd i kiedy go popełniamy. A popełniamy, go kiedy nie ma sukcesu...
Kolejnym darem, którym zostaliśmy obdarzeni (jak również kot, pies, mysz, chomik czy kanarek) jest KONIECZNOŚĆ NAUCZENIA SIĘ radzenia sobie z tym, że taki błąd się popełniło.

Gdyby brak sukcesu demotywował, gepard po nieudanym polowaniu, rzucałby się pod pędzącego nosorożca; sikorka próbująca zasiedlić zajęta już budkę wlatywałaby wprost w szpony jastrzębia a lis, któremu nie udało się upolować gryzonia dałby się zasztyletować dzikowi. Tak się jednak nie dzieje. Ich motywacja do osiągnięcia sukcesu (która w naturze jest jednoznaczna z przeżyciem) jest na to zbyt wielka.

Chodzi jednak o sam schemat. Nieudana próba wiąże się z poniesieniem pewnych kosztów energetycznych. Sami dobrze to znamy. Kiedy ktoś się krząta w kuchni, zamiast iść i wstawić czajnik, krzykniemy z prośbą, aby zrobiła to osoba, która już tam jest. W naturze, zbyt rozrzutne ponoszenie kosztów może skończyć się tragicznie. To właśnie dlatego błędy przyspieszają proces uczenia. Każda istota stara się dostrzec wady swojej błędnej decyzji, aby w przyszłości jej nie ponowić (cóż, ludzie są tu czasami wyjątkiem...). Aby zachowanie mogło przynieść oczekiwany rezultat-sukces.

Wiecie, jaka jest najlepsza metoda nauczenia małego berbecia pojęcia "gorące=NIE DOTYKAJ"?
Wołanie "Aj"? Mówienie "Uważaj, to gorące!"? Owszem, to skutkuje odciągnięciem uwagi dziecka od dajmy na to-kubka gorącej herbaty. Przerywa zachowanie. Ale nie uczy go, żeby tego kubka nie dotykać z powodu przykrych konsekwencji, jakich może doznać. Jeśli jednak dziecko się sparzy (co i tak nastąpi prędzej czy później), następnym razem nie będzie czekało na wasz okrzyk trwogi. Doskonale będzie kojarzyło, że z takimi rzeczami trzeba uważać. Efekt szkoleniowy (jeśli można to tak nazwać) nie tylko będzie trwalszy ale i szybszy...choć i brutalny w tym przypadku.

Sukces jest ważny. Nawet bardzo. Długie pasmo niepowodzeń osłabia nasze samopoczucie, percepcję, zdolność uczenia się. Ale czy uzależnieni od hazardu to Ci, którzy wciąż wygrywają? Czy kibicujemy polskiej reprezentacji podczas meczu z mniejszym entuzjazmem, znając historię ich porażek?

Popełnianie błędów to nic złego. 
Złe jest obniżanie progu możliwości ucznia przez naszą postawę (sukces, musi być sukces, zawsze-wszędzie-tu-i teraz) względem niego. Nagradzanie za spowolnione wykonanie zadania, zrobienie go na odczepne czy też pomylenie komend to nic innego jak spowolnienie procesu uczenia się naszego ucznia.

Z rozrzewnieniem wspominam "moją kurę" na warsztatach klikerowych i to jaki efekt przynosiło zakończenie sesji treningowej bez nagrody. Wiązało się to, z jej zamknięciem w klatce.
Czy kura zamykała się przez to w sobie i chlipała po cichu w kącie? Nie.
Czy podchodziła do ponownego ćwiczenia ze zbolałą miną? Nie.
Kura DOSKONALE wiedziała, co było powodem zakończenia ćwiczenia. Miała również motywację, ponieważ to ćwiczenia były jedyną możliwością zdobycia nagrody. Wystarczyło raz przerwać strategię cwanego kurczaka, by ten przestał strzelać na oślep, którą kartę należy dziobać. Inna przedstawicielka kurzego rodu od razu zaprzestała opieszałości na rzecz energicznego tuptania, a jeszcze inna szła prosto do celu, zamiast podziwiać widoki. Jednak, gdy kurom pozwalano na tego typu kombinacje, efekt był coraz gorszy.
Sytuację można jeszcze lepiej odzwierciedlić takim to oto opisem.

Zadanie: kura ma wejść na stół i po kilku krokach dziobnąć w sznurek.
*
Zachowanie kury: rozglądanie się po wyjściu z klatki.
(powodem mogło być na przykład niezbyt delikatne postawienie jej na stole)
*
Rozumowanie człowieka: ojej, ona chyba zapomniała co robić...podsunę jej smaczka na zachętę, żeby wiedziała co robić!
*
Rozumowanie kury: o ja! dostałam jedzenie za nicnierobienie! Następnym razem po wyjściu znowu postoję i się porozglądam!

I tak powstał piękny łańcuch zachowań, w którym nasze DOBRE CHĘCI popsuły nam kurę...



A jeśli pomyślimy nad tym, że kura jest w stanie dojść do takich błyskotliwych wniosków, to co dopiero pies...? Zwierzę, które przez tysiące lat uczyło się schematu pracy z człowiekiem? Które o wiele lepiej wie, jak wykorzystać saszetkę ze smakołykami na dwóch nogach?

Nieważne czy uczysz psa sztuczki, dobierania się do zapakowanego pudełka, czy też pracy na śladzie. Jeśli pies "nie czuje" ćwiczenia, bądź kombinuje, lepiej je przerwać. Nie tylko ze względu na psa. Może trzeba jeszcze raz przeanalizować to, w jaki sposób uczymy psa, bądź poziom zadania jest dla psa jeszcze nie osiągalny. Ale nie nagradzaj go tylko po to, żeby tylko dobrze kojarzył zabawę! 

Świetnym przykładem jest jedno z moich ćwiczeń w wyzwaniu Pro-Canine. Pies miał wybrać kubeczek ze smakołykiem (jeden z trzech). Kubki stały normalnie (nie dnem do góry) a pies widział, do którego z nich jest wrzucany przysmak. A więc miał ZAPAMIĘTAĆ i OBSERWOWAĆ zachowanie opiekuna. Następnie pies miał podejść do właściwego kubeczka (po usłyszeniu komendy zwalniającej). 
Bardzo wiele osób, nie chciało, żeby psu było...przykro i pozwalali na sprawdzanie kubeczków :) Oczywiście można i tak, ale psi mózg nie był wtedy na najwyższych obrotach. Bo nawet jeśli nie trafi do pełnej miski, to co z tego? Znajdzie nagrodę prędzej czy później. Mała strata. Zaś te psy, które miały zgadywanie uniemożliwione (nie patrzyłeś? no to nie ma!), o wiele lepiej SKUPIAŁY się na opiekunie i tym, co ROBI. Świetnym przykładem jest filmik (1:40 do 2:25)



To czym motywować psa (bo nie zawsze są to smaczki), jak szybko pies łączy fakty czy też sposób radzenia sobie z frustracją, jest mocno indywidualne. Nie ma jednolitego schematu. Ale fakt, że uniemożliwienie osiągnięcia nagrody przez przerwanie ćwiczenia (za wolno/strzelanie na oślep bez namysłu/robienie jakiejkolwiek komendy/ robienie jej niedokładnie) przyspiesza proces uczenia się, jest nieodłącznym elementem takiego schematu.

Sukces jest potrzebny. Żeby nie było nieporozumień! Należy się z niego cieszyć, zaznaczać go i dawać psu do zrozumienia jaki jest wspaniały, mądry i w ogóle naj! Ale podczas treningu zaznaczamy to w adekwatny sposób. I nagradzamy wtedy, gdy faktycznie zrobił to, na co było go stać. W innym przypadku to pies szkoli was. Zaniżanie progu, byleby tylko psu się dobrze szkolenie kojarzyło skutkuje tym, że ostatnia próba to próba, kiedy starać się nie trzeba. Przecież i tak dostanie nagrodę. Na zachętę ;)




8 komentarzy:

  1. Lepiej tego wytłumaczyć chyba się nie da ;) Dzięki za ten post :)

    OdpowiedzUsuń
    Odpowiedzi
    1. Zawsze znajda się tacy, którzy nawet po przeczytaniu wciąż nie będą pojmować w czym rzecz...ale przynajmniej robiłam co mogłam :)

      Usuń
  2. Świetny post :-)
    Ja staram się nie nagradzać Terrora za połowiczne sukcesy, ale czasem jednak się zdarza :-) Pracujemy nad tym!
    Przykład z kurą - genialny!

    OdpowiedzUsuń
    Odpowiedzi
    1. Bo to nagradzanie jest silniejsze od nas. No i jeszcze te wielkie oczy, większe niż sam terror zapewne :P

      Usuń
  3. Bardzo ciekawy temat, bardzo dobre rozumowanie. Kiwałam głową przez cały czas, gdy czytałam Twoje spostrzeżenia - w stu procentach się zgadzam!

    OdpowiedzUsuń
  4. Świetny post.Najtrudniej chyba nie nagradzać szczeniaka :) Przecież tak słdko robią siad kiedy mówisz leżeć ;)

    OdpowiedzUsuń