Ta książka jest o tym jak uczyć - człowieka lub zwierzę, młodego lub starego,
siebie lub innych - tego co może i powinno być robione. Jak pozbyć się kota ze
stołu kuchennego i co zrobić żeby teściowa przestała się nas czepiać. Jak
wpłynąć na zachowanie zwierząt, dzieci, szefa i przyjaciół. Jak poprawić
uderzenie tenisowe, grę w golfa, wyniki w matematyce, pamięć. Wszystko to przy
użyciu zasad treningu przez wzmocnienie. Te zasady to prawa, takie same jak
prawa w fizyce. Są one podstawą wszystkich procesów uczenia tak jak prawo
grawitacji jest podstawą spadania jabłka na ziemię. Gdy usiłujemy zmienić
zachowania, nasze własne lub innych, działamy w oparciu o te prawa - świadomie
bądź nieświadomie.
Zazwyczaj działamy w sposób niewłaściwy. Grozimy, wykłócamy się, zmuszamy, szantażujemy. Naskakujemy na innych kiedy coś się nie udaje, nie zauważamy okazji do nagrody kiedy wszystko idzie po naszej myśli. Jesteśmy ostrzy i niecierpliwi wobec naszych dzieci, wobec innych a nawet wobec samych siebie - i czujemy sie potem winni z powodu takiego zachowania. Zdajemy sobie sprawę, że przy pomocy innych metod moglibyśmy osiągać nasze cele o wiele szybciej i bezboleśniej, ale nie jesteśmy w stanie wprowadzić ich do codziennej praktyki. Po prostu nie jesteśmy przyzwyczajeni do wykorzystywania nowoczesnych metod opartych na prawach pozytywnego wzmacniania.
Jakiekolwiek stałoby przed nami zadanie - utrzymanie w spokoju czterolatka w publicznym miejscu, uczenie porządku szczeniaka, trenowanie drużyny czy uczenie się na pamięć wiersza - zrealizujemy je szybciej, lepiej i z wiekszą przyjemnością jeśli wiemy jak stosować pozytywne wzmacnianie.
Prawa rządzące wzmacnianiem są proste. Można je spisać na tablicy w dziesięć minut i nauczyć się ich w godzinę, ale wprowadzenie ich w praktyce jest już dużo cięższym wyzwaniem. To jest jak gra oparta na szybkim myśleniu. Każdy może być trenerem i niektórzy są w tym świetni od pierwszej chwili. Nie potrzeba jakichś specjalnych przymiotów, cierpliwości, mocnej osobowości, daru obcowania z dziećmi czy zwierzętami, lub tego, co treser cyrkowy Frank Buck nazywał siłą ludzkiego oka. Trzeba tylko wiedzieć dokładnie co się robi.
Zdarzają się ludzie posiadający wrodzone, intuicyjne zrozumienie działania praw rządzących procesem nauki. To utalentowani nauczyciele, zdolni dowódcy w armi, wygrywający trenerzy w sporcie, genialni treserzy zwierząt. Miałam możliwość obserwować kilku reżyserów teatralnych i dyrygentów orkiestr symfonicznych, wspaniale wyszkolonych w zastosowaniu wzmocnienia. Ci naturalnie utalentowani nauczyciele nie potrzebują książek aby wykorzystać prawa rządzące nauczaniem. Jednakże dla pozostałych - dla tych którzy zmagają się na codzień z trudnym do kontroli zwierzęciem, dzieckiem lub współpracownikiem - poznanie zasad działania wzmacniania może stać sie prawdziwym darem niebios.
Nauka poprzez wzmacnianie nie jest systemem nagród i kar - w dużej mierze
nowocześni trenerzy nie używają nawet tych określeń. Sama koncepcja nagrody i
kary niesie w sobie wielki ładunek skojarzeń emocjonalnych i interpretacji,
takich jak pożądanie, jak strach, jak wina, jak wszystkie "trzeba" i "nie
trzeba".
Na przykład, nagradzamy innych za nasze własne czyny, kiedy kupujemy
dziecku loda po tym jak na nie nakrzyczymy. Mamy też przeświadczenie, że wiemy
jaka powinna być nagroda, na przykład lody czy pochwała. Ale niektórzy ludzie
nie lubią lodów, a pochwała od niewłaściwej osoby w niewłaściwym momencie może
sprawić przykrość. Czasami pochwała ze strony nauczyciela w klasie może być
gwarancją narażenia się na śmieszność w oczach kolegów.
Spodziewamy się, że ludzie będą robić co do nich należy bez żadnych nagród. Nasza nastoletnia córka powinna zmywać talerze, bo to nałeży do jej obowiązków. Wpadamy w złość kiedy dzieci czy pracownicy łamią rzeczy, kradną, spóźniają się, odpowiadają niegrzecznie i tak dalej, bo przecież oni wiedzą, że nie powinni się tak zachowywać. Stosujemy kary, często z wielkim opóźnieniem w stosunku do danego zachowania - czego najlepszym przykładem jest pakowanie ludzi do więzień - nie dające żadnej gwarancji wpływu na przyszłe zachowania, a będące de facto jedynie formą zapłaty. Mimo to myślimy o tego typu karach jako o wychowaniu i często używamy zwrotu "ale dałem mu nauczkę".
Nowoczesny trening wzmacniający oparty jest nie na tych popularnych
wierzeniach lecz na naukowym badaniu zachowań. Z naukowego punktu widzenia
wzmocnienie jest wydarzeniem, które:
Dwa elementy są tu kluczowe: oba wydarzenia są ściśle
połączone w czasie - zachowanie wywołuje wzmocnienie - i wtedy zachowanie
występuje coraz częściej.
Wzmocnienia mogą być pozytywne, takie, których
uczący się pragnie jak najwięcej, na przykład uśmiech lub poklepanie, bądź mogą
one być negatywne, czyli takie, których chciałoby się uniknąć, na przykład
szarpnięcie smyczą czy zmarszczenie brwi. Najważniejsze jest to, że są one
połączone w czasie - po wystąpieniu zachowania nastąpuje wzmocnienie i w
rezultacie zachowanie, które spowodowało miłe konsekwencje lub uniknęło
niemiłych bedzie sią powtarzać. Ta definicja działa w obu kierunkach: jeśli dane
zachowanie nie powtarza się, oznacza to, że albo wzmocnienie nastąpiło za
wcześnie lub za póżno, albo, że wybór zastosowanego wzmocnienia nie był właściwy
dla danego osobnika.
Dodatkowo, ja osobiście wierzę, że istnieje zasadnicza
różnica pomiędzy naukową teorią wzmacniania a praktycznym jej zastosowaniem.
Badania wykazują, że wystąpienie wzmocnienia po danym zachowaniu zwiększa
występowanie tego zachowania. To prawda, lecz w praktyce, żeby uzyskać
rewelacyjne wyniki, których się spodziewamy, niezbędne jest żeby wzmocnienie
nastąpiło dokładnie w momencie kiedy następuje zachowanie. Bingo! Teraz! W
jednej sekundzie, ty, uczeń, wiesz, że to co zrobiłeś w tej chwili przyniosło ci
nagrodę.
Nowocześni trenerzy rozwinęli wiele sposobów na wzmacnianie
natychmiastowe, przede wszystkim poprzez użycie sygnału zaznaczającego
zachowanie.
Ta nowa wersja książki "Nie zabijaj psa!" mówi o prawach
rządzących wzmacnianiem, o niektórych praktycznych zastosowaniach tych praw w
realnym świecie oraz o coraz bardziej rozpowszechnionym stosowaniu clicker
training.
Ja usłyszałam po raz pierwszy o pozytywnym wzmacnianiu na Hawajach, gdzie w 1963 roku pracowałam jako główny treser delfinów w ośrodku Sea Life Park. Miałam doświadczenie w tresowaniu psów i koni metodami tradycyjnymi, ale z delfinami to była zupełnie inna sprawa. Nie można używać smyczy czy wędzidła czy nawet ręki na zwierzęciu, które po prostu od ciebie odpływa. Jedynym narzędziem do dyspozycji pozostawały pozytywne wzmocnienia, zwykle w postaci wiaderka pełnego ryb.
Podstawy treningu poprzez wzmocnienie zostały mi wyłożone przez psychologa.
Sztuki stosowania tych podstaw w praktyce nauczyłam się podczas pracy z
delfinami. Jako biolog z wykształcenia i osoba od lat interesująca się
zachowaniem zwierząt, uległam zafascynowaniu nie tyle samymi delfinami ile
możliwością komunikowania z nimi, ilością informacji przepływającą ode mnie do
zwierzęcia i od zwierzęcia do mnie. To czego nauczyłam się podczas pracy z
delfinami znalazło potem zastosowanie w pracy z innymi zwierzętami. Zaczęłam też
zauważać jak niektóre elementy tych doświadczeń powoli wkradały się do mojego
życia codziennego. Przestałam krzyczeć na własne dzieci, bo stwierdziłam, że
krzyki nie przynoszą żadnych rezultatów. Zaczęłam natomiast wzmacniać właściwe
zachowania co dawało podwójną korzyść: działało dużo lepiej i w domu był
spokój.
Za praktyczną nauką jaką wyniosłam z pracy z delfinami kryje się
solidna teoria naukowa. Ta książka wychodzi daleko poza teoretyczne ramy,
ponieważ uważam, że reguły praktycznego stosowania tych teorii są w znacznym
stopniu pomijane bądź źle stosowane przez samych naukowców. Lecz podstawy teorii
są dobrze zakorzenione i muszą być brane pod uwagę.
Tę teorię, znaną w psychologii pod nazwą modyfikacji zachowań, teorii
wzmacniania, uwarunkowania instrumentalnego, psychologii behawioryzmu i analizy
behawiorystycznej, w dużej mierze zawdzięczamy pracy profesora z Harwardu, B. F.
Skinnera.
Nie znam żadnej innej nowoczesnej myśli naukowej, która byłaby
bardziej oczerniana, fałszywie interpretowana i źle stosowana w praktyce niż
teoria Skinnera. Samo imię Skinnera wywołuje wściekłość wśród zwolenników
"wolnej woli", która miałaby odróżniać człowieka od zwierzęcia. Dla ludzi
wychowanych w humanistycznych tradycjach sama myśl o manipulowaniu ludzkimi
zachowaniami przy pomocy świadomie stosowanych technik jest czymś z gruntu złym.
I to pomimo oczywistego faktu, że wszyscy bezustannie usiłujemy sobą nawzajem
manipulować za pomocą wszystkich dostępnych nam środków.
Podczas gdy
humaniści atakowali behawioryzm i samego Skinnera z zaciekłością z jaką w
dawnych czasach atakowano heretyków religijnych, sam behawioryzm rozrastał się
do rozmiaru ważnej galęzi psychologii. Powstawały wydziały uniwersyteckie,
kliniki, periodyki fachowe, kongresy międzynarodowe, programy
post-uniwersyteckie, doktryny, schizmy oraz tony literatury.
I pojawiły się
pierwsze rezultaty. Przy niektórych schorzeniach, jak na przykład autyzm,
kształtowanie i wzmacnianie wydają się przynosić rezultaty jakich nie dają inne
terapie. W wielu przypadkach terapia oparta na technikach behawioryzmu
doprowadziła do pozytywnego rozwiązania problemów emocjonalnych pacjentów. W
niektórych okolicznościach sama zmiana zachowań zamiast zagłębiania się w ich
korzenie, przyczyniła się do powstania terapii rodzinnej, która bada zachowania
wszystkich członków rodziny, a nie jedynie osoby chorej. To nawet na zdrowy
rozsądek wydaje się słuszne.
Wczesne próby kształtowania procesów uczenia się krok po kroku, z pomocą
wzmacniania studentów za poprawne odpowiedzi, zaowocowały powstaniem uczących
maszyn i zaprogramowanych podręczników. Te pierwsze kroki nie były zbyt sprawne,
lecz doprowadziły do powstania CAI, Computer Assisted Instruction (Komputerowo
Wspomagane Uczenie), które jest niezwykle zabawne ze względu na rodzaj
stosowanych wzmocnień (fajerwerki, tańczące roboty) oraz szalenie efektywne
dzięki wielkiej precyzji komputera w koordynacji czasowej.
Wprowadzono
programy oparte na wzmocnieniu także w szpitalach psychiatrycznych i w podobnych
instytucjach. Pacjenci kolekcjonowali żetony, które mogli potem wymieniać na
słodycze lub papierosy. Powstało wiele programów odchudzających bądź
oduczających złych nawyków opartych na samokontroli. Wydajne systemy edukacyjne
oparte na zasadach kształtowania i wzmacniania, takie jak Precision Teaching
(Uczenie Precyzyjne) czy Direct Instruction (Uczenie Bezpośrednie), zaczynają
wkradać się do naszych szkół. Ciekawym zastosowaniem wzmacniania w treningu
reakcji psychologicznych jest biofeedback.
Naukowcy przestudiowali
najdrobniejsze nawet aspekty uwarunkowań. Odkryli, na przykład, że jeśli w
programie auto-treningowym przewidziane jest prowadzenie zapisu graficznego
własnych osiągnieć, dużo lepsze rezultaty osiąga się poprzez staranne codzienne
zamalowywanie kwadracika niż poprzez zwykłe stawianie w nim
krzyżyka.
Zaabsorbowanie detalami ma ważne podstawy psychologiczne, lecz
rzadko prowadzi do dobrego treningu praktycznego.
Trening jest jak pętla,
dwustronne porozumiewanie, gdzie wydarzenie na jednym końcu pętli powoduje
zmiany na drugim, dokładnie tak samo jak w systemie komputerowym. A jednak wielu
psychologów traktuje swoją pracę jako coś co robią podmiotowi, a nie z
podmiotem. Dla prawdziwego trenera zróżnicowane i nieprzewidziane reakcje
podmiotu są najciekawsze i potencjalnie najbardziej produktywne w procesie
treningu. Mimo to większość eksperymentów jest zaplanowana w taki sposób by
minimalizować lub ignorować indywidualistyczne reakcje. Wynajdywanie metod na
wprowadzenie tego co Skinner nazwał kształtowaniem i stopniową zmianą zachowań,
jest procesem twórczym.
W literaturze psychologicznej pełno jest przykładów na programy kształtujące
pozbawione wyobrażni, żeby nie powiedzieć bezsensowne, które, według mnie, są
jedynie wyjątkowo okrutnym systemem kar.
Jako przykład weżmy niedawno
opublikowany sposób na moczenie łóżka. Przewiduje on nie tylko umieszczenie
specjalnych czujników wilgoci w łóżku dziecka, ale wręcz obecność terapeuty
przez całą noc. Autorzy mieli na tyle zdrowego rozsądku, że przepraszająco
wyjaśniali dość wysoki koszt takiej terapii. A jakie koszty ponosi psyche
dziecka poddanego takiej terapii? Tego rodzaju rozwiązania "behawiorystyczne"
przypominaja zabijanie muchy łopatą.
To Schopenhauer powiedział kiedyś, że każdy nowy pomysł jest najpierw
wyśmiewany, potem ostro atakowany, a potem uznawany za oczywistość. Jak widać
teoria o wzmacnianiu nie stanowiła tu wyjątku. Wiele lat temu Skinner został
powszechnie wyśmiany gdy zademonstrował kształtowanie poprzez nauczenie pary
gołębi gry w ping-ponga. Kiedy dla swoich małych córeczek zbudował ciepły,
wygodny, samo-czyszczący, pełen zabawek kojec, okrzyknięto to dzieło nieludzkim
"pudłem na dzieci", czymś niemoralnym i graniczącym z herezją. Do tej pory krążą
plotki, że córki Skinnera oszalały, podczas gdy obie są cenionymi na polu
zawodowym i uroczymi osobami.
W naszych czasach wielu wykształconych ludzi
traktuje teorię wzmacniania jak coś mało ważnego, co jest im znane od zawsze. W
rzeczywistości wiekszość ludzi nie rozumie jej, bo gdyby było przeciwnie, nie
zachowywaliby się tak jak się zachowują wobec innych.
Od czasu moich doświadczeń z tresowaniem delfinów odbyłam wiele odczytów i
pisałam o prawach rządzących wzmacnianiem zarówno w kołach akademickich i
zawodowych, jak dla szerokiej publiczności. Uczyłam tego rodzaju treningu
uczniów szkół średnich, studentów, gospodynie domowe i pracowników zoo, rodzinę
i przyjaciół, i - podczas seminariów weekendowych - kilkanaście tysięcy
właścicieli i treserów psów. Obserwowałam też wiele innych rodzajów treningu, od
kowbojów do trenerów sportowych, i zauważyłam, że zasady wzmacniania zaczynają
się powoli wkradać do naszej świadomości.
Treserzy zwierząt w Hollywood nazywają pozytywne wzmocnienie "affection
training" (trening przez miłość) i używają tych technik aby uzyskać zachowania
niemożliwe do uzyskania przy pomocy siły, takie jak te u zwierząt występujących
w filmie "Babe". Wielu trenerów olimpijskich używa dziś pozytywnego wzmocnienia
i kształtowania zamiast zastraszania i osiąga dzięki temu znaczne wyniki
sportowe.
Nigdzie jednak nie znalazłam opisu reguł teorii wzmacniania tak
spisanych aby mogły być pomocne w praktycznym rozwiązywaniu problemów. Oto więc
one, spisane w tej książce tak jak ja je rozumiem i jak je widzę stosowane -
prawidłowo i błędnie - w życiu codziennym.
Wzmacnianie nie rozwiązuje wszystkich problemów. Nie powiększy wam konta w banku, nie uratuje rozlatującego się małżeństwa i nie przezwycięży zaburzeń osobowości. Niektóre sytuacje, na przykład płaczące niemowlę, nie reprezentują problemów dotyczących treningu i wymagają innych rozwiązań. Niektóre zachowania ludzkie i zwierzęce mają podłoże genetyczne i mogą okazać się trudne lub niemożliwe do zmodyfikowania poprzez trening. Niektóre problemy nie są warte zachodu. Ale w wielu życiowych wyzwaniach, próbach i kłopotach prawidłowe użycie wzmacniania może pomóc.
Zastosowanie pozytywnych wzmocnień w jednej sytuacji może pokazać wam jak
używać ich w innych. Jak powiedział kiedyś gorzko treser delfinów z którym
pracowałam: "Nikomu, kto przedtem nie wytresował kurczaka, nie powinno się
pozwalać mieć dzieci."
Chodzi o to, że doświadczenie zdobyte w trakcie
tresury kurczaka, stworzenia, którego niczego nie można nauczyć siłą, powinno
jasno dać do zrozumienia, że użycie kar wobec dziecka nie daje rezultatów.
Powinno też dostarczyć pomysłów jak wzmacniać u dziecka porządane
zachowania.
Zauważyłam, że większość treserów delfinów, którzy muszą rozwinąć
w sobie zdolność używania pozytywnych wzmocnień niezbędną w codziennej pracy,
posiada wyjątkowo miłe i zgodne dzieci.
Ta książka nie zagwarantuje wam
zgodnych dzieci. W rzeczy samej nie obiecuje ona żadnych rezultatów ani
umiejętności. To co ma do zaofiarowania to podstawowe zasady leżące u podstaw
procesu nauczania i niektóre wskazówki dotyczące stosowania tych zasad w sposób
twórczy w rozmaitych sytuacjach. Może pomóc wam uporać się z niektórymi
problemami, z którymi borykacie się od lat lub rozwiązać sytuacje, które utknęły
w martwym punkcie. Na pewno, jeśli sobie życzycie, nauczy was jak wytresować
kurczaka.
Wydaje się, że trening przez wzmocnienie posiada wlasną, naturalną kolej
rzeczy. Następne rozdziały ułożone są w kolejności, w której mają miejsce
poszczególne elementy treningu, od najprostszych do najbardziej złożonych.
Wydaje się to być także kolejność, w której ludziom najłatwiej przychodzi nauka
jak zostać trenerem.
Cała książka zorganizowana jest tak aby ułatwić
zrozumienie teorii wzmacniania, a przykłady jej stosowania mają być jej
odzwierciedleniem praktycznym. Poszczególne, prezentowane w książce metody mają
być sugestią bądź inspiracją raczej niż zbiorem instrukcji.
Wzmacnianie to cokolwiek, co występując jednocześnie z zachowaniem,
powoduje, że zachowanie to ma większe szansę się powtórzyć. Zapamiętajcie to
stwierdzenie. W nim leży sekret treningu.
Istnieją dwa rodzaje wzmocnień:
pozytywne i negatywne.
Pozytywne wzmocnienie to coś czego podmiot
pragnie jak jedzenie, pieszczoty lub pochwała.
Negatywne wzmocnienie
to coś czego podmiot pragnie uniknąć - uderzenie, zmarszczone brwi lub niemiły
dźwięk (brzęczyk w samochodzie, kiedy nie zapniesz pasów bezpieczeństwa to jest
negatywne wzmocnienie).
Ofiarowanie pozytywnego wzmocnienia zachowania jest podstawą treningu. W
literaturze naukowej można znaleźć następujące wypowiedzi psychologów:
"zastosowano metody behawiorystyczne", lub "problem rozwiązano poprzez
zastosowanie behawioryzmu". Oznacza to, po prostu, że porzucono poprzednią
metodę i zastosowano pozytywne wzmocnienie. Nie oznacza to wcale, że zastosowano
wszystkie opisane w tej książce sposoby; być może nawet ich nie znano.
Mimo
to, przejście do wzmacniania pozytywnego często wystarcza samo w sobie. Jest to
najbardziej efektywny sposób pomocy, na przykład dziecku, które moczy łóżko:
pochwała w cztery oczy i przytulenie za suche prześcieradło.
Pozytywne wzmacnianie można stosować również wobec samego siebie. Kiedyś
byłam członkiem szekspirowskiej grupy, w której spotkałam czterdziestoletniego
adwokata z Wall Street, zapalonego gracza w squash. Podsłuchał on kiedyś moją
rozmowę o wzmacnianiu i podszedł potem do mnie, mówiąc, że ma zamiar wypróbować
je na sobie w grze w squash. Zamiast, jak miał w zwyczaju, przeklinać własne
błędy, postanowił chwalić samego siebie za dobre uderzenia.
Spotkałam go w
dwa tygodnie później. "Jak idzie squash?" zapytałam. Na jego twarzy ukazał sie
wyraz zdumienia i radości, nieczęsto widywany u nowojorskich adwokatów. "Z
początku czułem się jak idiota", powiedziaał. " Mówiłem sobie: "brawo chłopcze,
świetnie" za każde dobre uderzenie. Kiedy ćwiczyłem sam, nawet się poklepywałem
po ramieniu. I nagle moja gra zaczęła się polepszać. Jestem o cztery miejsca
wyżej w tabeli klubowej niż byłem kiedykolwiek. Wygrywam z ludżmi, którym kiedyś
nie mogłem odebrać nawet jednego punktu. I dużo lepiej się bawię. Ponieważ nie
przeklinam sam siebie przez cały czas gry, nie schodzę z boiska wściekły i
rozczarowany. Jeśli nie wyszło mi jedno uderzenie to trudno, wyjdzie następnym
razem. I świetnie się bawię kiedy mój przeciwnik popełnia błąd, wścieka się i
wali rakietą w ziemię. Wiem, że to nie pomoże jego grze i tylko się
uśmiecham…"
Co za szatański przeciwnik. I to tylko dzięki zastosowaniu
pozytywnego wzmocnienia. Wzmocnienia nie są absolutne lecz relatywne. Deszcz
jest pozytywnym wzmocnieniem dla kaczek, negatywnym dla kotów, zazwyczaj
obojętnym dla krów. Jedzenie nie jest pozytywnym wzmocnieniem jeśli mamy pełen
żołądek. Uśmiechy i pochwały mogą być bezużyteczne jeśli podmiot usiłuje nas
doprowadzić do szału. Aby stać się wzmacniaczem obrany element musi być pożądany
przez podmiot.
Pożyteczne jest używanie zróżnicowanych wzmocnień w tej samej sytuacji
treningowej. W Ośrodku Oceanicznym Sea World wieloryby dostają wiele wzmocnień
włącznie z rybami (ich pożywienie), głaskaniem i drapaniem po różnych częściach
ciała, uwagą trenera, zabawkami i tak dalej.
Odbywają się całe pokazy podczas
których zwierzęta nie wiedzą które kolejne ich zachowanie będzie wzmocnione i w
jaki sposób. "Niespodzianki" są tak interesujące dla zwierząt, że cały pokaz
może się odbyć bez użycia standardowego wzmacniacza jakim są ryby. Zwierzęta
dostają swój posiłek pod koniec dnia.
Potrzeba ciągłej zmiany elementu
wzmacniającego jest też ciekawym wyzwaniem dla samego trenera.
Pozytywne wzmacnianie ma też korzystny wpływ na stosunki międzyludzkie. Jest
podstawą sztuki dawania prezentów: trafny wybór czegoś co na pewno podziała
wzmacniająco. (Trafny wybór jest również wzmacniaczem dla osoby wybierającej
prezent.)
W naszej strefie kulturowej robienie prezentów jest często domeną
kobiet. Znana mi jest nawet rodzina, w której matka kupuje prezenty gwiazdkowe
dla wszystkich od wszystkich. Na Gwiazdkę rozgrywa się zabawna scena podczas
której siostry i bracia zgadują: "A, to jest od Ani dla Krzysia" - a wszyscy
obecni doskonale widzą, że Ania nie miała z tym nic wspólnego. Takie
postępowanie nie wykształca w dzieciach zdolności wyboru sposobów wzmacniania
zachowań innych ludzi.
W naszej kulturze człowiek, który wyrobił w sobie umiejętność obserwacji
stosowaną w procesie wzmacniania, ma dużą przewagę nad innymi. Jako matka
upewniłam się, że moi synowie potrafią dawać prezenty. Kiedy mieli pięć i siedem
lat zabrałam ich kiedyś do eleganckiego sklepu i pozwoliłam wybrać dwie sukienki
dla ich młodszej siostry. Mieli świetną zabawę siedząc w pluszowych fotelach,
oceniając kolejne przymierzane przez siostrę sukienki. Mała też doskonale się
bawiła i miała ostateczne prawo decyzji. Dzięki takim doświadczeniom wszyscy
troje nauczyli się zwracać uwagę na potrzeby innych ludzi i czerpać przyjemność
z odkrywania pozytywnych elementów wzmacniających wobec bliskich im
osób.
Wzmocnienie utrwala zachowanie, ale niekoniecznie jest to coś czego uczący się pożąda. Unikanie czegoś niepożądanego może również być elementem wzmacniającym. Badania laboratoryjne wykazały, że zachowanie może być umocnione poprzez bodziec negatywny jeśli zmiana zachowania spowoduje zniknięcie tego bodźca. Tego typu bodźce są nazywane wzmacnianiem negatywnym: ludzie i zwierzęta gotowi są pracować by ich uniknąć.
Negatywne wzmacnianie może być niezwykle delikatne - poczynając od krzywego spojrzenia przyjaciela kiedy opowiemy kiepski dowcip, czy lekkiego powiewu zimnego powietrza z klimatyzatora, który spowoduje, że wstaniemy i przesiądziemy się na inne krzesło. Także bardzo ostre bodźce mogą być jednocześnie negatywnymi wzmacniaczami i karą, jak na przykład publiczne poniżenie czy szok elektryczny. Możemy boleśnie odczuwać kiedy ktoś na nas wrzeszczy, ale szybko się uczymy wchodzić do biura tylnymi drzwiami, kiedy wrzaskliwy szef stoi w głównym wejściu.
Negatywne wzmocnienia to coś co możemy zatrzymać lub czego możemy uniknąć
modyfikując nasze zachowanie. W momencie zmiany zachowania negatywny bodziec
ustaje i nowe zachowanie jest wzmocnione. Wyobraźmy sobie, że siedząc w saloniku
u cioci położę nogi na stoliku do kawy jakbym była u siebie w domu. Ciocia
znacząco unosi brwi. Moje nogi wracają na podłogę. Ciocia się rozluźnia. Ja
czuję ulgę.
Uniesione brwi cioci to był negatywny bodziec działający jako
negatywne wzmocnienie. Ponieważ udało mi się zatrzymać ten negatywny bodziec,
nowe zachowanie, czyli moje nogi na podłodze, prawdopodobnie się nie powtórzy,
przynajmniej w domu cioci, ale nie wykluczone, że również w innych domach.
Nauka może się odbywać prawie wyłącznie poprzez stosowanie negatywnych
bodźców wzmacniających. Większa część tradycyjnego szkolenia zwierząt odbywa się
w ten sposób. Koń uczy się skręcać w lewo kiedy pociągamy za lewe wodze bo
nieprzyjemny ucisk w pysku znika po wykonaniu zakrętu. Lew wskakuje na stołek i
zostaje tam żeby uniknąć świstu bata lub krzesła trzymanego koło
pyska.
Jednak negatywne wzmocnienie to nie to samo co kara. Na czym polega
różnica? W pierwszym wydaniu tej książki napisałam, że karą jest negatywny
bodziec występujący po zachowaniu, które miało być zmodyfikowane, czyli bodziec
ten nie może mieć żadnego wpływu na zachowanie. "Dziecko dostało lanie za zły
stopień i następne stopnie mogą być lub nie być lepsze. Jedno jest pewne:
stopień już otrzymany się przez to nie zmieni." Rzeczywiście, kiedy celowo
wymierzamy karę robimy to zazwyczaj dużo za późno, ale nie na tym polega
właściwa różnica pomiędzy karą i negatywnym wzmocnieniem.
Współcześni analitycy zachowń identyfikują karę z wydarzeniem które zatrzymuje zachowanie. Dziecko usiłuje włożyć metalową spinkę do kontaktu. Matka gwałtownym ruchem oddala jego rękę od kontaktu. To zagrażające życiu zachowanie musi być przerwane teraz. Zachowanie ustaje. Mogą wystąpić inne zachowania - dziecko zaczyna płakać, matka czuje się winna i tak dalej - ale zachowanie "spinka-w-kontakcie" zostało zahamowane, przynajmniej chwilowo. Oto jak działa kara.
B.F. Skinner był bardziej precyzyjny. Zdefiniował on karę jako utratę czegoś
pożądanego w rezultacie zachowania - w przypadku dziecka przyjemności z zabawy
spinką - lub wystąpienie czegoś niemiłego. Jednakże, w obu przypadkach, mimo że
zachowanie ustaje, nie ma żadnej gwarancji na przyszłość. Wiemy, że wzmocnienie
umacnia zachowania w przyszłości, a kara nie daje nadzei na przewidzialne
zmiany.
Na przykład, czy łapiąc dziecko lub dając mu po łapach, nawet w
dokładnie tym samym momencie, będziemy mieć gwarancję, że nie będzie ono już
próbowało nic wtykać do kontaktu? Zapytajcie o to rodziców małych dzieci. Zwykle
kończy się na tym, że zabieramy małe przedmioty, dorabiamy pokrywki do
kontaktów, przesuwamy meble tak by je zasłonić i czekamy aż dziecko wyrośnie z
potrzeby wtykania do nich spinek.
Analitycy zachowań patrzą na to inaczej.
Zarówno wzmacnianie jak kara są procesami określanymi przez rezultaty. Negatywne
wzmacnianie może być używane efektywnie do nauki zachowań i pomimo stosowania
negatywnych bodźców proces ten może być stosunkowo bezbolesny.
Oto przykład
(z podziękowaniem dla eksperta od lam Jima Logana) użycia negatywnego
wzmocnienia do tresury na wpół oswojonego zwierzęcia jakim jest lama, trzymana w
Stanach Zjednoczonych jako zwierzę do towarzystwa, a w innych krajach jako
zwierzę stadne i na wełnę.
Lamy są nieśmiałe i płochliwe jak konie. Jeżeli
nie są od małego przyzwyczajone do ludzi, trudno jest się do nich zbliżyć.
Instrumentalne uwarunkowanie poprzez pożywienie zdaje świetnie egzamin z lamami,
ale czasami są one zbyt płochliwe by podejść do człowieka na tyle blisko by
wziąć jedzenie. Oto jak radzą sobie wtedy nowocześni treserzy: używają klikera
jako sygnału informującego lamę, że to co robi jest właściwe i należy się
nagroda. Lecz właściwym i realnym wzmocnieniem jest usunięcie negatywnego
bodźca.
W rzeczywistości mówią do lamy: "Czy pozwolisz mi podejść do
siebie na trzydzieści stóp? Tak? Dobrze! Kliknę klikerem, odwrócę się i odejdę
na większą odległość." "A teraz pozwolisz mi podejść na dwadzieścia pięć stóp?
Tak? Dobrze! Kliknę i oddalę się."
Używając klikera do zaznaczenia
pożądanego zachowania, w naszym przypadku stania spokojnie w miejscu, i
ofiarowując oddalenie się człowieka jako wzmocnienie, czasami udaje się podejść
do lamy w ciągu kilku minut. To tak jakby lama miała kontrolę nad sytuacją.
Dopóki stoi spokojnie w miejscu jest w stanie nas od siebie oddalić. Więc stoi,
nawet kiedy człowiek jest już zupelnie blisko.
Kiedy lama pozwoli sie
dotknąć kilka razy i za każdym razem ręka się cofnie, można powiedzieć, że lody
zostały przełamane. Osoba nie jest już tak groźna. Teraz jest czas na wiaderko z
pokarmem. Komunikacyjna pętla się zamyka: "Mogę cię dotknąć kiedy stoisz w
miejscu? Tak? Klik i, prosze, tu jest coś pysznego do jedzenia." Lama jest
na dobrej drodze do otrzymania pozytywnego wzmocnienia z jedzeniem, głaskaniem i
drapaniem włącznie, w zamian za swoje nowe zachowanie, czyli stanie w miejscu
zamiast ucieczki na oślep.
Wykorzystanie wycofania czy złagodzenia negatywnego bodźca jest podstawą tak
zwanej techniki "szepczących do koni". W większości przypadków trener pracuje z
koniem puszczonym wolno na ogrodzonym terenie i w stosunkowo krótkim czasie
przekształca konia uciekającego w popłochu w konia akceptującego spokojnie
obecność człowieka. Koń, przed chwilą zupełnie oszalały, uspokaja się, akceptuje
nawet siodło i jeźdźca i efekt takiej sceny jest zupełnie magiczny.
Treserzy
używający tego rodzaju technik często mają przesądne wytłumaczenie tego co się
dzieje. Wielu wypracowało sobie jakiś ruch bądź dźwięk, który pełni funkcję
sygnału lub uwarunkowanego wzmocnienia lecz niewielu czyni to świadomie. W
każdym razie to nie magia działa na konia, lecz prawa instrumentalnego
uwarunkowania.
Negatywne wzmacnianie jest przydatne, lecz należy pamiętać, że każdy jego
moment zawiera w sobie również element kary. Kiedy szarpiemy za lewe wodze, do
chwili kiedy koń skręci stosujemy karę za chodzenie na wprost. Nadużycie
negatywnych wzmocnień może doprowadzić do - jak nazwał to Ph. D. Murray Sidman -
"odpadania", które jest negatywnym efektem ubocznym stosowania kar (patrz
rozdział 4).
Jak już wspomniałam, wzmocnienie musi nastąpić w synchronizacji z
zachowaniem, które ma zmodyfikować. Synchronizacja wzmocnienia reprezentuje
informację: mówi uczącemu się o co nam dokładnie chodzi.
Kiedy ktoś usiłuje
się czegoś nauczyć, informacje zawarte w elemencie wzmacniającym stają się
ważniejsze od samego wzmocnienia. Podczas trenowania atletów lub tancerzy to
okrzyk trenera "Tak!" lub "Dobrze!" podkreśla zachowanie w momencie kiedy ono
się pojawia i dostarcza trenującym prawdziwej informacji - nie dyskusja w szatni
w godzinę później.
Opieszałe wzmacnianie jest największym problemem początkującego trenera. Pies
siada, ale zanim właściciel powie "Dobry pies", pies już zdążył wstać. Jakie
zachowanie zostało wzmocnione przez słowa "Dobry pies"? Wstawanie. Kiedy
napotykacie na trudności w szkoleniu, pierwsze pytanie, które należy sobie zadać
to czy wzmacnia się zbyt późno. Jeśli pracujecie z człowiekiem lub ze
zwierzęciem i macie problemy, dobrze jest poprosić kogoś o poobserwowanie i
wyłapanie zbyt powolnych wzmocnień.
Zawsze wzmacniamy się nawzajem zbyt
póńno. "Kochanie, jak pięknie wyglądałaś wczoraj wieczorem" różni się bardzo od
tego samego komplementu wypowiedzianego na gorąco. Spóźniony komplement może
nawet mieć przeciwny od zamierzonego efekt ( A co, czy teraz nie wyglądam
pięknie?) Mamy zadziwiające zaufanie, że słowa potrafią wypełnić dziurę w
czasie.
Wzmacniać za wcześnie też nie należy. W zoo w nowojorskim Bronxie
strażnicy mieli kłopoty z gorylem. Należało wyprowadzić go na wybieg w celu
wyczyszczenia wewnetrznej klatki, lecz goryl nabrał zwyczaju siadania w
przejściu i blokowania automatycznych drzwi.
Kiedy strażnicy z zoo zostawiali
na wybiegu jedzenie lub wymachiwali bananami goryl albo ich ignorował albo
szybko łapał jedzenie i wracał na swoje miejsce w drzwiach zanim te się
zamknęły. Poproszono o radę tresera z zoo. Wyjaśnił on, że zostawianie jedzenia
i machanie bananami były próbą wzmocnienia zachowania, które jeszcze nie
wystąpiło. To sie nazywa przekupstwo. Rozwiązanie leżało w tym by ignorować
goryla kiedy siedzał on w drzwiach i wzmacniać go kiedy tylko zdarzało mu się z
własnej woli wyjść na wybieg. I już po problemie.
Myślę, że czasami wzmacniamy dzieci zbyt wcześnie w błędnym przekonaniu, że je zachęcamy ("Dobra dziewczynka, prawie ci się udało"). Być może umacniamy w ten sposób próbowanie. Jest różnica między próbowaniem robienia czegoś a robieniem tego. Jączenie "och, nie mogę, nie potrafię" czasami może odpowiadać prawdzie lecz może też być symptomem wzmocnienia próbowania. Z reguły, dawanie prezentów, składanie obietnic, prawienie komplementów i tak dalej za zachowanie, które się jeszcze nie pojawiło, absolutnie nie wzmacnia tego zachowania. Wzmacnia jedynie to co się już pojawiło, czyli, prawdopodobnie, samo domaganie się wzmacniania.
Podczas trenowania negatywnych wzmocnień równie ważnym elementem jest synchronizacja w czasie. Koń uczy się skręcać w lewo kiedy pociągamy lewe wodze jeśli ciągnięcie ustaje w momencie wykonania przez niego skrętu. To ustanie ciągnięcia jest elementem wzmacniającym. Wskakujecie na konia, naciskacie na jego boki i koń rusza do przodu. Wtedy należy zwolnić ucisk (chyba że chcecie by koń szedł szybciej). Początkujący jeźdźcy często popełniają ten błąd, że ściskaja i kopią konia bezustannie, jakby chcieli mu w ten sposób dostarczyć paliwa do poruszania się. Jeśli ucisk nie ustaje, przestaje zawierać informacje dla konia. W ten sposó otrzymuje się typowego konia "o stalowych bokach" ze szkółki jeździeckiej, idącego zawsze powoli jak żółw pomimo nieustannego nacisku.
To samo odnosi się do ludzi bezustannie poganianych i besztanych przez rodziców, szefów i nauczycieli. Jeśli negatywne wzmocnienie nie ustaje w chwili gdy osiągnięty jest pożądany efekt, przestaje ono być zarówno wzmocnieniem jak informacją. Staje się dosłownie - i jak to określa naukowa teoria informacji - "hałasem".
Podczas oglądania w telewizji meczów footbolowych i basebolowych często
uderza mnie jak wspaniale zsynchronizowane są wzmocnienia, które otrzymują
gracze na boisku. Kiedy zdobywają bramkę lub bazę natychmiast odzywa się ryk
kibiców. W momencie zdobycia kolejnego punktu lub wygrania meczu zwróćcie uwagę
ile wzajemnych wzmocnień wymieniają między sobą gracze.
Z aktorami sprawa ma
się inaczej, szczególnie z aktorami kinowymi. Nawet na scenie teatru oklaski
dostaje się po wykonaniu całej pracy. Dla aktorów kinowych nie ma
natychmiastowego wzmocnienia, poza sporadyczną reakcją reżysera czy operatora.
Listy od wielbicieli i recenzje krytyków nadchodzą w wiele tygodni lub miesięcy
później i nie mogą być porównywane z owacją publiczności na stadionie. Nie
należy się zatem dziwić, że wiele spośród gwiazd kina przejawia niemal
neurotyczny głód pochwał i adoracji. Taka praca może być szczególnie pozbawiona
satysfakcji ponieważ wzmocnienia, mimo że niezwykle silne, nadchodzą zawsze z
opóńnieniem.
Początkujący treserzy zwierząt używający jedzenia jako wzmocnienia często mają wątpliwości co do rozmiaru poszczególnych kąsków. Powinny one być możliwie jak najmniejsze. Im mniejszy kęs, tym szybciej zwierzę go zje. Z jednej strony skraca to czas oczekiwania aż zwierzę przełknie, a z drugiej pozwala na stosowanie większej liczby kąsków w trakcie jednej sesji nauki, zanim zwierzę się naje do syta.
W 1979 roku pracowałam jako konsultant w Narodowym Paku Zoologicznym w
Waszyngtonie, D.C. gdzie uczyłam grupę pracownikó zoo technik wzmacniania. Jeden
z moich uczniów, pracownik zoo, skarżył się, że jego tresura misia panda posuwa
się do przodu bardzo powoli. Zdziwiło mnie to, bo instynktownie uważałam, że
panda - duże i łakome zwierzę - powinno łatwo poddawać się wzmocnieniom
składającym się z pożywienia.
Poszłam się przyjrzeć ich sesji ćwiczeniowj i
stwierdziłam, że treser kształtował stopniowo i z powodzeniem konkretny ruch
ciała pandy, ale dawał za każdym razem wzmocnienie w postaci całej marchewki.
Miś, za każdym razem, spędzał kilka miłych chwil delektując się marchewką i w
rezultacie, po kwadransie nauki i po trzech zjedzonych marchewkach zaczynał mieć
ich dość. Plasterek marchewki jako pojedyńcze wzmocnienie byłby o wiele
skuteczniejszy.
W zasadzie, jeden kęs pożywienia powinien wystarczyć i podtrzymać zainteresowanie zwierzęcia - ziarenko kukurydzy dla kurczaka, centymetrowa kosteczka mięsa dla kota, pół jabłka dla słonia. Jeśli używa się jakiegoś wyjątkowo ulubionego smakołyku można jeszcze bardziej zmniejszyć dawkę - łyżeczka owsa dla konia. Strażnicy w National Zoo nauczyli polarne niedźwiedzie wielu pożytecznych rzeczy, takich jak przechodzenie do innej klatki na rozkaz, przy pomocy rodzynek.
Praktyczna zasada treserów głosi, że jeśli odbywasz jedną sesję nauki w ciągu
dnia, możesz liczyć, że zwierzę będzie dobrze pracowało za, mniej więcej, jedną
czwartą swojej dziennej racji pożywienia - resztę dajesz mu potem za
darmo.
Jeśli odbywasz dwie lub trzy sesje dziennie, możesz podzielić
całodniowę rację na około osiemdziesięciu porcji i dawać dwadzieścia lub
trzydzieści podczas każdej sesji. Osiemdziesiąt wzmocnień wydaje się być
maksymalną ilością zdolną podtrzymać czyjekolwiek zainteresowanie w ciągu
jednego dnia. (Być może dlatego jeden pojemnik na slajdy zawiera właśnie
osiemdziesiąt slajdów; wiem, że ja zawsze wznoszę oczy do nieba, kiedy
wykładowca prosi o podanie drugiego pojemnika w czasie wykładu.)
Rozmiar pojedyńczego wzmocnienia pozostaje również w relacji do trudności
stawianego zadania. W Sea Life Park musieliśmy dawać wielorybom za ich
olimpijski skok dlugości dwudziestu stóp, dużą makrelę. Po prostu odmawiały
wykonania go za zwyczajne dwie małe sardynki. Także ludzie, zazwyczaj a nawet
zawsze, za większy wysiłek dostają większą nagrodę. A kiedy to my robimy ten
wielki wysiłek, to bardzo nie lubimy jeśli tak nie jest.
Zarówno dla ludzi jak i dla zwierząt, bardzo wydajną techniką wzmacniania
jest, tak zwany, jackpot, czyli super-nagroda. Jest to nagroda dużo większa,
nawet dziesięć razy większa, niż zwykle i pojawiajęca się niespodziewanie.
W
agencji reklamowej, w której kiedyś pracowałam urządzaliśmy zazwyczaj przyjęcie
na Boże Narodzenie i mniejsze uroczystości z okazji podpisania kontraktu z nowym
klientem czy zakończenia pracy nad dużym projektem. Prezydent firmy miał jednak
zwyczaj organizować kilka razy do roku zupełnie niespodziewane imprezy. Pojawiał
się nagle w środku dnia pracy i wołał by wszyscy przestali pracować. Wyłączano
telefony i wchodziła cała procesja kelnerów, barmanów, muzyków, szampan, wądzony
łosoś i tak dalej. Tylko dla pracowników i bez żadnej specjalnej okazji. Zawsze
uważałam, że to się niezwykle przyczyniało do miłej atmosfery w pracy.
Jackpot może być stosowany by podkreślić przełom w pracy. Znam trenera koni,
który, kiedy młodemu koniowi po raz pierwszy powiedzie się jakiś trudny manewr,
zeskakuje z niego, ściąga siodło i uzdę i puszcza go wolno - nagroda w postaci
wolności często daje dobre rezultaty w utrwalaniu zachowań.
Paradoksalnie,
jackpot może przynieść wyniki również w przypadku opornego, nieśmiałego czy
upartego podmiotu, który nie oferuje żadnych pożądanych zachowań.
W Sea Life
Park prowadziliśmy badania na zlecenie Marynarki Stanów Zjednoczonych,
polegające na wzmacnianiu u delfina nowych zachowań zamiast starych, dobrze mu
znanych. Nasz delfin, łagodne stworzenie o imieniu Hou, rzadko prezentował nowe
zachowania. Kiedy nie otrzymał wzmocnienia za ofiarowane zachowanie, stracił
aktywność i kiedyś przez całą dwudziestominutowę sesję przestał w ogóle
pracować. W końcu treser rzucił mu dwie ryby "za darmo". Wyraźnie zdumiony tym
delfin zaczął ponownie pracować i w krótkim czasie zaprezentował nowe zachowanie
warte wzmocnienia. Od tej chwili praca potoczyła się lepiej.
Mnie samej
przydarzyło się kiedyś podobne doświadczenie. Kiedy miałam piętnaście lat moją
największą pasją była jazda konna. W maneżu, w którym jeździłam sprzedawano
karnety na dziesięć lekcji jazdy każdy. Było mnie stać z mojego kieszonkowego
tylko na jeden taki karnet na miesiąc. Mieszkałam wtedy z moim ojcem, Filipem
Wylie, i macochą Ricky. Mimo że traktowali mnie bardzo dobrze, wkroczyłam wtedy
w wiek kiedy nastolatki starają sie być jak najbardziej niemiłe i
wojownicze.
Pewnego dnia, państwo Wylie, jako kochający i sprytni rodzice,
oświadczyli mi, że mają powyżej uszu mojego zachowania i że wobec tego
postanowili mnie wynagrodzić.
Dali mi w prezencie nowy, darmowy karnet na
dziesięć lekcji jazdy. Jedno z nich zadało sobie trud pójścia do maneżu i zakupu
karnetu! Super! Niezasłużony jackpot. O ile pamięć mnie nie myli, od razu
poprawiłam swoje zachowanie, co potwierdziła Ricky Wilie kiedy pisałam o tym w
mojej książce wiele lat później.
Nie rozumiem do końca dlaczego niezasłużony
jackpot miał tak gwałtowny i długotrwały efekt. Może ktoś kiedyś napisze na ten
temat pracę doktorską i nam to wyjaśni. Wiem jedynie, że ten karnet otrzymany za
darmo wyzwolił mnie od uczucia opresji i buntu i podejrzewam, że delfin też się
tak poczuł.
Zdarza się często, szczególnie w pracy ze zwierzętami, że absolutnie nie
można dostarczyć wzmocnienia w momencie kiedy ma miejsce zachowanie.
Kiedy
uczę delfina skoków, w żaden sposób nie mogę dać mu ryby kiedy jest on w locie.
Jeśli po każdym skoku dostaje on rybę - i traci czas na jej zjedzenie - w końcu
skojarzy skakanie z jedzeniem i będzie częściej skakał. Ale nie będzie wiedział,
co w jego skoku mi się podobało. Wysokość? Łuk? A może piękny plusk w chwili
spadania do wody? Potrzeba by było wielu powtórek żeby zwierzę się zorientowało
o co mi chodzi. By obejść ten problem używamy wzmocnienia uwarunkowanego.
Wzmocnienie uwarunkowane to jakiś sygnał, początkowo bez znaczenia - dźwięk, światło, ruch - który nastąpuje przed lub podczas wzmocnienia. Treserzy delfinów używają jako uwarunkowanego wzmocnienia gwizdka policyjnego. Jest on dobrze słyszalny, nawet pod wodą, i pozostawia swobodę rąk przy rzucaniu ryb i dawaniu sygnałów gestami. Z innymi zwierzętami używam małej zabawki, która wydaje dźwięk klik-klik lub po prostu słownej pochwały, wybranego słowa używanego wyłącznie jako wzmocnienie uwarunkowane: "Dobry pies", "Dobry konik". Nauczyciele w szkole czasami wypracowują sobie takie rytualne i oszczędnie używane słowo pochwały - "Bardzo dobrze" lub " Wspaniale" - na które dzieci czekają i starają się zapracować.
Nasze codzienne życie pełne jest uwarunkowanych wzmocnień. Lubimy kiedy
dzwoni telefon lub skrzynka jest pełna listów, nawet jeśli duża część telefonów
nie oznacza nic dobrego, a poczta składa się w dużym stopniu z reklam. Dzieje
się tak dlatego, że mieliśmy wiele okazji by skojarzyć dzwonienie telefonu czy
widok koperty z czymś miłym.
Lubimy muzykę bożonarodzeniową i nie cierpimy
zapachu gabinetu dentystycznego. Otaczamy się zdjęciami, talerzami pamiątkowymi,
trofeami - nie dlatego, że są ładne lecz dlatego, że przypominają nam chwile
radości i ukochane osoby. To są uwarunkowane wzmocnienia.
W paktyce tresura zwierząt za pomocą pozytywnego wzmacniania powinna się
prawie zawsze zaczynać od ustalenia uwarunkowanego wzmacniania. Przed
przystąpieniem do właściwego trenowania zachowań należy nauczyć zwierzę
rozpoznawać uwarunkowane wzmocnienie. Osiąga się to przez asocjację z jedzeniem,
pochwałą lub jakimkolwiek innym realnym wzmocnieniem.
Moment gdy zwierzę
rozpoznaje nasz sygnał jest łatwy do zaobserwowania: zwierzę jest wyraźnie
zaciekawione i zaczyna szukać rzeczywistego wzmocnienia. Gdy ugruntujemy
wzmocnienie uwarunkowane mamy do dyspozycji świetny środek do komunikowania
zwierzęciu co nam się w jego zachowaniu podoba. Nie trzeba być Doktorem Dolittle
by móc się porozumiewać ze zwierzętami. Można im bardzo wiele powiedzieć poprzez
uwarunkowane wzmocnienie.
Uwarunkowane wzmocnienia nabierają niewiarygodnej siły. Widziałam ssaki morskie, które pracowały za uwarunkowane wzmocnienia nawet kiedy były już najedzone oraz konie i psy, które pracowały ponad godzinę za bardzo niewiele rzeczywistych wzmocnień w postaci jedzenia. No i, oczywiście, ludzie pracują bezustannie dla pieniędzy, które są w końcu tylko uwarunkowanym wzmocnieniem - są żetonem, za który można wszystko kupić - szczególnie ludzie, którzy już zarobili więcej pieniędzy niż są w stanie wydać i którzy nabrali nałogu uwarunkowanego wzmocnienia.
Instrumentalne wzmocnienie może nabrać wielkiej siły poprzez skojarzenie go z
kilkoma podstawowymi wzmocnieniami.
Powiedzmy, że podmiot w danym momencie
nie jest głodny, lecz gdy wzmacniający dźwięk lub słowo zostało skojarzone także
z wodą lub jakąś inną przyjemnością czy potrzebą, zachowuje ono swoją
przydatność. Moje koty słyszą słowa "dobry kot" kiedy stawiam im miskę z
jedzeniem, kiedy je głaszczę, kiedy je wpuszczam i wypuszczam z domu, kiedy - po
wykonaniu różnych sztuczek -dostają smakołyki. Dlatego mogę używać "dobry kot"
by wzmocnić złażenie ze stołu kuchennego bez dawania właściwego wzmocnienia. Być
może pieniądze są dla nas tak silnym wzmocnieniem ponieważ mogą być skojarzone
praktycznie ze wszystkim. Stanowią one wyjątkowo zgeneralizowane wzmocnienie
instrumentalne.
Kiedy wzmocnienie instrumentalne zostanie już ugruntowane nie należy go
nadużywać w niekontrolowany i pozbawiony znaczenia sposób by nie straciło ono
swej siły. Dzieci, które jeździły na moich pony walijskich, szybko nauczyły się
używać słów "dobry konik" jedynie wtedy kiedy chciały wzmocnić jakieś
zachowanie. Jeśli chciały po prostu porozmawiać z konikiem, używały dowolnych
słów za wyjątkiem "doby konik". Pewnego dnia chłopczyk, który od niedawna
dołączył do tej grupy, głaskał konika po pysku i mówił mu: "jesteś dobrym
konikiem". Troje innych dzieci natychmiast zareagowało: "Po co mu to mówisz?
Przecież on nic nie zrobił."
Podobnie należy postępować z dziećmi
(małżonkami, rodzicami, ukochanymi i przyjaciółmi) traktując ich przyjaźnie, z
miłością i uwagą. Lecz pochwała, szczególnie jako instrumentalne wzmocnienie,
powinna być zawsze związana z czymś konkretnym. Nie brakuje rzeczywistych okazji
do pochwał wzmacniających harmonie rodzinną. Pochwały fałszywe lub pozbawione
podstaw często wywołują opór, nawet u małych dzieci, i tracą swoją wzmacniającą
siłę.
Treserzy ssaków morskich używają wzmocnień uwarunkowanych - najczęściej gwizdków - do tresury wielorybów, delfinów, fok i białych niedźwiedzi. Pomysł ten został wprowadzony po raz pierwszy do parków morskich i ośrodków szkoleniowych Marynarki Wojennej Stanów Zjednoczonych w latach 60-tych przez Kellera Brelanda, byłego studenta B. F. Skinnera. Breland nazwał gwizdek "bodźcem pomostowym" ponieważ informując delfina o tym, że właśnie zapracował sobie na rybę, jednocześnie tworzył on pomost czasowy pomiędzy wzmacnianym zachowaniem - skokiem w basenie - a chwilą podpłynięcia delfina do brzegu i odebraniem nagrody.
Fachowa literatura behawiorystyczna uznała oba te aspekty uwarunkowanego
wzmocnienia. Lecz pozostawały jeszcze do odkrycia inne jego zalety.
W latach
90-tych coraz liczniejsi treserzy zwierząt zaczęli używać instrumentalnego
uwarunkowania, kształtowania, pozytywnego wzmacniania i wzmacniania
uwarunkowanego. Także wśród szerokich mas, szczególnie wśród właścicieli psów,
metody te nabrały popularności. Używają oni, jako uwarunkowanego wzmocnienia,
pudełeczka ze sprężyną zwanego klikerem. Stąd powstała nazwa "szkolenie
klikerowe" i "klikerowcy".
Nie wszystkie aspekty użycia klikera jako wzmocnienia uwarunkowanego i jako bodźca pomostowego, zostały poddane badaniom naukowym. Ph. D. Ogden Lindsay określił kliker jako zaznacznik wydarzeń. Pozwala on uczącemu się podmiotowi zidentyfikować precyzyjnie wzmacniane zachowania. Ale nie tylko. Oddaje on kontrolę nad sytuacją w ręce, łapy czy płetwy uczącego się. Po jakimś czasie podmiot nie ogranicza się już tylko do powtarzania zachowań lecz zaczyna wykazywać inwencję: "Hej, kliknąłeś na mnie! Zobacz, znowu to robię!". Klikerowcy nazywają ten przełomowy moment "zapaleniem się żarówki". Jest to niezwykle wzmacniająca chwila, zarówno dla ucznia jak i dla uczącego.
Ph.D. Ellen Reese wyjaśniła mi, że sposób w jaki klikerowcy wykorzystują kliker jako uwarunkowane wzmocnienie nadaje mu jednocześnie znaczenie zakończenia ofiarowanego zachowania. Oznacza po prostu "koniec". Jak mówi Gary Wilkes: "klik kończy zachowanie". To samo w sobie jest wzmocnieniem. Dla zwolenników tradycyjnych metod szkolenia jest to nieco szokujące; jakoś nie mogą oni pojąć, że żeby nauczyć psa trzymać w pysku drewniany koziołek, trzeba klikać za jego trzymanie i tym samym pozwalać mu go upuścić i zająć się jedzeniem plasterków parówki.
Gregory Bates, filozof, który pracował kilka lat w Sea Life Park, utrzymywał,
że uwarunkowanie instrumentalne jest po prostu sposobem na porozumiewanie się z
istotami innymi niż człowiek. W rzeczy samej tak może być. Kolejną ważną
właściwością sygnału zaznaczającego jest przekazywanie konkretnych
informacji.
Steve White, policjant, opowiadał mi o swoim owczarku niemieckim
szukającym rzuconego mu przedmiotu, który to przedmiot wylądował na dwumetrowej
wysokości krzaku. Pies długo i bezskutecznie przeszukiwał ziemię dookoła. Kiedy
przypadkowo podniósł glowę Steve kliknął.Pies natychmiast począł węszyć na nowej
wysokości, potem coraz wyżej, stając nawet na tylnych łapach. Już bez dalszej
pomocy policjanta pies zlokalizował przedmiot i wskoczył po niego na
krzak.
Ważnym aspektem porozumiewania się Steva z psem za pomocą klikera było to, że
sygnał nie oznaczał zakończenia zachowania. Oznaczał on "kontynuuj!".
Dźwięk
klikera wzmocnił węszenie na większej wysokości i podtrzymał zachowanie
poszukiwania gdyż przedmiot nie został jeszcze odnaleziony.
W pierwszym wydaniu tej książki napisałam o wielokrotnym użyciu
uwarunkowanego wzmocnienia bez wzmocnienia właściwego po każdym sygnale a
jedynie na samym końcu. Stało się tak ponieważ czasem postępowaliśmy w ten spsób
z delfinami w Sea Life Park w przypadku zachowań seryjnych lub długo trwających.
To co wtedy umknęło mojej uwadze, to fak, że w rzeczywistości używaliśmy dwóch
(conajmniej dwóch) sygnałów czyli uwarunkowanych wzmocnień.
Pierwszy, czyli
gwizdek, oznaczał "OK! Nadchodzi jedzenie, chodź i weź rybę, koniec!".
Drugi, gwizd zmodyfikowany, znaczył "OK! Ale to jeszcze nie koniec!".
W latach 90-tych pracowałam z wieloma nowicjuszami klikerowymi. Byli to - jak
ich nazwał Morgan Spector - "nawróceni" treserzy, ludzie dobrze obeznani ze
szkoleniem tradycyjnym opartym na korygowaniu, którzy starali się nawrócić na
kształtowanie i pozytywne wzmacnianie.
Stwierdziłam wtedy, że wszyscy oni
wykazywali tendencję do klikania bez nagradzania w takim stopniu, że działanie
klikera wygasało. Należało wprowadzić zasadę "jeden klik - jedna nagroda" by
nauczyć tych ludzi wydajnego kształtowania zachowań.
W rzeczywistości zachodzi wiele sytuacji kiedy jakiś przejściowy bodziec
wzmacniający może być przydatny, jak w przypadku psa policyjnego
Steva.
Praktyczne rozwiązanie tego problemu polega na wprowadzeniu
zróżnicowanych bodźców: jeden z nich oznacza "OK! Kontynuuj!". Ciekawe
jest, że tego rodzaju sygnał nie musi być bezpośrednio powiązany z właściwym
wzmocnieniem. Wystarczy wprowadzić go przed sygnałem oznaczającym "koniec" i
uczący się szybko zacznie go rozpoznawać jako sygnał wiodący do rzeczywistego
końcowego wzmocnienia.
Wtedy można zacząć go używać jako sygnału
informującego w trakcie zachowań złożonych, bez hamowania samego zachowania. Na
przykład, w zawodach agility, psy są wysyłane na tor przeszkód i właściciel musi
poinformować psa w biegu na którą przeszkodę ma się skierować.
Widziałam
kiedyś psa, który po pokonaniu przeszkody był wyraźnie zdezorientowany co do
następnej, jakby nie dosłyszał komendy. "Czy mam biec do tunelu czy skakać przez
poprzeczkę" - zdawał się pytać obracając głowę na różne strony. W momencie kiedy
pies patrzył na poprzeczkę jego właściciel wrzasnął "Tak!", pies od razu skręcił
na poprzeczkę i wykonał skok.
Tak jak w przypadku bodźca, który oznacza zakończenie zachowania, nie jest
ważne czy używamy klikera, gwizdka, okrzyku czy gestu. Liczy się jedynie to, że
dostarczony bodziec nie jest jedynie pustą zachętą czy kibicowaniem mogącym
rozproszyć zwierzę lub wręcz niechcący wzmocnić niewłaściwe zachowanie, lecz
stanowi dokładne i dobrze ugruntowane wzmocnienie.
Dostarczone na czas pozytywne wzmocnienie uwarunkowane oznacza dla uczącego się:"To co robisz jest poprawne i będzie nagrodzone, więc zrób to jeszcze!". Można jednak stosować uwarunkowany bodziec negatywny czyli karę, która oznacza: "To co robisz jest niewłaściwe i będzie ukarane, więc przestań to robić!".
Uwarunkowane bodźce negatywne są dużo bardziej skuteczne niż pogróżki. Niektóre podmioty, na przykład koty, są niewrażliwe na krzyki i besztanie. Moja przyjaciółka zupełnie przypadkowo oduczyła kota ostrzenia sobie pazurów o kanapę poprzez wprowadzenie okrzyku:"Nie!" jako uwarunkowanego bodźca negatywnego. Będąc w kuchni upuściła niechcący dużą miedzianą tacę, która upadła tuż obok kota. Zanim taca głośno brzęknęła o podłogę z ust jej wyrwał się okrzyk:"Nie!". Gdy taca huknęła o podłogę kot, cały zjeżony z przerażenia, podskoczył i uciekł. Kiedy następnego dnia przyłapała kota z pazurami wbitymi w kanapę znowu krzyknęła:"Nie!" i wystraszony kot natychmiast zaprzestał niszczycielskiej dzałalności. Jeszcze dwa razy powtórzyła tę lekcję i zachowanie to nigdy więcej się już nie powtórzyło.
Reprymendy są częścią naszej egzystencji. Używanie pozytywnych wzmocnień jako
podstawowej techniki nauczania nie oznacza wcale, że nie można - w razie
potrzeby - stosować "Nie!", na przykład kiedy dziecko dłubie w kontakcie
elektrycznym.
Niestety, niektórzy treserzy wykorzystują tę życiową
konieczność jako usprawiedliwienie dla szerokiego i zgeneralizowanego stosowania
w nauczaniu elementów "korekcji". Czyniąc to popełniają dwa błędy. Po pierwsze
przypisują oni korekcji wartość równoważną wartości wzmocnienia pozytywnego, nie
uwzględniając jej efektów ubocznych (patrz rozdział IV - "Kary"). I, po drugie,
używają kar bez uprzedniego wprowadzenia sygnału ostrzegawczego, czyli
uwarunkowanego bodźca negatywnego.
Sztuka efektywnego użycia "Nie!" polega na
utrwaleniu go jako uwarunkowanego wzmocnienia negatywnego.
Na przykład, ten
kto uważa za konieczne użycie obroży zaciskowej na psie powinien zawsze mówić
"Nie!" kiedy pies robi coś niewłaściwego i odczekać chwilę, zanim szarpnie i
zaciśnie obrożę. W ten sposób daje się psu szansę uniknięcia zacisku obroży
poprzez zmianę zachowania. Zaciśnięcie obroży bez ostrzeżenia czyni z niego
zwykłą karę, nie posiadającą przewidywalnego efektu na przyszłe zachowania i w
efekcie prowadzącą do zaniku chęci psa do pracy.
Trzeci, często popełniany
błąd to nie poluzowanie zacisku obroży po tym jak pies skorygował swoje
zachowanie. Wtedy karane są oba zachowania: pierwsze - niewłaściwe, oraz drugie
- skorygowane.
Brak uwarunkowanego negatywnego wzmocnienia prowadzi do zwiększenia ilości
bodźców negatywnych dostarczanych podczas tradycyjnego szkolenia opartego na
korekcji. Brak ten spowalnia też sam proces uczenia.
Tresura psów czy koni
metodami tradycyjnymi trwa zwykle o wiele dłużej niż tresura przez wzmacnianie.
Czasami potrzebne są długie miesiące lub wręcz lata by uzyskać przy ich pomocy
wyuczone zachowania. Jest tak nie tylko dlatego, że opierają się one głównie na
karaniu - które powstrzymuje zachowania zamiast je prowokować - lecz także
dlatego, że opierają się na negatywnych bodźcach a nie na uwarunkowanych
negatywnych wzmocnieniach. Potrzebne są wtedy setki prób i powtórzeń zanim
zwierzę zorientuje się czego się od niego chce.
Od niedawna, wśród klikerowców, rozpowszechniło się użycie szczególnego
rodzaju uwarunkowanego sygnału negatywnego w postaci słowa "źle!"
wypowiedzianego bardzo neutralnym tonem. Polega to na tym, że kiedy pies próbuje
rozmaitych zachowań w poszukiwaniu tego, które mogłoby się treserowi spodobać,
pomaga się psu zidentyfikować zachowania które nie będą nagrodzone.
Według
definicji kary B. F. Skinnera (karą jest odebranie czegoś pożądanego) sygnał
"źle!" oznacza bezwzględnie uwarunkowaną karę ponieważ oznacza brak wzmocnienia.
Czy dostarcza on jednak informacji i staje się wzmocnieniem? W szczególnych
przypadkach tresury psów sygnał "źle!" jest przydatny. Jeśli wasz pies ma spory
zasób ukształtowanych zachowań i komend - czyli, krótko mówiąc, jest
doświadczonym uczniem - możecie wprowadzić sygnał "źle!" jako komendę na
zróżnicowanie zachowań. Nabiera ona wtedy znaczenia: "Oszczędzaj siły, to slepy
zaułek, spróbuj czegoś innego!".
Sprawdza się to tylko wtedy kiedy uczeń był
już dość często wzmacniany za zróżnicowane zachowania i za aktywne poszukiwanie
spsobów na wywołanie kliknięcia z waszej strony. Jest to dość skomplikowane i
może przyspożyć kłopotów w tresurze niedoświadczonego psa, który nie roumie
znaczenia tego sygnału. W takich przypadkach sygnał "źle!" używany jest tak samo
jak obroża zaciskowa.
Mówi się psu żeby usiadł - pies nie siada - więc,
trach: "źle!". Jeśli sygnał ten został już wyuczony jako oznaczający "nie będzie
nagrody!", wtedy karane jest nie-siedzenie psa. Ale to jeszcze nie oznacza, że
teraz nastąpi siedzenie. Prawdopodobny rezultat będzie taki sam jak w przypadku
jakiejkolwiek innej kary, czyli bardzo trudny do przewidzenia. Pies może całkiem
zaprzestać współpracy i wycofać się, zacząć szukać innych wzmocnień poprzez
szczekanie, ciągnięcie na smyczy, węszenie, drapanie się i generalne
rozproszenie uwagi.
Dość zakorzeniona jest błędna opinia, że jeśli zacznie się uczyć danego
zachowania za pomocą pozytywnego wzmocnienia, trzeba będzie stosować to
wzmocnienie do końca życia zwierzęcia; jeśli się go zaprzestanie, zachowanie to
zaniknie. Jest to nieprawda. Stałe wzmacnianie konieczne jest jedynie w okresie
nauki. Można nagradzać małe dziecko za używanie toalety, ale kidy nauczy się już
z niej prawidłowo korzystać, pochwały stają się zbędne.
Na początku nauki
należy dostarczać jak najwięcej wzmocnień - uczenie dziecka jazdy na rowerze
wymaga stałego potoku słów "dobrze, tak trzymaj, świetnie!". Jednak wyglądałoby
to zabawnie (i dziecko uznałoby nas za szaleńców) gdybyśmy biegli za rowerem i
chwalili je kiedy potrafi już dobrze jeździć.
By utrzymać wyuczone raz zachowanie na dobrym poziomie, nie tylko nie należy
wzmacniać go za każdym razem, lecz należy wręcz nie wzmacniać go regularnie.
Trzeba wzmacniać je jedynie od czasu do czasu, w sposób nieregularny i trudny do
przewidzenia.
Psycholodzy nazywają to zmiennym schematem wzmocnień. Zmienny
schemat jest o wiele bardzej wydajny w podtrzymaniu zachowań niż schemat stały,
łatwy do przewidzenia.
Pewien psycholog wyjaśnił mi to na przykładzie: jeśli
wasz nowy samochód, który zawsze zapala przy pierwszej próbie, pewnego dnia, po
przekręceniu kluczyka w stacyjce nie daje znaków życia, spóbujecie go uruchomić,
lecz po kilku nieudanych próbach stwierdzicie, że problem jest poważny i
zawołacie mechanika.
Wobec nie wystąpienia spodziewanego natychmiastowego
wzmocnienia, wasze przekręcanie kluczyka w stacyjce szybko ustanie. Z drugiej
strony, jeśli macie starego grata, który prawie nigdy nie zapala od pierwszego
razu, będziecie próbować i próbować bez końca. Wasze zachowanie jest ustawione
na zmienny schemat i jest dzięki temu dobrze utrwalone.
Gdybym dawała delfinowi rybę po każdym skoku, bardzo szybko skoki stałyby się
byle jakie, wykonane przy minimalnym wysiłku - byleby tylko zarobić na rybę.
Gdybym wtedy przestała wogóle dawać ryby, delfin szybko całkowicie przestałby
skakać. Jednak, jeśli delfin jest nauczony skakać za rybę, a ja zaczęłabym
nagradzać raz pierwszy skok, raz trzeci, przypadkowo, zachowanie uległoby
silniejszemu wzmocnieniu. W przypadku braku nagrody zwierzę skakałoby coraz
więcej, w nadziei trafienia na właściwy skok, a same skoki stałyby się lepsze.
To z kolei pozwoliłoby mi selektywnie wzmacniać najlepsze skoki. W ten sposób
zmienny schemat pozwala kształtować perfekcję zachowań. Lecz nawet zawodowym
treserom sprawia trudności poprawne stosowanie zmiennych schematów pozytywnych
wzmocnień.
Wielu ludzi ma kłopoty ze zrozumieniem tego mechanizmu. Rozumiemy,
że nie należy karać niepożądanego zachowania w momencie kiedy ono ustaje, a nie
możemy zrozumieć, że nie potrzeba, a nawet nie należy, ciągle nagradzać zachowań
właściwych. Jesteśmy mniej pewni siebie kiedy stosujemy pozytywne wzmacnianie w
celu osiągnięcia dobrych wyników.
Moc zmiennego schematu wzmacniania jest podstawą wszelkich gier hazardowych.
Gdyby za każdym razem kiedy wkładamy złotówkę do automatu wyskakiwało dziesięć
złotych, nasze zainteresowanie szybko by spadło. Zarabialibyśmy pieniądze, ale
jakie by to było nudne!
Ludzie lubią grać na automatach właśnie dlatego, że
nie można przewidzieć czy wyskoczy z nich trochę pieniędzy, jakaś większa suma,
czy nic. Nie można też przewidzieć kiedy nastąpi wzmocnienie - może to być już
za pierwszym razem. Dlaczego niektórzy stają się niewolnikami hazardu, a inni
mogą przestać grać w każdej chwili, to już zupełnie inna sprawa. Jedno jest
pewne: ci, którzy popadają w nałóg robią to włażnie z powodu zmiennego schematu
wzmocnień.
Im bardziej wydłużony w czasie jest zmienny schemat, tym silniej
umacnia on zachowanie. Jeśli staramy się wyeliminować jakieś zachowanie,
stosowanie wydłużonego schematu zmiennego nie jest wskazane. Każde zachowanie
nie wzmacniane ma tendencję do zanikania. Lecz, jeśli będzie wzmacniane od czasu
do czasu, nawet bardzo rzadko - jeden papieros, jeden kieliszek, jedno ustępstwo
wobec nudzącego dziecka czy skomlącego psa - zachowanie, zamiast wygasać, będzie
silnie wzmacniane poprzez wydłużony schemat zmienny. Tak bywa z byłym palaczem,
który zapali jednego papierosa - może wrócić do nałogu w ciągu jednego
dnia.
Wszyscy znamy ludzi, którzy z niewiadomych powodów, trzymają się
kurczowo małżonlów lub kochanków, mimo złego traktowania przez nich. Zazwyczaj
przypisujemy takie zachowanie kobietom. To one zakochują się w egoistach i źle
wychowanych nicponiach - lecz mężczyznom też to się zdarza. Osoby te, jeśli się
rozwiodą czy uwolnią od niemiłego partnera, zazwyczaj bardzo szybko znajdują
sobie nowego, dokładnie takiego samego.
Czy te osoby są, z głębokich przyczyn
psychologicznych, wiecznymi ofiarami? Być może. Lecz może są one także ofiarami
wydłużonego zmiennego schematu? Jeśli nawiązujecie romans z osobą czarującą,
seksowną, sympatyczną, troskliwą i osoba ta staje się stopniowo coraz bardziej
nieprzyjemna czy wręcz wroga, lecz nadal od czasu do czasu pokazuje wam swoje
pozytywne strony, zaczniecie żyć dla tych rzadkich chwil miłości i czułości.
Jest to paradoksalne z punktu widzenia zdrowego rozsądku, lecz oczywiste z
punktu widzenia tresera. Im rzadziej i bardziej niespodziewanie będą następować
te miłe wzmocnienia, tym silniejszy będzie ich efekt i tym dłużej wasze
zachowanie będzie trwało. Poza tym łatwo jest pojąć dlaczego ktoś kto przeżył
już tego rodzaju związek może go ponownie pragnąć.
Związek z osobą normalną,
która się zawsze zachowuje przyzwoicie, może być pozbawiony atrakcyjności,
której dostarcza związek pełen niespodzianek, długo wyczekiwanych wzmocnień i
intensywnych doznań.
Spójrzmy na to z punktu widzenia osoby manipulującej tą
sytuacją: "on/ona będzie mi jeść z ręki, mogę z nią zrobić co chcę tak długo
jak długo będę jej dawać to czego ona chce... od czasu do czasu". To jest
sposób stosowany przez sutenerów na utrzymanie w swojej władzy prostytutek. Jest
to bardzo silny mechanizm, lecz kiedy ofiara orientuje się, że siła
przyciągająca ją jest zależna od rodzaju stosowanych wzmocnień, zazwyczaj może
się uwolnić od takiej sytuacji i odejść.
Jedynym przypadkiem kiedy niewskazane jest stosowanie zmiennego schematu po
wyuczeniu zachowania jest rozwiązywanie testów czy układanek.
W zaawansowanym
treningu obedience, psy muszą wybrać węchem z grupy przedmiotów ten jeden
jedyny, który był trzymany w ręku przez właściciela i nosi jego zapach. Należy
wtedy nagrodzić każdy poprawny wybór, bo wtedy pies będzie wiedział o co nam
chodzi następnym razem. W testach wykluczających (na przykład na rozpoznanie
dźwięku o wyższym tonie) podmiot musi być wzmacniany za każdym razem za poprawną
odpowiedź by wiedział jak się zachować przy następnej próbie. (Oczywiście w
zupełności wystarczy uwarunkowane wzmocnienie.)
Kiedy rozwiązujemy krzyżówki lub układamy puzzle otrzymujemy wzmocnienie za
poprawne odpowiedzi, bo to są jedyne, które "pasują". Gdyby przy układaniu
puzzle można było dopasować kilka kawałków do jednego pustego miejsca, nie
otrzymywalibyśmy pozytywnego wzmocnienia, a jest ono konieczne w większości
sytuacji gdzie postępujemy według zasady "prób i błędów".
Oprócz zmiennych schematów można stosować stałe schematy wzmacniania, kiedy
podmiot musi pracować przez określony okres czasu lub musi wykonać określoną
ilość zachowań w zamian za każde wzmocnienie.
Na przykład, mogę nauczyć
delfina skakać sześć razy poprzez wzmacnianie co szóstego skoku. Szybko otrzymam
serie skoków po sześć w serii. Problem z tego typu schematem polega na tym, że
wczesne zachowania w danej serii nigdy nie są wzmacniane i mają tendencję do
pogarszania się jakościowo. W przypadku skaczącego delfina wszystkie skoki, za
wyjątkiem ostatniego, który jest wzmacniany, stałyby się mniejsze.
To
pogarszanie jakości przy stałych schematach odgrywa prawdopodobnie ważną rolę
przy wielu ludzkich poczynaniach, na przykład przy fabrycznych liniach
produkcyjnych. Trzeba pracować przez pewien czas by otrzymać wzmocnienie, lecz
ponieważ następuje ono według stałego schematu, niezależnie od jakości wykonanej
pracy, podmiot w naturalny sposób stara się wykonać jak najmniejszy możliwy
wysiłek i może pracować szczególnie źle na początku okresu.
Wypłata piątkowa
jest stałym wzmocnieniem i prowadzi do "Leniwego Poniedziałku". (W Stanach
Zjednoczonych i Anglii pracownicy wynagradzani są co tydzień, w piątek, a nie co
miesiąc, jak w innych krajach - przypis tłumacza).
W przypadku delfinów
wzmacnianie co jakiś czas pierwszego lub drugiego skoku z serii pomoże w
utrzymaniu zachowania i poziomu jakości jego wykonania. W przypadku ludzi
rozmaite formy bonusów i innych wzmocnień (na przykład wyróżnienie) bezpośrednio
powiązanych z ilością i jakością wykonanej pracy i pojawiających się bez związku
z normalnym wynagrodzeniem, może przynosić dobre efekty.
Poprzez stosowanie stałych bądź zmiennych schematów mogą być uczone bardzo
długie łańcuchy zachowań. Młodego kurczaka można nauczyć dziobać przycisk setki
razy w celu otrzymania jednego ziarenka kukurydzy.
W przypadku ludzi mamy
wiele przykładów opóźnionego wzmocnienia. Pewien psycholog żartował, że
najdłuższym okresem niewzmacnianego zachowania w ludzkim życiu jest szkoła
średnia prowadząca do matury.
Przy bardzo wydłużonych w czasie schematach
występuje też inne zjawisko: powolny start. Kurczak, kiedy już zacznie dziobać,
robi to ze stałą prędkością, bo każde dziobnięcie przybliża go do momentu
otrzymania wzmocnienia. Naukowcy zauważyli jednak, że kurczak tym bardziej
odkłada moment rozpoczęcia dziobania, im bardziej schemat wzmacniania się
wydłuża.To jest czasami nazywane "opóźniony start długoterminowych zachowań" i
jest nam dobrze znane z naszego życia. Począwszy od wypełniania deklaracji
podatkowej aż do sprzątania garażu, kiedy stoi przed nami zadanie wymagające
dużego wysiłku, wymyślamy tysiąc powodów by odwlec je w czasie.
Pisanie -
czasem nawet napisanie zwykłego listu - jest takim długotrwałym zadaniem. Jak
już raz zaczniemy, zwykle idzie nam całkiem nieźle, lecz - och! - jakże ciężko
nam usiąść do tej roboty.
James Thurber miał tak wielkie trudności z
rozpoczęciem pisania kolejnego arykułu, że czasami oszukiwał swoją żonę (która
całkiem słusznie niepokoiła się, bo to za te artykuły mieli pieniądze na
zapłacenie czynszu) i leżał całymi dniami w swoim gabinecie na kanapie,
trzymając w jednej ręce książkę, a drugą uderzając na oślep w klawisze maszyny
do pisania.
Zjawisko opóźnionego startu przeważało szalę na niekorzyść
ewentualnego pozytywnego wzmocnienia w postaci pieniędzy. A stukanie na maszynie
trzymało z daleka negatywne wzmocnienie w postaci zrzędzenia żony.
Dobrym sposobem na przezwyciężenie zjawiska opóźnionego startu jest
wprowadzenie pozytywnego wzmocnienia za samo rozpoczęcie pracy, tak jak czyniłam
to z delfinami, wzmacniając czasami pierwszy lub drugi skok z sześcioskokowej
serii. Używałam tej techniki z powodzeniem na samej sobie. Przez kilka lat
uczęszczałam do wieczorowej szkoły średniej dwa razy w tygodniu. Trzy godziny
lekcji plus godzina na dojazd w każdą stronę. Kiedy dochodziła piąta po południu
pokusa by nie iść była zawsze wielka. Odkryłam, że jeśli podzielę czas dojazdu
na pięć etapów - dojście do kolejki, złapanie pierwszego pociągu, przesiadka na
drugi pociąg, jazda autobusem pod szkołę i, w końcu, wejście po schodach do
budynku - i wzmocnię każde z tych początkowych zachowań poprzez zjedzenie
kawałka czekolady, którą lubię, ale której zwykle nie jadam, byłam w stanie
zmusić się do wyjścia z domu. Po kilku tygodniach dojeżdżałam już do szkoły bez
czekolady i bez wewnętrznych rozterek.
Wzmocnienia pojawiają się bezustannie w codziennym życiu, często zupełnie
przypadkowo. Pewien biolog studiujący zachowanie sów zauważył, że jeśli sowa
złowiła mysz pod konkretnym krzakiem, będzie pod ten krzak zaglądać przez
tydzień lub dłużej; prawdopodobieństwo, że będzie tam zaglądać wzrosło. Jeśli
znajdziesz stuzłotowy banknot w koszu na śmieci, to założę się, że na drugi
dzień, przechodząc obok niego nie powstrzymasz się od dokładnego obejrzenia tego
kosza.
Przypadkowe wzmocnienie było korzystne dla sowy. Ogólnie można
stwierdzić, że ewolucja zachowania zwierząt prowadzi do tego, że każde otrzymane
wzmocnienie jest korzystne. Jednak zdarzają się przypadkowe skojarzenia i mają
one równie duży wpływ na zachowania. Kiedy zachowanie pozostaje bez związku z
konsekwencjami, lecz podmiot ciągle podtrzymuje je jakkby było ono konieczne dla
otrzymania wzmocnienia, mamy do czynienia z, tak zwanym przez naukowców,
zachowaniem przesądnym.
Przykładem jest żucie ołówków. Jeśli podczas
egzaminu zdarzy nam się włożyć do ust koniec ołówka i w tym samym momencie
przyjdzie nam do głowy odpowiedź na egzaminacyjne pytanie, to wzmocnienie może
wpłynąć na nasze dalsze zachowanie. "Oświeciło" nas kiedy żuliśmy ołówek, więc
żucie ołówka zostaje wzmocnione. Kiedy uczęszczałam do college'u wszystkie moje
ołówki nosiły ślady zębów - przy wyjątkowo trudnych egzaminach zdarzało mi się
przegryźć ołówek na pół. Byłam pewna, że obgryzanie ołówka pomaga mi w myśleniu
- oczywiście nie pomagało, a było jedynie przypadkowo uwarunkowanym
zachowaniem.
To samo odnosi się do wkładania jakiejś części garderoby lub
rytualnych zachowań kiedy zabieramy się za coś trudnego.
Widziałam gracza w
baseball, który przed każdym kolejnym uderzeniem przechodził przez
dziewięciostopniowy rytuał zachowań: dotknąć czapki, dotknąć rękawicy piłką,
zepchnąć czapkę na oczy, potrzeć ucho, zepchnąć czapkę do tyłu, i tak dalej. W
momentach szczególnego napięcia przechodził przez cały rytuał dwa razy, zawsze w
tej samej kolejności. Odbywało się to całkiem szybko - komentatorzy nie zwracali
na to uwagi - a był to raczej skomplikowany rytuał.
Zachowania przesądne często pojawiają się w tresurze zwierząt. Zwierzę może
reagować na kryteria, których wcale nie mieliśmy zamiaru wprowadzać, lecz które
niechcący wzmocniliśmy na tyle, że stały się one uwarunkowaniami. Na przykład,
zwierzę może się zachowywać tak jakby dla otrzymania wzmocnienia było konieczne
przebywanie w określonym miejscu, przybranie określonej pozycji lub zwrócenie
się w określoną stronę. Kiedy chcecie powtórzyć ćwiczenie w innym miejscu, lub
zwróceni w inną stronę, zachowanie nagle załamuje się i nie bardzo jest wiadomo
dlaczego. Dobrze jest więc, kiedy zachowanie jest już częściowo wyuczone,
wprowadzać zmiany wszystkich zewnętrznych okoliczności, które nie mają
bezpośredniego wpływu na samo zachowanie. Uniknie się w ten sposób przypadkowego
uwarunkowania, które później mogłoby nam zawadzać w dalszym szkoleniu.
Nade
wszystko należy się wystrzegać przypadkowego ustalenia schematów czasowych.
Zarówno ludzie jak i zwierzęta mają bardzo precyzyjne wyczucie przerw
czasowych.
Kiedyś byłam przekonana, że nauczyłam dwie synogarlice skakania na
komendę (sygnał mojej ręki) dopóki znajomy naukowiec uzbrojony w stoper nie
poinformował mnie, że skakały one co dwadzieścia dziewięć sekund. Przez
przypadek wydawałam swoją komendę z wielką regularnością i one to podchwyciły,
opierając się na tej informacji zamiast na gestach mojej ręki.
Wielu tradycyjnych treserów zwierząt jest dosłownie zniewolonych przez
przesądne myślenie i zachowania. Ktoś mówił mi, że delfiny wolą ludzi ubranych
na biało, że muły należy bić, że niedźwiedzie nie lubią kobiet, i tak
dalej.
Ci którzy uczą ludzi nie są o wiele lepsi. Wierzą, że do dzieci z
piątej klasy należy krzyczeć, że karanie jest niezbędne dla wywołania respektu.
Ci ludzie są na łasce tradycyjnych metod; muszą uczyć dokładnie w ten sam sposób
za każdym razem bo nie są w stanie odróżnić metod, które przynoszą rezultaty od
przesądów. Tego rodzaju błędy pojawiają się w wielu zawodach - nauczyciele,
inżynierzy, wojskowi, a szczególnie lekarze, są na nie podatni. Strach pomyśleć
ile rzeczy robi się z pacjentami nie dlatego, że przynoszą pozytywne rezultaty,
lecz dlatego, że tak się robi od zawsze, albo tak się robi w dzisiejszej
medycynie. Każdy kto leżał kiedyś w szpitalu może przytoczyć pół tuzina
przykładów czynności, które nie są niczym innym jak tylko zachowaniem
przesądnym.
Zadziwiające jest, że zachowania przesądne nie zawsze zanikają po
tym jak zostaną napiętnowane i wytknięte jako bezużyteczne. Są mocno
uwarunkowane i w konsekwencji mocno bronione. Spróbujcie zaatakować lekarza za
stosowanie bezużytecznych bądź wręcz szkodliwych terapii, a zostaniecie sami
zaatakowani w ostry sposób. Tak samo jestem przekonana, że nasz gracz w baseball
gorąco broniłby się gdyby mu kazano grać bez czapki, której ciągle
dotyka.
Sposobem na pozbycie się własnych przesądnych zachowań jest zdanie
sobie sprawy, że nie pozostają one w żadnym związku ze wzmocnieniami.
Mój
syn jest bankierem i jako hobby uprawia szermierkę. Trenuje dwa lub trzy razy w
tygodniu i w weekendy często wyjeżdża na zawody. Kiedyś, przed spotkaniem z
trudnym przeciwnikiem, czuł się załamany, bo zapomniał w domu ulubionej szabli.
Przegrał ten mecz. Wtedy zdał sobie sprawę, że własne przygnębienie
prawdopodobnie bardziej mu zaszkodziło niż brak szabli. I, rzeczywiście,
posiadanie "ulubionej" szabli było zachowaniem przesądnym.
Ted postanowił
wyeliminować wszytkie przesądne zachowania mające związek z szermierką. Odkrył w
sobie bogaty ich repertuar, od przywiązania do niektórych części garderoby do
wewnętrznego przekonania, że na jego wyniki sportowe mogła mieć wpływ źle
przespana noc, kłótnia, lub nawet to, że zabrakło soku owocowego podczas
turnieju. Systematycznie przeanalizował każdą z tych okoliczności, zrozumiał
swoje od nich uzależnienie i wyeliminował je jedno po drugim jako zachowania
przesądne. Teraz idzie na każdy turniej spokojny i pewny siebie, nawet jeśli
poprzedziły go koszmary w rodzaju spóźnienia na pociąg, zgubienia sprzętu,
awantur z taksówkarzami i nawet wtedy kiedy występuje z pożyczoną szablą, w
treningowym dresie i w skarpetkach nie do pary.
Oto kilka rzeczy, które znani mi ludzie osiągnęli przez pozytywne wzmocnienie:
Wszelkie grupy (kluby grubasów, alkoholików, itp.) uczące kontroli i
poprawy samego siebie, masowo wykorzystują siłę wzmocnień pozytywnych jakich
grupa dostarcza pojedyńczej osobie. Oklaski, medale, wręczanie nagród i inne
grupowe wzmocnienia są bardzo efektywne i często używane z wielką
fantazją.
Pewien dyrektor do spraw handlowych w IBM chciał wzmocnić swoich
handlowców po osiągnięciu przez nich świetnych rocznych wyników rocznych w
sprzedaży. Wynajął wtedy stadion footballowy, zorganizował wielkie przyjęcie
dla pracowników, kadr i ich rodzin. Handlowcy wbiegali na stadion przez tunel
dla graczy podczas gdy ich nazwiska jarzyły się na tablicy świetlnej, a tłum
na trybunach oklaskiwał ich.
Przeszłam kiedyś kurs Wernera Erharda, tzw. " est". Program ten pełen był
handlarskich sztuczek, ale, z treningowego punktu widzenia, był sprytnym i
często błyskotliwym zastosowaniem kształtowania i wzmacniania. Program ten
nazywał się - według mnie słusznie - Treningiem. Przywódca nazywany był
Trenerem. Celem szkolenia było osiągnięcie wzmożonej świadomości samego
siebie, a głównym wzmocnieniem nie była reakcja ze strony Trenera, lecz
niewerbalne zachowania całej grupy.
Aby wprowadzić zachowanie grupy jako
wzmocnienie, 250 osób miało oklaskiwać kolejnych mówców, bez względu na to czy
miały na to ochotę czy nie. W ten sposób nieśmiali nabrali śmiałości, odważni
zostali nagrodzeni i wszystkie kolejne przemówienia - mądre i mniej mądre -
zyskały uznanie grupy.
Na początku oklaski były nieco wymuszone. Szybko
jednak nabrały znaczenia wyrażając nie tyle zachwyt, jak w teatrze, ile emocje
i zrozumienie.
W mojej klasie - jak to się zdarza w każdej klasie - znalazł
się mężczyzna, który polemizował z Trenerem na każdy podjęty przez niego
temat. Kiedy powtórzyło się to trzeci czy czwarty raz, Trener podjął dyskusję.
Jasne było dla nas wszystkich, że racja była po stronie ucznia. Ale kiedy
dyskusja zaczęła się przeciągać, nikogo z obecnych to już nie obchodziło.
Chcieliśmy tylko żeby facet wreszcie usiadł i siedział cicho.
Zasady tej
gry - a właściwie zasady kształtowania - zabraniały nam protestować czy kazać
mu siedzieć cicho. Lecz stopniowo głucha cisza ze strony całej grupy dotarła
do jego świadomości. Widzieliśmy jak zdał sobie nagle sprawę, że nikogo nie
interesuje fakt, że to on ma rację. Być może mieć rację nie było najważniejsze
w tym momencie. Powoli umilkł i usiadł. Na sali wybuchły oklaski wyrażające
sympatię i uznanie - a także ulgę - bardzo mocne pozytywne wzmocnienie dla
decyzji podjętej przez mówcę.
Kiedy ważne elementy treningu stanowią zachowania, czyli nie są one
werbalne, jest niezwykle trudno wyjaśnić je osobom postronnym. Erhard, jako
nauczyciel Zen, często odwołuje się do aforyzmów. W powyżej opisanym przypadku
mężczyzny, który za dużo dyskutował, odpowiednia maksyma to: "Kiedy masz
rację, masz tylko rację, i na tym koniec." To nie znaczy wcale, że cię lubimy,
że jesteś miły, ani nic innego: masz tylko rację. Gdybym miała wygłosić coś
takiego na przyjęciu, na którym ktoś się za bardzo puszy, jakiś inny były
uczestnik kursu "est" wyśmiałby mnie - na pewno wyśmiałby mnie mój bardziej
nowoczesny trener - lecz większość słuchaczy pomyślałaby, że jestem pijana lub
postradałam zmysły. Dobre treningowe intuicje nie zawsze się nadają do
werbalnego wyjaśnienia.
Jednym z możliwych zastosowań treningu wzmacniającego jest wzmacnianie
samego siebie. Często to zaniedbujemy, częściowo ponieważ nie przychodzi nam
to do głowy, a częściowo ponieważ zazwyczaj wymagamy od samych siebie dużo
więcej niż od innych. Mój znajomy minister ujął to następująco: "Niewielu z
nas ma tak niskie wymagania wobec siebie, żeby łatwo było im
sprostać".
W rezultacie, często przez długie okresy czasu gonimy, bez
przerwy, od jednego zadania do drugiego, nieświadomi, że nawet sami sobie nie
podziękujemy za wysiłek. Niezależnie od wzmacniania nas samych za pozbycie się
złego nawyku lub nauczenie czegoś pozytywnego, pewna doza wzmocnienia jest
niezbędna w codziennym życiu dla samego przetrwania. Sądzę, że pozbawienie
wzmocnień jest jedną z przyczyn powstawania stanów depresji lub lęku.
Można
wzmacniać samego siebie w zdrowy sposób - poprzez pójście na spacer, rozmowę z
przyjacielem, dobrą książkę; lub w sposób mniej zdrowy - przez papierosy,
whisky, tuczące jedzenie, narkotyki, zabawę do późnej nocy, i tak dalej.
Podoba mi się stwierdzenie aktorki, Ruth Gordon: "Aktor potrzebuje
komplementów. Kiedy przez długi czas nikt mi ich nie prawi, robię to sama i
działa to bardzo dobrze ponieważ wiem przynajmniej, że są one szczere".
Tłumaczenie: Magda Wejroch
Alicja Mielcarzewicz
Media Rodzina
Wszelkie ciekawe artykuły na temat pozytywnego szkolenia psów mile widziane.