> Pусского Russian

Дрессировка Прогрессивным Подкреплением Mанифест

По Эмили Ларлхам

Почему потребовался новый термин:

Существует тип дрессировки животных, который не включает в себя ни в каком виде устрашение, конфронтацию, насилие, замечания или доминирование. Этот свободный от насилия тип дрессировки получал разные названия: “дрессировка с кликером”, “позитивная дрессировка”, “дрессировка положительным подкреплением”, “дрессировка наградой” и прочие. Тем не менее, хотелось бы ввести более четкий, более точный и более вдохновляющий термин. В последние годы перечисленные мной названия использовались так широко, что они утратили первоначальный смысл. Как это происходило? Дрессировщики, использующие методы принуждения, могут прибегать к кликеру (инструменту, который производит щелчок, чтобы обозначить желаемое поведение) и называть себя “кликер-дрессировщиками”. Те, кто использует болезненные или устрашающие методы, могут включать в процесс дрессировки поощрение игрушкой или лакомством и называть себя “дрессировщиками поощрением” или “дрессировщиками позитивным подкреплением”. Уже сейчас случается так, что человек, обратившись к дрессировщику, который называет себя “позитивным”, обнаруживает, что тот регулярно осуществляет физическое насилие над животными. Я предлагаю новый термин, которым дрессировщики и обычные люди смогут пользоваться, чтобы говорить об этом типе современной дрессировки — о системе тренировки, которая не только человечна, сострадательна и надежна, но еще и основана на новейших научных открытиях.

Так как эта форма дрессировки постоянно включает в себя новые и наиболее достоверные научные изыскания и содействует эволюционному прогрессу в сторону более гармоничных отношений между людьми и живущими с ними животными, мы будем называть его Дрессировкой Прогрессивным Подкреплением.

По сути дела Дрессировка Прогрессивным Подкреплением значит обучение животных через подкрепление желательного поведения и исключение сознательно используемого физического или психологического запугивания.

Что означает дрессировка прогрессивным подкреплением:

1) Дрессировка, в рамках которой мы подкрепляем желательное поведение, чтобы оно с большей вероятностью повторилось в будущем, и в то же время избегаем подкреплять нежелательное для нас поведение.

Пример: в качестве поощрения за то, что собака не тянет, вы позволяете ей пройти вперед и понюхать кустик, пока поводок остается провисшим, но не позволяете собаке добраться до куста, если поводок натягивается (чтобы не поощрять натягивание поводка). Еще пример: если вы учите собаку вежливо здороваться с гостями, вы сначала поощряете собаку за то, что она спокойно стоит всеми четырьмя лапами на полу (не прыгает) в ситуации возбуждения, а позже, когда собака прыгает, вы ненадолго лишаете ее внимания (отворачиваясь от собаки; внимание является поощрением). При этом, если бы вы просто попытались отучить собаку прыгать тем, что постоянно отворачивались бы от нее, не вознаграждая за правильные действия — собака бы загрустила. Дело в том, что если собака поняла, что прыжками внимания от вас не добиться, она будет искать другие способы — однако с большей вероятностью ей придет в голову попробовать прыгать выше, лаять, скулить и прихватывать за одежду, а не встать неподвижно или сесть, чтобы вы обратили на нее внимание. Когда вы сразу вознаграждаете собаку за то, что хотите, чтобы она делала, вы ей тем самым предлагаете поведение “на все случаи жизни”, и она будет пробовать применить его, когда ее собственные действия не приводят к результату.

Примеры поощрений:

Еда, игрушки, внимание, люди, другие животные, шанс побегать, понюхать, поплавать, выход на улицу, вход в дом и т.д.

Не забывайте, что именно собака, а не дрессировщик выбирает, чтò является поощрением. Это значит, что если вы дали собаке лакомство за то, что она села, потом снова командуете “сидеть”, а она не садится, с большой вероятностью она не считает ваше лакомство за поощрение. Еще стоит иметь в виду, что награда не будет эффективной, если собака сыта или находится в состоянии стресса.

2) Прерывание и предотвращение нежелательного поведения без физического или психологического устрашения, одновременно с поощрением альтернативной реакции (формированием желательного для вас поведения взамен нежелательного).

Пример: если вы хотите, чтобы собака не лежала на диване, вам нужно сначала научить собаку тому, что вы ХОТИТЕ, чтобы она вместо этого делала. То есть, вы учите ее уходить и ложиться на свою подстилку. После этого, если собака попробует забраться на диван, вы ее прерываете и перенаправляете в правильное место (на подстилку), так что залезание на диван не подкрепляется. В процессе дрессировки придется заниматься планированием и стараться предотвратить нежелательное поведение: когда вас нет дома, загородите подходы к дивану, потому что скорее всего собака попробует в ваше отсутствие залезть на него, и поведение будет подкреплено.

Вы можете прерывать нежелательное поведение животного таким образом, что подкрепления не происходит, но нет и физического или умственного устрашения. Для этого научите животное реагировать на команду подзыва или какой-то сигнал для привлечения внимания: что-то, означающее “прекрати делать то, что делаешь и посмотри на меня” или “прекрати делать то, что делаешь и подойти скорее сюда”.

Простейший план дрессировки для отработки звука привлечения внимания, чтобы прерывать нежелательные действия:

Сначала вы издаете звук, на который вы хотите, чтобы ваше животное реагировало (например, свист или чмоканье) и сразу даете лакомство. Повторяйте это до тех пор, пока собака не начнет ожидать лакомства после звука. Затем издайте звук, когда животное смотрит в другую сторону, и В ТОТ МОМЕНТ, когда она повернется и посмотрит на вас (за лакомством), отметьте это действие либо щелчком кликера, либо словом (“да!”). Повторите этот этап, и потом начинайте вводить отвлекающие факторы. Держите собаку на поводке, чтобы она не дотянулась до отвлекающего предмета (например, куска не очень привлекательной пищи на земле), издайте звук, которым вы привлекаете внимание собаки, если она повернулась к вам, скажите “да” или щелкните кликером и дайте лакомство. Если животное не повернулось к вам на звук, не нужно говорить “да” или щелкать кликером. Не давайте животному дотянуться до интересующего его отвлекающего предмета.

Вы можете на шаг отступить от отвлекающего предмета, чтобы животному было проще выполнить задание.  Вы сможете “привязать” ваш звук, привлекающий внимание или команду подзыва к мышечной памяти собаки таким же образом, каким водитель отвечает на зеленый сигнал светофора (зеленый означает “трогаемся с места”). Когда вы успешно опробуете большое количество разных сценариев, в которых собака сможет отвлечься от того, что ее интересует, и подойти к вам, глядя на вас, только тогда можно начинать использовать ваш звук для прерывания нежелательных действий собаки.

Не забывайте, что когда вы игнорируете собаку и обращаете на нее внимание только когда она делает что-то нежелательное, вы тем самым учите ее делать именно то, что вам не нравится, тем что каждый раз подкрепляете ее своим вниманием.  Поэтому ваша ЦЕЛЬ — подкреплять альтернативные реакции собаки в той же ситуации параллельно с прерыванием и предотвращением нежелательных действий.

Пример: если собака стащила ваше нижнее белье и носится с ним по дому, желая привлечь ваше внимание, вам нужно поощрить собаку вниманием тогда, когда она спокойна и НИЧЕГО не предпринимает. Когда пес спокойно лежит у ваших ног, нужно поощрять его БОЛЬШИМ вниманием, чем когда он носится с вашим бельем.

3) Учет эмоционального состояния собаки и уровня ее стресса.

Дрессировщики, использующие подход Прогрессивного Подкрепления, стараются отследить телесный язык животного, чтобы не пропустить сигналов стресса или возбуждения и в соответствии с ними изменить подход в дрессировке.

Пример: я уведу собаку из ситуации, в которой маленький ребенок за ней гоняется или пристает к ней, если замечу, что она подает сигналы стресса.

4) Социализирование собаки и выработка у нее умения справляться с ситуацией путем использования подкрепления.

Вы можете использовать Дрессировку Прогрессивным Подкреплением для того, чтобы социализировать животное и научить его быть успешным в окружающей его обстановке, помещая его в ситуации, не вызывающие стресса или вызывающие минимальный стресс, в которых у животного велик шанс успеха и получения вознаграждения за желательное для вас поведение. Впоследствии вы можете повышать уровень сложности и количество отвлекающих факторов, по мере того как собака успешно справляется с ситуацией, и вашей целью всегда остается воспитание уверенной в себе, хорошо адаптированной собаки.

Пример: приучение собаки оставаться спокойной и расслабленной в тот момент, когда ее берут на руки или ограничивают ее движения методом подкрепления. Собаку Павлова обучали выдавать новую эмоциональную реакцию на звонок, потому что за звуком звонка немедленно следовало кормление. Вы можете научить собаку получать удовольствие от того, что ее берут на руки: для этого нужно всего лишь дотрагиваться до собаки и сразу же скармливать ей лакомство, а затем повышать интенсивность прикосновения, пока собака не впадает в стресс от ситуации. Если собака избегает руки, дрессировщик возвращается на шаг назад к таким действиям, которые спокойно переносились собакой (классическое обуславливание).

Другой пример: cкармливание собаке лакомства за то, что она остается спокойной и расслабленной в волнующей ситуации (например, возле дороги с активным движением), сначала на расстоянии, а затем, по мере того как собака успешно адаптируется, перемещаясь все ближе к проезжей части. Если собака становится слишком возбужденной или выдает признаки стресса, дрессировщик должен вернуться на предыдущий этап занятий, чтобы дать собаке успешно справиться с ситуацией.

5) Использование в дрессировке маркёра, будь то кликер, какой-то другой инструмент для издавания звуков, ваш голос или прикосновение, либо визуальный маркёр. Также возможно, наоборот, что маркёр не используется, а вместо этого животное подкрепляется непосредственно скармливаемым ему прямо в пасть лакомством.

Маркёр может быть использован для того, чтобы заострить внимание собаки на желательном для нас действии. Он сообщает животному, что то действие, которое оно совершает в данный конкретный момент, принесет ему подкрепление.

Пример: если собака сидит, дрессировщик может щелкнуть кликером, пока она остается в положении сидя, и после этого дать собаке лакомство. Или можно сказать “да” радостным тоном, в то время, как собака сидит, и затем дать собаке лакомство, или позволить ей взять игрушку, или выйти на улицу.

Подкрепление поведения возможно и без использования маркёра. Например, вы можете дать собаке лакомство за то, что она смотрит на другую собаку, и этим изменить ее эмоциональную реакцию на другую собаку (классическое обуславливание). Еще вы можете подкрепить собаку за спокойное лежание в доме или на улице тем, что положите перед ней лакомство, когда она его не ждет — тогда собака с большей вероятностью повторит это действие в будущем.

6) Использование человечной, эффективной, уважительной формы дрессировки, основанной на новейших научных свидетельствах.

Верность Дрессировке Прогрессивным Подкреплением означает строгое следование всем приведенным выше принципам — не только в процессе занятий с собакой, но в каждый момент, проведенный в ее обществе.

Дрессировка Прогрессивным Подкреплением не означает:

1) сознательное прибегание к физическому или психологическому запугиванию; использование голоса, прикосновения, языка тела, инструмента или окружающей обстановки для того, чтобы напугать животное, чтобы оно продолжило, начало или перестало что-то делать.

Примеры: смотреть на животное в упор, специально наклоняться над ним, тыкать, дергать, давать разряд электроошейником, обливать водой, пугать резким звуком или говорить угрожающим голосом для того, чтобы прервать действие собаки (говоря “фу” или “нельзя”).

2)Сознательное игнорирование уровня стресса, в котором находится собака, или сигналов стресса, которые она подает.

Сознательное помещение собаки в слишком стрессовую ситуацию, с которой она не может справиться, вместо того, чтобы постепенно подвергать ее воздействию стресса, не выводя за грань, где собака уже не сможет делать выбор, как себя вести.

Пример: принуждение собаки ко встрече с незнакомым человеком, когда она демонстрирует целый спектр сигналов стресса и избегания.

Пример: ситуация, в которой вы тащите животное по участку, который его пугает или на который он отказывается наступать, вместо того, чтобы научить его уверенному и спокойному проходу по нему, используя противообуславливание (поощрение собаки, когда она выбирает наступить на пугающую поверхность до тех пор, пока она не начнет переходить уверенно без вашей поддержки).

3) Постановка целей дрессировки, основанных на эгоизме или отсутствии сострадания к животному.

Сознательный риск физического или эмоционального урона, которому вы подвергаете животное в угоду собственным интересам.

Верность Прогрессивному Подкреплению означает, что вы никогда сознательно не используете перечисленные здесь тактики устрашения — ни в процессе дрессировки, ни в другое время, когда общаетесь с собакой.

Зачем воздерживаться от физического или психологического устрашения?

По научным, моральным и этическим соображениям. Использование этих форм обуславливания может спровоцировать нежелательные побочные эффекты в дополнение к исходной травме, которую они наносят собаке.

Вот неполный список проблем от использования физического или психологического устрашения:

1) без идеального выбора момента, интенсивности и последовательности такая “дрессировка” не выливается ни во что, кроме издевательства над животным

2) собака приучается избегать наказывающего, чтобы заняться тем, что запрещено

3) такие техники могут причинить необратимый эмоциональный ущерб животному

4) наказание может увеличить выделение гормонов стресса, возбуждение и уровень агрессии

5) животные могут адаптироваться к наказанию — это значит, что интенсивность наказания должна постоянно расти, чтобы оно оставалось эффективным по мере того, как животное приучается его терпеть.

6) вы не можете наказанием изменить то, что является базовой эмоциональной реакцией животного, например, что оно реагирует на детей, взрослых, других животных или что угодно другое; все, что вы можете сделать, это подавить действия собаки, в ответ на которые вы ее наказываете.

7) Запугивание может заставить собаку скрывать предупреждающие сигналы перед попыткой укусить.

8) Собаки, которых наказывают при дрессировке, могут почувствовать себя в ловушке, потому что, если дана команда “место”, когда они решают уйти или хотят отойти от дрессировщика (например, если к ним пристает надоедливый ребенок), их наказывают. Когда животное чувствует, что убежать некуда, оно с большей вероятностью укусит, вместо того чтобы отойти.

9) Намеренное запугивание может, наоборот, усилить проявление поведения, которое вы хотите искоренить, потому что запугивание включает в себя элемент внимания к животному.

10) Присутствие того, от кого исходит наказание, становится менее подкрепляющим для собаки. Если вы наказываете собаку, используя запугивание, вам будет сложнее соревноваться с привлекательностью для собаки других элементов окружающей ее ситуации. Собака будет ориентироваться на другие стимулы вокруг как сулящие большее подкрепление, по мере того как вы все больше ассоциируетесь у нее с наказанием, а не с наградой.

11) Собаки, которых дрессировали с применением физического или психологического устрашения, не так охотно действуют на свое усмотрение, когда от них это требуется, что затрудняет отработку сложных действий при дрессировке.

12) Те, кто использует устрашение в качестве наказания, впредь будут еще с большей готовностью наказывать собаку, потому что наказание оправдает себя (будет достигнут желаемый результат — если ударить собаку, она перестанет лаять, поэтому человек с большей вероятностью ударит животное в будущем). Другими словами, психологическое или физическое запугивание заставляет менять наши собственные сценарии поведения.

В заключение подчеркну, что Дрессировка Прогрессивным Подкреплением не является формой попустительского отношения к поведению собаки. Она требует, чтобы у всех действий животного были последствия. Тренер берет на себя роль доброжелательного лидера и направляет собаку, используя описанные этичные и научно доказанные методы.

progressive reinforcement training

Happy Training!