ЖАНРЫ

Руководство по поведенческой медицине собак и кошек
Шрифт:

Поскольку отрицательное наказание, как и положительное, не обучает животное определенному целевому поведению, для повышения эффективности этого воздействия его следует сочетать с той или иной формой ап-петентного подкрепления. Например, в случае слишком оживленной игры это может быть возобновление игры сразу, как только животное успокоится.

Консультирование владельцев по применению наказания

Животные выбирают, что им делать, оценивая “за” и “против” для разных вариантов поведения в данный момент времени. Цель программ модификации поведения - добиться, чтобы по результатам такой оценки животное гарантированно выбирало приемлемое поведение.

Владелец, как правило, сосредоточивается на наказании за недостойное поведение, тогда как на деле гораздо эффективнее вознаграждать за хорошее поведение. В лучшем случае наказание оказывается неэффективным (поскольку поведение сохраняется), часто же проблема только усугубляется вследствие эмоциональных последствий наказания.

Исходя из этих соображений, а также потому, что эффективное применение наказания обычно сопряжено с большими трудностями, следует отговаривать владельцев от его использования. Если же наказание представляется необходимым, специалист должен хорошо знать факторы, позволяющие добиться максимальной его эффективности при минимальном риске причинения вреда пациенту (Mills, 1997).

Режимы подкрепления_

Определив, какие поведенческие реакции (если таковые вообще имеются) подлежат подкреплению, можно использовать режимы непрерывного, прерывистого и затухающего подкрепления.

Режимы непрерывного подкрепления

Непрерывное подкрепление предусматривает подкрепление каждой желательной поведенческой реакции. В режиме непрерывного подкрепления новые модели поведения усваиваются животным быстро, но если подкрепление прекращается, они вскоре утрачиваются (угасание условного рефлекса). Этот режим наиболее эффективен на первых этапах дрессировки.

Режимы прерывистого подкрепления

Прерывистое подкрепление предусматривает подкрепление желательной ответной реакции от случая к случаю. Оно может проводиться несколькими способами.

• Фиксированный режим, при котором точно определяются временные параметры подкрепления ответной реакции; при этом можно использовать:

– фиксированное соотношение (например, каждая шестая реакция);

– фиксированный интервал (первая ответная реакция, полученная после определенного промежутка времени);

– фиксированную продолжительность (после того, как животное воспроизводит желательную реакцию в течение определенного периода).

• Переменный режим, при котором время подкрепления реакции устанавливается произвольно.

• Дифференцированный режим, при котором время подкрепления реакции устанавливается по ее качественной характеристике.

В режиме прерывистого подкрепления независимо от степени проявления поведенческой реакции объем подкрепления, по определению, всегда меньше, чем в режиме непрерывного подкрепления. Следовательно, дрессировка может продолжаться дольше. На практике чаще используют либо переменный, либо дифференцированный режим, поскольку их легче применять для формирования четкого и стойкого изменения поведенческих реакций животного.

Режим прерывистого подкрепления для выработки требуемой поведенческой реакции

Если режим прерывистого подкрепления используют для того, чтобы выработать определенную модель поведения, то первоначально подкрепление производят часто, а затем, как только устанавливается стабильная ответная реакция, начинают применять все реже и реже. Так, на начальном этапе животное поощряют за исполнение любого действия, приближающегося к целевому поведению, а позднее только за наиболее четкое выполнение требований, с тем чтобы его поведение формировалось в заданном направлении. Этот процесс, называемый последовательным приближением, наиболее эффективен в тех случаях, когда в определенный отрезок времени работа ведется только с одним аспектом поведения. Например, если животное учат садиться по команде, то первоначально его вознаграждают каждый раз, когда оно выполняет команду (непрерывное подкрепление); как только ответная реакция становится стабильной, обычно переходят на дифференцированный режим, т.е. поощряют только те случаи, когда животное садится правильно и быстро.

Режим прерывистого подкрепления для подавления нежелательного поведения

Использование режимов прерывистого подкрепления позволяет также снизить частоту некоторых поведенческих проявлений или даже полностью устранить их. Это достигается путем дифференцированного подкрепления ослабленных проявлений проблемного поведения (ДПО), причем для успеха не требуется активного участия животного в программе дрессировки.

При ограниченном ДПО подкрепляется поведение, при котором частота или продолжительность нежелательных проявлений не превышают предварительно заданного уровня. Экспериментально установлено, что некоторые варианты метода позволяют устранять усвоенное нежелательное поведение быстрее, чем простым прекращением подкрепления (Zeiler, 1971).

Этот метод наиболее целесообразно применять на ранних этапах борьбы с чрезмерно громкими голосовыми сигналами животного, особенно если цель данного поведения — привлечь внимание хозяина. Успех зависит от характера голосовых сигналов, а также от того, насколько животное заинтересовано в получаемом от владельца вознаграждении.

• Первоначально вознаграждаются менее интенсивные проявления, благодаря чему животное быстро понимает, что предпочтительны более мягкие формы поведения.

• Затем требования становятся строже: поощряется еще более спокойное поведение.

• Даже после того, как реакции животного станут стабильно менее интенсивными, эту стратегию продолжают до тех пор, пока не достигнут допустимого уровня громкости, либо совсем перестают обращать на проблему внимание.

• В качестве альтернативы можно использовать раздельное ДПО, при котором подкрепляют реакции, разделенные определенным временным интервалом.

Одна из причин, почему эти методы очень полезны для коррекции некоторых типов поведения, направленного на привлечение внимания, состоит в том, что трудно ожидать от хозяина, чтобы он не обращал внимания на своего питомца каждый раз, когда тот пытается установить контакт,— ведь большинство живот-ных-компаньонов содержат именно ради радости общения с ними. Практичнее попросить владельца ограничивать свое внимание к животному и не проявлять его хотя бы в те минуты, когда животное оставляет его одного.

При использовании данных методов следует очень осторожно относиться к росту ожиданий животного, поэтому важно увеличивать объем вознаграждения лишь по мере улучшения поведения. Если же животное будет получать все большее вознаграждение при минимальном уровне требований к нему, успеха не будет. Исходя из этого, необходимо, чтобы клиент вел записи того, какой объем вознаграждения он использует каждый день.

Режимы затухающего подкрепления — разрушение ассоциации

Принцип затухания заключается в следующем: если после обычно подкрепляемой поведенческой реакции не давать аппетентного подкрепления, вероятность ее проявления будет снижаться. По существу это форма отрицательного наказания за сформированное поведение.

Как правило, подкрепление, приводящее к возникновению проблемы, бывает неумышленным. Например, доставив почту, почтальон уходит, а непосредственно перед его уходом собака случайно начинает лаять. Поведение собаки подкрепляется уходом почтальона, так как собака не знает, что почтальон все равно ушел бы, даже если бы она не среагировала подобным образом. В этом случае для разрушения ассоциации методом затухающего подкрепления необходимо, чтобы “подставной почтальон” пришел в дом и не уходил до тех пор, пока собака не успокоится. Если повторить это упражнение несколько раз, собака, в конце концов, поймет, что ее реакция никак не влияет на исход ситуации.

Поделиться с друзьями: