Оперантное поведение
Шрифт:
Мы выбираем относительно простой вид поведения, который свободно и многократно воспроизводим и который легко поддается наблюдению и регистрации. Например, если испытуемым является голубь, то поднятие им головы выше определенного уровня является удобным поведением для изучения. Оно может быть зафиксировано взглядом экспериментатора на шкале, прикрепленной к задней стенке ящика, на фоне которой находится голубь. Сначала мы изучаем естественную высоту поднятия головы голубем и выбираем на шкале отметку, которая достигается им только в отдельных случаях. Фиксируя свой взгляд на шкале, экспериментатор начинает очень быстро открывать поднос, как только голова поднимается выше этой линии. Если эксперимент проводится в соответствии со спецификациями, то получается один и тот же результат: мы наблюдаем быстрое изменение частоты пересечения головой голубя заданной линии. Мы также видим, что голова голубя поднимается на более высокий уровень, и этот факт имеет большое теоретическое значение. Мы можем очень быстро заставить голубя высоко поднимать голову, установив время предъявления пищи. Через одну-две минуты поза голубя изменяется таким образом, что его голова редко опускается ниже линии, которую мы выбрали вначале.
Когда мы демонстрируем процесс запечатления в такой относительно простой форме, мы видим, что некоторые обычные интерпретации эксперимента Торндайка избыточны. Выражение «научение путем проб и ошибок», которое часто связывается с законом эффекта, здесь явно неуместно. Мы вкладываем особый смысл в наши наблюдения, когда называем любое поднятие головы «пробой», и нет оснований считать «ошибочным» любое движение, которое не приводит к установленному нами результату. Даже употребление термина «научение» вводит в заблуждение. Утверждение, что «птица научается получать пищу посредством вытягивания шеи», является неадекватным выражением того, что происходит. Говорить, что она приобрела «навык» вытягивать шею — значит просто обращаться к объяснительным вымыслам, поскольку единственным доказательством наличия навыка является приобретенная тенденция выполнять действие. Простейшим возможным описанием данного процесса является следующее: мы делаем данный контингент следствий зависимым от определенных физических свойств поведения (поднятия головы), далее фиксируем, что частота появления этого поведения возрастает. Принято рассматривать любое движение живого существа как реакцию. Это слово заимствовано из исследований, посвященных изучению рефлексов. Оно означает действие, которое наступает в ответ на предшествующее событие — стимул. Но мы можем сделать событие зависимым от поведения без определения предшествующего стимула. Мы не изменяем среду обитания голубя для того, чтобы вызвать поднятие головы. Вероятно, нельзя показать, что любой простой стимул неизменно предшествует этому движению. Такое поведение может оказаться под контролем стимулов, но при этом отсутствуют отношения по типу «одно порождает другое», поэтому термин «реакция» не вполне адекватен, но он настолько укоренился, что далее мы будем его использовать.
Конечно, нельзя предсказать и проконтролировать реакцию, которая уже произошла. Можно только предсказать, что похожие реакции будут наблюдаться в будущем. Поэтому единицей науки о прогнозировании является не реакция, а класс реакций. Для его описания будет использоваться слово «оперантный». Данный термин показывает, что поведение «воздействует» (operates) на среду, генерируя последствия. Следствия определяют свойства, по которым устанавливается сходство реакций. Он будет использоваться и как прилагательное (оперантное поведение), и как существительное, обозначающее поведение, определенное данным следствием.
Поднятие голубем головы один раз в определенный момент является реакцией. Это прошлое и его можно рассматривать со всех точек зрения, которые представляют для нас интерес. Поведение, называемое «поднятием головы», которое происходит независимо от определенных обстоятельств (instances), является оперантным. Его можно описать не как завершенное действие, а как состав действий, определяющийся свойствами высоты, на которую нужно поднять голову. В этом смысле оперант можно определить посредством следствия, характеризуемого с помощью физических терминов. «Поднятие головы» («cutoff») на определенную высоту является частью (property) поведения.
Традиционное употребление термина «научение» может быть сохранено для описания перераспределения реакций на классы в сложной ситуации. Терминология, необходимая для описания процесса запечатления, может быть заимствована из теории условных рефлексов И. П. Павлова. Сам Павлов называет все события, которые усиливают поведение «подкреплением» и все возникающие в связи с ним изменения, «обусловливанием». Однако в экспериментах Павлова подкрепление сочетается со стимулом, а при оперантном поведении оно зависит от реакции. Поэтому оперантное подкрепление является специальным процессом и нуждается в специальном анализе. В обоих случаях усиление поведения, происходящее в результате подкрепления, называется «обусловливанием». При оперантном обусловливании мы усиливаем оперант, чтобы увеличить вероятность или частоту появления реакции. В условиях павловского, или «респондентного», обусловливания мы просто повышаем величину реакции, вызванную условным стимулом, и сокращаем время между стимулом и реакцией. Мы уже отмечали, что этими двумя случаями исчерпываются возможности: 1) организм обусловливается, когда подкрепление сопровождает другой стимул или 2) следует за поведением организма. Любое событие, которое не приводит к одному из этих случаев, не влияет на изменение вероятности реакции. Тогда в эксперименте с голубем еда является тем, что подкрепляет, а.ее предъявление, когда реакция «выделяется», является подкреплением. Оперант определяется свойствами, от которых зависит подкрепление — высотой, на которую должна подниматься голова голубя. Изменение частоты поднятия головы на эту высоту есть процесс оперантного обусловливания.
Находясь в состоянии бодрствования, мы постоянно воздействуем на среду, и многие последствия нашего поведения имеют силу подкрепления. Посредством оперантного обусловливания среда конструирует базисный репертуар поведения, благодаря которому мы сохраняем равновесие, ходим, играем в спортивные игры, пользуемся инструментами, говорим, пишем, гребем, управляем автомобилем и самолетом. Мы можем оказаться не готовыми к изменению в среде, например появлению нового автомобиля, нового друга, новых интересов, к смене работы и местожительства, но мы обычно быстро приспосабливаемся к новой обстановке, приобретая новые реакции и утрачивая старые. ‹:…› Оперантное подкрепление не только структурирует репертуар поведения. Оно улучшает продуктивность поведения и еще долгое время сохраняет его после того, как его усвоение или продуктивность теряют свою значимость.
КОЛИЧЕСТВЕННЫЕ СВОЙСТВА
Совсем не просто получить кривую научения. Мы не можем полностью изолировать оперант и устранить все случайные помехи. Можно было бы построить кривую и показать, как частота поднятия головы на определенную высоту изменяется в зависимости от времени или количества подкреплений, но дело в том, что общий эффект больше. Происходит смещение в более крупной схеме поведения, и для того чтобы его полностью описать, необходимо проследить все движения головой. Даже в этом случае мы не исчерпаем всей проблемы. Высота поднятия головы была выбрана произвольно, и эффект подкрепления зависит от нее. Если подкрепить высоту, которая достигается редко, изменение в схеме будет гораздо больше, чем в случае, когда выбирается высота, на которую голубь обычно поднимает голову. Для адекватного объяснения необходимо получить набор кривых, описывающих все случаи. Если заставить голубя поднимать голову все выше и выше, появляется еще один произвольный элемент, так как можно использовать различные графики подкрепления. Каждый график дает свою кривую, и картину можно считать исчерпывающей, только если будут использованы все графики подкрепления.
Мы не можем обойти эти проблемы, выбрав реакцию, которая более строго определяется свойствами среды, например открытие двери. Определенный механический индикатор поведения, разумеется, предпочтительнее, поскольку, например, он позволяет организовать постоянное представление подкрепления. Можно регистрировать высоту поднятия голубем головы с помощью фотоэлемента, но легче выбрать такую реакцию, которая производит изменение в среде и которую легче регистрировать. Если птица научается нажимать на небольшой рычаг, находящийся на стене экспериментального ящика, можно сконструировать рычаг таким образом, чтобы он замыкал электрическую цепь, что позволит предъявлять поднос с пищей и регистрировать реакции. Думается, что такая реакция отличается от реакции поднятия головы тем, что она имеет характеристику «все или ничего». Но ниже будет видно, что «реакция», которая не так произвольна, как реакция поднятия головы, не определяется механическими свойствами движения «нажатия на рычаг».
Нет необходимости иметь совершенное экспериментальное устройство для того, чтобы получить важные количественные данные об оперантном обусловливании. Мы уже можем оценивать много факторов. Важность обратной связи ясна. Организм можно стимулировать последствием его поведения, если имеет место обусловливание. Например, при обучении шевелить ушами необходимо знать, когда уши двигаются, если мы хотим подкреплять двигательные реакции. При переучивании больного пользоваться частично парализованной конечностью можно с помощью специальных приспособлений или другого человека усиливать обратную связь при слабых движениях. Глухонемой научается говорить, только если он получает обратную связь о. своем поведении, что можно сравнить со стимуляцией, которую он получает от других говорящих людей. Одной из функций педагога является обеспечение произвольных (иногда ложных) последствий с целью получения обратной связи. Обусловливание также зависит от вида, количества и момента предъявления подкрепления, а также от многих других факторов.
Отдельное подкрепление может иметь значительный эффект.
При благоприятных условиях один какой-нибудь резкий шаг может привести к увеличению частоты появления реакции в дальнейшем. В обычных случаях такое значительное увеличение наблюдается уже после одного подкрепления, и дальнейший дополнительный прирост величины продолжается по мере предъявления последующих подкреплений. Это наблюдение ни в коей мере нельзя объяснить мгновенным изменением в сторону максимальной вероятности, поскольку не выделен оперант в чистом виде. Увеличение частоты можно интерпретировать с точки зрения других поведенческих характеристик ситуации. Тот факт, что обусловливание организма может быть быстрым у животных такого «низкого уровня развития», как крысы и голуби, приводит к интересным выводам. Различия в том, что обычно называют интеллектом, до некоторой степени объясняются различиями в скорости научения. Но не может существовать более быстрого научения, чем мгновенное увеличение вероятности реакции. Следовательно, специфичность человеческого поведения определяется какими-то другими факторами.
УПРАВЛЕНИЕ (CONTROL) ОПЕРАНТНЫМ ПОВЕДЕНИЕМ
Экспериментальная процедура оперантного обусловливания не сложна. Создается контингент подкрепления и предъявляется организму в течение определенного периода времени. Затем на основе этого объясняется частота возникновения реакции. Что было сделано в на-: правлении предсказания и управления поведением в будущем? Какие переменные заставляют нас предсказывать, будет или не будет реагировать организм? Какими переменными нужно управлять, чтобы заставить организм реагировать? Мы экспериментируем с голодным голубем. Это означает, что голубь лишался пищи в течение определенного периода времени или до тех пор, пока он немного не терял в весе. В противоположность тому, что можно было бы ожидать, экспериментальные исследования показали, что сила эффекта пищевого под- крепления может не зависеть от количества пищи. Но наблюдается, что частота реакций, которая является результатом подкрепления, зависит от степени депривации. Даже если мы научили голубя вытягивать шею, он не будет этого делать, если он не голоден. Таким образом, имеется еще один способ контроля за его поведением: для того чтобы заставить голубя вытягивать шею, необходимо лишить его пищи. Выбранный оперант прибавляется ко всему тому, что будет делать голодный голубь. Контроль за реакцией объединился с контролем за лишением животного пищи. Оперант " может также контролироваться с помощью внешнего стимула, являющегося еще одной переменной величиной, которую можно использовать для предсказания поведения и контроля за ним. Тем не менее следует отметить, что обе эти переменные можно вывести из самого оперантного подкрепления.