Зоопсихология. Элементарное мышление животных: Учебное пособие
Шрифт:
Методики выработки дифференцировочных УР весьма многочисленны и разнообразны по процедуре эксперимента. Перечислим основные параметры, по которым различаются такие методики.
1. Порядок предъявления стимулов может быть последовательным или одновременным. При последовательном предъявлении голубь должен научиться клевать кнопку (диск) в ответ на стимул А и воздерживаться от реакции при включении стимула Б (методика go— nogo). Выработка дифференцировки, таким образом, состоит в торможении реакции на второй стимул. При одновременном предъявлении конкретной пары стимулов животное учится различать (дифференцировать) их абсолютные признаки. Например, при дифференцировке стимулов по их конфигурации животному одновременно показывают две фигуры — круг и квадрат, и подкрепляют выбор одной из них, например, круга. Это наиболее распространенный вид дифференцировочных УР. Выработка и упрочение такой реакции требует, как правило, многих десятков сочетаний.
2. Животному предлагают сделать выбор стимулов: альтернативный или множественный.
3. Предъявление стимулов может осуществляться в соответствии с двумя режимами: повторение одной пары стимулов до достижения критерия и чередование нескольких пар стимулов при систематическом варьировании второстепенных параметров.
Рассмотрим некоторые методы более подробно.
При систематическом варьировании второстепенных параметров стимулов можно оценивать способность животных различать не только данную конкретную пару раздражителей, но и их «обобщенные» (отвлеченные) признаки, совпадающие у многих пар.
Например, животных можно обучить различать не конкретные круг и квадрат, а любые круги и квадраты независимо от их размера, цвета, ориентации и т. п. С этой целью в процессе обучения каждый следующий раз им предлагают новую пару стимулов (новые круг и квадрат). Новая пара отличается от остальных по всем второстепенным признакам стимулов — цвету, форме, размерам, ориентации и т. п., но сходна по их основному параметру — геометрической форме, различения которой и предполагается добиться. В результате такой тренировки у животного постепенно происходит обобщение основного признака и отвлечение от второстепенных. В приведенном примере обобщается признак «круг» (подробнее см. гл. 5).
Данный режим оказался весьма эффективным для выработки дифференцировочного УР на обобщенный признак «мерность», когда животное училось выбирать любую объемную (трехмерную) фигуру и не реагировать на плоские (двумерные) фигуры (см. 4.6.3). В таких опытах с собаками, обезьянами и воронами у одной группы животных каждого вида вырабатывали УР выбора любой объемной (трехмерной) фигуры, а у второй группы — любой плоской (двумерной). Каждый раз животному предъявляли новую пару стимулов из набора, изображенного на рис. 4.15 ' (всего 30 пар), причем плоская фигура всегда представляла собой фронтальную проекцию объемной.
Может возникнуть предположение, что задача по выработке таких дифференцировок для животных очень сложна, однако с ней справляются не только приматы, но и хищные млекопитающие (Дашевский, Детлаф, 1974), а также птицы — врановые (Крушинский и др., 1981) и даже голуби. При этом животным всех указанных видов требовалось примерно столько же сочетаний, как и при выработке дифференцировки с одной парой стимулов. После такой серии обучения они способны выбирать любую новую объемную (или плоскую) фигуру без дополнительной тренировки.
При систематическом варьировании второстепенных признаков стимулов можно исследовать не только способность животных к обучению, но и более сложную форму их высшей нервной деятельности — способность к обобщению, которая составляет одно из важнейших свойств довербального мышления животных (гл. 5).
Как уже упоминалось, животные с разным уровнем структурно-функциональной организации мозга практически не различаются по способности к простым формам условно-рефлекторного обучения. Образование отдельных дифференцировочных УР в этом плане не составляет исключения. Однако благодаря использованию дифференцировочных УР в качестве элементарных единиц обучения и созданию их разнообразных комбинаций было разработано несколько экспериментальных процедур, которые называют«сложными формами обучения», или серийным обучением (seriallearning). Появление этих методов было связано со стремлением специалистов все же выявить какие-то различия в способностях у животных разных таксоноцеских групп с разным уровнем организации мозга (см. 8.1). Наиболее важные из этих методов:
* последовательные переделки сигнального значения дифференцировочных стимулов;
* формирование установки на обучение;
* формирование «систем» дифференцировочных УР.
Переделка сигнального значения условных раздражителей (ее часто называют переделкой дифференцировки) — это разновидность дифференцированного обучения.
После достижения определенного, выбранного экспериментатором критерия выработки различения (например, 80 % правильных решений) условия получения подкрепления меняются на противоположные: теперь реакция на стимул, ранее подкреплявшийся, перестает сопровождаться пищей, а реакцию на стимул, на который животное только что научилось не реагировать, начинают подкреплять.
Американский исследователь М. Биттерман (1973) предложил проводить такие переделки многократно. Эта процедура получила название метода последовательных (или обратимых) переделок (discriminationreversallearning). Автор исходил из того, что после многократных смен сигнального значения стимулов у животных может сформироваться единая стратегия (или правило), и они не будут каждый раз обучаться совершенно заново.
Опыты проводились на разных видах позвоночных. При каждой следующей переделке число ошибок снижалось, и в конце концов наступал момент, когда при очередной смене сигнального значения стимулов животное уже со второй пробы начинало выбирать «правильно» без дополнительного обучения. в Снижение числа проб, необходимого для очередной переделки реакции, происходит тем быстрее, чем выше уровень эволюционного развития данного животного.
Метод формирования «установки на обучение» (objectlearning-setformation) разработал американский исследователь Г. Харлоу (Harlow, 1949; 1958). Согласно классическому варианту этой методики, животное (в опытах Харлоу макака-резуса) обучают простой дифференцировке — выбору одного из двух стимулов: игрушек или мелких предметов обихода. По достижении определенного критерия выработки дифференцировки начинают следующую серию: животному предлагают два новых стимула, ничем не похожих на первые. По завершении второй стадии обучения формируют третью дифференцировку и т. д. После выработки 100–150 таких реакций (их число зависит от уровня организации данного вида и может доходить до 1500 у крыс и голубей, занимая многие месяцы) животное уже при втором предъявлении новой пары стимулов действует не наугад, не методом проб и ошибок, а в соответствии с усвоенным им ранее правилом, которое принято называть установкой. Оно запоминает результат первой пробы и далее реагирует в соответствии с этой «установкой».
Правило состоит в том, чтобы «выбирать тот же предмет, что и в первой пробе, если его выбор сопровождался подкреплением, или другой, если подкрепление получено не было (в дальнейшем эта стратегия получила название "win-stay, Jose-shift"}-».
Принято считать, что при обучении с использованием метода последовательных переделок и при формировании установки происходят сходные процессы, так что первый можно считать частным случаем формирования установки.
Впоследствии было создано несколько модификаций исходной методики. Например, Д. Уоррен (Warren, 1977) в своих опытах не вырабатывал каждую дифференцировку до достижения критерия обученности, а предъявлял каждую пару определенное число раз и затем предлагал следующую. Именно этот вариант был использован рядом авторов для сравнения обучаемости разных видов приматов (Passingham, 1982; Rumbaugh et al., 1987, 2000).