Психология интеллекта и одаренности
Шрифт:
Покажем, каким образом гибридная модель Андерсона может сочетаться с двухполюсной концепцией творчества. Фактически работа системы продукций осуществляет то, что Пономарев относил к логическому полюсу. Продукции работают строго детерминистически, осуществляя трансформацию исходной модели события в новый вариант. Модель событий при этом образована совокупностью декларативных знаний, активированных в данный момент времени в рабочей памяти.
В то же время процесс распространения активации может быть кандидатом на объяснение ряда процессов, связанных с тем, что Пономарев называл интуицией. В самом деле, согласно теории Пономарева, роль интуиции заключается в том, чтобы снабжать наш логический аппарат, т. е. создаваемые модели действительности, информацией о свойствах объектов. Именно это и делает семантическая сеть, движение активации по которой приводит к вхождению в рабочую память (= умственную модель) элементов знания, хранящихся в долговременной памяти. Другими словами, механизм интуиции можно представить как систему связей между элементами информации в нашей долговременной памяти, которая формируется независимо от наших сознательных усилий и позволяет в нужный момент актуализировать нужное содержание.
В модели Андерсона отсутствует представление о различии интуитивного и логического режимов функционирования когнитивной системы. Однако такое представление совместимо с моделью, если предположить возможность различных состояний сети. В логическом состоянии активация сети включает немногочисленные элементы, которые в соответствии с веерным эффектом при этом могут быть активированы в большей степени. Высокая степень активации элементов позволяет осуществлять с ними логические операции, однако при этом невысоким оказывается количество элементов, включенных в решение.
Коннекционистские модели
В отличие от гибридных, коннекционистские модели используют сети для описания не только активационных процессов, но и процессов переработки информации. Описание сетей тоже получается несколько иным – понятие может быть связанным не с одним каким-либо узлом, а с целым их набором. Соответственно, и отношения между узлами не оказываются более отношением между понятиями. В коннекционистских моделях в основу функционирования сети положен принцип параллельности.
На сегодняшний день в когнитивизме наиболее распространенным является моделирование с помощью параллельных распределенных сетей. На рисунке 2.13 приведен фрагмент сети, примененной Д. Румелхартом и Дж. Мак-Клелландом для их модели овладения ребенком прошедшим временем английских глаголов, выполненной в рамках подхода параллельной распределенной переработки информации (Rumelhart, McClelland, 1986).
Модель имеет сеть, включающую четыре слоя нейроноподобных элементов, или узлов. Один слой узлов является входным, два – промежуточными (или ассоциативными), четвертый – выходным. Возбуждение распространяется от первых слоев к следующим через дуги между узлами. Связи между первым и вторым, а также третьим и четвертым слоями рассматриваемой модели являются жестко фиксированными. Связи между вторым и третьим слоями могут изменяться в процессе обучения. Изменению в ходе обучения подвержен также порог активации элементов третьего слоя.
Рис. 2.13. Фрагмент сети модели Д Румелхарта и Дж. Мак-Клелланда
Если подавать на входные узлы сети активацию, сеть будет реагировать – выдавать определенный паттерн активации на выходе. Например, сеть Румельхарта и Мак-Клелланда на входе получает инфинитив глагола, а на выходе выдает прошедшее время (каждый входной и выходной узел модели кодирует один звук). Сеть можно обучать: если она выдает неправильный ответ, по определенному алгоритму модифицируются связи между ассоциативными слоями.
Наиболее интересным в моделях такого типа является то, что они показывают весьма любопытное сходство с реальным поведением людей. В частности, модель Румельхарта и Мак-Клелланда на определенном этапе обучения, как и дети, демонстрирует сверхгенерализацию (например, выдает gived вместо gave), на другом этапе – появление частных правил и т. д.
Показана способность параллельных распределенных сетей и к более сложной переработке информации. Так, Г. Хинтон создал модель, которая обучается определению родственных отношений (Hinton, 1986). На ее входные узлы подают имена людей и учат устанавливать между ними родственные отношения. Была показана способность этой модели к простым умозаключениям. Так, если дать ей некоторое количество отношений типа «Иван отец Петра», «Петр отец Сидора», «Иван дед Сидора», то сеть из «Джон отец Джека» и «Джек отец Джима» может сама вывести «Джон дед Джима». Интересно, что анализ функционирования отдельных узлов промежуточных слоев показывает образование понятий, таких как пол, поколение, принадлежность к семье и т. д. Другими словами, некоторые узлы срабатывали только в отношении лиц старшего поколения, другие – только в отношении женщин и т. д.
Коннекционистские модели обладают определенной привлекательностью в силу ряда причин: подобия нашей нейрофизиологической организации (или по крайней мере тому, что мы о ней сегодня знаем), способности естественным образом моделировать некоторые процессы, высокой точности и возможности компьютерного моделирования, но при принципиальном отличии по архитектуре от компьютера и т. д. Они позволяют объяснить такие феномены, которые оказываются непонятными для информационных моделей, лишенных сетевой составляющей. К таким феноменам относится, например, облегчающее влияние контекста на решение задач.
В то же время некоторые авторы высказывают сомнение по поводу того, что коннекционизм может стать главным средством моделирования познавательных процессов. Так, Дж. Фодор и З. Пылишин доказывают, что коннекционистские модели в принципе не обладают вычислительной мощью, позволяющей выполнять в полном объеме пропозициональное исчисление, и, следовательно, не могут объяснить всех возможностей познавательной системы человека.
Сети Хопфилда
Специально рассмотрим вид сетей, предложенный Дж. Хопфилдом, поскольку эти сети привлекли особое внимание в контексте проблемы творчества. В этих сетях каждый нейрон может принимать одно из двух состояний. В них нет входных, промежуточных и выходных слоев, однако, как показано на рисунке 2.14, есть обратные связи.
За счет обратных связей сети Хопфилда являются динамическими, т. е. выход, передаваясь по сети обратной связи, модифицирует вход. Затем новый вход модифицирует выход, и процесс повторяется снова и снова. Для устойчивой сети последовательные итерации приводят к все меньшим изменениям выхода, пока в конце концов выход не становится постоянным. Для некоторых сетей процесс никогда не заканчивается, такие сети называют неустойчивыми.
Рис. 2.14. Сеть Хопфилда
Во время работы сети Хопфилда признаком нахождения решения является момент, когда достигается аттрактор, статический (когда на каждом следующем шаге повторяется устойчивое состояние) или, возможно, динамический (когда до бесконечности чередуются два разных состояния). Это конечное состояние сети и является ее реакцией на данный образ.
На первом этапе сеть Хопфилда обучают. Это означает, что сеть запоминает определенное количество состояний.
Матрица весовых коэффициентов настраивается детерминированным алгоритмом раз и навсегда, и затем весовые коэффициенты больше не изменяются.
Как только веса заданы, сеть может быть использована для получения запомненного выходного вектора по данному входному вектору, который может быть частично неправильным или неполным.
Обычно ответом является такое устойчивое состояние, которое совпадает с одним из запомненных при обучении векторов, однако при некоторых условиях (в частности, при слишком большом количестве запомненных образов) результатом работы может стать так называемый ложный аттрактор («химера»), состоящий из нескольких частей разных запомненных образов, а также в синхронном режиме сеть может прийти к динамическому аттрактору.