ЖАНРЫ

Охота на электроовец. Большая книга искусственного интеллекта
Шрифт:

Авторы считают, что в реальности возможны три варианта состояния дел в области проектирования общего искусственного интеллекта (AGI):

1) у этой проблемы будет стадия «взлёта», но мы пока ещё не «вырулили на взлётную полосу»;

2) у этой проблемы будет стадия взлёта, и мы уже находимся внутри неё;

3) у этой проблемы в принципе не будет стадии взлёта, потому что последний шаг для создания AGI окажется невозможным реализовать как мегапроект (например, если AGI будет создан в результате неожиданного теоретического прорыва в другой области, который резко повысит возможности уже созданных систем).

В статье авторы озвучивают страхи в отношении того, что в силу своей возможности быстрой консолидации ресурсов авторитарные режимы могут продвинуться в задаче разработки AGI дальше, чем демократические, что создаёт угрозу глобального технологического превосходства первых.

Для оценки продвижения к стадии взлёта авторы предлагают мониторинг следующих областей:

1) запланированные подзадачи [Roadmapped sub-problems]: появление чётко сформулированного набора подзадач для проекта по созданию AGI;

2) производственная функция AGI [AGI production function]: появление производственной функции AGI, которая бы описывала взаимосвязь затрат ресурсов (времени обучения, данных, вычислений и других ресурсов) с производительностью ИИ;

3) капиталоёмкость [Capital intensiveness]: рост инвестиций в аппаратную инженерию и программное обеспечение;

4) параллелизм [Parallelism]: подзадачи решаются параллельно (а не последовательно) несколькими командами;

5) скорость обратной связи [Feedback speed]: более быстрая оценка результатов решения подзадач позволяет менять подходы на основе полученных результатов и более эффективно использовать ресурсы;

6) поведение ключевых действующих лиц [Behavior of key actors] — учёных, политиков, предпринимателей и так далее.

В конце исследования авторы делятся мнением о существующем положении дел и перспективах данного направления:

1) «площадь поверхности» проблемы AGI в настоящее время, по всей видимости, слишком мала, чтобы отдельные государства могли воспользоваться своими ресурсами и добиться успеха в создании AGI. Однако когда фундаментальные исследования в достаточной мере расширят эту «площадь», всё может резко измениться;

2) в связи с научными и геополитическими последствиями такого сдвига необходимы более точные метрики для оценки того, насколько исследования AGI близки к стадии взлёта;

3) предлагается дальнейшее уточнение и формализация показателей прогресса по продвижению к этой стадии.

Учитывая сказанное выше, можно сделать вывод, что перед ИИ сегодня стоит множество интересных проблем, решение которых может существенно изменить привычный нам мир. Причём список задач и направлений исследований, приведённый в этой главе, вовсе не претендует на полноту — в стремительно развивающейся области новые ответвления исследований возникают весьма быстро, и не всегда есть возможность уследить за всем, что происходит в университетских лабораториях и корпоративных исследовательских центрах. В качестве шагов по направлению создания AGI можно рассматривать и многозадачные мультимодальные фундаментальные модели, и новые модели в области обучения с подкреплением (такие, например, как MuZero), и новые подходы в области активного обучения (например, GFlowNets [3350] ), и новые успехи в симуляции биологических нейронных сетей (такие, например, как проект лаборатории Rain Neuromorphics по моделированию работы мозга [3351] ).

3350

Bengio Y., Deleu T., Hu E. J., Lahlou S., Tiwari M., Bengio E. (2021). GFlowNet Foundations // https://arxiv.org/abs/2111.09266

3351

Koetsier J. (2022). Building an artificial brain: 86B neurons, 500T synapses, and a neuromorphic chip / YouTube, Mar 9, 2022 // https://www.youtube.com/watch?v=WEymRJb0dso

Более того, создание AGI может стать следствием сугубо прикладных исследований, ведь между текущими возможностями ИИ-систем и возможностями гипотетического общего искусственного интеллекта лежит множество интеллектуальных задач, решение которых необходимо для развития вполне конкретных продуктов и сервисов. И некоторые из этих задач могут оказаться AI-hard-задачами, то есть задачами, требующими для своего решения наличия у решающих их систем общего интеллекта. Исследование свойств стафилококков и череда совпадений привели Александра Флеминга и его коллег к одному из величайших научных событий XX века — открытию пенициллина. Работа над машинным переводом привела к появлению трансформерных архитектур и фундаментальных моделей — наиболее передовых инструментов современного ИИ. Не исключено, что очередное локальное, на первый взгляд, достижение откроет нам прямую короткую дорогу к AGI. Или, быть может, этот путь уже открыт и нам просто стоит правильным образом скомбинировать уже существующие методы, сдобрить полученную смесь огромными вычислительными мощностями, и, вуаля, золотой ключик у нас в кармане?! В конце концов, ChatGPT — это продукт именно такого подхода. Все основные предполагаемые ингредиенты (большие трансформерные модели, самообучение, дообучение на целевых данных, обучение с подкреплением) были хорошо известны ещё несколько лет назад.

Давайте окинем взглядом все кусочки имеющейся у нас мозаики, чтобы понять, все ли необходимые детали для создания будущего AGI имеются в наличии?

Начнём с критериев успеха. Поскольку под AGI-системой мы понимаем систему, способную выполнить любую интеллектуальную задачу, посильную для человека, то критерием создания такой системы станет невозможность нахождения такой задачи, которую люди будут решать статистически значимо лучше, чем созданная система. Мы уже подробно обсуждали историю и проблематику создания соответствующих процедур тестирования в разделах 1.2 и 6.3.4. В целом идеи Айера и Тьюринга сохраняют свою значимость даже спустя почти столетие. Конечно, в отношении оригинальных формулировок игры в имитацию существует ряд вполне резонных вопросов, которые при реализации подобной процедуры потребуют прояснения. Например, важно определиться, с какими именно людьми мы выполняем сравнение, кто входит в жюри (сколько людей, являются ли они специалистами?), каковы критерии завершения теста, каким образом оценивается статистическая значимость результата, как избежать ситуации, когда демаскирующим свойством системы-кандидата будет проявление её сверхчеловеческих способностей (например, способность быстро и точно выполнять арифметические расчёты), важно ли включать в тест задачи, требующие способности системы работать с разными модальностями, и так далее. Однако все эти нюансы, на мой взгляд, ничего не меняют существенным образом. Кроме того, в настоящее время создано множество наборов тестов, позволяющих с минимальными затратами в автоматическом режиме (без привлечения людей-оценщиков) получить приближённую оценку прогресса, мы подробно говорили о них в разделе 6.3.3.6 (например, наборы тестов из семейства GLUE, BIG-bench, MMLU). В общем, в области оценки возможностей систем ИИ ещё требуется дополнительная работа по расширению, систематизации и стандартизации, однако, кажется, нет никаких задач, выглядящих неразрешимыми. Если тезис о симуляции верен, то тест Тьюринга в его последней авторской формулировке теоретически в будущем сможет пройти большая тьюринг-полная языковая модель.

Но можно ли создать такую модель, используя уже имеющиеся у нас методы? Ключевым вопросом в данном случае является вопрос о том, можно ли создать AGI без активного обучения и воплощения, опираясь только на имеющийся массив цифровых данных, накопленный нашим обществом на данный момент, — так называемый «цифровой след человечества». Вопрос этот совершенно нетривиальный и, вероятно, может быть разрешён только экспериментальным путём. Система ИИ, обученная только на данных, являющихся продуктами чужой практики, подобна Жаку Паганелю — знаменитому герою романа «Дети капитана Гранта» Жюля Верна. В романе Паганель стал секретарём Парижского географического общества, членом-корреспондентом географических обществ Берлина, Бомбея, Дармштадта, Лейпцига, Лондона, Петербурга, Вены и Нью-Йорка, почётным членом Королевского географического и этнографического обществ, а также Института Ост-Индии, и всё это — не выходя из своего кабинета. Однако возможен ли такой искусственноинтеллектуальный Паганель на практике? Вот некоторые доводы за и против этой гипотезы (мы будем называть её гипотезой о выводимости [AGI из цифрового следа человечества]).

За:

1. Собранные человечеством цифровые данные — продукт масштабной социальной практики, в которой участвуют миллиарды людей. Цифровой след человечества — отпечаток столь масштабного и разностороннего опыта, что он на много порядков превосходит по объёму любой индивидуальный опыт человека. Отталкиваясь от продуктов этого опыта, можно построить подробную модель мира и без непосредственного выхода в этот мир в физическом теле. Проще говоря — миллиарды шишек, набитых другими, могут заменить машине несколько собственных.

2. Размер цифрового следа человечества растёт экспоненциальными темпами (см. раздел 5.4). Даже если данных не хватает в настоящий момент, очень скоро их будет ещё больше. Растёт разрешение цифровых камер, и увеличивается их доступность, всё больше данных накапливается в журналах систем, взаимодействующих с реальным миром, ежедневно люди пишут миллионы постов в социальных сетях — всё это пополняет копилку данных, полезных для обучения. И, рано или поздно, количество перейдёт в качество.

3. В конце концов мы уже стали свидетелями потрясающих успехов больших языковых моделей и генеративного ИИ. Большие модели оказались способны осуществлять обобщения, необходимые для возникновения у них новых удивительных возможностей. Таких, например, как написание содержательных текстов, генерация новых изображений по текстовым описаниям, сочинение музыки, создание новых молекул и т. д. Вполне возможно, что для нерешённых задач нам просто нужны более крупные модели, больше данных и больше вычислительных мощностей.

Поделиться с друзьями: