Охота на электроовец. Большая книга искусственного интеллекта
Шрифт:
Уследить за всеми успехами коннекционистских моделей в настоящее время практически невозможно — столь обширна лавина публикаций по этой тематике. Вы можете самостоятельно поиграть в игру, добавляя к названию какой-либо задачи слова neural network и выполняя соответствующие запросы в поисковом сервисе: cookies recipe neural network; detect a pig neural network; predict when you last shaved neural network. Если результат поиска вас не удовлетворит, возможно, настало время задуматься о собственном стартапе.
6.3 Машина учится понимать: обработка естественного языка
Полоний: …Что вы читаете, мой принц?
Гамлет: Слова, слова, слова.
Полоний: Но в чём же именно тут дело, принц?
Гамлет: Чьё дело, с кем?
Полоний: В чём суть того, что вы читаете, мой принц?
2016
* Пер. Н. Россова.
Различные области науки и технологий содержат множество пересечений, что делает невозможным построение их простой древовидной классификации. Обработка естественного языка (Natural language processing, NLP) — так сказать, NLP здорового человека, в отличие от раскрученного «нейролингвистического программирования», — является одновременно областью лингвистики, информатики, информационной инженерии и искусственного интеллекта. К области NLP относят распознавание речи, понимание естественного языка и его генерацию. При этом с NLP совершенно очевидным образом пересекается распознавание образов, методы которого применяются в решении различных задач NLP. Мы уже обсудили прогресс в области распознавания речи, вызванный революцией глубокого обучения, теперь пришла пора обратить внимание на другие задачи из области NLP.
В широком смысле к области NLP относят все задачи, связанные с взаимодействием между машинами и человеческими (естественными) языками. Методы NLP применяются для создания диалоговых и справочных систем, систем поиска информации и машинного перевода, систем анализа тональности высказываний (так называемый сентимент-анализ [sentiment analysis]), систем реферирования текста, уточнения текста при оптическом распознавании, проверки правописания и так далее. В отношении последней задачи я рекомендую всем интересующимся детальное исследование Татьяны Шавриной «Методы обнаружения и исправления опечаток: исторический обзор» [2017] . Вообще, для того чтобы сделать полноценный обзор методов NLP и сфер их применения, вероятно, потребовалось бы как минимум написать отдельную книгу, а возможно, и целую серию книг, поэтому здесь мы остановимся лишь на отдельных задачах и проектах, чтобы показать, как область NLP изменилась под влиянием методов глубокого обучения.
2017
Шаврина Т. О. (2017). Методы обнаружения и исправления опечаток: исторический обзор / Вопросы языкознания. № 4. С. 115—134 // https://doi.org/10.31857/S0373658X0001024-5
6.3.1 Первые диалоговые системы: ELIZA, PARRY и SHRDLU
Хигинс: Как вас зовут?
Цветочница: Элиза Дулитл.
Хигинс (торжественно декламирует):
Элиза, Элизабет, Бетси и Бесс
Удрали за птичьими гнёздами в лес.
Пикеринг: В гнезде там четыре яйца отыскали.
Хигинс: Оставили три, а по штучке забрали.
Оба заливаются хохотом, довольные своим остроумием.
2018
********** Пер. П. Мелкова.
О создании диалоговых систем [dialogue system], или, как их сегодня нередко называют, разговорных агентов [conversational agent], человечество мечтало задолго до появления ЭВМ и изобретения теста Тьюринга.
Английский историк монах XII в. Уильям Мальмсберийский приводит различные слухи, связанные со знаменитым эрудитом прошлого — папой римским Сильвестром II, который, как говорят, путешествовал в Аль-Андалус, где похитил том тайных знаний, от владельца которого смог спастись, лишь прибегнув к помощи демона. Используя знания из области астрологии (sic!), Сильвестр II смог отлить голову статуи, способную давать своему владельцу ответы на вопросы, используя слова «да» и «нет». Благодаря ей, вероятно, он мог знатно потешить себя игрой в данетки.
Французский священник и поэт Готье де Мец в своём произведении «Образ мира», или «Зеркало мира» (L’Image du monde, ок. 1245), приписывает римскому поэту Вергилию, которого в Средние века считали колдуном, создание собственной головы-оракула. В начале XIV в. в одном из популярных анонимных романов о Лисе Ренаре «Ренар Обманщик» (Renard le Contrefait) эта история пересказывается с новыми подробностями. В частности, упоминается, что голова была сделана из латуни.
Впрочем, реальные успехи в деле создания чат-ботов в Средние века были весьма скромными: вплоть до 60-х гг. XX в. их было создано всего ноль штук. Конечно, искусные механики смогли создать некоторое количество устройств, способных имитировать звуки человеческой речи (о них мы поговорим немного позже), но первой системой, способной вести хоть сколь-нибудь внятный диалог, стала ELIZA, созданная в 1964–1966 гг. в лаборатории искусственного интеллекта MIT Джозефом Вейценбаумом.
6.3.1.1 ELIZA
ELIZA, получившая своё имя в честь Элизы Дулитл, героини пьесы Бернарда Шоу «Пигмалион», была основана на сопоставлении реплик собеседника с набором шаблонов. При совпадении слов собеседника с шаблоном программа отвечала репликой, сопоставленной данному шаблону, при этом в ответ могли подставляться фрагменты реплики человека. Таким образом, «интеллект» бота состоял из большого набора правил [rule], составляющих в совокупности так называемый сценарий или скрипт [script], написанный на языке SLIP (реализованном в виде расширения языка MAD).
Самый известный сценарий ELIZA под названием DOCTOR в слегка карикатурной форме имитировал работу психотерапевта, использующего метод клиент-центрированной («роджерсовской») психотерапии. Изобретатель этого метода, Карл Роджерс, был известен тем, что в своих ответах пациентам нередко повторял их собственные слова.
Забавно, что имя, данное чат-боту, оказалось в некоторой степени пророческим (дальше — спойлеры!). В пьесе Шоу лондонский профессор фонетики Генри Хигинс берётся на спор сделать из простой цветочницы Элизы Дулитл настоящую леди, обучив её великосветскому произношению. В процессе обучения девушка приобретает чувство собственного достоинства и покоряет высшее общество. Создатели нескольких экранизаций пьесы, а также Алан Лернер — автор сценария мюзикла «Моя прекрасная леди», написанного по мотивам пьесы, — вопреки желанию самого Шоу, добавили в историю романтический финал, в котором Элиза (после ссоры, которая присутствует и в оригинальном произведении) воссоединяется с профессором. Конечно, Вейценбаум не стал вторым Пигмалионом, влюбившимся в свою Галатею, но многие пользователи программы начали очеловечивать её, приписывая ей наличие человеческих чувств и воспринимая её как живого собеседника.
Человек: Все мужчины одинаковы.
ELIZA: В каком смысле?
Человек: Они постоянно достают нас по разному поводу.
ELIZA: Вы можете вспомнить конкретный пример?
Человек: Ну, мой парень заставил меня прийти сюда.
ELIZA: Ваш парень заставил вас прийти сюда?
Человек: Он говорит, что я подавлена большую часть времени.