ЖАНРЫ

Охота на электроовец. Большая книга искусственного интеллекта
Шрифт:

Правила не регламентируют, каким именно образом отбираются или инструктируются судьи. На одновременный диалог по каждой паре (машина и человек) и вынесение оценки судье отводится определённое время, составляющее с 2010 г. 25 минут. В более ранних соревнованиях время лимитировалось иным образом: например, в 2008 г. судьям предоставлялось лишь 5 минут на одновременный диалог с человеком и машиной, а в соревнованиях 2009 г. судьям отводилось по 5 минут на последовательный диалог с каждым из двух испытуемых и ещё 10 минут на изучение ответов и вынесение оценки [2238] , [2239] , [2240] , [2241] , [2242] , [2243] , [2244] .

2238

Loebner Prize 2004 Rules (2004) // https://web.archive.org/web/20130616214306/http://www.loebner.net/Prizef/2004_Contest/2004Rules.html

2239

Loebner Prize 2005 $3000 and a Bronze Medal (2005) // https://web.archive.org/web/20050519085947/http://www.loebner.net/Prizef/2005_Contest/2005_Rules.txt

2240

2006 Loebner Prize competition will be held Sunday, 17 September 2006 at Torrington Theater, University College, London (2006) // https://web.archive.org/web/20081119161913/http://www.loebner.net/Prizef/2006_Contest/2006_Rules.txt

2241

Rules for Loebner Prize 2007 (2007) // https://web.archive.org/web/20120219114233/http://www.loebner.net/Prizef/2007_Contest/Rules.html

2242

Loebner Prize 2009 US$3000 and a Bronze Annual Medal (2009) // https://web.archive.org/web/20120708013756/http://loebner.net/Prizef/LP_2009.html

2243

Loebner Prize for Artificial Intelligence “The First Turing Test” 2010 Competition (2010) // https://web.archive.org/web/20120712005759/http://www.loebner.net/Prizef/2010_Contest/Loebner_Prize_Rules_2010.html

2244

Warwick K., Shah H. (2016). Turing’s Imitation Game. Conversations with the Unknown. Cambridge Univesity Press // https://www.google.ru/books?id=nMbxDAAAQBAJ

В принципе, при достаточной неразборчивости «прохождением теста Тьюринга» можно объявить всё что угодно. Например, в 2005 г. текст под заголовком Rooter: A Methodology for the Typical Unification of Access Points and Redundancy, чуть больше чем полностью состоящий из псевдонаучной белиберды, сгенерированной программой SCIgen, был принят в качестве нерецензируемого документа на Всемирную мультиконференцию 2005 г. по систематике, кибернетике и информатике (WMSCI), и авторам было предложено выступить на самой конференции [2245] .

2245

Kelly-Bootle S. (2005). Call That Gibberish?: Detecting the real from the fake is getting harder / Queue, July 2005 // https://doi.org/10.1145/1080862.1080884

Известный российский биоинформатик Михаил Гельфанд перевёл этот текст на русский язык (используя в качестве помощника систему машинного перевода «ЭТАП-3») и разослал его в целый ряд периодических изданий из списка Высшей аттестационной комиссии (ВАК). В итоге «Журнал научных публикаций аспирантов и докторантов» принял к публикации прекрасную статью под названием «Корчеватель: алгоритм типичной унификации точек доступа и избыточности», в которой отношение сигнал/шум измерялось в нанометрах, а время — в цилиндрах [2246] . Чем вам не «прохождение теста Тьюринга»? Как тебе такое, Илон Маск?

2246

Якутенко И. (2009). Слегка упорядоченные размышления о науке, религии и чайниках. Михаил Гельфанд о «Корчевателях», креационизме и ситуации в российской науке / Lenta.ru, 18 июня 2009 // https://lenta.ru/articles/2009/06/18/gelfand/

Многие учёные изначально относились к лёбнеровским и другим подобным соревнованиям с изрядной долей скепсиса. Лимит времени существенно ограничивает возможности судей, которые вдобавок часто не являются экспертами. Используемые ботами остроумные фразы-заготовки могут легко ввести в заблуждение непрофессионала, не замечающего главного — собеседник не сотрудничает, что в тесте Тьюринга может означать только одно: перед вами бот.

В 1995 г., под впечатлением от лёбнеровских соревнований первых лет, Марвин Минский даже предложил премию любому, кто сможет остановить их дальнейшее проведение [2247] . На что Лёбнер резонно заметил, что это предложение делает Минского в некотором роде соспонсором премии [2248] .

2247

Minsky M. (1995). Annual Minsky Loebner Prize Revocation Prize 1995 Announcement / comp.ai, comp.ai.philosophy, 3 Mar 1995 // http://science.slc.edu/~jmarshall/courses/spring/2009/artificial-minds/notes/week08/minsky_prize.pdf

2248

Home Page of The Loebner Prize--“The First Turing Test” (2001) // http://www.thocp.net/reference/artificial_intelligence/Loebner%20Prize%20Home%20Page.htm

Большая часть соревнований чат-ботов (и самих чат-ботов) ориентирована на английский язык, однако интересные проекты существуют и для русского языка.

Чат-бот «Соня Гусева», в соответствии с идеями «Жени Густмана» притворяющийся четырнадцатилетней девочкой, обхитрил семерых из пятнадцати экспертов и занял первое место в конкурсе «Тест Тьюринга на русском языке» на Startup Village 2015 в Сколково, организованном компанией «Наносемантика». В соревновании участвовало 69 команд создателей ботов. «Соня Гусева» с большим отрывом обошла серебряного и бронзового призёров: «Сократа» и «Лиску Лисичкину», которые смогли ввести в заблуждение 24 и 19% от общего числа экспертов соответственно (против 47% у «Сони») [2249] . Создатель бота, выпускник Университета ИТМО Иван Голубев, позже стал руководителем проектов компании Just AI — создателя одноимённой платформы для разработки чат-ботов и одного из лидеров российского рынка диалоговых систем.

2249

Пушкаш А. (2015). Чатбот выпускника Университета ИТМО стал лучшим в конкурсе «Тест Тьюринга» / ITMO.NEWS, 24 Июня 2015 // https://news.itmo.ru/ru/archive/archive2/news/4916/

6.3.4.2 Смысл теста Тьюринга

Наблюдая за публичными рассуждениями журналистов и публики о тесте Тьюринга и об успехах современных чат-ботов, хочется обратиться к истинному смыслу этой процедуры, вложенному в неё автором. Тест Тьюринга нужно рассматривать в контексте других его идей и исследований. Одной из важных концепций, созданных Тьюрингом, стала концепция эквивалентности двух машин (также называемая «слабой эквивалентностью» [weak equivalence]): если машина A может эмулировать работу машины B, а машина B может эмулировать работу машины A, то эти машины являются эквивалентными (или, как принято говорить сегодня, тьюринг-эквивалентными). Идея «игры в имитацию» заключается в том, что машина обладает интеллектом в том случае, если она может эмулировать естественный интеллект [2250] . Принципиальная возможность такой эмуляции называется тезисом о симуляции [Simulation thesis], этот тезис является более сильной версией тезиса Чёрча — Тьюринга [2251] . Ввиду этого тест Тьюринга в действительности имеет весьма опосредованное отношение к чат-ботам: естественный язык в нём используется лишь потому, что он является символьной системой, при помощи которой может быть сформулировано условие интеллектуальной задачи. Вообще, при помощи естественного языка можно сформулировать условие любой «эффективно вычислимой» задачи, ведь при помощи естественного языка можно описать формализм машины Тьюринга или лямбда-исчисление Чёрча.

2250

Dawson M. R. W. (2013). Weak Equivalence and the Turing Test / Dawson M. R. W. (2013). Mind, Body, World: Foundations of Cognitive Science. Athabasca University Press // https://books.google.ru/books?id=l8D0llrudVMC

2251

Copeland B. J. (2017) The Church-Turing Thesis / Stanford Encyclopedia of Philosophy // https://plato.stanford.edu/entries/church-turing/#SimuThes

Таким образом, в тесте Тьюринга проверяется не способность интеллектуального агента давать разумные ответы на бытовые вопросы, а его способность решать интеллектуальные задачи: «Какая последняя буква в слове „вечность“?», «Напиши имя лучшего друга крокодила Гены задом наперёд», «Отсортируй вот эти числа по убыванию: 1 1 2 3 5 8 13 21», «Назови синоним слова „воздушный“», «Сочини стишок с рифмой „розы — морозы“», «Реши анаграмму: аалтерк», «Скажи, на какой предмет это похоже: -O-O-» и так далее. На все эти и подобные им вопросы должен уметь отвечать универсальный ИИ, ведь ответы на них сможет дать практически любой человек, заинтересованный в том, чтобы помочь судье понять, кто из участников является человеком, а кто нет.

Надо заметить, что в обычном разговоре мы редко задаём другим (тем более незнакомым) людям подобные вопросы: мешают правила приличия, боязнь ненароком обидеть собеседника либо показаться дураком в его глазах. Эту уязвимость людей в обычном общении могут использовать мошенники, в том числе «высокотехнологичные», применяющие чат-боты в качестве инструментов своего жульничества. В этом случае чат-боты могут успешно выпрашивать у людей деньги (например, на якобы благотворительные цели), персональные данные, CVV- и пин-коды от банковских карточек, обнажённые фото и бог знает что ещё. Такие «успехи» чат-ботов в рассуждениях дилетантов нередко используются в качестве аргументов в пользу мифа о том, что тест Тьюринга уже пройден машинами. Нередко из этого делается вывод о том, что тест Тьюринга устарел, «сломан», что его нужно заменить на какую-либо другую процедуру, дополнить или радикально переформулировать. Нельзя сказать, что изначальные формулировки теста лишены недостатков, однако нередко его «улучшатели» не в полной мере понимают суть идеи Тьюринга: его тест — это не тест на способность обманывать кого-либо, а тест на способность системы ИИ выполнять все задачи, подвластные человеческому разуму.

6.3.4.3 Прогресс диалоговых систем и применяемые подходы

Впрочем, безотносительно теста Тьюринга прогресс в области диалоговых систем в последнее десятилетие весьма впечатляет. Eugene Goostman, как и другие боты из числа победителей и призёров соревнований (Tutor, Mitsuku, Rose, Uberbot, Arckon, Colombina и т. д.), являются удивительными образцами искусства программирования, демонстрирующими как достижения современных технологий, так и незаурядные таланты их создателей. Лучшие системы на сегодняшний день способны в ходе пятиминутного диалога уверенно обвести вокруг пальца как минимум треть неподготовленных судей, что, вне всяких сомнений, является выдающимся результатом.

Разработкой разговорных агентов в нашей стране сегодня занято множество профессиональных коллективов. Благодаря их усилиям на свет появилось большое количество продвинутых платформ и библиотек для разработки систем для автоматизированных коммуникаций. Это и «Алиса» от Яндекса, и DeepPavlov — открытая библиотека для создания диалоговых систем, разработанная лабораторией нейронных систем и глубокого обучения МФТИ, и NLP-платформа Сбербанка, включающая сегодня робота-оператора от дочерней компании банка ООО «АБК», и диалоговые платформы от «Центра речевых технологий», mail.ru, Тинькофф Банка, Dasha.AI и других команд опытных исследователей и разработчиков.

В последние годы мы наблюдаем настоящий бум в области диалоговых систем. Роботы осуществляют всё большее количество голосовых коммуникаций с клиентами компаний, а технологические гиганты уверены в том, что голосовые помощники могут стать новым способом «переизобрести» интернет (предыдущими были поисковые системы и социальные сети, радикально изменившие широко распространённые практики использования ресурсов сети). Чат-бот может быть источником полезной информации, помощником в выполнении какой-нибудь задачи и даже собутыльником. Можно долго рассуждать о причинах нынешнего бума, я назову лишь наиболее, на мой взгляд, важные. Прогресс в области распознавания и синтеза речи позволил диалоговым системам освоить голосовой канал коммуникаций, и в то же время, благодаря развитию мессенджеров и социальных сетей значительно выросла популярность текстового канала. Люди стали активно использовать мобильные устройства коммуникации, что вкупе с ростом доступности доступа в интернет привело к тому, что сегодня они проводят онлайн гораздо больше времени, чем раньше. Всё это привело к росту числа онлайн-сервисов, начиная от площадок для онлайн-торговли, сервисов бронирования авиабилетов и гостиниц и заканчивая платформами госуслуг и дистанционной медицины. Развитие этих сервисов повысило спрос на соответствующие технологии автоматизации, в том числе автоматизации диалоговых взаимодействий. Не последнюю роль здесь сыграл и прогресс в области обработки естественного языка, позволивший разрабатывать системы, создание которых в прошлом было или просто невозможно, или связано с неприемлемыми издержками. При этом некоторые методы, применяемые в наши дни создателями диалоговых систем, были изобретены ещё во времена Элизы и Перри. Поэтому типичный чат-бот в наши дни чем-то напоминает монстра Франкенштейна — причудливый конгломерат коннекционистских и традиционных (GOFAI) методов, примотанных друг к другу программными аналогами синей изоленты. Он способен худо-бедно решать стоящие перед ним задачи, но не отличается особым изяществом архитектуры и грациозностью действий. Давайте разберём некоторые подходы и методы, которые применяются при создании диалоговых систем, и попробуем разобраться, какие принципиальные инновации появились в этой области в последние годы. В зависимости от способа получения реплик все диалоговые модели теоретически подразделяются на генеративные [generative] и основанные на поиске [retrieval-based].

Поделиться с друзьями: