Чтение онлайн

ЖАНРЫ

Всё об искусственном интеллекте за 60 минут
Шрифт:

Решение – это поиск. ИИ представляет, что, делая выбор за выбором, он движется по дереву возможностей вниз и выносит суждение: в этот момент, если бы я сделал такой ход, я бы стал ближе к решению? Рассмотрев достаточное количество комбинаций вариантов, ему удается найти правильный путь, а значит, теперь можно принять следующее решение – я положу этот диск туда. После этого ИИ находит новое дерево возможностей, на один шаг дальше, и ищет следующий ход.

Поиск в сочетании с символическим представлением знаний стал стандартным подходом в ИИ. Независимо от того, ищет ли ИИ способ, как выиграть партию в шахматы или го, пытается доказать формулу или планирует маршрут, позволяющий роботу избежать препятствия на пути, он, вероятно, ищет среди тысяч, миллионов, а возможно, и триллионов вариантов. Размер пространства поиска быстро стал ключевым ограничивающим фактором в основанном на поиске символическом ИИ, поэтому было разработано много умных алгоритмов для удаления маловероятных областей «деревьев» или деления большой проблемы на более мелкие задачи. В меньшем пространстве и вариантов для поиска тоже меньше.

Все, что дает нам новые знания, дает нам возможность быть более рациональными.

ГЕРБЕРТ САЙМОН (2000)

Но размер пространства (его комбинаторика) все же оставался проблемой. По иронии судьбы выяснилось, что программы вроде «Универсального решателя задач» непригодны для решения общих задач – пространство возможностей оказывалось слишком большим, что делало поиск невозможным в обозримом временном промежутке. Хотя эти программы могли справиться с проблемой вроде головоломки «Ханойские башни», они пасовали перед сложностями реального мира. Как оказалось, большего успеха можно достичь, если каждый ИИ сосредоточить на определенной задаче. Создайте набор правил о соответствии медицинских симптомов и различных заболеваний. Тогда компьютер сможет задать ряд вопросов, например «вы чувствуете боль?», «это острая боль или тупая?», «где локализуется боль?» и так далее, которые выявят симптомы, и в результате предложить одну или несколько версий вероятных заболеваний.

Подобные версии ИИ известны как экспертные системы, и на какое-то время они стали чрезвычайно популярны (возможно, даже слишком, как вы поняли по предыдущей главе). Хотя у крупных экспертных систем есть проблемы с техническим обслуживанием, они продолжают использоваться в медицине для диагностики, системах поддержки для автомобильных инженеров, системах обнаружения мошенничества и интерактивных сценариях для продавцов.

Хранение знаний

Многие идеи символического ИИ связаны с тем, как лучше всего представлять и использовать информацию. Правила и структурированные фреймы (формы представления знаний) слились с объектно ориентированными языками программирования, и сегодня существует множество способов хранения знаний: например, вкладывание, при котором родительский объект «дерево» содержит дочерние элементы «дуб» и «береза», или передача сообщений, при которой объект «продавец» может отправить аргумент «скидка 10 %», чтобы вызвать действие с объектом «цена». Были созданы языки для представления всех знаний, иногда называемые онтологическими, со своими сложными структурами и правилами. Все они основаны на логике и могут быть объединены с автоматизированными системами формирования рассуждений, для того чтобы логически выводить новые факты, которые затем могут быть добавлены к их знаниям, или проверять соответствие существующих фактов.

Например, ИИ узнал, что «велосипед» – это вид «транспорта с педальным приводом», имеющий «два колеса». Если «тандем» – это вид «транспорта с педальным приводом», который тоже имеет «два колеса», то ИИ легко может вывести новый факт: «тандем – это разновидность велосипеда». Но другой вид «транспорта с педальным приводом», имеющий «ноль колес», не соответствует этому правилу, поэтому ИИ придет к выводу, что «катамаран» не является «велосипедом».

С развитием интернета компилировать обширный набор фактов становится все проще и проще. И одно из основных направлений при разработке общего искусственного интеллекта – это объединение достаточного объема знаний, чтобы ИИ мог начать помогать нам во многих областях. Cyc – один из таких проектов, который в течение нескольких десятилетий собирал факты и взаимосвязи, формируя гигантскую базу.

Уильям Тунсталл-Педо развил эту идею. Он создал True Knowledge («Подлинное знание») – программу, сформировавшую обширную сеть знаний, предоставляемых пользователями интернета. Она насчитывает более 300 миллионов фактов. В 2010 году Тунсталл-Педо решил, поскольку ИИ уже знает так много, задать ему вопрос, на который не сможет ответить ни один человек: «Нам пришло в голову, что, имея дело с более чем 300 миллионами фактов, большой процент которых связывает события, людей и места с определенными точками во времени, мы сможем вычислить объективный ответ на вопрос “Какой день в истории был самым скучным?”».

Программа True Knowledge изучила все дни, о которых знала с начала XX века, и пришла к выводу, что ответ – 11 апреля 1954 года. В этот день, согласно ИИ, состоялись всеобщие выборы в Бельгии, родился турецкий академик Абдулла Аталар и умер футболист Джек Шаффлботэм. Подобных событий оказалось меньше по сравнению со всеми другими днями, поэтому ИИ решил, что это самый скучный день. True Knowledge в конечном итоге стала Evi – ИИ, которому вы можете задать вопросы или просто предложить поговорить. В 2012 году Evi приобрела компания Amazon и превратила ее в Amazon Echo – известный домашний говорящий ИИ.

Символический ИИ развивается вместе с интернетом. В то время как ИИ, такие как Cyc и Evi, полагались на тысячи пользователей, предоставлявших сведения вручную, сэр Тим Бернерс-Ли, создатель Всемирной паутины, давно высказал идею, что WWW (World Wide Web) должна стать GGG (Giant Global Graph) – гигантским глобальным графом [6] данных. То есть помимо того, что веб-сайты стоит делать удобными для пользователей, на них также необходимо хранить данные в форме, понятной компьютерам. Сайты традиционно создавались как документы с текстом, изображениями и видео или как программы со сценариями, которые запускаются при заполнении форм и нажатии кнопок. В мечтах же Бернерса-Ли внутри каждой веб-страницы данные поименованы и имеют уникальные идентификаторы. В семантической паутине веб-сайты становятся базами данных сведений, где каждый элемент является самостоятельным объектом, который может быть найден независимо и имеет четкую текстовую метку или тип. Если вся WWW станет GGG, то наши ИИ смогут искать знания всего мира, рассуждать о них и делать выводы.

6

Граф – структура данных, состоящая из множества вершин и ребер, соединяющих их.

Эта великая мечта о символическом ИИ, к сожалению, не была принята большинством веб-разработчиков – они продолжают размещать огромные объемы данных в интернете в форме, которую ИИ с трудом распознает. Но такая необходимость становится насущной. Было подсчитано, что в 2019 году 80 % новых данных оказались неструктурированными, то есть не были представлены в такой форме, которую могут понять компьютеры, – это текстовые документы, изображения и видео. (Подумайте обо всех электронных письмах и отчетах, которые вы пишете в виде «свободного текста», не разбивая его на разделы. Или о фотографиях и видео, что вы снимаете на телефон, – вы не просматриваете и не обозначаете каждую сцену или элемент в кадре.) В то же время объем данных растет с каждым годом. В 2019 году число пользователей интернета составило 4,4 миллиарда, что на 80 % больше чем пятью годами ранее, и ежедневно отправлялось 293 миллиарда электронных писем. Каждую секунду в Google создавалось 40 000 поисковых запросов и публиковалось 7 800 твитов. Все больше и больше компаний использовали интернет в качестве части своего бизнеса и генерировали огромные объемы данных. В 2016 году в день собиралось 44 миллиарда гигабайт данных. Подсчитано, что к 2025 году в день мы будем генерировать 463 миллиарда гигабайт.

У меня есть мечта… [7] Машины смогут анализировать все данные в сети… сегодняшние механизмы торговли, бюрократии и повседневной жизни будут управляться машинами, разговаривающими с машинами, оставив людям вдохновение и интуицию.

ТИМ БЕРНЕРС-ЛИ (2000)

У нас больше нет выбора: ни один человек не сможет осмыслить эти ошеломляющие объемы данных. Наша единственная надежда – использовать ИИ в качестве помощника. К счастью, об этом речь пойдет в следующих главах, другие формы ИИ теперь способны обрабатывать неструктурированные и немаркированные данные и помечать их особыми метками, давая символическим ИИ то, что им необходимо, чтобы оперировать такими данными. В конце концов, пожалуй, не имеет значения, будет ли это истинный интеллект (сильный ИИ) или своего рода притворный (слабый ИИ). Обработка символьных сетей в соответствии с правилами позволяет нашим компьютерам осмысливать обширную вселенную данных. Так что, возможно, мечта Бернерса-Ли однажды все же станет реальностью.

7

Отсылка к наиболее известной речи Мартина Лютера Кинга I have a dream («У меня есть мечта»).

03. Мы все падаем

Вы учитесь ходить не следуя правилам. Вы учитесь пробуя и падая.

РИЧАРД БРЭНСОН

Мы видим зернистые кадры из фильма. Странный робот, похожий на неустойчивый фотокопировальный аппарат на колесах, с камерой вместо головы, кружит вокруг пространства, занятого большими цветными кубиками и другими простыми фигурами. Слышны мягкие джазовые интонации песни Take Five в исполнении квартета Дейва Брубека. Повествование начинается с пронзительного писка на заднем плане.

Поделиться с друзьями: