Душа машины. Радикальный поворот к человекоподобию систем искусственного интеллекта
Шрифт:
В то время на сайте компании ежемесячно появлялось около миллиона уникальных поисковых запросов. Поисковая система должна была сопоставить эти запросы с более чем 100 000 позиций в каталоге [26] . Генетические алгоритмы моделируют процесс естественного отбора – по Дарвину. Система Zappos, например, создает алгоритмы, которые определяют смысл поисковой фразы.
Один алгоритм рассматривает в определенной фразе как сильный сигнал слово «платье». Конкурирующий алгоритм в этом же запросе уделяет больше внимания другим словам. «Тест на релевантность», имитирующий поведение пользователей, вознаграждает победителя и передает его черты следующему поколению. Алгоритм, который лучше всех справился с поставленной задачей, и начинает работать на сайте, пока его не заменят более эффективным. Таким образом, поисковая система постоянно совершенствуется.
26
Jared Council, “At Zappos, Algorithms Teach Themselves,” Wall Street Journal, July 8, 2019, https://www.wsj.com/articles/at-Zappos-lgorithms-teach-themselves-11562578200.
Менее чем через год использования технологии генетических алгоритмов компания обнаружила, что клиенты быстрее совершают покупки и применяют меньше фильтров: покупателям не приходится постоянно переформулировать запросы для уточнения поиска. По словам Амина Казеруни, ведущего специалиста по обработке данных в Zappos, «в конце концов, это не постоянные расходы: подключил – и работает» [27] .
Люди регулярно и часто без особых усилий перебирают вероятности и, даже имея относительно небольшой опыт, действуют в соответствии с наиболее возможными из них. Сейчас специалисты обучают машины подражать рассуждениям с помощью вероятностных моделей, основанных на гауссовских процессах; такие модели позволяют действовать в условиях значительной неопределенности, работают с разреженными данными и обучаются на опыте.
27
Hilary Milnes, “How Zappos Used AI to Rebuild its Search Engine,” Modern Retail, August 2, 2019, 2019, https://www.modernretail.co/retailers/how-Zappos-used-ai-to-rebuild-its-search-engine.
Около десяти лет назад компания Alphabet, материнская компания Google, запустила в регионах мира, слабо охваченных интернетом, проект Loon. Это было сделано с помощью системы гигантских аэростатов, размещенных в стратосфере [28] . Их навигационные системы использовали гауссовские процессы для определения траектории оптимального движения среди разных слоев порывистых и изменчивых воздушных потоков. Каждый шар перемещался в воздушный поток нужного направления, таким образом из аэростатов формировалась большая коммуникационная сеть.
28
Cade Metz, “Machine Learning Invades the Real World on Internet Balloons,” Wired, February 17, 2017, https://www.wired.com/2017/02/machine-learning-drifting-real-world-internet-balloons/.
Воздушные шары могли не только делать достаточно точные прогнозы на основе прошлых полетов, но и анализировать новые данные прямо в воздухе, корректируя с их учетом свежие прогнозы.
Компания Alphabet завершила эксперимент в начале 2021 года, однако использование гауссовских процессов имеет большие перспективы. Стартап Secondmind разработал продукт Decision Engine, основанный на вероятностном моделировании с помощью гауссовских процессов. С помощью этой платформы японский автоконцерн Mazda смог улучшить настройку двигателя, используя в тысячу раз меньше данных, чем требуется обычным современным системам [29] .
29
Tony Quested, “Great Decision as Secondmind Blooms from PROWLER.io”, BusinessWeekly, September 29, 2020, https://www.businessweekly.co.uk/news/hi-tech/great-decision-secondmind-blooms-prowlerio.
Некоторые эксперты считают, что использование гауссовских процессов для работы с небольшими объемами данных может ускорить создание автономного искусственного интеллекта. «Чтобы создать действительно независимое средство, нужно научить его очень быстро адаптироваться к меняющимся внешним условиям, – говорит Вишал Чатрат, генеральный директор стартапа Secondmind, занимающегося искусственным интеллектом. – То есть обучаться, эффективно используя данные» [30] .
30
Cade Metz, “AI Is about to Learn More Like Humans – with a Little Uncertainty”, Wired, February 3, 2017, https://www.wired.com/2017/02ai-learn-like-humans-little-uncertainty/.
Гауссовские процессы не требуют огромного количества данных для распознавания закономерностей. Вычисления, необходимые для выводов и обучения, относительно просты, а если что-то пойдет не так, причину этого можно будет отследить, чего не скажешь о черных ящиках нейросетей.
Искусственный интеллект хорошо умеет выявлять взаимосвязи и делать на их основе ценные прогнозы. Например, компания GNS Healthcare из Кембриджа, занимающаяся точной (персонализированной) медициной, использует алгоритмы причинно-следственных связей, чтобы помочь крупнейшим фармацевтическим компаниям мира понять не только кто именно из пациентов реагирует на те или иные препараты, но и почему.
Используя байесовские методы, их программная платформа переводит данные в каузальные (причинные) модели. Это позволяет определить, какие переменные в наборе данных оказывают максимальное влияние на другие переменные, улучшить качество проверки лекарственных препаратов, ускорить их апробацию и лучше спрогнозировать риски для пациентов.
В одном из исследований компания GNS совместно с Альянсом клинических испытаний в онкологии поставила задачу определить предикторы (прогностические параметры) для группы пациентов с метастатическим колоректальным раком (мКРР) [31] . Это один из самых распространенных видов рака в США: ежегодно диагностируется около 140 000 новых случаев.
31
Rahul K. Das et al., “Bayesian Machine Learning on CALGB/SWOG 80405 (Alliance) and PEAK Data Identifies Heterogeneous Landscape of Clinical Predictors of Overall Survival (OS) in Different Populations of Metastatic Colorectal Cancer (mCRC)”, GNS Healthcare, July 4, 2019, https://info.gnshealthcare.com/hubfs/Publications2019/ESMOGIFinalPosterPrintedPD20.pdf.
В исследовании использовалась платформа на основе ИИ, учитывающего причинно-следственные связи; с ее помощью был проведен анализ клинических данных более чем 2000 пациентов с мКРР. Исследователи хотели выявить биомаркеры пациентов на разные лекарственные препараты и предикторы общей выживаемости среди определенных подгрупп пациентов.
«Мы никогда не были в лучшем положении, чтобы разгадать движущие силы заболевания и реакции пациентов на конкретные препараты, – говорит Колин Хилл, председатель совета директоров, генеральный директор и соучредитель GNS. – Мы создали компьютерную модель пациента с колоректальным раком и смогли обнаружить биомаркеры, показывающие, какие пациенты будут реагировать на то или иное лечение и, самое главное, почему. Именно это приведет нас к созданию персонализированной медицины и позволит искоренить болезнь» [32] .
32
“GNS Healthcare Chosen to Present Discovery of New Clinical Predictors of Overall Survival in Metastatic Colorectal Cancer at ESMO 2019 in Collaboration with the Alliance for Clinical Trials in Oncology,” GNS Healthcare, July 2, 2019, https://www.gnshealthcare.com/discovery-of-ew-clinical-predictors-of-overall-survival/.
Ежедневно на YouTube загружается около 720 000 часов [33] видео, которое необходимо обработать для рекламных рейтингов и выдачи в рекомендациях пользователям. В медицинских учреждениях терабайты видеозаписей должны использоваться только на локальных устройствах, чтобы не нарушать конфиденциальность пациентов. В «умных» городах огромный объем записи камер видеонаблюдения иногда надо проанализировать очень быстро, чтобы предотвратить угрозу потенциально опасных или преступных действий.
33
Maryam Mohsin, “10 YouTube Stats Every Marketer Should Know in 2021,” Oberlo, January 25, 2021, https://www.oberlo.com/blog/youtube-statistics.
Все эти задачи требуют точного и эффективного понимания происходящего на каждой конкретной видеозаписи. Но распознавание видео (в отличие от распознавания статичных изображений) требует временного моделирования – способности понимать и предугадывать последовательность действий. Как и другие разновидности искусственного интеллекта, основанные на глубоком обучении, видеоприложения обычно нуждаются в огромных и дорогих вычислительных мощностях, без которых просто не работают.
Однако недавно в лаборатории MIT-IBM Watson AI Lab разработали новую методику обучения систем распознавания видео, обеспечивающую высокую точность при сокращении вычислительных затрат [34] . Исследователям удалось обучить систему выдавать результат втрое быстрее, чем если бы они использовали другие современные методики.
34
Ji Lin, Chuang Gan, and Song Han, “TSM: Temporal Shift Module for Efficient Video Understanding,” arXiv, August 22, 2019, https://arxiv.org/pdf/1811.08383.pdf.
Конец ознакомительного фрагмента.