Охота на электроовец. Большая книга искусственного интеллекта, Марков Сергей Николаевич

Охота на электроовец. Большая книга искусственного интеллекта

Марков Сергей Николаевич

Шрифт:

Создание систем такого рода открывает перед нейроморфной инженерией новые удивительные перспективы.

5.3.11 Перспективные вычислительные технологии

В эпоху повсеместного торжества микроэлектроники учёные продолжают поиск альтернативных технологий, способных в будущем стать базой вычислительных машин. В качестве одной из возможных замен «классических» устройств рассматриваются машины, в основу которых будут положены эффекты квантовой физики, — так называемые квантовые компьютеры. По мнению учёных, они смогут решать многие вычислительные задачи намного быстрее, чем современные ЭВМ [1713] .

1713

Fedorov A. K., Beloussov S. M. (2021). Quantum computing at the quantum advantage threshold / Unpublished paper.

Базовым строительным кирпичиком квантовых компьютеров являются кубиты (qubit, сокращение от quantum bit — квантовый бит) — «квантовые версии» двоичных регистров. Как и бит, кубит допускает два собственных состояния, обозначаемых — по предложению Поля Дирака — «|0>» и «|1>». При этом, согласно принципам квантовой механики, кубит находится в «суперпозиции»: «A|0> + B|1>», где A и B — это комплексные числа, удовлетворяющие условию A2 + B2 = 1, а при любом измерении состояния кубита он случайным образом с вероятностью A2 переходит в состояние «|0>», а с вероятностью B2 — в состояние «|1>». Кубиты могут пребывать в состоянии «квантовой запутанности» друг с другом, что предполагает наличие между ними некоторой ненаблюдаемой связи, выражающейся в том, что при любом изменении одного кубита остальные изменяются согласованно с ним. Из кубитов можно составлять квантовые логические вентили, позволяющие конструировать сложную вычислительную логику. Также существует расширенная версия кубита с количеством состояний больше двух — кудит (qudit, сокращение от quantum dit — квантовый дит [1714] ) [1715] .

1714

* Дит — единица количества информации, содержащейся в сообщении о данном состоянии системы, имеющей десять равновероятных состояний.

1715

Wang Y., Hu Z., Sanders B. C., Kais S. (2020). Qudits and high-dimensional quantum computing // https://arxiv.org/abs/2008.00959

За последние три десятилетия достижения в области квантовых вычислений стимулировали значительный интерес к этой области со стороны промышленности, инвесторов, средств массовой информации, менеджмента и общества. Создано множество опытных квантовых компьютеров, возможности которых пока существенно ограниченны, однако с их помощью уже получен ряд обнадёживающих результатов [1716] . В последние годы активно исследуются возможности реализации алгоритмов машинного обучения на квантовых компьютерах. Разработаны квантовые реализации как для «классических» методов, таких как линейная регрессия [1717] , [1718] , [1719] , [1720] , деревья решений [1721] , SVM [1722] , [1723] , [1724] , скрытые марковские модели [1725] , [1726] , так и для различных архитектур нейронных сетей: машин Больцмана [1727] , [1728] , [1729] , [1730] , [1731] , [1732] , вариационных автокодировщиков [1733] , свёрточных сетей [1734] , LSTM [1735] , трансформеров [1736] , а также произвольных многослойных перцептронов [1737] , [1738] , [1739] , [1740] , [1741] . Предложены концепции, позволяющие реализовать на квантовых машинах такие парадигмы машинного обучения, как обучение с подкреплением [1742] , генеративно-состязательные сети [1743] , [1744] , [1745] и ансамбли моделей [1746] , [1747] , [1748] .

1716

Fedorov A. K., Beloussov S. M. (2021). Quantum computing at the quantum advantage threshold / Unpublished paper.

1717

Wang G. (2014). Quantum Algorithm for Linear Regression // https://arxiv.org/abs/1402.0660

1718

Schuld M., Sinayskiy I., Petruccione F. (2016). Prediction by linear regression on a quantum computer // https://arxiv.org/abs/1601.07823

1719

Li G., Wang Y., Luo Y., Feng Y. (2019). Quantum Data Fitting Algorithm for Non-sparse Matrices // https://arxiv.org/abs/1907.06949

1720

Dutta S., Suau A., Dutta S., Roy S., Behera B. K., Panigrahi P. K. (2020). Quantum circuit design methodology for multiple linear regression / IET Quantum Communication, Vol. 1, Iss. 2, pp. 55-61 // https://doi.org/10.1049/iet-qtc.2020.0013

1721

Lu S., Braunstein S. L. (2014). Quantum decision tree classifier / Quantum Information Processing, Vol. 13, pp. 757—770 // https://doi.org/10.1007/s11128-013-0687-5

1722

Rebentrost P., Mohseni M., Lloyd S. (2014). Quantum Support Vector Machine for Big Data Classification / Physical Review Letters, Vol. 113, Iss. 13 // https://doi.org/10.1103/PhysRevLett.113.130503

1723

Chatterjee R., Yu T. (2016). Generalized Coherent States, Reproducing Kernels, and Quantum Support Vector Machines // https://arxiv.org/abs/1612.03713

1724

Schuld M., Killoran N. (2018). Quantum machine learning in feature Hilbert spaces // https://arxiv.org/abs/1803.07128

1725

Monras A., Beige A., Wiesner K. (2010). Hidden Quantum Markov Models and non-adaptive read-out of many-body states // https://arxiv.org/abs/1002.2337

1726

Srinivasan S., Gordon G., Boots B. (2017). Learning Hidden Quantum Markov Models // https://arxiv.org/abs/1710.09016

1727

Denil M., de Freitas N. (2011). Toward the Implementation of a Quantum RBM / NIPS 2011 Deep Learning and Unsupervised Feature Learning Workshop // https://www.cs.ubc.ca/~nando/papers/quantumrbm.pdf

1728

Dumoulin V., Goodfellow I. J., Courville A., Bengio Y. (2013). On the Challenges of Physical Implementations of RBMs // https://arxiv.org/abs/1312.5258

1729

Wiebe N., Kapoor A., Svore K. M. (2014). Quantum Deep Learning // https://arxiv.org/abs/1412.3489

1730

Benedetti M., Realpe-Gomez J., Biswas R., Perdomo-Ortiz A. (2015). Estimation of effective temperatures in quantum annealers for sampling applications: A case study with possible applications in deep learning // https://arxiv.org/abs/1510.07611

1731

Amin M. H., Andriyash E., Rolfe J., Kulchytskyy B., Melko R. (2016). Quantum Boltzmann Machine // https://arxiv.org/abs/1601.02036

1732

Anschuetz E. R., Cao Y. (2019). Realizing Quantum Boltzmann Machines Through Eigenstate Thermalization / https://arxiv.org/abs/1903.01359

1733

Khoshaman A., Vinci W., Denis B., Andriyash E., Sadeghi H., Amin M. H. (2018). Quantum variational autoencoder / Quantum Science and Technology, Vol. 4, No. 1 // https://iopscience.iop.org/article/10.1088/2058-9565/aada1f

1734

Cong I., Choi S., Lukin M. D. (2019). Quantum convolutional neural networks / Nature Physics, Vol. 15, pp. 1273—1278 // https://doi.org/10.1038/s41567-019-0648-8

1735

Chen S. E.-C., Yoo S., Fang Y.-L. L. (2020). Quantum Long Short-Term Memory // https://arxiv.org/abs/2009.01783

1736

Di Sipio R. (2021). Toward a Quantum Transformer / Towards Data Science, Jan 10, 2021 // https://towardsdatascience.com/toward-a-quantum-transformer-a51566ed42c2

1737

Kak S. C. (1995). Quantum Neural Computing / Advances in Imaging and Electron Physics, Vol. 94, pp. 259—313 //70147-2

1738

Zak M., Williams C. P. (1998). Quantum Neural Nets / International Journal of Theoretical Physics, Vol. 37, pp. 651—684 // https://doi.org/10.1023/A:1026656110699

1739

Cao Y., Guerreschi G. G., Aspuru-Guzik A. (2017). Quantum Neuron: an elementary building block for machine learning on quantum computers // https://arxiv.org/abs/1711.11240

1740

Wan K. H., Dahlsten O., Kristjansson H., Gardner R., Kim M. S. (2017). Quantum generalisation of feedforward neural networks / npj Quantum Information, Vol. 3 // https://doi.org/10.1038/s41534-017-0032-4

1741

Killoran N., Bromley T. R., Arrazola J. M., Schuld M., Quesada N., Lloyd S. (2018). Continuous-variable quantum neural networks // https://arxiv.org/abs/1806.06871

1742

Stromberg T., Schiansky P., Dunjko V., Friis N., Harris N. C., Hochberg M., Englund D., Wolk S., Briegel H. J., Walther P. (2021). Experimental quantum speed-up in reinforcement learning agents / Nature, Vol. 591, pp. 229—233 // https://doi.org/10.1038/s41586-021-03242-7

1743

Gao X., Zhang Z., Duan L. (2017). An efficient quantum algorithm for generative machine learning // https://arxiv.org/abs/1711.02038

1744

Lloyd S., Weedbrook C. (2018). Quantum generative adversarial learning // https://arxiv.org/abs/1804.09139

1745

Dallaire-Demers P.-L., Killoran N. (2018). Quantum generative adversarial networks // https://arxiv.org/abs/1804.08641

1746

Schuld M., Petruccione F. (2018). Quantum ensembles of quantum classifiers / Scientific Reports, Vol. 8 (2772) // https://doi.org/10.1038/s41598-018-20403-3

1747

Wang X., Ma Y., Hsieh M.-H., Yung M. (2019). Quantum Speedup in Adaptive Boosting of Binary Classification // https://arxiv.org/abs/1902.00869

1748

Arunachalam S., Maity R. (2020). Quantum Boosting // https://arxiv.org/abs/2002.05056

По мере создания квантовых компьютеров, состоящих из достаточно большого числа элементов (кубитов или кудитов), квантовые машины смогут претендовать на роль основной вычислительной платформы для задач машинного обучения. Однако пока их разработка находится на стадии поиска физической основы вычислений, наиболее подходящей для последующего масштабирования. Появление удачной физической платформы может стать началом настоящей революции, которая до неузнаваемости изменит нашу вычислительную технику, а вместе с ней, по всей видимости, и всю индустрию машинного обучения. Обнадёживающие новости приходят и из мира нанофотоники.

В биотехнологических лабораториях учёные из биологических нейронов выращивают органоиды, которые могут стать основой будущих вычислительных устройств на основе технологий wetware [1749] . Исследователи из компании Cortical Labs создали систему Dishbrain, состоящую из находящихся в чашке Петри примерно миллиона человеческих нейронов, которая успешно соперничает с искусственными нейронными сетями при обучении игре в Pong [1750] . Клеточные культуры управляют первыми криповатыми гибротами (гибридными роботами из электроники и живой ткани) [1751] .

1749

Trujillo C. A., Gao R., Negraes P. D., Chaim I. A., Domissy A., Vandenberghe M., Devor A., Yeo G. W., Voytek B., Muotri A. R. (2018). Nested oscillatory dynamics in cortical organoids model early human brain network development // https://www.biorxiv.org/content/10.1101/358622v1

1750

Le Page M. (2021). Human brain cells in a dish learn to play Pong faster than an AI / New Scientist, 17 December 2021 // https://www.newscientist.com/article/2301500-human-brain-cells-in-a-dish-learn-to-play-pong-faster-than-an-ai/

1751

Bakkum D. J., Booth M. C., Brumfield J. R., Chao Z., Madhavan R., Passaro P. A., Rambani K., Shkolnik A. C., Towal R. B. (2004). Hybrots: hybrids of living neurons and robots for studying neural computation / Brain Inspired Cognitive Systems, August 29 — September 1, 2004, University of Stirling, Scotland, UK // http://www.cs.stir.ac.uk/~lss/BICS2004/CD/papers/1094.pdf

Какие-то из этих технологий так и останутся лабораторными игрушками, а каким-то уже совсем скоро предстоит стать новой технологической базой нашего общества.

5.4 Данные

Ещё младенцем, однажды где-то

без спросу взял я с гербом и грифом бумагу;

и в правом верхнем углу цветное

своё, конечно, изображенье наклеил;

а посредине — единым махом,

славянской вязью, китайской тушью —

вписал подряд, как есть, не тая:

свой рост и возраст, и вес и адрес,

и род занятий, и беспартийность, конечно;

к тому прибавил, со строчки красной,

подробный список родных и близких, а как же;

потом немного ещё подумал —

и отпечаток большого пальца

оттиснул в левом нижнем углу;

а в нижнем правом — поставил подпись,

таким уж, видно, смышлёным был я ребёнком…

Михаил Щербаков

Важным и во многом недооценённым фактором, повлиявшим на прогресс технологий машинного обучения, является наличие массивов оцифрованных данных, которые могут быть использованы в качестве обучающих выборок. В датасете MNIST, широко использовавшемся на заре новой коннекционистской весны, содержится 60 000 изображений в обучающей и 10 000 в тестовой выборке. Если при обучении перцептрона Розенблатта вы предъявляли бы ему эти изображения обучающей выборки со скоростью одно в секунду, процесс обучения занял бы почти 17 часов. А ведь это массив, который в наши дни считается «игрушечным». Для сравнения: в базе ImageNet, использовавшейся для обучения и тестирования систем распознавания образов в 2010-е гг., есть 14 197 122 изображения, разбитые на 21 841 категорию. На «скармливание» такого массива перцептрону ушло бы почти полгода. Во времена первой коннекционистской весны не существовало доступной цифровой фотографии, не существовало гигантских библиотек оцифрованных текстов, не было миллионов пользователей социальных сетей, ежедневно выкладывающих в открытый доступ тексты, фотографии и аудиозаписи. Причём данные, доступные в интернете, уже отчасти структурированы и размечены пользователями: посты в социальных сетях содержат метки в виде лайков и тегов, фотографии часто снабжены сопроводительным текстом, профили пользователей содержат информацию о связях с другими профилями, публикации снабжены комментариями, видео на видеосервисах — информацией о количестве просмотров и так далее. Специалистами собраны, размечены и выложены в открытый доступ специализированные датасеты на любой вкус. И наконец, мощным источником данных являются производственные системы автоматизации. Благодаря внедрению вычислительной техники в работу предприятий и учреждений ежедневно собираются и накапливаются структурированные сведения о самых разных формах человеческой деятельности.

Таким образом, затраты на сбор и подготовку данных для многих задач машинного обучения сократились за несколько десятилетий многократно, причём темпы накопления человечеством цифровых данных в наши дни напоминают экспоненту.

В ноябре 2018 г. компания IDC при спонсорской поддержке Seagate провела исследование динамики объёма «цифровой вселенной» и пришла к выводу, что к 2025 г. человечество накопит 175 зеттабайт данных (по сравнению с 33 зеттабайтами в 2018 г.) [1752] . Вдумайтесь только: один зеттабайт равен одному триллиону гигабайт. Если бы мы могли записать всю эту информацию на DVD-диски с максимальной плотностью записи (17,08 Гб), то получили бы более 10 трлн дисков, а сложив эти диски вместе, мы получили бы стопку высотой более 12 млн километров, что примерно в 30 раз больше расстояния от Земли до Луны.

1752

Reinsel D., Gantz J., Rydning J. (2018). Data Age 2025: The Digitization of the World From Edge to Core. An IDC White Paper — #US44413318, Sponsored by Seagate // https://www.seagate.com/www-content/our-story/trends/files/idc-seagate-dataage-whitepaper.pdf

Таким образом, по оценке IDC, «датасфера» человечества в течение следующих пяти лет будет удваиваться приблизительно каждые три года, а за год увеличиваться примерно в 1,27 раза. Интересно посмотреть на прогнозы IDC в ретроспективе. Доклад 2012 г. прогнозировал, что к 2020 г. количество накопленных данных достигнет 40 зеттабайт [1753] . Похоже, мы опередили этот план чуть больше чем на год.

Не только количество, но и качество в данном случае имеет значение. Расширение области применения алгоритмов машинного обучения создало целую сопутствующую индустрию по разметке данных. В рассказе о механическом турке фон Кемпелена мы уже упоминали платформу Amazon Mechanical Turk (MTurk), созданную для коллективной обработки данных. Идея этого сервиса впервые появилась в патентной заявке предпринимателя Венки Харинараяна, поданной им в США в 2001 г. [1754] Идея заключалась в том, чтобы не просто привлечь людей к разметке данных в целях последующей автоматизации, а чтобы временно сделать людей частью производственных процессов по обработке данных там, где машины пока ещё не могут работать эффективнее, чем люди. В Amazon был придуман специальный термин для такого применения человеческого труда — «искусственный искусственный интеллект» (artificial artificial intelligence).

1753

Gantz J., Reinsel D. (2012). IDC Digital Universe Study: Big Data, Bigger Digital Shadows and Biggest Growth in the Far East // https://www.whizpr.be/upload/medialab/21/company/Media_Presentation_2012_DigiUniverseFINAL1.pdf

1754

См. патент «Hybrid machine/human computing arrangement». 2001-03-19 .

MTurk была официально запущена 2 ноября 2005 г. К середине ноября 2005 г. в системе было создано несколько десятков тысяч задач (на MTurk для них используется термин HIT — human intelligence task, задача для человеческого интеллекта), заказчиком которых была сама Amazon. К числу типичных заданий на MTurk относятся расшифровка (например, аудиозаписей), оценка (например, качества изображений), расстановка тегов (например, для видеороликов), заполнение опросов, написание текстов и так далее. В 2007 г. владельцы сервиса сообщали, что всего на платформе зарегистрировано 100 000 работников из более чем 100 стран мира, а в 2011 г. — уже 500 000 работников из более чем 190 стран.

В 2014 г. в России компания «Яндекс» создала собственный, популярный ныне сервис разметки «Яндекс.Толока» [1755] . Сегодня у нас в стране и за рубежом создан целый ряд сходных платформ. Одни из них делают упор на геймификацию процесса, другие в качестве конкурентных преимуществ заявляют наличие разметчиков, обладающих специализированными знаниями или сертификатами, третьи создаются крупными компаниями для разметки данных, которые не могут по какой-либо причине передаваться сторонним подрядчикам. К разметке данных, помимо сотрудников компаний и фрилансеров, привлекают даже заключённых и должников банков.

1755

* Словом «толoка» в России в прошлом называли форму деревенской взаимопомощи, толоку организовывали для выполнения срочных работ, требующих объединения усилий большого количества работников: сооружения дома или постройки дороги, вырубки леса и так далее.

1-128 129 130 131 132 133 134 135 136 137 138 139 140 141 142-292

Поделиться с друзьями:

Чтение онлайн

КНИГИ

АВТОРЫ

ЖАНРЫ

Деловая литература

Детективы

Детские

Документальная литература

Дом и Семья

Драматургия

Жанр не определен

Компьютеры и Интернет

Любовные романы

Научно-образовательная

Поэзия

Приключения

Проза

Прочее

Религия и эзотерика

Справочная литература

Старинная литература

Техника

Фантастика

Фольклор

Юмор

Охота на электроовец. Большая книга искусственного интеллекта

Марков Сергей Николаевич

Шрифт: