Технологии будущего против криминала
Шрифт:
Работы ведутся совместно с Лабораторией искусственного интеллекта корпорации Google выработали инженерное определение искусственного интеллекта, о котором говорилось в предыдущей главе. Именно оно будет положено в разработку концепции архитектуры и перечня программных решений для N4G.
Особое внимание ФБР уделяет скачкообразному увеличению быстродействия компьютеров. От многих из нас укрылось определяющее обстоятельство. Выигрыш компьютеров в Го у человека был осуществлен не просто компьютером Google, а программно-аппаратным комплексом, где за программу отвечали алгоритмисты Google, а железо сделала канадская компания, недавно купленная Google – Google Deep Mind. Deep Mind – это единственная сегодня компания в мире, которой удалось создать действующий квазиквантовый компьютер. Квази потому, что значительная часть вычислений осуществляется в рамках традиционного кремниевого электромеханического компьютера, и лишь некоторые выполняет квантовый компонент. Но даже в таком виде обеспечивается на порядки более высокая скорость, чем у современных кремниевых суперкомпьютеров. Чем выше скорость, тем проще осуществлять глубокое обучение методом проб и ошибок.
Двусторонние и многосторонние встречи, открытые конференции и совещания за закрытыми дверями позволили определить основные направления использования искусственного интеллекта и его элементов в работе ФБР и полиции штатов. Эти направления нашли отражение в концепции N4G. В число основных направлений включаются:
1. Использование в аналитико-ситуационных центрах в офисах ФБР на местах и аналогичных офисах полиции штатов программно-аппаратной среды с единой интегральной обработкой файлов различной размерности и формы представления, включая текстовые, табличные, аудио, видео, сигналы от датчиков, банковские транзакции, показания локации и т.п.
До конца 2017 г. минимум в пяти полицейских управлениях на уровне штатов и в двух отделах ФБР будут запущены подобные пилотные ситуационные центры.
2. В настоящее время ФБР и полиция подвергается частично оправданной критике за хранение избыточной информации об американцах. Например, в 2016 г., в Конгрессе США рассматривался доклад Центра по конфиденциальности и технологиям университета Джорджтауна. В ходе дискуссий по докладу выяснилось, что в настоящее время в базе данных ФБР и полиции содержатся биометрические данные на 130 млн. американцев, т.е. более половины взрослого населения страны. В ходе обмена мнениями стороны согласились, что порядка 35 млн. единиц хранения являются избыточными, поскольку эти люди никогда не совершали противоправных поступков, не имели связей и отношений с террористами и преступниками, а также не совершали предосудительных поступков в общественном плане. На этом совещании представитель ФБР был вынужден признать, что в базе не оказалось примерно полутора миллиона единиц хранения биометрических данных американцев, впервые совершивших преступления в период 2010-2015 гг. (Полные профили, включающие до 50 параметров содержатся на 12 млн. американцев. В то же время на 130 млн. американцев в базе ФБР содержатся фотографии, голосовые данные и т.п. Они не считаются полным профилем и не составляют индивидуальный идентификационный файл гражданина).
Данная ситуация сложилась не из-за злого умысла или стремления ФБР играть роль Большого брата, а из-за способа ввода биометрических данных и особенностей их хранения. На сегодняшний день Информационный центр ФБР и локальные информационные центры полиции штатов вводят биометрические данные вручную в соответствии с решениями, применяемыми людьми. Кроме того, хотя ФБР и использует наиболее современные на сегодняшний день технические средства, они предусматривают отдельное хранение и обработку биометрических данных.
Для преодоления этих недостатков с 2015 г. Центр ФБР совместно с MTI и Google ведет работу по созданию рекуррентной базы данных. По прикидкам в течение 2017 г. база будет запущена в опытную эксплуатацию. Ее принципиальное отличие отныне существующих баз данных состоит в трех обстоятельствах. Не человек, а машина будет принимать решение о появлении того или иного профиля в базе данных. Грубо говоря, предусматривается система, в корне отличающаяся от ныне принятого порядка. Сейчас соответствующие руководители полиции, агенты ФБР принимают решения о заведении файлов на того или иного человека. Как показывает практика, эти решения часто бывают ошибочны и субъективны. В новой систем предполагается обеспечивать ее нефильтрованными потоками информации. Фильтровать, а соответственно, определять необходимость заведения профилей, будет сама система. В систему встраивается модуль глубоко обучаемых нейронных сетей. Данный модуль будет отвечать за своевременное исключение профилей и параметров лиц, которые по критериям базы попали в нее, но в течение определенного времени не вызвали интереса со стороны ФБР или полиции штатов. Наконец, данная система, в отличие от ныне применяемых, будет способна взаимодействовать с конечными пользователями на естественном языке и с использованием визуальных средств.
3. Как уже отмечалось, одним из наиболее угрожаемых с точки зрения динамики организованной преступности секторов экономической жизни страны, являются небанковские платежные системы. По согласованию с наиболее динамичными платежными системами Stripe и Wise, ФБР организовало частно-государственное партнерство по созданию и эксплуатации платформы по обнаружению мошенничеств и взломов платежных систем. Данная система будет открыта для всех лицензированных платежных систем. Предусматривается, что они будут выделять на содержание системы ежегодный взнос в зависимости от объема транзакций и уровня сертификата информационной защиты, присвоенного платежной системе. Производителем системы в результате тендера выбрана компания Palantir. В 2017 г. она должна запустить платформу POLPAY.
4. В 2017 г., используя платформу контекстного интеллекта Nigel, предусматривается создать безбумажный офис агента ФБР или полицейского участка. Поскольку система Nigel в отличие от других способна не только к семантическому анализу (распознаванию объектов по различным онтологиям. Онтологии могут быть различны – свойства, отношения, функции, человек, юридическое лицо, предмет и т.п.), но и к контекстному распознаванию ситуации (ситуации могут быть одинаковы по онтологиям, но различными по смыслу. Например, в двух ситуациях участвуют одни и те же персонажи – женщина, мужчина и ребенок. Контекст ситуации может быть различен. В одном случае это может быть счастливая семья. В другом – бывшие супруги, делящие ребенка. Сейчас ни одна система кроме Nigel не способна распознавать ситуацию), она будет давать экспертные советы правоохранителям, привязанные к уникальной конкретной обстановке.
5. Использование искусственного интеллекта для экономии бюджета ФБР и полиции штатов. В настоящее время почти четверть работников, проходящих как занятые в полиции штатов, на которых приходится чуть больше 15% фонда заработной платы, заняты различного рода рутинными операциями, имеющими общепрофессиональный характер. Речь идет о многочисленных секретарях, юрисконсультах, фотографах и т.п. ФБР в рамках программы сокращения бюджета федеральных органов власти за счет роботизации, в течение 2017-2020 гг. будет последовательно заменять юрисконсультов и секретарей роботизированными устройствами. В настоящее время для ФБР на 2020 г. установлен норматив сокращения не менее 10% вспомогательного персонала, не связанного с выполнением оперативно-розыскных, следовательских и других полицейских функций, а также работой в лабораториях.
6. Начиная с 2017 г. ФБР совместно с компанией For All Secure и университетом штата Пенсильвания преступило к разработке системы искусственного интеллекта Mayhem – первой в мире системы искусственного интеллекта, основными функциями которой являются распознавание индивидуального почерка хакеров и хакерских группировок, а также обнаружение атак активного тестирования и преследование хакеров в их ходе, вплоть до установления их локации.
ФБР и исследователям Пенсильванского университета удалось установить, что методы комбинаторики позволяют системам искусственного интеллекта распознавать в доли секунды некоторые особенности вредоносного софта, а также архитектуры атак, которые укрываются из-за недостатка времени от высококвалифицированного персонала служб информационной безопасности.
Есть основания полагать, что данная система является подлинным прорывом и может обеспечить долгожданный перелом в состязании информационных меча и щита.
Как отмечают исследователи «Больших данных», сам термин «Большие данные» (Big Data) не имеет общепринятого определения даже в индустрии информационных технологий. Наиболее распространенным является раскрытие феномена «Больших данных» через указание проблем, с которыми приходится сталкиваться на современном этапе развития технологий при обработке информации. Исходя из этого «Большие данные» определяются посредством указания следующих основных характеристик: 1) большого объема, 2) разнообразия данных и 3) высокой скорости их изменения.
Согласно указанному подходу, помимо собственно обработки больших объемов данных проблема, решаемая посредством Big Data, состоит также и в том, что большая часть потенциально ценной информации представлена в неструктурированном виде, то есть не упорядочена и содержится в различных форматах, в отличие от данных, которые наполняют традиционные базы данных. Огромные массивы разнообразной информации, например, информация с форумов и социальных сетей, видеозаписи, текстовые документы, лог-файлы или, например, данные о трафике и соединениях абонентов, содержатся в различных источниках, нередко за пределами организации. В результате правоохранительные структуры могут иметь доступ к огромному объему данных из внутренних и внешних источников и не иметь необходимых инструментов, чтобы осуществить их совместную обработку, выявив определенные взаимосвязи и сделать на их основе значимые выводы. Технологии «Больших данных» позволяют решить эту проблему, связав воедино разнородные данные.