ЖАНРЫ

Аналитика: методология, технология и организация информационно-аналитической работы

Конотопов Павел Юрьевич

Шрифт:

В рамках разработок в области автоматизированных систем поддержки электронного бизнеса класса B2B (Business to Business — уровень взаимодействия корпоративных субъектов экономической деятельности) постепенно начинает формироваться комплекс подходов и технологий, приближающих момент решения этой проблемы. Имеются в виду интеллектуальные приложения на базе автономных программных агентов и языков гипертекстовой разметки, пытающихся учесть специфику поведения и интересов посетителей электронных торговых площадок в ГСТК Интернет, с тем, чтобы адаптироваться к их индивидуальным потребностям, поведению и предоставить им именно те сведения, которые могут потребоваться.

Еще одним немаловажным аспектом ИАР является то, что факт отсутствия ожидаемых данных также является информацией для аналитика. Использование сведений такого рода возможно тогда, когда существует некая модель, определяющая ожидания аналитика относительно момента появления данных, подтверждающих те или иные события. Но часто при построении систем автоматизации ИАР этот аспект работы аналитика игнорируется, а аналитик, увы, не всегда в состоянии помнить о том, что в тот или иной момент времени после события А должно наступить событие Б, сопровождающееся появлением данных Д(Б) — для этого следует помнить не только последовательность событий но и их информационный контекст (интерьеры).

Таким образом, решению проблемы ослабления дезадаптационного стресса, вызываемого неполнотой знаний аналитика и системы эвристик ЭС, могут служить именно системы гибридного интеллекта. «Гибридность» таких систем должна заключаться не только в том, что благодаря системе коммуникаций между отдельными субъектами ИАР формируется коллективный разум, но и в том, что коллективный разум должен включать в себя и те компоненты, которые обеспечиваются средствами автоматизации в виде систем искусственного интеллекта и экспертных систем. С одной стороны, такие системы призваны решать проблему интеллектуальной изолированности аналитика за счет создания среды информационного взаимодействия, а с другой — управлять режимом предоставления данных, брать на себя функции управления поиском и отбором релевантных текущей работе аналитика.

Как это может быть сделано?

Прежде всего, подобная система (система гибридного интеллекта) должна быть интегрирована с инструментами типа майнд-мэпперов, которые должны стать одним из основных инструментов работы аналитика, за счет чего может быть осуществлена формализация системы рассуждений аналитика, включая и ссылки на данные, положенные в основу аргументации. Впрочем, если бы имели место проговаривание рассуждений, их регистрация, распознавание речи, логико-лингвистическая обработка высказываний и автоматическое построение логико-лингвистических структур, отражающих рассуждения аналитика, было бы и того лучше. Такие модели с применением средств лингвистической обработки текстов могут быть подвергнуты автоматизированному анализу, за счет чего система сможет сформулировать поисковые задания для подбора аргументации, провести поиск ранее отмечавшихся сценариев анализа и предложить дополнительные массивы данных, а также сведения о возможных дополнительных источниках информации. Еще одна возможность, представляющаяся вполне реализуемой при современном уровне развития информационных технологий — это возможность отыскания шаблона сценария анализа, характерного для данного аналитика. Что позволяет предложить ему для ознакомления группу сценариев анализа, полученных в результате протоколирования работы других аналитиков.

Кроме того, используя лингвистические технологии, системы гибридного интеллекта способны регламентировать процесс информационного взаимодействия между аналитиками как на уровне представления данных, так и на уровне управления временными параметрами процесса коммуникации. Благодаря первой группе регламентов может быть снят (или ослаблен) стресс дезадаптации, вызванный различиями в способах представления данных, а благодаря введению временных регламентов может быть снижен эффект неожиданности акта коммуникации, сформирована привычка к разбиению ИАР на временные интервалы, посвященные различным видам активности.

Однако и это не все положительные свойства таких систем… Они могут стать мощным инструментом подготовки аналитиков, их ввода в контекст текущей ситуации, формирования рабочих групп в распределенных средах, что очень важно в крупных территориально распределенных информационно-аналитических службах государственного и ведомственного подчинения, диспетчирования информационных потоков по информационным направлениям и так далее.

Комментированному перечислению преимуществ такой идеологии построения систем комплексной поддержки ИАР можно было бы посвятить еще много страниц. Но мы предоставляем читателям возможность, как-нибудь на досуге, самостоятельно поразмышлять в этом направлении.

9.7 Средства снижения размерности массива измерений

Класс инструментальных средств поддержки процессов анализа данных — это весьма пестрый по составу класс, объединенный одним свойством входящих в него средств: все они направлены на преодоление проблемы большой размерности. Сущность проблемы заключается в том, что человек, хотя и устроен как мощнейшая система анализа и обработки данных, но система эта обладает недостаточно мощной подсистемой сбора данных. Она, эта подсистема сбора данных, обладает относительно низким разрешением, инерционна и обладает множеством иных недостатков. Отсюда это стремление к созданию все новых инструментальных средств, расширяющих возможности органов чувств… Но, как только очередная проблема этого сорта решена, так сразу появляются проблемы коммуникации с очередным созданным инструментом, преодоления избыточности массива измерений, обеспечения избирательности и иные — то есть, все то, что порождено высокой размерностью массива измерений. Эти проблемы порождены «неинтеллектуальностью» инструментария сбора данных.

В результате человек концентрируется на изыскании путей снижения размерности, выделения именно тех фрагментов данных, которые представляют интерес для решения конкретной проблемы, сведения процесса анализа к оцениванию минимального числа интегральных показателей, позволяющих с заданной точностью решать те или иные задачи.

В принципе, весь инструментарий ИАР может быть по ряду признаков отнесен именно к этому классу, однако лучше всего в этот класс вписываются средства статистической, корреляционной и спектральной обработки результатов наблюдений. Наибольшее распространение получили здесь программные комплексы статистической обработки данных.

Для пользователей, имеющих дело со сверхбольшими объемами данных, характеризующихся высоким уровнем формализации представления, серьезной альтернативы использованию этого класса программного обеспечения пока нет. Сегодня на этом рынке лидируют профессиональные западные пакеты статистической обработки и среды математического моделирования. В большинстве из них реализованы специальные высокоуровневые языки программирования для реализации собственных алгоритмов обработки данных. Их разработка осуществляется путем комбинирования готовых подпрограмм, поставляемых с данным программным продуктом в специализированных библиотеках. При этом задача пользователя состоит, главным образом, в исследовании информативности и выделении наиболее информативных признаков функционирования объекта изучения, установлении взаимосвязи между их изменениями и состоянием объекта. Кроме того, пользователям предоставляется возможность разработки собственных процедур с применением встроенных средств разработки или внешних сред программирования.

Существует условное деление инструментальных средств этого класса на профессиональные (специализированные) и универсальные, не имеющие привязки к отрасли исследований программные продукты. Безусловно, специализированные программные продукты за счет адаптации к классу решаемых задач обладают большей эффективностью при решении прикладных задач в заданной области исследований, но при проведении междисциплинарных исследований универсальным средам альтернативы нет. Поэтому на рынке представлены как специализированные системы обработки данных (например, предназначенные для экономических или социологических исследований), так и универсальные системы.

Универсальные пакеты обладают несколько меньшими возможностями. Но, с другой стороны, их стоимость значительно ниже, чем стоимость профессиональных. Универсальные пакеты во многом схожи по составу методов обработки, реализованы по модульному принципу и за счет обращения к процедурам и функциям операционной системы упрощают работу с графикой и интерфейсными элементами. Однако, при приобретении таких систем следует убедиться, что они действительно реализуют требуемые методы и алгоритмы обработки данных.

Поделиться с друзьями: