Методы статистического анализа исторических текстов (часть 1)
Шрифт:
Ответ не удовлетворил. Во-первых потому, что хронология, то есть проблема вычисления дат, имеет самое прямое отношение к прикладной математике. Это, в частности, астрономические вычисления, оценка их точности, календарные проблемы, дешифровка старых надписей (на основе частотных характеристик текстов) и т.п. Во-вторых, знакомство с современными хронологическими таблицами довольно быстро показало, что они приводят древние даты без каких-либо обоснований. Либо, в лучшем случае, ссылаются на первые хронологические таблицы по всемирной истории, составленные, однако лишь в XVI-XVII веках. То есть, сравнительно недавно. Углубившись в проблему, удалось обнаружить, что принятая сегодня версия древней хронологии - далеко не единственная. Оказалось, что уже давно разные ученые в разных странах высказывали мысль о необходимости серьезного пересмотра древних дат. Стало понятно, что ответ не так прост и чтобы разобраться в этом, потребуется много времени и усилий. Так началась моя работа в этом направлении, совместно с коллегами, в основном, с профессиональными математиками и физиками.
Эти исследования развивались довольно быстро. За прошедшие годы многое прояснилось, были получены исключительно интересные результаты. Они опубликованы мною и моими коллегами как в разных книгах, так и научных статьях, перечисленных в списке литературы. Надо отметить, что с течением времени, в отдельных случаях наша точка зрения на некоторые проблемы хронологии менялась. Эти изменения не касались понимания всей картины в целом, но в деталях иногда происходили существенные сдвиги. Сегодня стало ясно, что назрела необходимость еще раз вернуться к изложению новых, разработанных нами эмпирико-статистических методов, лежащих в основе исследований, собрать их воедино в рамках одной книги, включая и приложения к проблеме хронологии. Так возникла настоящая книга.
В ее фундаменте лежит первая моя книга на эту тему: "Методы статистического анализа нарративных текстов и приложения к хронологии. (Распознавание и датировка зависимых текстов, статистическая древняя хронология, статистика древних астрономических сообщений)". Она вышла в Москве, в издательстве МГУ в 1990 году и была переиздана издательством "Наука" в 1996 году в расширенном и переработанном виде, под названием "Методы математического анализа исторических текстов. Приложения к хронологии" Москва, изд-во Наука, 1996. В настоящей книге весь этот материал заново переработан, дополнен и систематизирован. Во вторую часть настоящей книги в переработанном виде вошел материал, ранее опубликованный в моих книгах "Глобальная хронология" - М., МГУ, 1993 и "Новая хронология Греции. Античность в средневековье" - М., МГУ, 1996.
Некоторые важные результаты, кратко включенные в настоящую книгу, были получены совместно с замечательными учеными, - д.ф.м.н., профессором В.В.Калашниковым (МГУ и ВНИИСИ, то есть НаучноИсследовательский Институт Системных Исследований, Россия, г.Москва) и старшим научным сотрудником, к.ф.м.н. Г.В.Носовским (МГУ, механико-математический факультет) - специалистами по теории вероятностей и математической статистике. Эти результаты будут специально отмечены в настоящей книге. Многолетнее сотрудничество с В.В.Калашниковым и Г.В.Носовским сыграло большую роль в формировании взглядов автора на проблемы хронологии. Пользуясь случаем, выражаю глубокую благодарность В.В.Калашникову и Г.В.Носовскому.
Хочу особо отметить, что в последние годы, в результате постоянного и плодотворного сотрудничества с Г.В.Носовским (начиная с 1981 года), мы опубликовали с ним несколько исключительно важных, по моему мнению, книг о новой хронологии. Именно благодаря нашей совместной работе удалось сформулировать основные черты предположительной реконструкции новой хронологии и истории средних веков. Этот этап наших, совместно с Г.В.Носовским исследований, представляется чрезвычайно важным.
Как уже было отмечено, настоящая книга опирается, в основном, на первые три книги по этой теме, вышедшие в 1990-1993 годах. Однако за последние годы многие стороны проблемы существенно прояснились. Мы существенно глубже проникли в суть дела. Поэтому настоящая книга написана уже с позиций того более глубокого понимания проблемы, которое мы с коллегами, в первую очередь с Г.В.Носовским, достигли за последние годы.
Перейдем к краткому описанию структуры настоящей книги. Созданная окончательно в XVI веке н.э.и принятая сегодня хронология и история древнего и средневекового мира по-видимому содержит крупные ошибки. Это понимали и на протяжении длительного периода обсуждали многие выдающиеся ученые (см. Главу 1). Но построить новую, непротиворечивую концепцию истории оказалось очень сложной задачей.
Начиная с 1974 года разработкой этой проблемы занялась группа математиков, в основном, из Московского государственного университета. В результате были получены интересные результаты, опубликованные как в научной периодической печати (несколько десятков научных статей), так и в виде отдельных монографий. См. список литературы. Подчеркнем, что новая концепция хронологии основывается, прежде всего, на анализе исторических источников МЕТОДАМИ СОВРЕМЕННОЙ СТАТИСТИКИ и на обширных КОМПЬЮТЕРНЫХ РАСЧЕТАХ.
Настоящая книга посвящена разработке новых ЭМПИРИКО-СТАТИСТИЧЕСКИХ МЕТОДОВ обнаружения зависимостей между историческими текстами и основанных на этих методах способов ДАТИРОВКИ событий древности.
Задача РАСПОЗНАВАНИЯ ЗАВИСИМЫХ И НЕЗАВИСИМЫХ ТЕКСТОВ встречается в разных областях знания: в прикладной статистике, лингвистике, физике, генетике, историческом источниковедении и т.д. Например, применительно к источниковедению значительный интерес представляет выявление ЗАВИСИМЫХ хроник, летописей, то есть восходящих к ОБЩЕМУ ПЕРВОИСТОЧНИКУ, опирающихся на общий оригинал, быть может, не дошедший до нашего времени. С другой стороны, полезно знать - какие летописи НЕЗАВИСИМЫ, то есть опираются на существенно разные первоисточники, архивные данные.
Само понятие ТЕКСТА можно трактовать достаточно широко. Текстом может быть последовательность символов, сигналов, кодов какой-либо природы. Например, - последовательность ген-кодов в цепочках ДНК. Общая задача поиска ЗАВИСИМЫХ ТЕКСТОВ формулируется так. Нужно обнаружить в данной длинной последовательности сигналов "похожие куски", то есть фрагменты текста, повторяющие, дублирующие друг друга.
Сегодня известно много методов выявления зависимостей. Мы предлагаем некоторые новые эмпирико-статистические методы, которые могут оказаться полезными как при анализе исторических текстов, - хроник, летописей, архивных данных, - так и для поиска так называемых гомологичных фрагментов в текстах более общей природы.
Для удобства читателя мы разобьем книгу на несколько частей или тем. Это поможет надежно отделить четко установленные нами статистические факты от гипотез. В то же время такое разбиение книги на темы условно, так как в действительности они тесно переплетены.
ПЕРВАЯ ТЕМА.
а) Решается задача статистического выявления зависимых и независимых исторических текстов. Формулируются новые статистические модели, гипотезы. Они проверяются на большом экспериментальном материале конкретных исторических хроник. Оказывается, предложенные нами модели подтверждаются. Другими словами, удалось обнаружить интересные статистические закономерности, управляющие эволюцией письменной информации во времени, то есть - что происходит с летописными сведениями при их переписке, дублировании и т.д.
ОБНАРУЖЕНИЕ ЭТИХ ЗАКОНОМЕРНОСТЕЙ - ПЕРВЫЙ ГЛАВНЫЙ РЕЗУЛЬТАТ проведенной нами работы.
б) На основе обнаруженных закономерностей предлагаются новые методы датирования событий, описанных в летописях. Для этого исследуемые хроники и документы статистически сравниваются с хрониками, датировка событий которых сомнений не вызывает. Методы проверяются на обширном достоверно датированном материале. Оказывается, что их применение к хроникам и документам, описывающим события на интервале XIV-XX века н.э. подтверждает эффективность методов. В частности, наши статистические датировки, полученные новыми методами, согласуются с датировками, известными ранее и установленными другими, традиционными методами. На интервале XIV-XX века н.э. ЗАВЕДОМО ЗАВИСИМЫЕ пары хроник оказываются СТАТИСТИЧЕСКИ ЗАВИСИМЫМИ и с точки зрения наших методов. А пары ЗАВЕДОМО НЕЗАВИСИМЫХ хроник оказываются СТАТИСТИЧЕСКИ НЕЗАВИСИМЫМИ и в нашем смысле.
При экспериментальном обследовании надежно датированных летописей, описывающих события XIV-XX веков н.э., в 1974-1979 годах мне удалось обнаружить, что существуют естественные числовые коэффициенты, надежно различающие пары ЗАВЕДОМО ЗАВИСИМЫХ хроник от пар ЗАВЕДОМО НЕЗАВИСИМЫХ хроник. Грубо говоря, для заведомо зависимых пар эти числа очень малы, а для заведомо независимых - весьма велики. Следовательно, сравнивая теперь произвольные летописи Х и Y, мы можем выяснить попадает ли значение "их коэффициента близости" в зону значений, характерных для зависимых хроник, или же - в зону значений, характерных для независимых хроник. Конечно, границы этих зон были найдены экспериментально.