Империя (Части 4-7)
Шрифт:
0 С.
0
Ясно, что графики К(Т, Т) и К(С, Т), определение которых
0 0 было дано выше, имеют в этом случае вид, качественно показанный на рис. 4.
В самом деле, все имена ВПЕРВЫЕ появившиеся в главе с номером Т (первой в паре глав-дубликатов) повторяются затем еще
0 раз в главе с номером С (второй главе этой пары). Поэтому
0 частота употребления "имен главы Т " в последующих главах хроники
0 Х скачком возрастет, когда при движении слева направо по оси абсцисс мы дойдем до номера С.
0
График К(Т, Т) будет иметь в точке С характерный ВСПЛЕСК,
0 0 говорящий о появлении в тексте дубликата главы с номером Т .
0
Что же касается графика К(С, Т), то ясно, что все значения
0 К(С, Т) просто равны нулю, так как глава Х(С ), являясь точным
0 0 повтором уже бывшей главы Х(Т ), не содержит ни одного нового
0 имени (все ее имена уже появились в Х(Т )) -- см. рис. 4.
0
Первый график на рис. 4 явно не удовлетворяет принципу затухания частот (так нет монотонного убывания справа от Т ).
0 Следовательно, для восстановления правильного хронологического порядка глав следует переставить главы-поколения в хронике Х так, чтобы добиться соответствия с теоретическим графиком (рис. 1). Ясно, что наилучшее совпадение с теоретическим графиком получится, если мы поместим главы-дубликаты Х(Т ) и Х(С ) рядом
0 0 или просто отождествим их.
Итак, если среди глав-поколений некоторой хроники Х обнаружились две главы Х(Т ) и Х(С ), для которых их графики
0 0 К(Т, Т) и К(С, Т) имеют вид приблизительно как на рис. 4, то эти
0 0 главы являются дубликатами (в рамках рассматриваемой модели). Скорее всего, эти главы говорят об одних и тех же событиях и их следует отождествить.
Все сказанное переносится на случай, когда в хронике Х содержится три и более дубликатов.
1. 6. ПРИМЕР ИЗ СРЕДНЕВЕКОВОЙ ИСТОРИИ ИТАЛИИ
Метод был экспериментально проверен на реальных исторических данных. В качестве простого примера, в частности, была взята книга "Истории Флоренции" Н. Макьявелли (Л., 1973), снабженная развернутым комментарием. Ясно, что комментарии можно рассматривать как серию дополнительных глав-поколений, ДУбЛИРУЮЩИХ основной текст (так как в них в основном говорится о тех же событиях, что и в основной хронике).
Текст "Истории" вместе с комментариями был разбит на главы-поколения. Для получившегося совокупного текста (охватывающего как саму "Историю", так и комментарии к ней) была построена матрица {K}, определенная выше.
Оказалось, что она имеет вид, качественно показанный на рис. 5, где жирным отмечены клетки матрицы, заполненные максимумами в ее строках (то есть максимумами, всплесками в графиках К(Т, Т)). Комментарии к основной хронике ясно выделяются на рис. 5
0 в виде СПЛОШНОГО ЖИРНОГО ОТРЕЗКА, ПАРАЛЛЕЛЬНОГО ГЛАВНОЙ ДИАГОНАЛИ.
В данном случае методика успешно обнаружила ЗАРАНЕЕ ИЗВЕСТНЫЕ дубликаты -- комментарии к тексту Макьявелли (при обработке этого текста принимал участие А. Макаров).
Описанные методы распознавания зависимостей ("статистических дубликатов"), основанные на принципе затухания частот, были предложены А. Т. Фоменко в работах [5-8]. С их помощью, а также с помощью других, независимых методик, в 1980-1988 гг. А. Т. Фоменко и его коллегами была проделана исключительно объемная вычислительная работа по глобальному статистическому анализу совокупности текстов, описывающих древнюю и средневековую историю. Результаты этой работы суммированы в виде разложения ГХК (глобальной хронологической карты) [6, 7, 18].
p3'1'2
2. ХРОНОЛОГИЧЕСКИЕ СПИСКИ ИМЕН. ПРИМЕРЫ.
2. 1. ПОНЯТИЕ СПИСКА ИМЕН.
ПРАВИЛЬНЫЕ, КРАТНЫЕ, ПРОСТЫЕ СПИСКИ ИМЕН
В дальнейшем мы будем рассматривать не сами хроники (тексты), а СПИСКИ ИМЕН, извлеченные из них. Это означает, что каждый фрагмент хроники, описывающий события некоторого выбранного периода времени (одного поколения, 10-ти, 20-ти летия и т. п.) заменяется на список собственных имен, упоминаемых в данном фрагменте. При этом, в каждом фрагмента любое имя учитывается столько раз, сколько оно упомянуто в нем -- то есть учитывается "с кратностью".
Предположим, что общее число глав в рассматриваемой хронике равно N. Выстроив и занумеровав списки имен, извлеченных из каждого фрагмента этого текста, в том порядке, как они следовали в нем, получим список имен Х, являющийся объединением последовательности более коротких списков имен Х, Х,..., Х :
1 2 N
Х = Х +Х +... +Х.
1 2 N Списки имен Х (1\Д<\Аi\Д<\АN) мы в дальнейшем будем называть
i ГЛАВАМИ-ПОКОЛЕНИЯМИ или просто ГЛАВАМИ списка Х.
Список Х является упорядоченным списком имен и его можно рассматривать также и без разбиения на главы:
Х = {a, a,..., a }.
1 2 n
Здесь через a обозначено i-тое по порядку имя в списке Х.
i Мы будем придерживаться следующих обозначений для характеристик списков имен:
n -- общее число имен в списке Х (с учетом кратности их
вхождения в список);
m -- число РАЗЛИЧНЫХ имен списка Х;
N -- число глав списка Х (если используется разбиение списка
имен на главы).
Итак, основной объект нашего исследования -- список имен Х, разбитый на следующие одна за другой в хронологическом порядке главы Х, Х,..., Х. Такие списки мы будем называть
1 2 N ХРОНОЛОГИЧЕСКИМИ СПИСКАМИ ИМЕН.
Хронологические списки имен, удовлетворяющие принципу затухания частот, являются (в рамках нашей модели) списками с ПРАВИЛЬНОЙ хронологией. В дальнейшем мы будем называть такие списки имен ПРАВИЛЬНЫМИ СПИСКАМИ.
Допустим, что в списке имен нарушен принцип затухания частот (или следствия этого принципа). Пусть это нарушение достаточно ярко выражено и позволяет выделить в списке имен систему "статистических дубликатов" (после отождествления которых справедливость принципа затухания частот восстанавливается). Тогда назовем такие хронологические списки имен -- СПИСКАМИ С ДУБЛИКАТАМИ.
Хронологический список имен назовем ПРОСТЫМ, если имя (имена) каждого исторического деятеля входит в каждую главу списка не более, чем один раз. В тех случаях, когда в главах списка содержатся по нескольку раз имена одного и того же лица, мы будем называть его КРАТНЫМ списком.
Таким образом, ПРОСТЫЕ СПИСКИ -- это просто перечисление имен (скажем, некоторой династии правителей) в хронологическом порядке.
КРАТНЫЕ СПИСКИ имен получаются, как правило, при выписывании всех имен из исторического источника, разбитого на фрагменты (главы-поколения). При этом, в каждом фрагменте имя (имена) одного и того же персонажа обычно повторяются НЕСКОЛЬКО РАЗ.