Империя - II
Шрифт:
Поскольку при описании одних и тех же событий в хронике Х могли использоваться сразу несколько исходных текстов, то над каждой точкой отрезка Х на рис. В1 расположено, вообще говоря, несколько коротких отрезков.
Представим себе, например, летопись, которая велась на протяжении длительного времени в одном и том же месте, в одних и тех же традициях (например – в одном монастыре). Предположим, что в нее ежегодно включались события, произошедшие в текущем году. Структура такой летописи наиболее проста – она условно изображена на рис. В2.
Короткие отрезки, «накрывающие» летопись Х (см. рис. В2), соответствуют промежуткам деятельности отдельных летописцев, дополнявших летопись описаниями современных им событий. Несмотря на смену летописцев, такая летопись длительное время могла оставаться однородной по стилю, характеру отбора материала, объему описаний и т.п.
Эта однородность условно отражена на рис. В2 тем, что все короткие отрезки, «накрывающие» летопись Х изображены на одном и том же уровне.
При составлении же глобальной хронологии большое количество разнородных летописей (хроник, мемуаров и т.п.) каким-то образом согласовывалось, летописи «сшивались» и включались во всеобщую хронику. При этом, естественно, нарушалась однородность текста. Эта ситуация схематично изображена на рис. В3: длинная хроника Х является «суммой» трех разнородных хроник Х1, Х2Х3.
Результат этой окончательной хронологической деятельности, проведенной, в основном, в XIV-XVII вв., мы и имеем сегодня в качестве «современного учебника по истории древности и средних веков».
Нашей задачей является:
1) Распознавание мест стыков внутренне однородных частей в «современном учебнике» по истории с помощью формальных математико-статистических процедур;
2) Формальное распознавание зависимых между собой частей этого «учебника».
В настоящей работе мы почти не касаемся содержательной интерпретации получаемых формальных результатов.
Отметим, что математико-статистические процедуры, предлагаемые в данной работе, основаны на некоторой вероятностной модели и наши результаты имеют смысл лишь в пределах этой модели (то есть в предположении, что она соответствует историческим данным).
Поэтому мы обращали особое внимание на то, чтобы модель была как можно проще, естественнее, и не требовала бы специальных предположений.
Глава 1. Принцип затухания частот
1. Формулировка принципа затухания частот и дублирования частот. Примеры
1. 1. Формулировка принципа
В работах [1]…[5] А. Т. Фоменко сформулировал фундаментальный принцип затухания частот, позволяющий строить естественные статистические модели эволюции во времени собственных имен исторических персонажей, упоминаемых в хрониках, летописях и т.п. Этот принцип состоит в следующем.
Предположим, что исследуется большая совокупность текстов (фрагментов), каждый из которых описывает события приблизительно одного поколения. Пусть задан некий их хронологический порядок, правильность которого необходимо проверить.
При правильном хронологическом порядке текстов, имена персонажей в них должны постепенно меняться при последовательном переходе от одного фрагмента к другому. Дело в том, что с течением времени речь начинает идти о все новых и новых людях, причем имена новых деятелей вытесняют имена прежних.
В самом деле, рассмотрим какое-нибудь одно определенное поколение. При описании событий, предшествующих этому поколению, имена персонажей этого поколения, как правило, не упоминаются, так как они еще не родились.
Затем, при описании событий самого этого поколения, именно персонажи этого поколения упоминаются наиболее часто, поскольку с ними связаны описываемые события.
Наконец, переходя к описанию следующих поколений, хронисты все реже упоминают о прежних персонажах, так как описывают уже новые события, персонажи которых сменяют умерших.
Это означает, что при правильном хронологическом порядке фрагментов, частота употребления имен персонажей данного поколения должна в среднем уменьшаться, «затухать», при переходе к описанию все более отдаленных от него во времени поколений.
Таким образом, каждое поколение рождает свои, новые исторические персонажи (имена); а при смене поколений эти лица сменяются.
Несмотря на внешнюю простоту, этот принцип (нуждающийся в проверке) оказался чрезвычайно полезен при создании методов датировки текстов.
Принцип затухания частот допускает более строгую переформулировку.
1. 2. Частотные графики имен. Идеальный затухающий график
Предположим, что анализируемая совокупность фрагментов текста, каждый из которых описывает события приблизительно одного поколения, расположена и занумерована в некотором хронологическом порядке. Эти фрагменты мы в дальнейшем будем называть главами-поколениями, поскольку каждый из них представляет собой как бы главу совокупного длинного текста и описывает в нем лишь одно поколение.
Рассмотрим группу имен, впервые появившихся в главе-поколении с номером Т (напомним, что главы занумерованы в хронологическом порядке). В эту группу входят те и только те имена, которые ни в каких главах с меньшими чем Т номерами не появлялись, но появились в главе Т.
Условно назовем имена этой группы Т-именами. Подсчитаем затем, сколько раз эти же имена упомянуты в произвольной главе-поколении с некоторым номером Т. Получившееся число обозначим через К(Т, Т). При этом, если одно и то же имя повторяется в главе с номером Т несколько раз (то есть с кратностью), то все эти упоминания будем подсчитывать и включать в общее количество К(Т0, Т). Построим график, отложив по горизонатали номера глав-поколений, а по вертикали – числа К(Т0, Т). Номер Т считаем при этом фиксированным (таким образом, для каждого номера Т получится свой график). Принцип затухания частот формулируется тогда так:
При хронологически правильной нумерации глав-поколений графики К(Т0, Т) при всех Т0 должны иметь следующий вид (рис. 1):
Слева от точки Т график равен нулю, в точке Т – абсолютный максимум, а затем график постепенно падает, затухает (монотонно убывает).
Буквой N на рис. 1 обозначено общее количество поколений в данной совокупности фрагментов текста.
График на рис. 1 назовем идеальным (теоретическим). Сформулированный принцип должен быть проверен экспериментально на достоверных данных. Если он верен, то мы сможем пользоваться следующим важным следствием этого принципа.