Русский генофонд на Русской равнине
Шрифт:
Этим примером мы вовсе не надеемся убедить читателя. На опыте знаем, что переубедить в отношении фамилий просто невозможно! Те, кто имел в роду Ивановых или же бескорыстно интересовался реальным распространением этой фамилии, скажут, что изложенные факты общеизвестны. Те, кто не интересовался Ивановыми, скажут, что это, конечно же, любопытно, но вот другие фамилии… И перейдут к волнующим их фактам из жизни иной фамилии. Но в обоих случаях забывается, что Ивановы служили нам просто примером для проверки подсознательно ожидаемой картины, причём примером, показавшим, что эта картина неверна и строится на ошибочных суждениях.
ЗАБУДЕМ О МИФАХ?
Поэтому мы призываем читателя лишь на время забыть о наших субъективных представлениях и беспристрастно рассмотреть несколько более объективные цифры, которые несут некую информацию о реальном распространении фамилий. Причём важно помнить, что все эти цифры нужны нам для изучения фамилий не как таковых, а как маркёров генофонда. Даже в том случае, когда мы будем уделять внимание какой-то одной фамилии — она будет для нас важна лишь в той мере, в какой она отражает закономерности всего фонда фамилий. А потом уже, получив информацию о фонде фамилий в целом, каждому из нас будет намного увлекательнее возвращаться к конкретным фамилиям, уже представляя их соотношение с общей картиной, оживляя и расцвечивая общий фон причудливыми событиями биографии отдельных фамилий.
После этих вводных слов перейдём, наконец, к сухим цифрам частот фамилий в разных регионах — именно такие беспристрастные данные позволят отделить научные факты от мифов.
НАЗОВЕМ ФАМИЛИИ ПОИМЁННО
Добавим лишь ещё одно пояснение нашего подхода. Дело в том, что популяционная генетика, приблизив к себе фамилии и присвоив им почётное звание «квазигенетических», решительно забыла о сути фамилий как таковых. Они стали просто безличным аналогом генов. Достаточно взглянуть на любую работу по русским фамилиям — мы встретим лишь обычные генетико-статистические показатели и ни одного намёка на содержательную сторону фамилий. А ведь в них скрыта значительная глубина дополнительной информации о генофонде. Странно, что генетика, привлекая далёкие от неё данные лингвистики, этнографии, археологии, очень внимательна к их содержательной стороне, а самым близким к генетике данным о фамилиях, она отказывает в содержании.
Мы же надеялись, что если мы вглядимся в лицо фамилий, если мы сравним их «поимённо», если учтём смысловую нагрузку фамилий, которая вложена в них историей популяций и языка, то семантика фамилий создаст новый источник информации о генофонде. Не менее важный, чем стандартные показатели популяционной генетики. Их мы также рассмотрели максимально полно в заключительном разделе 7.6. Однако три раздела (7.3., 7.4., 7.5.) мы целиком посвятили попытке вернуть фамилиям, работающим в генетике, их лицо и извлечь новую, не безликую, а ёмкую и расцвеченную всей красотой русского языка информацию о пространственной структуре русского генофонда.
Мы попытались сравнить регионы по «индивидуальным» особенностям фамилий. Насколько эта попытка оказалась успешной — судить читателю. Для нас самих она словно раскрыла глаза и позволила увидеть не скупые статистические показатели, а образы генофонда, яркие черты его «фамильных» портретов. Мы надеемся, что простота красок, использованных для написания этих портретов, не смутит читателя. Они просты не оттого, что авторы не умеют или не любят считать, а оттого, что мы хотели бережно сохранить всё своеобразие этого необычного и парадоксально надёжного маркёра — фамилий.
§ 1. Частые фамилии
Обзор русских фамилий стоит начать, конечно же, с самых частых. Именно они привлекают наше внимание, когда мы говорим о различиях между русскими землями.
Частыми мы будем называть только те фамилии, которые вошли в «топ-20» — самую верхушку списка фамилий, расположенных по убыванию частот. Мы решили ответить на вопрос — а могут ли они служить визитной карточкой каждого региона? Могут ли самые частые фамилии что-то рассказать о генофондах? Попробуем пока кратко ответить на эти вопросы. А составление полных фамильных портретов регионов отложим до раздела 7.4.
АЛГОРИТМЫ АНАЛИЗА
Для каждого из восьми регионов составлен полный список фамилий, встреченных в нём.
Для каждой фамилии рассчитана её средняя частота в данном регионе.
Во всех списках фамилии расположены по убыванию их частоты.
В результате мы получили восемь таких списков частот фамилий — по числу изученных регионов.
Первые 20 фамилий этих восьми списков («топ-20»), а также первые 20 фамилий девятого — магистрального списка — приведены в таблицах 7.3.1. и 7.3.2.
Этот девятый — главный — список содержит средние частоты фамилий, рассчитанные для русского генофонда в целом. Поэтому он условно называется «магистральным списком» фамилий. Частоты фамилий в нём рассчитаны как средние только по пяти «основным» регионам. И в этом списке фамилии также расположены в порядке убывания их частоты.
«ИНДЕКС МЕСТА» (Index place — IР). Каждой фамилии присвоен её порядковый номер в «магистральном списке». Например, самой частой фамилии присвоен № 1, десятой — порядковый номер № 10, сотой — № 100 и так далее. Теперь, когда у каждой из 67 тысяч русских фамилий есть свой собственный номер, можно для каждого региона рассчитать «индекс места». Порядковый номер будет означать «балл» редкости данной фамилии (чем больше балл, тем реже эта фамилия в русском генофонде в целом), а индекс места — представляет просто сумму таких баллов, набранных частыми фамилиями региона, деленную на число суммированных фамилий. Чем меньше сумма баллов — тем ближе регион к «общему порядку» русских фамилий, тем менее своеобразен регион по частым фамилиям. Поэтому «индекс места» позволяет количественно оценить степень сходства отдельного региона со всём русским генофондом по спектру (а не по частоте) самых частых фамилий в этом регионе. Величина этого показателя будет минимальна для тех регионов, которые по частотам самых частых фамилий больше всего приближаются к «магистральному списку» русских фамилий. Поэтому такой «индекс места» является своеобразной мерой генетических расстояний региона от общерусского генофонда.
Иными словами, показатель сходства IР — сумма «магистральных» порядковых номеров фамилий в региональном списке, деленная на число суммированных частых фамилий.
IP10 — сумма баллов десяти самых частых фамилий, деленная на 10.
Мы рассчитали три показателя для каждого региона — IР20, IР10, IР5. Но поскольку они полностью вторят друг другу, здесь мы приведём лишь один показатель — IР10.
§ 1.1 РЕГИОНЫ СРЕДНЕЙ ПОЛОСЫ
Частые фамилии сразу же преподнесли нам сюрприз: оказалось, что они умеют классифицировать регионы. Для трёх регионов средней полосы — Восточного, Западного и Центрального — наиболее частыми оказались «магистральные» фамилии. А для полярных Северного и Южного регионов в перечень самых частых фамилий входят «местные», характерные для этих территорий. Читатель может и сам проверить это утверждение, сравнив списки самых частых фамилий каждого региона (табл. 7.3.1.) с магистральным списком (табл. 7.3.2).
Таблица 7.3.1.
Двадцать наиболее частых фамилий для каждого из пяти основных регионов (фамилии расположены по убыванию частоты их встречаемости в «своём» регионе)
Двадцать наиболее частых фамилий для каждого из трёх «окраинных» регионов и для «магистрального» списка русских фамилий (фамилии расположены по убыванию частоты их встречаемости)
СХОДСТВО РЕГИОНОВ средней полосы