Русский генофонд на Русской равнине
Шрифт:
Поэтому основной акцент мы сделаем на другом виде анализа — на выявлении соотношений между основными частями генофонда по всем 14 тысячам коренных фамилий сразу. Такую оценку различия и сходства регионов (§ 1) мы получим с помощью обобщённых расстояний между регионами и диаграмм многомерного шкалирования — то есть так же, как в предыдущей главе для маркёров митохондриальной ДНК и Y хромосомы.
Это позволит нам сравнить обобщённые расстояния, рассчитанные по фамилиям, с генетическими расстояниями между теми же регионами, рассчитанными по маркёрам Y хромосомы (§ 2). Такое сравнение, во-первых, интригующе интересно — ведь оба типа признаков передаются по отцовской линии. А во-вторых, мы имеем редкую возможность сравнить их без карт — и фамилии, и Y хромосома изучены нами в одних и тех же русских популяциях.
А вот последний вид анализа можно провести только по фамилиям. Это — прогноз инбридинга и связанного с ним груза наследственной патологии (§ 4).
Все виды анализа вместе помогут составить обобщённый «фамильный портрет» русского генофонда.
§ 1. Различия и сходство регионов
ВЕСЬ ФОНД ФАМИЛИЙ
Каков портрет русского генофонда, рисуемый не оттенками двух-пяти десятков самых частых фамилий, а разноцветьем всего многотысячного спектра русских фамилий? Как по всему спектру фамилий русский генофонд подразделяется на региональные части? Каковы соотношения между региональными «фамильными фондами»? Отвечая на эти вопросы, мы можем располагать данными лишь о пяти регионах «исконного» ареала, поэтому структура генофонда выявится лишь в общих чертах. Но именно эти общие черты для нас сейчас и важны. В последующих разделах (§ 2 и § 3) картографирование по данным о 100 популяциях поможет взглянуть на детали структуры генофонда.
Чтобы оценить истинные «взаимоотношения» регионов, мы включили в анализ весь фонд «коренных» фамилий. Использованы данные по всем фамилиям — и всеобщим, и уникальным. Единственное условие — анализируемые фамилии должны быть «коренными», чтобы мятущиеся ветры миграций не создавали эфемерную видимость близости или удалённости популяций.
АЛГОРИТМЫ АНАЛИЗА
МЕРА СХОДСТВА. Напомним, что в предыдущих разделах этой главы для выявления сходства и различий регионов по частым фамилиям («топ-10» или «топ-50»,) мы использовали самые разные показатели, чтобы максимально сохранить «лицо» фамилий, сравнить их «поимённо». Но теперь, при обобщённом анализе всего фонда фамилий, мы воспользуемся общепринятой в популяционной генетике мерой сравнения популяций — генетических расстояний М. Nei (1975).
АЛГОРИТМ РАСЧЕТА. Напомним, что в анализ включена информация о распространении 14 тысяч «коренных» фамилий. Носители этих фамилий — 725 тысяч человек из пяти основных регионов «исконного» ареала. «Пришлые», случайные и потому редкие для данного района фамилии отсеяны согласно «демографическому» критерию (раздел 7.3., § 2).
Частоты фамилий (см. разделы 3.2. и 7.2.) были сначала рассчитаны для каждого района. По совокупности «районных» частот рассчитаны невзвешенные частоты фамилий в регионе. По региональным частотам рассчитаны генетические расстояния между регионами. По этой матрице расстояний построен график многомерного шкалирования.
КТО НА КОГО ПОХОЖ?
Степень сходства пяти основных регионов друг с другом показана на рис. 7.6.1.
Рис. 7.6.1. Сходство и различия пяти основных регионов по всем «коренным» фамилиям (14 428 фамилий).
Диаграмма многомерного шкалирования построена по обобщённым генетическим расстояниям [Nei, 1975].
СЕВЕРНЫЙ РЕГИОН (среднее расстояние от остальных регионов dN=1.1)[48] оказался наиболее своеобразным. Примечательно, что он удалён от всех регионов без исключения (1.0<dN<1.4). Более всего Северный регион по частотам фамилий отличается от географически близкого ему Восточного региона: генетическое расстояние между ними (dN-E=1.4) достигает вообще максимальной величины из расстояний между всеми парами регионов. Такое явное рассогласование географических и генетических расстояний подчеркивает, что распределение фамилий вовсе не является простой функцией от географического расстояния между популяциями. Такое рассогласование между географическими и генетическими расстояниями обычно свидетельствует о вмешательстве истории.
ЮЖНЫЙ РЕГИОН (ds=1.0) занимает второе место по своеобразию фамилий. Он также расположен на периферии «фамильного пространства» (рис. 7.6.7.). «Южные» фамилии ближе всех к «западным», но расстояние и между ними немалое (dS-W=0.7).
ВОСТОЧНЫЙ РЕГИОН (dE=0.9) оказывается на третьем месте по своеобразию фамилий. Он максимально удалён от обоих «полярных регионов» (в среднем dE-POLE=1.3). Но при этом близок к другим двум регионам среднерусской полосы (в среднем dE-MIDDLE ZONE=0.5). Из этих двух регионов он особенно близок к соседнему Центральному региону (dE-C=0.3). Так что в пределах среднерусской полосы Восточный регион не обнаруживает рассогласования с географическими расстояниями, а напротив, строго следует им. Видимо, здесь география и история были согласны друг с другом.
ЗАПАДНЫЙ РЕГИОН (dw=0.7) регион оказывается равноудален от Южного (dW-C=0.7) и Восточного (dW-E=0.8) регионов, и близок к Центральному (dW-C=0.3).
ЦЕНТРАЛЬНЫЙ РЕГИОН (dc=0.7) занял действительно центральное место в русском генофонде. Он почти в равной степени удалён от «полярных регионов» (dC-N=1.1; (dC-S=0.9) и одинаково близок к регионам средней полосы (dC-W=0.3; dC-W=0.3). Однако, хотя кажется, что здесь географические и генетические расстояния полностью ладят друг с другом, но история вмешивается и здесь. Генетические расстояния до регионов средней полосы оказались в три-четыре раза меньше, чем до «полярных». А разница в географических расстояниях невелика — лишь в полтора раза (Центр/3апад=400 км, Центр/Востоk=450 км, Центр/ Юr=600 км, Центр/Север=700 км). Таким образом, по частотам фамилий Центральный регион куда более удалён от полярных регионов, чем ожидалось из географии.
ПОДВЕДЁМ ИТОГИ
Итак, генетические расстояния, рассчитанные по всему фонду фамилий (14 тыс. фамилий), выделя-ют среднюю полосу европейской России (Западный,
Центральный, Восточный регионы) как наиболее полно воспроизводящую средние характеристики русского генофонда. «Полярные» Южный и Северный регионы демонстрируют выраженное своеобразие состава фамилий. При этом Восточный регион резко отличен от «полярных» регионов; Южный тяготеет к Западному; а Северный регион занимает совершенно особое место. График на рис. 7.6.1. иллюстрирует эти взаимоотношения регионов.
Не правда ли, знакомая картина? Мы её видели и тогда, когда рассматривали самые частые фамилии — «топ-20» (раздел 7.J.); и тогда, когда создавали «фамильные портреты» регионов по «топ-50» (раздел 7.4.). Такое взаимное подтверждение трёх независимых видов анализа — по частым фамилиям «топ-20», по «осмысленным» классам «топ-50» и по частотам всего массива «коренных» фамилий — радует, а уверенность в том, что мы на верном пути, растёт.
Из этого следуют и методические выводы.
Во-первых, это значит, что наше выделение классов фамилий (календарные, профессиональные, «звериные», «приметные») работает неплохо.
Во-вторых, если даже анализ «топ-50», то есть только полусотни самых частых фамилий (и отсев всех остальных фамилий), сохраняет основные тенденции, то значит и наш отсев лишь самых редких «пришлых» фамилий вряд ли эти тенденции исказил.
Но тогда возникает здравый вопрос. Может быть, и нет необходимости анализировать всю громаду всех фамилий, а заниматься только частыми? К сожалению, это не так. Прежде всего, не изучив все фамилии, не определишь, какие из них частые. Но главное, мы никогда не знаем, где та граница, после которой начинаются искажения тенденций. Ведь для разных регионов число «репрезентативных фамилий» может оказаться различным в зависимости от структурированности генофонда. Кроме того, разные группы фамилий — общие, частые, уникальные — могут описывать особые закономерности, не свойственные генофонду в целом, и сообщить много любопытных сведений об истории сложения генофонда.
§ 2. Фамилии и маркёры Y хромосомы
Итак, мы определили взаимное положение пяти основных регионов по данным о фамилиях. Но можно ли утверждать, что таково взаимное положение не только «фамильных портретов» регионов, а самих генофондов? Можно ли считать, что, изучая фамилии, мы видим генофонд? Чтобы ответить на этот вопрос, надо привлечь свидетельства ещё одного очевидца — данные самой генетики. Те же самые популяции, которые мы изучили по фамилиям, уже генотипированы нами по одной системе генетических маркёров — по маркёрам Y хромосомы. Причём именно эти маркёры наиболее интересны для сравнения с фамилиями: и те, и другие передаются по мужской линии. Так что совместное изучение русских фамилий и Y хромосомы полезно им обоим.