Русский генофонд на Русской равнине
Шрифт:
КОРРЕЛЯЦИЯ РУССКИХ ФАМИЛИЙ И ГАПЛОГРУПП Y ХРОМОСОМЫ
Рассмотрев вкратце, каковы мировые данные о связи фамилий и Y хромосомы, обратимся к изучению этой связи в русском генофонде.
Конечно, мы понимаем, что даже если мы проведём (как в случае наших русских регионов) полностью параллельный анализ одних и тех же популяций и по фамилиям, и по Y хромосоме, то всё равно полного совпадения результатов быть не может. Маркёры Y хромосомы — это «настоящие» гены, но у них есть свой изъян: по ним изучено много меньшее число популяций и человек. По Y хромосоме 1257 человек представляют 14 районов. По фамилиям изучен миллион человек из 50 районов. Разница существенная. Но у фамилий, к сожалению, есть свой и куда более важный недостаток — они только «квазигены», столь переменчивые и столь юные по сравнению с настоящими генами.
Поэтому нельзя ожидать полного сходства. Но есть ли оно вообще?
Те, кто заглядывал в 6 главу, уже знают, что сходство налицо. Напомним, что на карте главного сценария всех гаплогрупп Y хромосомы, мы видели чётко выраженный широтный градиент (рис. 6.3.11.). Это означает, что, двигаясь с севера на юг, мы обнаруживаем намного большие различия между русскими популяциями, чем двигаясь с запада на восток. Мы видим на этой «главной» карте Y хромосомы и резкие различия Северного и Южного регионов, и сходство регионов средней полосы. Это значит, что по маркёрам Y хромосомы в главе 6 мы видели ту же картину структуры русского генофонда, которую только что прогнозировали по фамилиям. Гены и фамилии в этой общей картине русского генофонда согласны друг с другом.
Но можно возразить, что это сходство отражает лишь самые общие черты генофонда, и получено оно с помощью качественных, а не количественных сравнений. Хотя мы считаем, что совпадение общих черт генофонда намного важнее количественного анализа, но проведём и его. Причём максимально строго. Выше мы рассчитали матрицу неевских генетических расстояний между пятью русскими регионами по данным о фамилиях. Проведём полностью аналогичный расчёт расстояний и для маркёров Y хромосомы. И построим матрицу тех же неевских генетических расстояний между теми же пятью основными регионами, но теперь уже по данным об изменчивости Y хромосомы.
Чтобы анализ был полностью количественным, мы будем сравнивать друг с другом не диаграммы многомерного шкалирования, являющиеся «картинками», иллюстрациями этих расстояний, а сами матрицы расстояний.
Коэффициент связи оценивает, насколько фамилии и гены дают похожие оценки близости между регионами, то есть оценки структуры русского генофонда. Если сходство велико, то коэффициент корреляции будет большим (при полной идентичности равен 1). Если сходства нет, то коэффициент корреляции будет равен 0.
Оказалось, что коэффициент корреляции между матрицей расстояний по фамилиям и матрицей расстояний по генам очень высок и достигает 0.6.
Напомним, что при введении фамилий в популяционно-генетические исследования, был проведён аналогичный анализ связи между распределением фамилий и классических маркёров. Этот анализ был проведён А. А. Ревазовым для северных русских популяций. Коэффициент корреляции оказался равным r=0.32 [Ревазов и др., 1986]. Этого уровня связи оказалось достаточным, чтобы фамилиям присвоить почетное звание «квазигенетических маркёров» и рекомендовать использовать фамилии, как аналоги генов при изучении генофондов [Ревазов и др., 1986].
Итак, корреляция между настоящими генами и фамилиями оказалась очень велика — 0.6. Это означает сходство между структурой русского генофонда, выявляемой через фамилии и через «настоящие» гены. Оба очевидца — фамилии и генетика — дают сходные показания. Такое прямое сравнение фамилий с генетикой ещё раз показывает, какими парадоксально надежными маркёрами являются фамилии.
§ 3. «Главные сценарии» изменчивости
Рассмотренные нами «простые» карты отдельных фамилий отмечают отдельные события. Чтобы увидеть цепь этих событий, сплетающихся в единую историю русского генофонда, надо «сплавить» воедино изменчивость множества популяций и фамилий. Такое обобщение могут дать синтетические карты, созданные на основе множества карт отдельных фамилий. Для этой цели, как и по всем другим признакам — антропологии и генетики (главы 4, 5, 6) — мы провели анализ главных компонент. Геногеографические карты главных компонент являются картами новых обобщённых признаков. Они описывают основную часть разнообразия всех фамилий и выявляют основные «сценарии» их изменчивости.
Однако специально проведённые разные виды анализа показали, что в составе 75 фамилий Атласа в большей степени представлены фамилии Западного и Центрального регионов и в целом — регионов среднерусской полосы, а Южный и Северный регионы отодвинуты на задний план. Это, конечно же, снижает возможности картографического Атласа фамилий в реконструкции структуры всего русского генофонда — его ландшафт мы видим с точки зрения Запада и Центра.
Поэтому из-за ограниченности объёма книги мы не приводим карты главных компонент (они будут приведены на сайте). Когда же мы соберём данные, настолько полно покрывающие «исконный» ареал русского народа, что мы сможем отказаться от заданного нам списка 75 фамилий и перейти к анализу сотен и тысяч фамилий, тогда будет проведён картографический анализ «фамильного генофонда», где смещение в сторону любого из регионов будет исключено.
Здесь укажем лишь, что в целом оба главных сценария фамильного ландшафта выделяют, прежде всего, среднерусскую полосу — она служит основным структурообразующим элементом обеих карт. Обе карты главных компонент имеют ещё две общие черты: постепенное изменение значений к югу ареала, и выраженное своеобразие северных русских популяций.
Таблица 7.6.1.
Коэффициенты корреляции между главными компонентами изменчивости фамилий и других признаков — соматологии, дерматоглифики, классических и ДНК маркёров
Подчеркнём, что этот результат, полученный при картографическом анализе 100 популяций (по 75 фамилиям), подтверждает результат, полученный статистическими методами при анализе 5 регионов (но по всему фонду фамилий — более 14 тыс.).
Сравним также показания фамилий и других очевидцев структуры генофонда. Такой «мультиокулярный» подход позволяет оценить, насколько карты «главных сценариев» по фамилиям сходны с теми, что обнаружила антропология и генетика.
КОРРЕЛЯЦИИ МЕЖДУ «ГЛАВНЫМИ СЦЕНАРИЯМИ» ВСЕХ ПРИЗНАКОВ
В нашем случае мы имеем редкую возможность сравнить показания фамилий с показаниями ещё четырёх свидетелей — соматологии, дерматоглифики, классических и ДНК маркёров. Корреляции между картами всех трёх главных компонент фамилий и остальных четырёх очевидцев приведены в таблице 7.6.1.
Мы видим, что карта первой главной компоненты изменчивости фамилий (1PCF) обнаруживает хорошее сходство с картой первой компоненты по признакам антропологии — коэффициент корреляции выше 0.6 (р=0.66). Несколько слабее связь с классическими маркёрами (р=0.44). Невысокая связь наблюдается с главным сценарием Y хромосомы (р=0.29). Однако с ландшафтом третьей компоненты Y хромосомы связь выражена чётко (р=0.49).
Зато вторая компонента по фамилиям (2PCF) высоко коррелирует с обеими вторыми компонентами маркёров генетики: и по ДНК маркёрам Y хромосомы (р=0.63), и по классическим маркёрам (р=0.65) коэффициенты связи выше отметки 0.6. Также явно выражена (р=0.47) и связь карты второй компоненты изменчивости фамилий (2РСр) со второй компонентой признаков антропологии (2РСд). Важно подчеркнуть, что фамильный ландшафт второй компоненты (2PCF) обнаруживает ровный ряд корреляций с первыми компонентами всех четырёх типов признаков (связь с 2РСА, 1PCD, 1PCG, 1PCY лежит в интервале 0.23<р<0.40), указывая на связь с широтно бегущими волнами русского генофонда.