Русский генофонд на Русской равнине
Шрифт:
«ПРОСТЫЕ» КАРТЫ. Раздел включает карты распространения в Восточной Европе 16 отдельных гаплогрупп (С, D, Н, HV, I, J, К, R, Т, U2, U3, U4, U5a, U5b, V, W), а также карту «бланка» (суммарной частоты всех прочих редких гаплогрупп).
ОБОБЩЁННЫЕ КАРТЫ. Раздел включает суммарные карты гаплогрупп и карты гаплотипического разнообразия (являющегося для однородительских маркёров аналогом средней гетерозиготности аутосомных маркёров).
Суммарная карта распространения восточно-евразийских гаплогрупп построена по данным о суммарной частоте гаплогрупп А, В, С, D, G, F, Y, Z.
Карты главных компонент построены по 17 картам отдельных гаплогрупп.
Карта общего гаплотипического разнообразия показывает географическое распределение уровня гаплотипического разнообразия, который был рассчитан по данным о частотах отдельных гаплотипов (линий). Приводится трендовая карта (окно 11x11).
РАЗДЕЛ «АНТРОПОЛОГИЯ ВОСТОЧНОЙ ЕВРОПЫ»
Подраздел «СОМАТОЛОГИЯ» описывает изменчивость 22 признаков соматологии в 253 популяциях Восточной Европы.
ОБОБЩЁННЫЕ КАРТЫ. Подраздел включает карты первой и второй канонических переменных изменчивости 22 антропологических признаков в популяциях восточноевропейских народов. В отличие от карт главных компонент в остальных атласах, эти карты строились не по картам отдельных признаков, а по значениям признаков в изученных популяциях. Расчёт значений канонических переменных выполнен В. Е. Дерябиным, и эти данные были затем нами картографированы.
Подраздел «ДЕРМАТОГЛИФИКА». Исходные данные о значениях шести ведущих некоррелированных признаков в 72 популяциях Восточной Европы были предоставлены Н. А. Долиновой.
«ПРОСТЫЕ» КАРТЫ. Были построены шесть карт распространения ведущих признаков дерматоглифики в Восточной Европе.
ОБОБЩЁННЫЕ КАРТЫ представлены картами главных компонент (тренды в окне 15x15). Расчёт главных компонент проведён в двух вариантах — только по «надёжному» ареалу карты, и по всему пространству карты. Надёжный ареал при уровне строгости 0.5 состоит из обширной центральной зоны и нескольких отдельных «анклавов» по периферии Восточной Европы. Поскольку восприятие карты главных компонент в таком разорванном ареале может затруднить читателя, мы приводим карты главных компонент в «полном» ареале, то есть построенные без учета надёжности. Впрочем, изученность дерматоглифики достаточно высокая, и как «надёжные», так и «безнадёжные» карты выявляют одинаковые закономерности в географии главных компонент.
АТЛАС «ГАПЛОГРУППЫ Y ХРОМОСОМЫ В ЕВРОПЕ»
Карты основаны на сводке о частотах гаплогрупп Y хромосомы в населении Европы, составленной А. С. Пшеничновым по литературным данным, и включающей также наши неопубликованные данные по русским, украинским и белорусским популяциям. Для картографирования выбраны восемь гаплогрупп, которые наиболее часты в населении Европы: E3b, J2, Иа, I1b, N2, N3, R1a, R1b.
Поскольку разные источники (оригинальные публикации) использовали разные схемы определения гаплогрупп, и типирование проводилось с разным уровнем филогенетического разрешения (дробности определения гаплогрупп), не для всех популяций было возможно определить частоты каждой из восьми гаплогрупп. В случае, если источник содержал информацию по парагруппе R1 (xRlb), эти частоты учитывались как относящиеся к гаплогруппе R1a. Число изученных популяций максимально для гаплогруппы R1a (К=148) и минимально для гаплогруппы N2 (К=74).
Большинство малочисленных выборок (N<40), имевшихся в сводке данных, не использовались для картографирования или были присоединены к более крупным выборкам. Такое объединение выборок проводилось только для географически близких популяций, принадлежащих к одному народу.
АТЛАС ГЕНОФОНДА ЕВРАЗИИ
(рассмотрен в главах 5, 6, 9)
Классические маркёры представлены четырьмя картами для генов групп крови АВ0 и резус (глава 5, раздел 5.2). Аутосомные ДНК маркёры представлены картой гена CCR5 (глава 6, раздел 6.1). В обоих случаях использована информация банка данных GENEPOOL. Но главным образом Атлас включает карты по митохондриальной ДНК (глава 9, раздел 9.2).
БАНК ДАННЫХ ПО МИТОХОНДРИАЛЬНОЙ ДНК. Источником исходных данных по мтДНК послужил банк данных World Mitochondrial. (Его последние версии обозначаются также MURKA database). Банк данных объединяет подавляющее большинство опубликованных данных по изменчивости митохондриальной ДНК в популяциях всех регионов мира. Объём банка данных на 2007 год превышает 67 000 изученных образцов мтДНК. Создание банка велось под общим руководством первого автора этой книги: начальные версии составлялись другим автором, затем сбор данных осуществлял А. С. Пшеничное, а нынешняя версия банка данных в значительной мере пополнена В. В. Запорожченко, которым написана также программа автоматического отнесения образцов к гаплогруппам.
Для каждого образца содержится информация по ГВС1, а также (при наличии таких данных в оригинальных статьях) по ГВС2 и по информативным мутациям в кодирующем регионе мтДНК («ПДРФ маркёры»). В банк включены также сведения по изученным популяциям, включая их этническую (народ) и административную принадлежность (страна, провинция) и географические координаты.
ОПРЕДЕЛЕНИЕ ЧАСТОТ ГАПЛОГРУПП. Особенность всех митохондриальных баз данных в том, что информация содержится в формате «образец (из определённой популяции) — его гаплотип», а не в формате «популяция — частота аллеля (гаплогруппы)», обычном для популяционно-генетических баз данных. Соответственно, на первом этапе использования митохондриальной базы данных необходимо для каждого образца указать его гаплогруппу, и только потом можно рассчитать и картографировать частоты гаплогрупп. Однако определение гаплогруппы для огромного массива образцов, изученных разными авторами по различным наборам маркёров с использованием различающихся обозначений одних и тех же гаплогрупп, представляет собой сложную задачу.
Для создания Атласа митохондриальной ДНК Евразии (версия 2007 года) мы использовали следующий алгоритм. Для образцов, по которым имелись удовлетворительные данные о ПДРФ маркёрах кодирующей части мтДНК, гаплогруппы определялись по наличию характеристических мутаций в кодирующей части, то есть наиболее корректным путём. Для образцов, по которым имелись данные только по ГВС1 (или данные по обоим сегментам, и ГВС1, и ГВС2), гаплогруппа определялась по степени сходства данного гаплотипа со всеми гаплотипами, для которых надёжно известна гаплогруппа. В качестве такой референтной базы (обучающей выборки) использовались образцы, секвенированные полностью или подробно охарактеризованные по ПДРФ маркёрам. Например, если гаплотип данного образца по набору мутаций оказывался наиболее сходен с восемнадцатью другими гаплотипами, несомненно относящимся к гаплогруппе U4, то и рассматриваемый гаплотип мы относили к той же гаплогруппе. Такая операция проводилась программным путём (используя возможности MURKA database), при необходимости результаты проверялись и корректировались вручную (экспертная оценка). Такой способ достаточно эффективен и в большинстве случаев точен (как показано для похожего алгоритма [Behar et al., 2007]), но не гарантирует стопроцентное определение гаплогруппы. Действительно, если тестируемый образец сходен с двадцатью гаплотипами, относящимися к одной гаплогруппе, и с сорока гаплотипами другой гаплогруппы, то классифицировать наш гаплотип затруднительно. Во всех подобных случаях гаплогруппа не проставлялась (считалась неизвестной), и популяции, в которых доля таких неизвестных гаплогрупп превышала 1 %, не включались в картографический анализ. Впрочем, для ряда гаплогрупп (тех, для которых общепринято выделение по ГВС1) такого исключения популяций не проводилось, поэтому карты разных гаплогрупп основаны на несколько различающихся наборах популяций.
Такой алгоритм позволил гарантировать высокую надёжность исходных картографируемых данных (частот гаплогрупп) и при этом использовать все имеющиеся данные: как из работ, включавших обязательное определение ПДРФ маркёров, так и данные из многочисленных исследований, в которых проводилось лишь секвенирование ГВС1 (например, публикации лабораторий судебно-медицинской экспертизы). Использованные для картографирования частоты гаплогрупп представлены на сайте www.genofond.ru (к моменту выхода книги представлены частоты 11 основных гаплогрупп в 136 популяциях Западной Евразии).
«ПРОСТЫЕ» КАРТЫ. Были построены 43 карты распространения отдельных гаплогрупп. Можно было построить карты для множества дробных гаплогрупп, но для целей этой книги мы выбрали 43 гаплогруппы, представляющие основное разнообразие митохондриальной ДНК в Евразии.
Перечень картографированных признаков: гаплогруппы А, А4, А5, А* В, С, D, F, Н, J, К, Ml, М3, М7, М7* М7а, М7b, М7Ы, М7b2, М7bЗ, M7b* М7с, Т, Tl, Т2-Т5, Т2, Т* U2, U2* U2a, U2b, U2c, U2e, U4, U5a, U5b, V, W, X, XI, X2, X*,Z.