ЖАНРЫ

Русский генофонд на Русской равнине
Шрифт:

ЭТАПЫ ГЕНОГЕОГРАФИЧЕСКОГО АНАЛИЗА

Как же именно провести геногеографический анализ для мтДНК? Мы прошли несколько этапов:

1) БАЗА ДАННЫХ. Все доступные опубликованные данные по популяциям Евразии были собраны в единую базу данных (описание см. Приложение, раздел 5).

Работа по сведению воедино всех опубликованных данных об изменчивости митохондриальной ДНК потребовала не одного года и продолжается по сей день под общим руководством Е. В. Балановской. Первые варианты базы данных составлялись О. П. Балановским и затем А. С. Пшеничновым в 2003–2005 годах, программную реализацию основных функций осуществил Ю. В. Пустовой. Современный вариант базы появился благодаря усилиям В. В. Запорожченко, взявшего на себя труд не только собрать практически все опубликованные данные, но и провести определение гаплогрупп для каждого образца с помощью разработанного им оригинального программного обеспечения. Эта задача унификации данных разных авторов и определения гаплогрупп — едва ли не самая трудная при создании базы данных, поскольку для большинства опубликованных данных имеется информация только о некодирующей части мтДНК (ГВС1), тогда как надёжное определение гаплогрупп возможно лишь при наличии достаточного набора данных по ПДРФ сайтам (SNP маркёрам) кодирующей части мтДНК. База данных, используемая в этой главе, содержит сведения по 67 000 образцов мтДНК, классифицированных в более чем 700 гаплогрупп, и включает также детальную характеристику тысячи изученных популяций.

2) «ПРОСТЫЕ» КАРТЫ. Созданы «простые» карты распространения основных гаплогрупп мтДНК.

Для выделения гаплогрупп мы воспользовались их современной филогенетической классификацией. По возможности картографировались не только основные гаплогруппы, но и их много более дробные подразделения. К сожалению (см. раздел 6.2.1.), отнесение данных по мтДНК к таким дробным гаплогруппам можно сделать далёко не всегда: для этого нужны детальный анализ ПДРФ маркёров кодирующей части мтДНК или даже полное сек-венирование мтДНК. А большинство имеющихся популяционных данных, увы, имеют «низкое разрешение»: включают лишь анализ ГВС1 и очень небольшое число ПДРФ маркёров. Поэтому и мы ограничены подробностью изученности мтДНК в основном массиве работ: большинство представленных здесь карт показывают распространение крупных гаплогрупп, а более дробное картографирование можно будет провести в дальнейшем, по мере роста числа таких данных «с хорошим разрешением». Карты отдельных гаплогрупп рассматриваются в § 1.

3) ОБОБЩЁННЫЕ КАРТЫ. Кроме карт отдельных гаплогрупп, проведен и обобщенный картографический анализ мтДНК. Построены обычные для геногеографии карты главных компонент. Кроме этого, картографирован и ряд других показателей, навеянных филогеографическим подходом.

Сюда относятся: карты, показывающие суммарную частоту для восточно-евразийских и для западно-евразийских гаплогрупп; карты разнообразия отдельных гаплогрупп, которые могут стать ценным инструментом при поиске зоны происхождения гаплогруппы. Этот последний тип карт, очевидно, является симбиотическим между геногеографией и филогеографией. Этим результатам посвящены § 2-§ 4.

4) АТЛАС мтДНК ЕВРАЗИИ. В результате картографирования создан Атлас географии мтДНК в Евразии. Мы называем его именно атласом, а не простым набором карт (см. главу 3), поскольку, во-первых, все карты сопоставимы, построены одними методами. Во-вторых, совместно они описывают все разнообразие мтДНК, все её основные гаплогруппы, характерные для Евразии. В-третьих, созданы также и обобщающие карты, являющиеся «лицом» атласа.

5) РУССКИЙ ГЕНОФОНД НА ПРОСТОРАХ ЕВРАЗИИ. Наконец, совокупность полученных результатов использована для анализа русского генофонда: показано его место в общем генофонде Евразии и построена карта генетических расстояний, показывающая, какие из евразийских популяций наиболее близки к русскому генофонду.

Итак, созданный Атлас изменчивости мтДНК в Евразии включает ряд разделов: 1) карты распределения в Евразии частоты каждой гаплогруппы; 2) карты разнообразия каждой гаплогруппы; 3) карты генофонда в целом — главных компонент, разнообразия, генетических расстояний. В этой книге приводятся многие, но не все, карты Атласа. Атлас будет доступен на нашем сайте www.genofond.ru, где в будущем будут появляться и обновленные версии Атласа, включающие — по мере появления данных — как новые изученные популяции Евразии, так и более дробные гаплогруппы мтДНК.

§ 1. Евразийские карты мтДНК

— Наверное, ты сделаешь и стрелку, которая всегда показывала бы на Рим?

— Нет, только на север, Цезарь. У. Голдинг. «Чрезвычайный посол».

Геногеографический анализ митохондриальной ДНК в Евразии мы начнём с географии отдельных гаплогрупп. Это самый простой и понятный подход, а построенные карты лежат в основе всех последующих видов анализа. Кроме самих карт, мы будем пользоваться таблицей частот гаплогрупп в регионах Евразии (табл. 9.2.1.) и схемой классификации гаплогрупп — их «родословным древом» (рис. 9.2.1).

УПРОЩЕННАЯ КЛАССИФИКАЦИЯ. Приводимая классификация упрощена и схематизирована по сравнению с современными знаниями о тонкой структуре глобального древа мтДНК. Рис. 9.2.1. — это именно схема, наглядно показывающая соотношения основных гаплогрупп и субгаплогрупп Евразии. Мы надеемся, она будет полезна тем читателям, которые не являются специалистами в анализе мтДНК, но нуждаются в общем представлении о гаплогруппах, встречающихся в Евразии.

Рис. 9.2.1. Упрощенная схема классификации (древо) гаплогрупп мтДНК.

РЕГИОНЫ. При описании карты каждой гаплогруппы мы будем называть те регионы, в которых гаплогруппа встречается чаще всего, и регионы, где её нет. Средние частоты гаплогрупп в регионах приведены в таблице 9.2.1.

Таблица 9.2.1.

Частоты гаплогрупп мтДНК в регионах Евразии

ТРИ ШКАЛЫ. Гаплогруппы очень разнятся по своей частоте: одни распространены с частотой выше 30 % по огромной территории, а иные встречаются с частотой всего в несколько процентов и на небольшом ареале. Поэтому мы будем пользоваться тремя разными шкалами:

Десятипроцентная шкала (для самых частых гаплогрупп): каждый интервал карты соответствует изменению частоты на 10 %. То есть самым светлым цветом показаны территории, где частота менее процента, следующим — частоты от одного до десяти процентов, а максимальный интервал — 50 % и выше.

Трёхпроцентная шкала: шаг шкалы намного меньше — только три процента. Первый (самый светлый) интервал опять показывает частоты ниже одного процента, второй интервал — от одного до трёх процентов, и максимальный интервал частоты выше 16 %.

Однопроцентная шкала: Наконец, для редких гаплогрупп мы будем пользоваться однопроцентной шкалой: первый интервал, как всегда, отмечает частоту ниже одного процента, второй интервал — от одного до двух процентов, а максимальный интервал — частоты выше шести процентов.

Итак, один и тот же цвет на разных картах может соответствовать совсем разной частоте. Но для всех карт, построенных в одинаковой шкале (например, однопроцентной), один цвет означает одну и ту же частоту. И чтобы облегчить сравнение карт, мы будем указывать, в какой из трёх шкал построена каждая карта. Сначала мы рассмотрим самые частые гаплогруппы (карты будут в десятипроцентной шкале) потом перейдём к тем, для которых оптимальна трёхпроцентная шала, и закончим уже не столь частыми гаплогруппами (их карты будут даны в однопроцентной шкале).

Поделиться с друзьями: