ЖАНРЫ

Русский генофонд на Русской равнине
Шрифт:

Подробная информация о каждой из карт — частоты (минимум, максимум, средняя), гетерозиготность и межпопуляционная изменчивость, корреляция с широтой и долготой, число изученных популяций и величина «надёжного» ареала картографирования — приведена в разделе 5.2. Даже эта информация показывает, насколько неравно изучены классические маркёры! Из таблицы 5.2.1. мы видим, что локус LEW представлен всего лишь 9 русскими популяциями, в то время как локус АВ0 (известный всем как «группы крови») — 182 русскими популяциями. Среднее число популяций, изученных по 17 локусам, составило 35. Много это или мало? Конечно, по сравнению с данными антропологии, охватывающими 180 популяций (см. главу 4) классические маркёры изучены в пять раз хуже. Однако всё познаётся в сравнении — классические маркёры в среднем изучены в два-три раза лучше, чем ДНК маркёры (см. главу 6).

На всех картах значения показаны только для «надёжной» зоны, а все остальные территории показаны как «белые пятна» в изученности русского генофонда. «Надёжная» зона — это территория, хорошо обеспеченная исходными данными, которую карта надёжности оценивает как область достоверного прогноза. Если карты антропологии (глава 4) охватывали одну и ту же территорию, а их «надёжные» зоны были всегда одинаковы, то для классических маркёров всё переменчиво: по одним маркёрам «надёжные» зоны оказываются в пять раз меньше, чем по другим. Это привело к тому, что обобщённые карты русского генофонда, представленные в разделе 5.3., по площади невелики. Их «надёжная» зона, как шагреневая кожа, сокращается при включении слабо изученных маркёров. Она определяется надёжным ареалом наименее изученных генов — только так можно обеспечить надёжность карт, обобщающих изменчивость всех генов.

§ 5. Что мы увидим на картах?

ОТ ТАБЛИЦЫ — К КАРТЕ

Но прежде, чем переходить к анализу карт, следует представить: а что же собственно происходит с исходной информацией, когда мы её картографируем? Ведь мы как бы возвращаем табличные популяционные данные, безразличные к пространству, в собственный географический ареал этих популяций, где эти данные вновь начинают жить в двумерном пространстве карты и соотноситься в нём с другими популяциями. Они находят своих географических соседей, и лишь в согласии (или в споре) с ними рождается карта. Но что при этом происходит с исходными оценками популяционных частот? Изменяются ли статистические параметры признаков (средние частоты, разнообразие), когда мы их картографируем? И если изменяются, то как?

Вопрос не праздный. Мы недаром приводим в разделе 5.3. две средние оценки гетерогенности русского народа (генетических различий между русскими популяциями — GST). Одна из них (GST=2.00) получена по табличным данным для того, чтобы сравнить её с табличными данными по другим народам Евразии. Вторая оценка гетерогенности (GST=1.36) получена по картографированным значениям для того, чтобы сравнить её с изменчивостью каждой из карт русского народа (см. раздел 5.1). Причём мы специально рассчитали обе оценки строго по одним и тем же популяциям и строго по одним и тем же генетическим маркёрам (44 аллеля 17 локусов). Однако, как мы видим, различия между этими двумя оценками велики (GST=2.00 и GST=1.36). И возникают эти различия в результате процедуры картографирования.

Так какая же оценка более «правильная»? Решающим аргументом служит то, что при картографировании учитывается новый параметр — география, учитывается важнейший атрибут популяции — её ареал. Если до этого для изменчивости гена было как бы одно измерение — лишь его частота, то теперь появляются ещё два измерения — двумерное пространство геногеографической карты. Карта учитывает географию гена. И поэтому мы считаем, что оценка, полученная по карте, является более точной — она уточняет статистические параметры изменчивости гена, рассчитанные просто по табличным данным, при игнорировании реального географического пространства, в котором живут популяции.

Но чтобы это утверждение не было голословным, рассмотрим на конкретных примерах, что в действительности происходит при переходе от таблицы к карте.

ЕСТЬ ЛИ РАЗЛИЧИЯ МЕЖДУ СТАТИСТИКАМИ КАРТ И ТАБЛИЦ?

Для ответа на этот вопрос проведём моделирование на разных генофондах. Возьмём в качестве модельных объектов три иерархически соподчинённых генофонда: 1) Белоруссия; 2) Черноморо-Балтийский регион (для краткости назовём его «Западным»), который включает в себя, кроме Белоруссии, также Украину, Молдавию, Литву, Латвию, Эстонию; 3) Северная Евразия, которая включает в себя и Черноморо-Балтийский, и все остальные регионы бывшего СССР. Мы видим, что каждый последующий генофонд включает в себя, как матрёшка, предыдущий и позволяет прослеживать закономерности более высокого порядка. Такой «принцип матрёшки» позволяет выявлять общее и особенное в пространственной структуре каждого из генофондов, а с методической стороны даёт возможность провести анализ с внутренним контролем. В качестве модельных генетических маркёров возьмём два самых подробно изученных. Это, конечно же, группы крови — всем известные как I, II, III и IV группы локуса АВ0 и резус (RH).

Таблица 5.1.1.

Сравнение средних частот (М) и межпопуляционных различий (GST) для исходных («таблица») и картографированных («карта») значений признаков

Примечание: состав регионов указан в тексте.

Чтобы критически оценить новую информацию, которую вносит учёт географического ареала популяций, рассмотрим для каждой из «матрёшек» по два распределения. Первое распределение («табличное») характеризует данные таблиц до картографирования — частоты гена в изученных популяциях. А второе распределение («карточное») характеризует карты — картографированные значения. Мы не будем утомлять читателя гистограммами (они приведены на картах модельных регионов в [Балановская и др., 1994; Балановская, Нурбаев, 1995]), и приведем только средние значения частоты аллеля (М) и межпопуляционные различия (GST) до и после картографирования (табл. 5.1.1).

Сравнение таблиц и карт показывает, что нет единой закономерности изменений при картографировании: всё зависит от самого гена, от особенностей его распределения и изученности. Каждый из показателей (М и GST) при переходе от таблиц к картам может как уменьшаться, так и увеличиваться!

В чем причина таких разночтений? То новое, что вносит карта, связано с двумя основными факторами, действующими противоположно.

Первый фактор — большее число анализируемых точек. На карте всегда больше число промежуточных значений, чем в таблице: число узлов сетки N всегда намного больше числа исходных популяций К. Поэтому только за счёт появления множества промежуточных значений между опорными точками дисперсия (и, соответственно, GST) картографированных значений уменьшается (по сравнению с дисперсией табличных значений), а гистограмма на карте становится более плавной.

Второй фактор — неравенство популяционных ареалов — обычно сказывается противоположным образом, то есть увеличением разнообразия карты (GST). Этот фактор оказывается ведущим тогда, когда есть связь между частотой признака и площадью, занятой данным интервалом частоты. Этот фактор не только увеличивает разнообразие, но и меняет среднюю частоту признака на карте, сдвигая его в сторону значений, распространённых на большем ареале.

Например, пусть зоны с минимальными (частота равна 0) и зоны с максимальными (частота равна 1) частотами признака резко различаются по площади их ареалов. Пусть площадь зоны минимумов (Nmin) в 10 раз меньше, чем площадь зоны максимумов (Nmax):(Nmin)=10. А в таблице число изученных популяций для каждой из зон одинаково: Kmax=Kmin. Тогда из таблицы мы получим среднее значение частоты равное 0.5.

А на карте — среднее значение частоты будет близко к единице (0.91). И карты дадут более корректный результат — он учитывает географическое пространство и размер популяционных ареалов. И этот пример невыдуманный. Например, мы можем изучить множество популяций кавказских народов на небольшом пространстве Кавказских гор — и столько же популяций на бескрайних просторах Сибири. Причём изученность народов (среднее число популяций, изученных для одного народа) может быть одинаковой — просто размеры этнических ареалов резко различны на Кавказе и в Сибири. И, характеризуя изменчивость Евразии, мы не имеем права смещать её средние оценки в сторону меньшего по площади Кавказа только потому, что на этой небольшой территории проживает множество народов.

Есть и третий фактор — влияние интерполяционной процедуры. Но его воздействие на изменчивость карты неоднозначно и зависит от параметров интерполяции.

При интерполяции ортогональными полиномами нулевой степени узлы сетки могут содержать только значения частот аллеля, промежуточные между значениями в опорных точках. Например, узлы сетки, расположенные вокруг исходных популяций с частотами 0.2 и 0.6, будут нести только промежуточные значения — 0.21, 0.30, 0.40, 0.50, 0.59. Это уменьшает дисперсию (и GST) при переходе от таблиц к карте. Однако при интерполяции ортогональными полиномами первой степени картина иная. При продолжении географического тренда признака на области, не обеспеченные опорными точками, в этих областях формируются значения не промежуточные, а соответствующие продолжению тренда. Например, увеличение частоты аллеля от 0.2. до 0.6 может сопровождаться продолжением тренда в узлах сетки — частотами 0.70,0.80, 0.90. Это увеличивает дисперсию карты (GST).

Поделиться с друзьями: