Русский генофонд на Русской равнине
Шрифт:
Такие обобщённые карты показывают, как видится структура генофонда с точки зрения данного раздела науки. Географические закономерности, сходство определённых популяций друг с другом, сходство с соседними народами и многое другое удаётся выявить на каждой из обобщённых карт.
Однако вновь всё не так просто. Дело в том, что для каждого массива карт мы можем построить разные типы обобщённых карт — например, разные карты генетических расстояний, или генетического разнообразия, или же «синтетические» карты главных компонент. Но суть всех этих карт одна: по массиву «простых» карт создается одна обобщённая карта данного типа, раскрывающая облик генофонда, а не отдельных его признаков.
СРАВНЕНИЕ ОБОБЩЁННЫХ КАРТ РАЗНЫХ РАЗДЕЛОВ НАУКИ
И, наконец, на последнем этапе мы сравнивали портреты генофонда, полученные по разным типам признаков (по данным разных разделов наук). И те общие черты, которые проявились на большинстве портретов, мы сочли основными, важнейшими закономерностями в структуре генофонда.
Конечно, реальный анализ сложнее. Он включает не только картографирование, но и другие методы. Да и в самом картографировании не всё сводится к обобщённым картам. Последующие главы содержат много разнообразной информации по каждому типу признаков, и мы провели много разных видов анализа. Но всё-таки, если вычерчивать схему нашего исследования, его маршрут, его суть, то они именно таковы: 1) сначала «простые» карты отдельных признаков; 2) потом обобщённые карты по каждому из разделов науки; 3) и венчает работу сравнение основных закономерностей по разным типам признаков.
ПЛАН АНАЛИЗА
Анализ проведён для семи типов признаков: соматологии, дерматоглифики, классических генетических маркёров, аутосомных ДНК маркёров, митохондриальной ДНК, Y хромосомы, фамилий.
Для русского народа анализ каждого типа признаков проведён по единому плану. Сначала рассматривается специфика данного типа маркёров, история его изучения в русском генофонде и описывается накопленный массив данных. Затем картографируются отдельные признаки, даётся описание «простых» карт и количественные показатели их изменчивости, интерпретация выявленных закономерностей. На следующем этапе проводится обобщённый картографический анализ: строятся синтетические карты, объединяющие информацию всех карт отдельных признаков. Основным инструментом являются карты главных компонент, также используются карты генетических расстояний и показателей генетического разнообразия.
После того, как такой анализ проведён для каждого отдельного типа признаков, основные результаты сравниваются с данными других наук, что позволяет сделать общие выводы об объективной структуре русского генофонда, истории его формирования и взаимоотношениях с соседними популяциями.
В основу изучения каждого типа признаков нами положен картографический метод. Этот метод позволяет: 1) рассмотреть географическую изменчивость каждого признака; 2) рассчитать статистические показатели изменчивости каждого признака; 3) выявить общие статистические параметры генофонда по совокупности признаков данного раздела науки; 4) дать «геногеографический портрет» генофонда с точки зрения данного раздела науки (обобщённые карты по совокупности признаков этого типа); 5) наконец, количественно сравнить, насколько похож полученный «портрет» генофонда на «портреты», независимо созданные другими разделами науки.
На каждом этапе картографический анализ широко дополняется другими методами — многомерного шкалирования, сравнения спектра гаплотипов мтДНК, оценки разнообразия и инбридинга, спектра фамилий и другими. Но наша задача — изучить русский генофонд через его географию. Поэтому и главным инструментом, и главным итогом работы являются геногеографические карты.
3.2. КАК СОЗДАНЫ КАРТОГРАФИЧЕСКИЕ АТЛАСЫ
Универсальный адаптер — Карта-это матрица — И лишь потом картинка — Что такое обобщённые карты — Что такое. Атласы — И как они устроены
БЕЗ КАРТ НЕТ СРАВНЕНИЙ
Почему только картографический подход позволяет объединять и сравнивать данные по разным типам признаков?
Признаки, изученные в разных популяциях, нельзя сравнить напрямую. Но можно сравнить интерполяционные карты распространения этих признаков. Так картографический подход становится единственным инструментом комплексного анализа.
Например, классические и ДНК маркёры изучены в разных популяциях. И сравнить результаты этих работ напрямую невозможно, если пользоваться лишь статистическими методами. Картографирование позволяет создать карты, на которых значения обоих признаков показаны в одних и тех же точках. Тем самым снимается проблема неравномерной и различной изученности разных признаков. Оценка надёжности позволяет не заходить при этом слишком далеко, чтобы не сравнивать данные по тем областям карты, которые недостаточно обеспечены исходной информацией.
ЧТО ТАКОЕ КАРТА
Любые карты мы всегда видим в графическом виде, как образ, картинку. Но эти изображения являются лишь производными от «базовых» компьютерных карт — цифровых моделей карты (ЦМ). Исходным материалом для построения цифровой модели служат значения признака в изученных популяциях, эта информация берется из банков данных. К этим данным применяется интерполяционная процедура и создаётся цифровая модель. Она представляет собой трёхмерный массив чисел, моделирующий геногеографические характеристики каждой точки карты: географическую широту, географическую долготу и значение картографируемого признака. Именно эти истинные «базовые» карты, которые для человеческого глаза предстают лишь как матрицы чисел, дают возможность строить графические карты.
Исходные популяции разбросаны в ареале неравномерно. Ареал как бы накрывается равномерной сетью, и для каждого узла сети рассчитываются интерполированные значения признака. Поскольку полностью идентичные сети набрасываются на распределение разных признаков, результаты оказываются полностью совместимыми. Каждый узел одной сети аналогичен соответствующему узлу другой сети. У них одинаковые координаты. И переходя от карты одного признака к карте другого, мы находим в аналогичном узле значение уже другого признака. Поэтому можно сравнить значения всех признаков в аналогичных узлах разных сетей. Мы можем количественно сравнивать любые интерполяционные карты друг с другом, если у этих карт одинаковые сети. Каждый узел сети — элемент общей матрицы. С матрицами можно проводить любые статистические операции. Матрица, сеть, цифровая модель интерполяционной карты — синонимы.
На основе цифровых моделей (а не графических образов) ведется весь точный картографический анализ: анализируются закономерности «простых» карт и строится множество специальных обобщённых карт.
Одну и ту же цифровую модель можно представить в разных графических вариантах, если использовать разные шкалы. При этом получаются различные картографические образы, отвечающие конкретным задачам исследования и особенностям зрительного восприятия. На рис. 10.3.1. (глава 10) в качестве примера показана одна и та же карта (одна и та же ЦМ), представленная в двух разных шкалах. В результате возникли два разных картографических образа. Поэтому при рассмотрении любых карт надо помнить, что непрерывный изменяющийся ряд значений ЦМ при создании графического образа превращён в небольшое число интервалов. И в зависимости от шкалы (границ интервалов) создаются разные графические образы. Это значит, что точное положение изолиний, каких-либо особенностей рельефа на карте не стоит абсолютизировать. Достаточно немного изменить шкалу, и изолиния пройдёт несколько иначе, и особенности очертаний изменятся. Поэтому мы говорим о выявлении резких границ только тогда, когда границы выявляются в самых разных шкалах, или выделяются по двум и более изолиниям.
ТИПЫ ОБОБЩЁННЫХ КАРТ
Важнейшим инструментом нашего исследования являются обобщённые карты. Мы создаём три типа обобщённых карт: карты главных компонент, карты генетических расстояний и карты разнообразия. Каждая из обобщённых карт показывает одну из главных тенденций в генофонде, концентрирует те закономерности, которые в картах отдельных признаков присутствовали только в очень «разбавленном виде».
КАРТЫ ГЛАВНЫХ КОМПОНЕНТ (synthetic maps) — самые популярные обобщённые карты и в отечественных, и в зарубежных геногеографических работах. Анализ главных компонент — это известный статистический метод, который позволяет от множества исходных признаков перейти к нескольким новым, которые называются главными компонентами и являются максимально информативными. При этом первые несколько главных компонент высоко коррелируют с большинством исходных признаков. То есть нам не нужно рассматривать всё множество исходных признаков — достаточно рассмотреть две-три главные компоненты, и при этом мы не потеряем информацию — главные компоненты покажут нам то главное, что есть во всей совокупности исходных признаков.
Две геногеографические школы, возглавляемые Ю. Г. Рычковым и L. L. Cavalli-Sforza, независимо пришли к мысли, что метод главных компонент идеален для выявления основных тенденций в генофондах. Эти два коллектива разработали оригинальные технологии картографирования главных компонент [Menozzi et al., 1978; Рычков, Балановская, 1992]. Точнее, методы расчёта карт главных компонент через карты отдельных признаков.[24]
Карты главных компонент — это карты новых, чрезвычайно информативных признаков. В отечественной традиции принято говорить, что они выявляют основные закономерности генофонда, за рубежом говорят более образно — о сценариях истории генофонда. Для признаков соматологии карты главных компонент заменяются их математическим аналогом — картами канонических переменных. Различие заключается лишь в методике расчёта (см. раздел 4.1.), а для интерпретации карт безразлично, какой показатель использован.