ЖАНРЫ

Русский генофонд на Русской равнине
Шрифт:

ПОСТРОЕНИЕ И ИСПОЛЬЗОВАНИЕ КАРТ НАДЕЖНОСТИ

Карты надёжности занимают особое место в геногеографии. Они сродни простым картам тем, что строятся не на основании других карт, а на основании данных в опорных точках. Но для построения карт надёжности нужно знать лишь географическое расположение опорных точек (исходных популяций). Результатом будет оценка для каждого узла карты того, насколько этот узел удален от совокупности опорных точек. И, следовательно, насколько надёжна интерполяция значений в этом узле.

Карты надёжности отвечают на главный вопрос интерполяционный процедуры: насколько надёжен наш прогноз, то есть рассчитанное нами интерполированное значение в данном узле карты, если для данной области карты нет ни одной непосредственно изученной популяции. Карта надёжности показывает степень достоверности интерполяции для каждого узла карты. И использование карты надёжности может быть двояким.

Во-первых, полезно чисто визуальное сравнение карты надёжности и карты того признака, для которого она построена. Мы видим, что значениям, которые показывает карта признака, можно доверять, если они находятся в тех областях, которые карта надёжности показывает как достоверные, и следует относиться с осторожностью, если они находятся в областях ненадёжных, то есть мало обеспеченных исходными опорными точками.

Второй способ использования карт надёжности состоит в том, чтобы вообще исключить «ненадёжные» значения из карты признака — в тех узлах, для которых величина надёжности ниже заданного порога. Наша карта какого-либо признака после такого применения карты надёжности приобретает «белые пятна» изученности: если раньше значения признака показывались в каждой точке, то теперь они показываются лишь для надёжных узлов, а остальные узлы остаются пустыми (белыми).

Отметим, что карты надёжности двух разных признаков могут быть идентичными — в том случае, если эти признаки изучены в одних и тех же популяциях. Например, если мы анализируем совокупность многих признаков (пусть это будут русские фамилии), изученных в одних и тех же популяциях. В этом случае и для карты любой фамилии, и для любой производной или обобщённой карты фамилий будет подходить одна и та же карта надёжности. Однако если один из наших признаков изучен в одних популяциях, а другой в других, то карты надёжности этих признаков будут различаться. Например, при построении обобщённых карт это создаёт проблему — какая из карт надёжности отдельных признаков описывает надёжность всей совокупности признаков, то есть надёжность самой обобщённой карты? На практике пользуются разными методами объединения карт надёжности, с тем, чтобы получить общую, «усреднённую» карту надёжности. Области низкой надёжности именно «усреднённой» карты и будут «белыми пятнами» на обобщённой карте изучаемых признаков.

АРСЕНАЛ

Подведём итоги нашего осмотра картографического арсенала. Мы видели, по меньшей мере, дюжину разных методов, более или менее тесно переплетённых друг с другом.

1. Построение «простой» карты по данным в опорных точках при заданных параметрах картографирования.

2. Построение карты надёжности (по данным о расположении опорных точек).

3. Построение простой карты с учетом надёжности (ненадёжные узлы остаются пустыми и отображаются как «белые пятна»).

4. Визуализация карты (создание графического изображения по данным цифровой модели).

5. Преобразование отдельной карты (например, дополнение до единицы).

6. Преобразование совокупности карт (например, суммирование карт).

7. Построение трендовой карты (усреднение значений попавших в плывущее окно).

8. Построение трендовой карты с использованием многочленов Чебышева.

9. Построение карты межпопуляционной изменчивости или другого показателя, рассчитываемого по заданной формуле в плывущем окне постоянного или меняющегося размера.

10. Расчёт корреляции карты с географическими координатами.

11. Построение корреляционной карты.

12. Построение синтетических карт (главных компонент, гетерозиготности, генетических расстояний) по нескольким исходным картам.

Напомним ещё раз, что к любым картам могут применяться любые из этих операций — например, можно построить трендовую карту не только для простой, но и для обобщённой карты, рассчитать корреляцию корреляционной карты с географическими координатами и так далее.

3. КАРТОГРАФИЧЕСКАЯ ТЕХНОЛОГИЯ

«Его Величество дал миру карты… Блага, принесённые императором Карлом, распространяются на всю вселенную, даже на земли, еще не открытые». Мартин Кортес де Алькабар, испанский королевский картограф, «Breve compendio de la sphera у de la arte de navegar, con nuevos instruments у reglas, exemplificado com muy subtiles demostraciones», 1530 г.

В этом разделе важнейшие из методов, упомянутых при рассказе о картографическом арсенале, описаны подробнее, с указанием конкретных алгоритмов и особенностей расчёта. Но сначала мы кратко расскажем об истории разработки этих методов (§ 1), а в заключение (§ 9) рассмотрим особый аспект анализа главных компонент — так называемую проблему ложных корреляций.

§ 1. Как карты пришли в геногеографию

КАРТЫ И ГЕНОГЕОГРАФИЯ

Более полувека, прошедшего с момента зарождения геногеографической идеи до её современного воплощения, — срок достаточно большой, чтобы раскрылись те её стороны, которые первоначально оставались в тени, и принципиальная важность которых в начале не была определена. Мы имеем в виду карту как инструмент геногеографического исследования. Перефразируя утверждение академика Д. Н. Анучина, можно сказать, что степень геногеографического познания генофонда страны определяется степенью совершенства имеющейся для него карты. Современная геногеография уже немыслима без компьютерной картографии как её основы. Картографический анализ не только обеспечивает создание математически строгих, объективных и унифицированных карт, но и создаёт совершенно новые возможности для анализа явлений, моделируемых геногеографическими картами. По мысли А. С. Серебровского, геногеография способна обнаруживать главнейшие процессы, происходящие в генофонде. И лучше всего она это делает с помощью карт. На современном этапе развития геногеография имеет многообразный картографический инструментарий для корректного решения сложных задач. Именно картографическое исследование географической архитектоники генофонда позволяет анализировать географию и историю процессов, формирующих основные свойства генофонда.

Вся сложность ситуации заключалась в том, что вопрос о карте как инструменте геногеографии не был поставлен А. С. Серебровским, создававшим науку геногеографию. Именно поэтому в дальнейшем на долгое время возобладал чисто статистический анализ популяций, изъятых из географического пространства. Карты географического распространения генов, особенно генов и фенотипов человека, создавались, а чаще — рисовались и до, и после постановки А. С. Серебровским проблем геногеографии. Некоторые прекрасные работы, основанные на строгом картографическом методе, остались малоизвестны и незаслуженно забыты [Чепурковский, 1913]. Другие, представляющие результат иллюстрирования, а не картографического анализа распределения генов, широко известны [Mourant et al., 1976].

КОМПЬЮТЕРНОЕ КАРТОГРАФИРОВАНИЕ

Лишь с 70х годов XX века начал формироваться картографический подход к геногеографии — как на путях создания цифровых моделей карт, так и на путях математического анализа и точного отображения трендовых явлений на карте [Cavalli-Sforza, Bodmer, 1971; Ward, Neel, 1976; Rychkov, Sheremetyeva, 1977, 1979]. На рубеже 80х годов, благодаря органическому соединению с картографией и с созданием компьютерных банков данных о частотах генов в населении, начался принципиально новый этап в развитии геногеографии — компьютерное генетическое картографирование [Menozzi et al., 1978; Piazza et al., 1981a, 19816, Ammerman, Cavalli-Sforza,1984]. Геногеография популяций человека пережила и в переносном, и в буквальном смысле второе рождение: возник журнал Gene Geography (1987 г.). Как ни печально, его учредители не догадывались ни о происхождении и долгой предыстории геногеографии, ни о её связи с исследованием генофонда, и полагали, что созданием журнала оформили те идеи, что витали в европейской науке в 60 х годах нашего столетия [Terrenato, личное сообщение]. Возможно, именно поэтому журнал был ориентирован исключительно на публикацию данных о частотах генов в населении мира, оставляя за рамками своих публикаций проблемы не только генофонда, но и генетической картографии.

Как бы то ни было, началась эпоха компьютерной геногеографии и создания электронных карт географического распределения генетической информации. Это означает, что появилась практическая возможность от географии генов человека перейти к географии генофондов населения мира, регионов, отдельных стран и этнических групп. Появилась возможность исследовать генофонд не только общими генетико-статистическими методами, но и собственными уникальными методами геногеографии — картографическими.

Широкие возможности компьютерных карт и заставили нас взяться за их создание. При этом мы прошли долгий путь, причём полностью независимо от коллектива L. L. Cavalli-Sforza. Их «синтетические» карты мы увидели тогда, когда уже были созданы наши «обобщённые» карты. Тем более впечатляюще и закономерно, что оба коллектива независимо шли параллельными путями. Эти пути ни в чем не повторяли друг друга, однако при этом все общие инструменты картографирования оказались очень похожи. Поэтому мы не будем в этой книге останавливаться на анализе сходства и различий в технологиях — достаточно того, что получаемые карты обоих коллективов полностью сопоставимы.

Поделиться с друзьями: