Русский генофонд на Русской равнине
Шрифт:
Смысл подобного преобразования станет ясен, если представить, что первая карта показывала распространение одного из аллелей двуаллельного гена. В этом случае вторая карта (дополнение до единицы) покажет распространение второго аллеля: ведь в каждой популяции, в каждой точке карты частота второго аллеля должна равняться единице минус частота первого аллеля! В результате мы получаем карты обоих аллелей, необходимые для дальнейших расчётов. Такой способ получения карты второго аллеля корректнее, чем независимое построение карты второго аллеля: лишь этот способ обеспечивает сумму частот равную единице в любой точке обеих карт. А это требование порой является необходимым для генетико-статистических расчётов.
Кроме вычитания, с картой можно проводить любые другие арифметические или алгебраические действия.
2) ОПЕРАЦИИ С ГРУППОЙ УЗЛОВ. Самым частым случаем преобразований в плывущем окне является построение трендовой карты. В этом случае значение в узле новой карты зависит не только от значения того же узла исходной карты, но и от значений в соседних узлах. Например, значения во всех соседних узлах усредняются, и это усреднённое значение записывается в «центральный» узел создаваемой трендовой карты. Затем мы переходим к следующему узлу, теперь он на время становится «центральным». У него уже несколько иные соседи, и мы проводим с ним ту же операцию. В результате по всей карте как бы проплывает окно заданного размера. В рамках этого окна мы проводим усреднение, и каждый узел карты поочерёдно становится «центральным». Результирующая карта по сравнению с исходной выглядит сглаженной. Благодаря усреднению соседних значений, резкие локальные скачки значений признака выровнялись, сгладились, и мы видим основные черты рельефа карты, не затушёванные локальными всплесками. Степень сглаживания будет зависеть от размера окна. Если мы выберем окно размером 3x3 узла сетки (один «центральный» узел и по одному соседу с каждой стороны, то есть восемь ближайших соседей для каждого «центрального» узла), то сглаживание будет очень небольшим. Если же размер окна будет 15x15 узлов сетки карты, то вся карта предстанет существенно выровненной.
В пакете GGMAG реализованы и много более сложные процедуры. Плывущее окно может быть не только постоянного, но и меняющегося размера. Например, мы можем задать минимальный размер окна 5x5 узлов, и для каждого узла этот размер будет автоматически увеличиваться до тех пор, пока число опорных точек, попавших в окно, не достигнет заданной величины. Тогда для разных узлов карты размер окна и соответственно степень сглаживания окажется разной, но в каждом случае вычисления будут проведены примерно с одной и той же степенью достоверности, поскольку результаты будут опираться хотя и на разное число интерполированных значений, но на одно и тоже число значений в опорных точках. Использование техники меняющегося окна необходимо, когда на карте есть и области с густым и разнообразным населением (например, Кавказ), и области с редким населением на огромных территориях (например, коренное население Сибири).
Эта техника плывущего окна — как постоянного, так и меняющегося размера — может применяться далеко не только для построения трендовых карт. Ведь вместо усреднения мы можем проводить любые другие вычисления по значениям, попавшим в окно, — например, рассчитать их дисперсию. И действительно, наиболее перспективное применение техники меняющегося окна состоит в построении карт межпопуляционного разнообразия, когда для каждой точки карты рассчитывается значение межпопуляционной изменчивости в окрестностях этой точки.
3) ОПЕРАЦИИ СО ВСЕМИ УЗЛАМИ КАРТЫ. Особым случаем преобразования отдельной карты является моделирование трендов с использованием многочленов Чебышева. В этом случае анализируется вся совокупность значений карты, и результирующая карта представляет значения трендового признака, вид которого зависит от исходных значений карты и от выбранной степени многочлена.
Анализ одновременно всех значений карты используется, например, и при расчёте корреляции карты с географическими координатами. В этом случае карта рассматривается как простая таблица, для каждой ячейки которой (узла) известна географическая долгота, широта и значение признака. По этим значениям вычисляется корреляция признака и географических координат. В зависимости от используемой формулы можно рассчитать обычный коэффициент корреляции, частную или множественную корреляцию.
ОПЕРАЦИИ С НЕСКОЛЬКИМИ КАРТАМИ
Этот тип преобразований карт очень похож на операции с отдельной картой. Разница заключается лишь в том, что проводится не операция вида «значение в узле карты и заданное значение», как для отдельных карт, а операция вида «значение в узле первой карты и значение в том же узле второй карты». Мы уже приводили пример дополнения карты до единицы. Аналогичным образом можно суммировать две или более карт, делить карты друг на друга и так далее — в зависимости от заданной нами математической формулы.
Проводятся и более сложные преобразования сразу нескольких карт. Например, та же технология плывущего окна может быть применена и к расчёту корреляции между двумя картами. В этом случае рассчитывается корреляция между всеми значениями в группе попавших в окно узлов одной карты и группе аналогичных узлов второй карты, и значение заносится в очередной «центральный» узел результирующей карты. Таким образом, для каждого узла карты получается свое значение коэффициента корреляции, и полученная карта носит название корреляционной. Она показывает, какова теснота связи на разных территориях.
А она зачастую различается не только по величине, но и по знаку!
Рассчитать корреляцию между двумя картами можно и более простым способом: как корреляцию между всеми узлами первой и (ранжированными в том же порядке) узлами второй карты. В этом случае мы получаем не корреляционную карту, а единственное значение коэффициента корреляции между двумя нашими картами.
Легко заметить, что операции с несколькими картами можно подразделить по тому же принципу, что и операции с отдельной картой: действия с каждым узлом независимо (например, суммирование карт); действия в плывущем окне (корреляционные карты); действия со всей совокупностью значений карты (расчёт коэффициента корреляции между двумя картами).
ПОСТРОЕНИЕ СИНТЕТИЧЕСКИХ КАРТ
По сути, этот тип преобразований ничем не отличается от только что рассмотренного анализа нескольких карт. Мы выделяем его как отдельный вид лишь потому, что этот анализ преследует особые цели и, к тому же, обычно использует более сложные математические формулы.
Самым простым из них является построение карт гетерозиготности. Гетерозиготность рассчитывается по обычной формуле из частот каждого аллеля: HS=1-?q(j)2. Только эти частоты берутся соответственно из карт распространённости этих j– тых аллелей, и расчёт проводится независимо для каждого узла карты. Для двуаллельного случая, чтобы получить карту гетерозиготности, нужно лишь перемножить карты двух аллелей — q и (1-q), а затем полученную карту умножить на два. Как видим, весьма несложно.
Построение карт генетических расстояний основано на том же принципе, только формула чуть сложнее. В этом случае исследователь задаёт, во-первых, частоты аллелей в реперной популяции (то есть той популяции, генетические расстояния до которой мы хотим оценить), и, во-вторых, карты распространённости этих аллелей. Тогда для каждого узла карты программа (как и при расчёте гетерозиготности) берет частоты каждого аллеля в этом узле и по заданной формуле рассчитывает генетическое расстояние от этих частот до частот в реперной популяции. Как обычно, такая операция проводится независимо для каждого узла, и создается карта расстояний, показывающая степень генетической удаленности каждой точки карты от реперной популяции.
Технически более сложным является расчёт карт главных компонент. В этом случае данные по всем узлам всех исходных карт анализируются совместно: вычисляются коэффициенты корреляции между картами и далее по обычному принятому в статистике алгоритму рассчитываются значения каждой из главных компонент для каждого узла карты. Результатом является серия карт главных компонент: в узлах этих карт содержатся значения соответствующей главной компоненты в этой точке карты.
Важно отметить, что обобщённая карта, например карта главной компоненты, по своему формату ничем не отличается от простой карты распространения какого-либо признака: точно так же каждый узел карты содержит какое-либо численное значение. Это значит, что с обобщёнными картами (как и с корреляционными и вообще любыми), можно проводить все те же операции, что и с простыми картами — картами отдельных признаков. Например, часто строят карты трендов для главных компонент, можно построить корреляционную карту между картой генетических расстояний и картой гетерозиготности, или карту главной компоненты по картам главных компонент и так далее. Главное сформулировать задачу и подобрать оптимальный показатель — а картографическая технология GGMAG позволит легко реализовать его и построить требуемую карту.