ЖАНРЫ

Русский генофонд на Русской равнине
Шрифт:

Итак, включение в выборку низко полиморфных генов приводит к неустойчивости (непредсказуемости оценок дифференциации генофонда FST, а также к отклонению от изменчивости по селективно-нейтральному типу (то есть FST?Fe).

Именно поэтому для получения устойчивых оценок дифференциации генофонда FST желательно использовать выборки генов, соответствующию строгому критерию полиморфизма: 0.05<=q<=0.95. Это важно ещё и потому, что для слабо полиморфных генов велика не только случайная ошибка. На её фоне проявляется и систематическая ошибка: включение слабо полиморфных генов вызывает занижение средней оценки дифференциации FST.

Поясним этот момент. На рис. 4.4. представлены оценки для шести основных регионов мира из сводки [Cavalli-Sforza et al.,

1994]. Мы рассчитали их в двух вариантах: 1) по всем маркёрам (0<q<l, левый столбик); 2) с учетом критерия полиморфизма (0.05<q<0.95, правый столбик). Мы видим, что для всех регионов пренебрежение критерием полиморфизма привело к занижению изменчивости генофонда. Лишь в Европе различия между обеими оценками невелики — видимо оттого, что именно европейские ученые и выбирали панель классических маркёров для популяционных исследований: в Европе они большей частью полиморфны.

Итак, рассмотрение разных оценок изменчивости генофондов основных регионов мира выявило, что устойчивость оценок FST связана с тремя факторами: 1) долей низко полиморфных генов; 2) средним уровнем их полиморфизма; 3) организацией данных о генофонде. Существует ещё один фактор — использование маркёров одного или же разных типов. Чтобы учесть его, необходимо выполнить ещё одно требование к организации исходных данных.

ТРЕБОВАНИЕ ТРЕТЬЕ: РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ ГЕННЫХ МАРКЕРОВ

Это требование означает, что нельзя включать в анализ маркёры одного лишь типа — это может привести к смещению полученных оценок изменчивости.

Структура генофонда отражена в результатах его изучения с той или иной точностью. Но, как положено в естественных науках, два корректных исследования одного и того же параметра для одного и того же генофонда должны привести к одинаковым выводам. Конечно же, число генов, по изменчивости которых делается вывод об изменчивости всего генофонда, должно быть достаточно велико, но оно всегда намного меньше общего числа генов в геноме (и, соответственно, в генофонде). Поэтому обобщённая изменчивость в разных исследованиях может определяться по совершенно разным, не перекрывающимся множествам генов, но результаты этих исследований все равно должны совпасть.

Это и понятно, поскольку целью этих работ является не изучение изменчивости данного набора генов, а исследование закономерностей генофонда. И если сравнивается изменчивость двух разных типов генов в одном и том же ареале, то ожидаемым и естественным должно быть совпадение результатов. Если же результаты несходны, то это тревожный знак того, что, по крайней мере, одна из систем не дает оценку «обобщённого гена», по крайней мере, один из результатов неверен. Неверен в том смысле, что он не отражает общую структуру генофонда, хотя возможно, вполне удовлетворительно описывает изменчивость данного набора генов.

Это снова подводит нас к вопросу о том, сколько и каких конкретных генов надо включить в анализ, чтобы их совокупная изменчивость соответствовала изменчивости некоего «обобщённого гена», отражала изменчивость не конкретного набора генов, а генофонда в целом. Но прежде ещё раз подчеркнём, что характеристику генофонда можно получить по разным панелям генетических маркёров, и все эти оценки могут быть правильными и равноценными и, что наиболее существенно, они должны совпадать друг с другом.

Формулируя требования к репрезентативности выборки генов — по отношению ко всему геному — важно учитывать обе её стороны, количественную и качественную.

1) КОЛИЧЕСТВЕННЫЙ АСПЕКТ ФОРМИРОВАНИЯ ВЫБОРКИ — ЧИСЛО ГЕННЫХ МАРКЁРОВ В ДАННОЙ ПАНЕЛИ.

Разные авторы пришли к эмпирическому обобщению, что, как правило, выборка примерно из 20–30 локусов (или ?50 аллелей) является достаточной для надёжной оценки FST. При дальнейшем увеличении выборки средняя оценка FST практически не меняется [Bowcock et al., 1987; Айала, Кайгер, 1988; Cavalli-Sforza, Piazza, 1993]. Меньшая выборка генов тоже может давать корректные результаты, но необходима проверка её корректности. Меньшая выборка требует обязательного контроля её репрезентативности с помощью прямых оценок Fe (§ 2) или иных доказательств её адекватности и соблюдения равенства FST=Fe.

Рис. 4.4. Оценки селективно-нейтральной дифференциации генофондов FST?Fe для основных генофондов коренного населения ойкумены

Примечания: заштрихованные столбцы — оценка по всем генам (0<q<1); черные столбцы — оценка по генам, удовлетворяющим пятипроцентному критерию полиморфизма (0.5<q<0.95)

2) КАЧЕСТВЕННЫЙ СОСТАВ ВЫБОРКИ ГЕНОВ ИЗ ГЕНОМА — ЕЁ СЛУЧАЙНОСТЬ ПО ОТНОШЕНИЮ К ДЕЙСТВИЮ ЕСТЕСТВЕННОГО ОТБОРА.

Если в выборке будут преобладать гены, подверженные стабилизирующему отбору — средняя оценка FST будет занижена. Если будут преобладать гены, на которые действует дифференцирующий отбор — средняя оценка FST будет завышена по сравнению с истинной, селективно-нейтральной дифференциацией генофонда. При этом важно знать, что некоторые типы маркёров — например генетико-биохимические маркёры (в отличие от иммунологических) [Балановская, 1998] или, тем более, гены наследственной патологии — всегда занижают среднюю оценку FST, поскольку для них преобладающим является стабилизирующий отбор.

В разных разделах мы приводили целый ряд примеров высокой устойчивости FST и выполнения равенства FST=Fe при использовании очень разных наборов классических маркёров. Адекватные выборки генов различаются столь сильно и по их размеру, и по их составу, что невозможно определить иное «правило» для их создания, чем случайность по отношению к эффектам отбора (что обычно обеспечивается включением в выборку самых разных типов классических маркёров). Более того, новые аутосомные маркёры не меняют картины: накапливающаяся информация по ДНК маркёрам указывает, что их средние FST близки к FST=Fe, определяемым по «классическим» маркёрам (см., например, табл. 4.3. и раздел 8.1). При включении в выборку новых маркёров со своеобразной функцией в организме, с особым характером микроэволюции, требуется специальная проверка выполнения для них равенства FST?Fe.

Такая проверка была проведена, например, для генов, связанных с иммунным ответом, для системы HLA (human leukocytal antigen) [Евсеева, 2001]. Ряд тесно сцепленных локусов этой генетической системы обладает выраженным полиморфизмом: панель аллельных вариантов каждого локуса необычайно обширна, поскольку обеспечивает генетический контроль иммунного ответа. Одни и те же народы Крайнего Севера, представляющие три разных лингвистических семьи, были изучены как по панели аллелей HLA (проверялось наличие 160 аллелей 6 локусов HLA-I и HLA-II классов), так и по панели классических маркёров (15 аллелей 5 локусов иммуно-биохимического полиморфизма). Каждый аллель HLA природой предназначен для ответа на запросы особой внешней среды. Поэтому можно было ожидать, что оценки дифференциации FST системы HLA — причём в экстремальных условиях Крайнего Севера! — будут чрезвычайно смещены (FST!=Fe) от селективно-нейтральных. Однако проверка показала, что — вопреки ожиданиям — средняя оценка дифференциации по системе аллелей HLA соответствует селективно-нейтральной дифференциации! Видимо, разнообразие факторов среды, на которые система HLA обеспечивает иммунный ответ, столь велико, что все разнонаправленные векторы компенсируют и взаимно «гасят» друг друга при расчёте средних оценок FST. В силу исключительного высокого полиморфизма система HLA дает устойчивую и объективную картину различий между генофондами.

Поделиться с друзьями: