ЖАНРЫ

Русский генофонд на Русской равнине
Шрифт:

Этот Банк данных (информация на конец 2005 г.) содержит данные о русских популяциях (более 500), изученных по признакам генетики и антропологии (350 маркёров различного типа).

Для того чтобы стать не просто хранилищем самых разнообразных сведений о русском генофонде, а материальной основой для синтеза этой информации, Банк данных должен был решить задачу унификации данных. Вся информация дается в Банке по единой схеме и для генетических, и для антропологических данных. Именно единство формата позволяет отбирать любые данные по общим формальным признакам и комбинировать их.

Банк данных (БД) включает в себя десять разделов, объединяемых в три группы: А) информация, общая для всех тематических разделов БД; Б) тематические разделы; В) справочники.

A) ОБЩАЯ ИНФОРМАЦИЯ

1. Популяционный раздел.

Детальные описания каждой популяции — административная принадлежность, географические координаты, особенности сбора выборки, статус и т. д.

2. Библиографический раздел.

Сведения по тем источникам, откуда были взяты данные.

Б) ТЕМАТИЧЕСКИЕ РАЗДЕЛЫ

3. Соматологические признаки (3276 записей),

4. Дерматоглифические признаки (201 запись).

5. Классические генетические маркёры (2754 записей);

6. Аутосомные ДНК маркёры (962 записи);

7. Гаплогруппы митохондриальной ДНК (363 записи).

8. Гаплогруппы У хромосомы (112 записей);

B) СПРАВ0ЧНИКИ

9. Административно-территориальная классификация

Перечень государств мира, областное деление стран СНГ до уровня областей, административное деление России на субъекты РФ и их подразделение на районы. Справочник позволяет каждой изученной русской популяции дать точную привязку к территории и административной единице.

10. Справочник маркёров и другие специальные справочники.

Основные задачи БД — обеспечить удобный ввод данных, проверку правильности их введения, возможность поиска (фильтрации) и любого комбинирования данных, выгрузку нужной комбинации данных в заданном виде, который «понимает» та или иная программа последующего анализа.

Банк данных обладает развитой системой поиска и отбора информации по различным параметрам и по запросам различного характера: группе популяций,

набору маркёров, интервалу значений признаков, любому сочетанию этих условий и т. д. Фактически — благодаря использованию готовых иерархически организованных списков — не представляет затруднений быстро отобрать из всего массива данных сведения по интересующей пользователя популяции или группе популяций, причем по любому конкретному маркёру или их заданной группе.

ОТ БАНКА — К АТЛАСАМ

Информация из банка данных выгружалась в формат данных для картографирования, и с использованием нашего геногеографического программного пакета GGMAG создавались карты — как для отдельных признаков, так и синтетические карты.

Все карты Атласов русского генофонда построены при следующих постоянных параметрах:

— Число узлов ЦМ: 88x103;

— Параметры интерполяции: степень полинома 0. радиус 10, степень весовой функции 6;

— Построение трендовых карт: осреднением в плывущем окне постоянного (для данной карты) размера. Для разных карт использованы окна разной величины (см. ниже описания каждого отдельного Атласа).

— Шкалы: равномерные, как правило, семиинтервальные.

Надёжная область: зона с вероятностью правильного прогноза более 95 % при заданном уровне строгости.

Другие параметры (например, размер окна сглаживания, уровень строгости, мера расстояний) различались от Атласа к Атласу и указаны ниже при описании построения соответствующих карт.

АТЛАС СОМАТОЛОГИИ РУССКОГО НАРОДА

(рассмотрен в главе 4).

Атлас основан на информации базы данных «Соматология» (содержит 3 276 записей) банка данных «Русский генофонд». Сводка данных составлена проф. В. Е. Дерябиным по материалам Русской антропологической экспедиции под руководством В. В. Бунака и Т. И. Алексеевой [Происхождение…, 1965],

антропологической экспедиции М. В. Витова [Битов, 1964, 1997], а также по данным В. П. Алексеева [Алексееу и др., 1994]. При составлении сводки (включена информация только о мужчинах) В. Е. Дерябиным была проведена коннексия[81] данных с учетом различий в методических приёмах измерений разных авторов. При невозможности коннексии по какому-либо признаку данные по этому признаку не включались в подраздел объединённых данных.

Атлас состоит из трёх разделов.

1. «ПРОСТЫЕ» КАРТЫ. ПЕРВЫЙ РАЗДЕЛ основывается на данных Русской антропологической экспедиции (РАЭ). Раздел включает в себя карты 30 антропологических признаков, изученных РАЭ в 107 русских популяциях.

Перечень признаков: длина тела, процент светлых глаз, поперечный диаметр головы, продольный диаметр головы, ширина носа, высота носа от бровей, горизонтальный профиль лица, рост бороды, скуловой диаметр, наименьший лобный диаметр, морфологическая высота лица, нижнечелюстной диаметр, высота носа от переносья, высота верхней губы, ширина рта, толщина губ, цвет глаз, цвет волос по Фишеру (средний балл), цвет волос по Бунаку (средний балл), рост волос на груди, рост бровей, высота переносья, частота вогнутой спинки носа, частота выпуклой спинки носа, положение кончика носа, положение основания носа, профиль верхней губы, складка верхнего века, наклон лба, развитие надбровья (средний балл).

2. «ПРОСТЫЕ» КАРТЫ. ВТОРОЙ РАЗДЕЛ включает как данные РАЭ, так и данные М.В. Витова по северным русским популяциям [Битов, 1964, 1997]. Этот раздел мы обозначаем как «АБВ» — от первых букв фамилий исследователей (Алексеева, Бунак, Битов). Раздел «АБВ», в отличие от раздела «РАЭ», включает меньше признаков, но зато основывается на данных о большем числе популяций (180 популяций). Раздел состоит из 18 карт, показывающих изменчивость основных антропологических признаков. Публикуются трендовые варианты карт, полученные осреднением в окне 5x5 узлов сетки.

Приведены значения этих 18 признаков в 180 русских популяциях: 107 изученных Русской антропологической экспедицией; 60 изученных М. В. Битовым; 13 изученных В. П. Алексеевым с соавторами. В 11 случаях обе экспедиции обследовали русское население одних и тех же районов. Однако, согласно концепции построения БД, эти популяции введены независимо, поскольку при совпадении этнической и административно-территориальной привязки популяций фактически были изучены разные выборки из одной генеральной совокупности.

Поделиться с друзьями: