ЖАНРЫ

Замысел. Как ДНК делает нас теми, кто мы есть
Шрифт:

Схема, которую я использовал, позволяла обнаруживать ассоциации, на долю которых приходилось более 2 % дисперсии интеллекта. Что-то здесь было не так. Возможно, мы искали не те гены-кандидаты. Поскольку у нас была возможность обнаружить только ассоциации, которые составляли более 2 % дисперсии, еще одна неприятная возможность заключалась в том, что эффекты были меньше 2 %. Оказывается, ответ был и тем, и другим.

Несмотря на это раннее предупреждение об отрицательных результатах для генов-кандидатов, более 200 последующих исследований сообщили об ассоциации между генами-кандидатами и интеллектом. Однако в большинстве из них участвовали небольшие выборки, и не было попыток воспроизвести результаты. В 2012 г. при систематической попытке воспроизвести основные SNP в двенадцати генах-кандидатах в трех больших выборках не удалось воспроизвести ни одного SNP: Christopher F. Chabris et al., «Большинство известных генетических ассоциаций с общим интеллектом, вероятно, являются ложноположительными», Psychological Наука, 23 (2012): 1314-23. дои: 10.1177/0956797611435528.

Неспособность воспроизвести отчеты о генах-кандидатах является проблемой не только для исследований интеллекта. Подход везде провалился. Например, для шизофрении более 1000 статей сообщили о результатах поиска генов-кандидатов для более чем 700 генов. Метаанализ двадцати четырех лучших генов-кандидатов, проведенный в 2015 году, показал, что ни один из них не реплицировался: Manillas S. Farrell et al., «Оценка исторических генов-кандидатов для шизофрении», Molecular Psychiatry , 20 (2015): 555-62. doi: 10.1038/mp.2015.16.

Как так много опубликованных статей могут так ошибаться? Ранее мы рассматривали кризис доверия к науке по поводу неудач в воспроизведении. Исследования генов-кандидатов стали жертвой всех описанных здесь ловушек. Две основные ловушки заключались в том, что эти исследования были недостаточно мощными и гонялись за значениями P.

Что касается ловушки мощности, средний размер выборки исследований генов-кандидатов составлял 200. Если бы ассоциации составляли 5 процентов дисперсии, выборка размером 200 имела бы достаточную мощность для их обнаружения. Но теперь мы знаем, что нет ни одного эффекта, близкого к 5 процентам. Самые большие эффекты составляют менее 1 процента. Для обнаружения таких небольших эффектов требуется размер выборки более тысячи.

По этой причине эти ранние исследования генов-кандидатов рисковали сообщить о статистически значимых результатах, которые не соответствуют действительности или ложноположительны. Научные журналы не любят публиковать отрицательные результаты, поэтому единственными результатами, которые могли быть опубликованы, были сообщения о положительных результатах, которые оказались ложноположительными.

Второй ловушкой была погоня за значениями P , что значительно увеличивает риск сообщения о ложноположительных результатах. Есть несколько способов, которыми ученые, как правило, невольно гоняются за значениями P. Они рассматривают несколько генов, несколько психологических черт или несколько способов анализа данных, но сообщают только те результаты, которые лучше всего рассказывают историю. Легко стать жертвой этого типа мошенничества, потому что мы все хотим рассказывать хорошие истории, и это вызывает искушение замести осложнения под ковер. Для публикации хорошей истории требуется, чтобы результаты соответствовали общепринятому 5-процентному значению P. Но погоня за этим значением P означает, что законы P (вероятности) нарушены. Погоня заканчивается тем, что выявляются только ложноположительные результаты.

Нет ничего плохого в том, чтобы попытаться рассказать хорошую историю, если она правдива. Проблема с сотнями историй о генах-кандидатах в том, что они не соответствовали действительности, но привели к сотням сообщений в СМИ о «гене интеллекта» или «гене шизофрении». Хотя исследования генов-кандидатов продолжают публиковаться и сегодня, большинство журналов теперь требуют, чтобы статьи, сообщающие об ассоциациях генов-кандидатов, перед публикацией включали доказательства репликации в независимых образцах. Ложноположительные результаты не повторяются. Сотни отчетов об ассоциациях генов-кандидатов с интеллектом и шизофренией не подтвердились.

Боль от этого фальстарта исследований генов-кандидатов была смягчена успехом нового подхода, появившегося на рубеже веков, когда стало ясно, что исследования генов-кандидатов потерпели неудачу. Новым подходом была полногеномная ассоциация (GWA), которая противоположна подходу гена-кандидата.

« Мечта заключалась в том, чтобы систематически искатьпо всему геному, а не выбирать несколько произвольно выбранных генов-кандидатов» : Neil Risch and Kathleen Merikangas, «The Future of Genetic Studies of Complex Human Diseases», Science, 273 (1996): 1516-17 . doi: 10.1126/наука.

273.5281.1516 . Я не описывал более старый подход к поиску генов в геноме, называемый анализом сцепления. Как и полногеномная ассоциация, сцепление представляет собой систематическую полногеномную стратегию охоты за генами. Он использует всего несколько сотен ДНК-маркеров в геноме для определения хромосомной локализации основных эффектов генов путем изучения косегрегации в семейных родословных между ДНК-маркером и заболеванием. Однако сцепление недостаточно эффективно для обнаружения меньших эффектов генов. Сцепление может указывать на хромосомное соседство, но не может указать точное местоположение. Я решил не обсуждать сцепление, так как сейчас оно редко используется, потому что оно способно обнаруживать только эффекты основных генов, в то время как большинство эффектов крошечные.

« В 1998 году я решил провести скрининг генома, генотипируя различия ДНК одно за другим, чтобы найти различия ДНК, связанные с интеллектом» : Роберт Пломин и др., «Полногеномное сканирование 1842 ДНК-маркеров для

Аллельные ассоциации с общей когнитивной способностью: пятиэтапный дизайн с использованием объединения ДНК и экстремально выбранных групп, Behavior Genetics , 31 (2001): 497-509. дои: 10.1023/A:1013385125887. Я сократил затраты времени и денег, объединив ДНК для групп людей, а не генотипируя каждого человека отдельно. Это называется объединением ДНК ; генотипирование 100 особей стоит не больше, чем генотипирование одной особи, потому что вы объединяете ДНК 100 особей и генотипируете объединенную ДНК: Lee M. Butcher et al., 'Genotyping Pooled DNA on Microarrays: A Systematic Genome Screen of Thousands of SNPs in Большие выборки для обнаружения QTL для комплексных признаков», Behavior Genetics , 34 (2004): 549-55. doi: 10.1023/b%3abege.0000038493.26202.d3.

Я сравнил группы из 100 человек с высоким интеллектом и 100 человек со средним интеллектом. Люди с высоким интеллектом пришли из двух источников. Половина была отобрана из более крупной выборки в Кливленде, штат Огайо, с оценкой IQ выше 130. Другая половина была получена из американского исследования, в котором были отобраны подростки с оценкой IQ выше 160. Контрольная выборка людей со средним IQ была получена из того же Кливленда. Выборка, выбирающая детей с IQ от 90 до 110.

Вторым коротким путем было использование типа ДНК-маркера со многими аллелями, потому что такие маркеры гораздо более информативны, чем SNP, которые имеют только два аллеля. Простые повторы последовательностей (SSR) содержат множество аллелей, содержащих последовательность из двух-пяти пар оснований, которая по неизвестным причинам повторяется от пяти до пятидесяти раз. Количество повторов передается по наследству. В геноме человека есть десятки тысяч SSR, в основном в некодирующих областях. SSR используются при снятии отпечатков пальцев ДНК, что произвело революцию в судебно-медицинской экспертизе, позволив создавать уникальные профили ДНК для отдельных лиц, «отпечатки пальцев» ДНК. Мы генотипировали 2000 SSR, равномерно распределенных по всему геному, используя пятиэтапную схему репликации, которая отсеяла ложноположительные результаты. 2000 SSR не могли охватить каждый бит генома, но они могли сканировать большую его часть.

SNPвызваливзрыв полногеномных ассоциативных исследований» : Джоэл Хиршхорн и Марк Дж. Дейли, «Полногеномные ассоциативные исследования общих болезней и сложных признаков», Nature Reviews Genetics , 6 (2005): 95-108. дои: 10.1038/nrg1521.

' результаты [ моего исследования GWA об интеллекте с использованием SNP– чипов ] были очень разочаровывающими» : Lee M. Butcher et al., «SNP, Microarrays and Pooled DNA: Identification of Four Loci Associated with Light Mental Disairment in the Sample of 6000 Children», Human Молекулярная генетика , 14 (2005): 1315-25. дои: 10.1093/hmg/ddi142. Мы провели еще один

Исследование GWA с использованием нового чипа SNP с 500 000 SNP, но дало такие же разочаровывающие результаты: Lee M. Butcher et al., «Количественное сканирование ассоциации локуса признаков по всему геному общих когнитивных способностей с использованием объединенной ДНК и 500 000 SNP (одиночный нуклеотидный полиморфизм) Microarrays', Genes, Brain and Behavior, 7 (2008): 435-46. doi: 10.1111/j.1601-183X.2007.00368.x. Основные ассоциации SNP из этих исследований не воспроизводились: Michelle Luciano et al., «Тестирование репликации набора из 5 SNP для общих когнитивных способностей в шести выборках населения», European Journal of Human Genetics , 16 (2008): 1388-95. . doi: 10.1038/ejhg.2008.100.

Поделиться с друзьями: