Логика случая. О природе и происхождении биологической эволюции
Шрифт:
На концептуальном уровне ответ на заданный выше вопрос кажется ясным: фундаментальную единицу эволюции можно в целом удовлетворительно определить как самую малую порцию генетического материала с отчетливой эволюционной траекторией — то есть такую, которая развивается независимо от других таких же единиц на протяжении достаточно длительного эволюционного периода. На практике, учитывая динамический характер эволюции прокариот, описанный в главе 5, критерию фундаментальной единицы древовидной эволюции отвечает геномный локус, кодирующий РНК или белок (или индивидуальный эволюционный домен). (Очевидно, такая единица соответствует гену, за исключением мультидоменных белков.) В самом деле, как впервые явно отметил Ричард Докинз (Dawkins, 2006), гены в большой степени эгоистичны, то есть подвержены отбору, частично независимому от других генов. В условиях обширного ГПГ ген или оперон потенциально может оказаться в широком спектре организмов. Конечно, обычно это происходит, когда некий ген дает селекционное преимущество организму-носителю, поэтому эволюция генов и эволюция организмов тесно связаны.
Осознание того, что отдельные гены, в противоположность геномам, являются «атомами» эволюции, ставит под сомнение самую идею ДЖ. Тем не менее, как было показано выше, деревья невозможно убрать из какого бы то ни было описания эволюции, по той простой причине, что репликация генетического материала – процесс по сути своей древовидный. Эти два фундаментальных наблюдения вместе приводят к логичному заключению о том, что должно прийти на смену ДЖ: лес жизни (ЛЖ), то есть совокупность филогенетических деревьев всех генов (за очевидным исключением ОРС). В таком случае реконструкция истории жизни (ясно, что не всей истории полностью, но ее «скелета») не так проста, как анализ топологии ДЖ. Эта реконструкция требует картирования ЛЖ в поисках «рощ» подобных деревьев, которые могут быть отражением долгосрочных тенденций связанной (вертикальной) эволюции наборов генов, и «лиан» ГПГ. Представляется, что всестороннее исследование ЛЖ и есть главная цель филогенетики. В следующем разделе я преимущественно рассматриваю результаты недавних исследований ЛЖ, проведенных совместно с моими коллегами Пере Пуигбо и Юрием Вольфом (Puigbo et al., 2009, 2010). Это ни в коем случае не единственные исследования, сравнивающие филогенетические деревья и пытающиеся провести различия между вертикальной и горизонтальной тенденциями в эволюции. Однако эта работа соответствует современным требованиям, и мне кажется, что мы нашли пригодные способы для представления отношений между деревьями многочисленных генов, поэтому краткое изложение этих результатов дает хорошее представление о структуре ЛЖ. (Изложение в следующих двух разделах носит заметно более специальный характер, чем эта книга в целом; некоторые читатели могут решить сразу перейти к заключительным параграфам каждого раздела, а затем и к краткому обзору главы.)
Лес жизни и почти универсальные филогенетические деревья
В принципе в ЛЖ входят деревья для «всех» генов. Однако на деле работать с тысячью или около того геномных последовательностей прокариот (это число увеличится на несколько сотен к тому времени, когда эта книга будет опубликована) тяжело технически, поскольку максимально правдоподобные (maximum likelihood) методы построения деревьев, обеспечивающие наилучшее разрешение, тяжелы в вычислительном отношении (то есть плохо масштабируются с увеличением числа видов). К счастью, использование всех геномов, видимо, не так уж и важно. Несмотря на динамичную эволюцию прокариот, гены ядра и оболочки в близкородственных организмах (идентифицированные, к примеру, по высокому сходству последовательностей рРНК или других генов ядра) большую часть времени эволюционируют синхронно (a только гены ядра и оболочки распространены достаточно широко для получения информативных филогенетических деревьев). Таким образом, тщательно отобранного представительного набора организмов должно быть достаточно для определения главных тенденций в ЛЖ. Для исследований, которые здесь рассматриваются, мы сконструировали такой набор из 100 геномов прокариот, 41 архейного и 59 бактериальных (в дальнейшем в этой главе мы ссылаемся на эти прокариоты как на виды – с полным осознанием ограничений этой концепции, которые были отмечены в гл. 5). Деревья были построены для всех наборов ортологов с более чем четырьмя членами (минимальное число последовательностей, необходимых для построения бескорневого дерева), таким образом, в общей сложности мы получили 7000 деревьев. Как и ожидалось, с учетом структуры генного пространства прокариот из ядра, оболочки и облака, описанной в главе 5, большинство из этих деревьев маленькие: только 2040 состояли из более чем 20 видов, и лишь небольшой набор из 102 почти универсальных древ (ПУД) [59] включали более 90 процентов проанализированных прокариот.
59
В оригинале NUTs (Nearly Universal Trees), весьма многозначное сокращение… Предоставляем читателям самим в этом разобраться.
Обычно филогенетики пытаются определить ГПГ путем сравнения деревьев отдельных генов с заданным заранее «древом видов». Однако, как мы увидели в предыдущем разделе, сама концепция «древа видов» сводится на нет всепроникающим ГПГ и эгоистичностью отдельных генов, которые являются фундаментальными единицами древовидной эволюции. Мы попытались исследовать структуру ЛЖ, не руководствуясь какой-либо предвзятой идеей стандартного древа, с которым следует сравнивать все остальные деревья. С этой целью мы проанализировали полную матрицу топологических расстояний между деревьями; это была довольно большая матрица, включающая почти 24 миллиона попарных сопоставлений деревьев, хотя многие клетки в матрице были пусты, потому что соответствующие деревья состояли из непересекающихся наборов видов.
На рис. 6–3 ЛЖ представлен в виде сети, где каждый узел соответствует дереву. Мы видим, что группа ПУДов занимает особое место в этой сети: около 40 процентов деревьев крайне похожи как минимум на один из ПУДов. (Два дерева считаются топологически подобными, когда различия в соединениях между их ветвями незначительны; из топологических различий высчитываются расстояния между деревьями. Подробности этих вычислений мы опустим.) Напротив, при использовании того же порога сходства 102 случайных дерева того же размера, что и ПУДы, были связаны всего лишь с примерно 0,5 процента деревьев в ЛЖ. Таким образом, существует высокое и неслучайное топологическое подобие между ПУДами и значительной частью ЛЖ.
Рис. 6–3. Лес жизни как сеть деревьев. Каждый узел в сети обозначает дерево. 102 почти универсальных дерева (ПУД) показаны в виде темных точек в середине, а остальные деревья – в виде незаштрихованных кружков. ПУДы связаны с деревьями с подобной топологией – то есть обладающими как минимум 50-процентным подобием с как минимум одним ПУДом. Адаптировано из Puigbo et al., 2009.
Зная все расстояния между деревьями в ЛЖ, мы можем применить статистические методы для кластеризации данных – то есть определить, является ли ЛЖ просто облаком случайно расположенных точек (деревьев в топологическом пространстве) или содержит определенные кластеры деревьев с подобными топологиями. Использованный статистический метод разделил ЛЖ на семь кластеров деревьев. Примечательно, что все ПУДы образовали компактную группу в пределах одного из кластеров (см. рис. 6–4). Семь кластеров существенно отличаются по распределению деревьев по количеству видов, распределению архебактерий и бактерий, а также функциональной классификации соответствующих генов. Таким образом, результаты кластеризации показали, что ЛЖ может быть разделен на крупные, отчетливые группы топологических подобных деревьев; однако на этой стадии по-прежнему неясно, насколько эта кластеризация обусловлена «вертикальными» эволюционными процессами и насколько – горизонтальными. Ключевым наблюдением является то, что все ПУДы занимают компактную, неразрывную область пространства ЛЖ, не разделяются на отчетливые кластеры (в отличие от остальных деревьев в ЛЖ) и отделены примерно одинаковыми расстояниями от всех кластеров (см. рис. 6–4).
Рис. 6–4. Кластеризация леса жизни в топологическом пространстве. Кластеры были получены с помощью классического многомерного шкалирования (метод кластеризации, являющийся по сути более изощренной версией популярного подхода анализа главных компонентов). ПУДы произвольно помещены в центр, показано среднее подобие между ПУДами и каждым из кластеров. Адаптировано из Puigbo et al., 2009.
Результаты первой части нашей экспедиции в чащу леса жизни приводят к важному заключению: топологии ПУДов крайне схожи между собой и, возможно, представляют главную эволюционную тенденцию в ЛЖ. Заявление о главной тенденции может показаться неочевидным, однако оно отражает очень простые и непосредственные наблюдения:
1. Топологии ПУДов сильно схожи с топологиями многих других деревьев в ЛЖ.
2. ПУДы расположены на приблизительно одинаковом расстоянии от кластеров других деревьев. В этом смысле они занимают центральное положение в ЛЖ.
До сих пор мы говорили о ПУДах отвлеченно, не учитывая реальных генов, которые стоят за этим набором больших деревьев. На самом деле природа ПУДов вполне предсказуема: это гены, кодирующие рибосомные белки, а также другие высококонсервативные белки, участвующие в трансляции, наряду с некоторыми ключевыми субъединицами ДНК-зависимой РНК-полимеразы. Это гены, которые, согласно гипотезе сложности, должны быть наименее предрасположены к ГПГ (Jain et al., 1999). Этот набор почти универсальных генов, что несколько парадоксально, также являет собой один из наиболее впечатляющих примеров ГПГ, в частности среди аминоацил-тРНК-синтетаз (АРСаз), некоторые из которых отвечают за устойчивость к антибиотикам, но также и среди некоторого количества рибосомных белков. Как бы то ни было, приведенные здесь наблюдения недвусмысленно показывают, что группа ПУДов внутренне топологически плотная и, более того, связана топологическим подобием со многими другими деревьями в ЛЖ.
В свете практически вездесущего ГПГ ничто не может восстановить ДЖ во всей его былой славе. Однако, если бы нам пришлось искать наиболее осмысленное приближение ДЖ, консенсусная топология ПУДов выглядела бы лучшим из кандидатов. Но прежде чем мы торжественно введем ПУДы в эту должность, следует обсудить более глубокие аспекты эволюции.
В глубь леса жизни: Большой взрыв или сжатый кладогенез?
В предыдущем разделе мы увидели, что ПУДы занимают особое положение в ЛЖ. Они топологически подобны друг другу и, следовательно, могут представлять главную тенденцию вертикальной, древовидной эволюции. Однако прежде чем мы признаем, что эти деревья почти универсальных, важнейших генов и в самом деле отражают главную тенденцию в ЛЖ, следует задать следующий ключевой вопрос: пронизывает ли древовидный сигнал всю историю жизни или ограничивается сравнительно недавней эволюцией?
Для такого вопроса у нас есть веская причина. Многие филогенетические исследования, включая изучение суперсети ПУДов (опуская технические детали, суперсеть – консенсусное дерево, сформированное путем «усреднения» топологий ПУДов), явным образом показывают, что глубокорасположенные внутренние узлы филогенетических деревьев, как правило, плохо разрешены по сравнению с узлами, расположенными ближе к листьям (см. рис. 6–5а). Эта особенность повторяется на многих различных уровнях истории жизни: к примеру, слабое разрешение среди глубочайших ветвей замечено как в филогенетическом древе млекопитающих, которое охватывает промежуток времени примерно в 100 миллионов лет, так и в гипотетическом полном ДЖ, которое охватывает более 3,5 миллиарда лет (Rokas and Carroll, 2006). Во всех этих случаях эволюционные интервалы, включающие первичное разделение крупных групп организмов, оказываются особыми, отличными от «нормальных» эволюционных эпох (аналогия с прерывистым равновесием хотя и поверхностна, но все же соблазнительна – см. гл. 2). Для объяснения этой особенности были предложены две модели: