Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Рожков Ю. И. Популяции, виды, эволюция

.pdf
Скачиваний:
8
Добавлен:
10.05.2023
Размер:
10.65 Mб
Скачать

но, представляли собой по сути филогенетические схемы. С этого момента началась новая эпоха в реконструировании филогений.

Общий методический подход в данном случае таков. В полевых условиях проводится сбор материала (обычно в виде заспиртованных проб ткани). Далее в лаборатории из этих проб выделяют и очищают ДНК. Размножают с помощью полимеразной цепной реакции (ПцР) выбранный участок генома (обычно длиной несколько сот нуклеотидов) до концентраций, доступных для анализа на секвенаторах. С помощью этого прибора определяют нуклеотидные последовательности участка для различных сравниваемых единиц. затем последовательности выравнивают (по специальным программам и «вручную»), располагая их друг под другом с учётом совпадений гомологичных позиций. После такой процедуры, исходя из полученной таблицы (в качестве конкретного примера на рисунке 21 приводим небольшую часть табличных данных из нашей предыдущей книги – Рожков и др., 2009, – с. 345), рассчитывают парные дистанции (в простейшем случае это число различающихся нуклеотидов между двумя сравниваемыми последовательностями) и строят дерево по той же приведённой выше (рис. 20) схеме.

UPGMA-метод основан на предположении, что скорость эволюции во всех линиях постоянна, то есть молекулярные часы идут с одной и той же интенсивностью. Однако вскоре выяснилось, что это не совсем соответствует действительности. В одних линиях часы могут идти быстрее, в других медленнее. Тогда был предложен NJ-метод (Neighbor-Joining Method – метод ближайшего связывания или присоединения), в какой-то мере учитывающий эту особенность их хода (Saiton, Nei, 1987).

В настоящее время это один из наиболее популярных дистанционных методов построения деревьев. В отличие от UPGMA-метода, длины ветвей NJ-дерева, выходящие из одного узла, различны. В какой-то мере они характеризуют скорости эволюции в разных ветвях. На рисунке 22 приведён пример такого дерева, построенного на основе представленной выше таблицы (рис. 21).

Гаплотип

№ вариабельного сайта

 

111122222

3333444444

 

2458935567

2246011134

 

7572230776

0565612952

L1(25)

TGATTATTTA

GTAGCATGTT

L2(21)

.AGC...

C..

......C...

L14(2)

A........

C

.........T

L12

AAGC...

C..

......C.CG

L23

TAGC.C.C..

......C...

L36

.A..C...

C.

ACGATG.A..

L42

TA....

T...

.......G..

L46(2)

.A....

C...

.......A..

Рис. 21. Вариабельные сайты (позиции) в выборке европейского лося (Alces alces) по фрагменту гипервариабельного участка контрольного региона мтДНК. В данном случае сравниваемые единицы – гаплотипы. Номера сайтов читаются сверху вниз (27…442). В скобках – число гаплотипов в выборке.

60

Рис. 22. Дендрограмма филогенетических отношений различных гаплотипов лосей (A. alces), построенная методом ближайшего связывания (соседства) (NJ) с использованием 2-параметри- ческой модели эволюции сиквенсов (Kimura, 1980). В узлах – результаты бутстреп-анализа (1000 реплик), характеризующие уровни «достоверности» ветвления . На концах ветвей – номера гаплотипов.

Вданном случае дерево характеризует филогенетические отношения не между видами, а гаплотипами определённого участка мтДНК и может быть названо «генным», а не «видовым» деревом.

Вприведённом примере мы имеем дело с обычным генетическим полиморфизмом анализируемого участка. Дерево здесь отображает внутрипопуляционные процессы, ведущие к преобразованию и диверсификации некоей предковой формы участка во времени.

Если же взять участки, вовлечённые не во внутрипопуляционную (внутривидовую) изменчивость, а межвидовую (мономорфные гены), то можно построить тем же способом и «генное» дерево, которое одновременно будет и «видовым» (так как каждый вид несёт единственный свойственный ему вариант мономорфного участка). Избирая

вкачестве таких участков слабо меняющиеся в ходе эволюции гены (например, гены 18S rРНК)28, можно построить и крупномасштабную филогению в пределах отрядов, классов и даже царств. А объединяя множество разнородных участков в один (используя одновременно несколько генов), можно значительно повысить точность построений и приблизить их к реальным филогениям29.

Другим, наиболее популярным в настоящее время способом построения деревьев является МР-метод (Maximum Parsimony – метод максимальной экономии) – Eck, Dayhoff, 1966; Fitch, 1977.

Этот метод основан на анализе дискретных признаков, а не использовании дистанций, как в UPGMA и NJ-методах. В роли дискретных признаков выступают так называемые филогенетически информативные позиции. К таковым причисляют те, что обладают достаточно высоким уровнем вариабельности нуклеотидов в анализируемой выборке последовательностей.

Рассматривая лишь эти позиции, по специальным алгоритмам проводят поиск филогенетического дерева с наименьшим числом эволюционных изменений (нукле-

28Для прокариот с теми же целями используются гены 16S rРНК, представляющие собой функциональное подобие 18S rРНК эукариот. Эти РНК являются составной частью малой субъединицы рибосомы, которые у прокариот немного полегче (16S), чем у эукариот.

29Каким образом это делается для построения внутривидовых «филогений» при использовании полиморфных генов, мы уже отмечали в разделе 3.2.

61

отидных замен). Считается, что с помощью такого подхода можно непосредственно восстанавливать «родословные» видов и получать тем самым наиболее эффективные «реальные» филогении. Естественно, что в качестве дискретных признаков с теми же целями можно использовать филогенетически информативные позиции аминокислотных последовательностей, а также и дискретные морфологические признаки. Этот способ особо любим кладистами – систематиками и сторонниками филогенетической концепции вида.

Ещё один достаточно часто встречающийся подход – это представление филогенетических отношений между сравниваемыми единицами в виде сети минимальных расстояний. При этом расстояния между сравниваемыми последовательностями равны количествам мутационных шагов, необходимых для превращения одного варианта

вдругой. На рисунке 23 мы приводим элементарный пример для такого рода сети, построенный на основе всё той же исходной таблицы (рис. 21).

Такие сети удобны и наглядны при передаче «родственных» связей между аллелями (или же гаплотипами, как в нашем случае) при анализе внутривидовой изменчивости последовательностей (полиморфизм). Обычно аллели (гаплотипы) обозначают на той же (сетевой) схеме кругами, диаметр которых пропорционален частотам этих аллелей

впопуляции.

Кроме сетей и деревьев с корнем (место развилки нижних ветвей)30 строят иногда и бескорневые деревья, которые с виду напоминают лишённый корней кустарник, растущий во всех направлениях. Такие «кустарники» иногда наглядны, но чаще нет. Если есть подходящий вид, обособившийся от анализируемой группировки видов заведомо ранее, чем любой из входящих в группу, его можно ввести в анализ и, получив «кустар-

Рис. 23. Филогенетические отношения между гаплотипами лося (A. alces), представленные в виде сети минимальных расстояний (MSW, Minimum Spanning Network). Отдельные гаплотипы обозначены кругами, площади которых приблизительно пропорциональны частотам гаплотипов в исследованной выборке. Расстояния между гаплотипами пропорциональны количеству мутаций, отделяющих их друг от друга (цифры на схеме). Расчеты расстояний проведены в программе Arlequin 2.000 (AMOVA). L1, L2 и т.д. – обозначения гаплотипов. Прерывистой линией выделена альтернативная связь.

30 Филогенетические деревья с корнями (нижний узел которых чаще всего не выделяют на схеме) могут изображаться не только стоящими на корню, но и лежащими на левом, правом боку или стоящими на «голове» корнем вверх (на рисунке 22 дерево лежит на боку, нижний узел не выделен).

62

ник», найти по точке присоединения этого вида-помощника «корень». А далее, ориентируясь по корню, «перерисовать» бескорневой «кустарник» в полноценное дерево. Подобного рода вид (а иногда и группы близких видов) обычно называют внешней группой. заметим, что такие манипуляции возможны в частности при использовании предпочитаемого многими NJ-метода, который допускает построение и «кустарников», и «деревьев». Перевод первых во вторые осуществляется как с помощью внешней группы, так и при отсутствии последней другим более простым, но менее надёжным способом (за корень дерева принимается середина самой длинной ветви «кустарника»).

Издругихметодов,иногдаприменяемыхприпостроении«филогений»,следуетещё указать на ML-метод (Maximum Linkelihood, метод максимального правдоподобия –

Cavalli-Sforza, Edwards, 1967; Felsenstein, 1973, 1981), а также на ME-метод (Minimum Evolution, метод минимума эволюции – Cavalli-Sforza, Edwards, 1967; Saiton, Imanishi, 1989; Rzhetsky, Nei, 1993).

Известны и другие методические подходы, предлагавшиеся для тех же целей. Считается, что чем изощрённее математический метод, тем лучшее приближение

к реальным филогениям он даёт. Лучшим из лучших (из всех «изощрённых») признаётся тот, что наиболее полно отвечает запросам популярной на сегодня кладистики. В соответствии с такими взглядами, UPGMA-метод многие признают худшим из всех, а MP-метод лучшим.31

Однако «объективные» сравнения различных методов, основывающихся на анализе случаев с известной эволюционной структурой либо на компьютерных симуляциях, в общем-то, не позволяют сделать однозначных выводов. Исходя из собственного опыта, считаем, что для микро- и мезоэволюционных уровней вполне пригоден UPGMA-метод наряду с NJ-методом (между ними по характеру ветвления деревьев как правило нет принципиальной разницы). Дистанционные методы (каковыми являются UPGMA и NJ) по нашему мнению здесь более уместны, так как истинные филогении на этих уровнях чаще всего в принципе невосстановимы, и работать приходится по сути дела со схемами сходства-различия (см. раздел 3.2). На макроуровне, по-видимому, пока вне конкуренции MP-метод и вполне допустим NJ-метод (скорее всего универсальный для всех случаев).

Рассмотрим теперь очень кратко и в упрощённом виде «технологию» определения по генетическим данным времени, прошедшего с момента расхождения сравниваемых видов. Для этих целей обычно используют следующие простейшие соотношения для молекулярных часов:

, [1]

гдеt –время,прошедшееот«момента»события, d –наблюдаемаягенетическаядистан- ция между видами (точнее последовательностями), r – скорость нуклеотидных замен.

31 Автор учебного пособия по молекулярным филогениям В.В. Лукашов (2009) уверяет даже, что в настоящее время UPGMA-метод по этим причинам практически не используется. Он совершенно прав. Но только в случаях составления филогений, отражающих масштабные макроэволюционные процессы у эукариот, филогений прокариот и вирусов (автор вирусолог). Неи и Кумар (2004) – авторы монографии по тому же предмету, напротив совсем не столь категоричны. Видимо здесь сказывается то, что они длительное время занимались не только разработкой методов построения деревьев на макроуровне, но и микроэволюционными проблемами, для которых и MP-метод ничуть не лучше, а даже много хуже, чем UPGMA (по причине ничтожного числа «филогенетически информативных позиций», что приводит к значительным ошибкам при построении «микрофилогений»). Так что последний метод по-прежнему продолжают активно применять, но обычно в пределах вида, рода и редко в пределах более высокой таксономической категории. В этом нетрудно убедиться, обратившись к соответствующим периодическим изданиям.

63

Из рисунка 24 понятно, откуда берётся это соотношение. Так как «путь» от предкового вида Адо вида потомка B равен ½d, то, чтобы определить время (t), надо разделить его на скорость прохождения этого «пути» (r). В качестве d используются разные меры в зависимости от того, каков уровень различий между видами (последовательностями). Если виды принадлежат к одному подсемейству или роду, вполне может подойти

расстояние Пуассона. В этом случае d = –ln(l – p), где

– доля несовпадений

между двумя последовательностями, nd – число различающихся нуклеотидов в сравниваемых последовательностях, n – общее число нуклеотидов (длина последовательности в нуклеотидах).

Так как на макроэволюционном уровне характер изменения nd от t становится существенно нелинейным,32 во избежание значительных ошибок, применять в качестве дистанции число различающихся нуклеотидов в сравниваемых последовательностях (или долю этого числа – p) нельзя. Поэтому при больших различиях применяются гораздо более сложные меры (Ней, Кумар, 2004). Однако при проведении сравнений на микро- и даже на мезоэволюционном уровне p может оказаться малой величиной. Тогда все сложные дистанции сразу же превратятся в простые, что можно проиллюстрировать на элементарной из сложных дистанций (расстояние Пуассона).

При p << 1, как известно d = –ln(l – p) = p, и, следовательно, выражение [1] может быть записано, как33

. [2]

значение r, необходимое для расчёта времени, в зависимости от обстоятельств определяют по «сложной» [1] или «упрощенной» [2] формуле. Для этого выбирают пару видов (изолированных популяций), для которых из палеонтологических данных (или других сведений) известно время их расхождения. Подставив в формулы время и значение дистанции, находят r. Полученное значение скорости используют затем для определения времени разделения для других пар.

В силу многих причин (неравномерность хода молекулярных часов, трудность сопоставления морфологических и генетических изменений (рис. 17) и т.д., ни о какой значительной точности здесь говорить не приходится. Вполне понятно, что при подобном подходе вполне позволительно использовать вместо реальных дистанций те, что переданы длинами ветвей на деревьях (тем более что разница между теми и другими, как правило, невелика). Так это часто и делали в прошлом (когда у макроэволюционистов был в моде метод UPGMA), подставляя под дендрограмму временную шкалу, по которой, как считалось, можно было напрямую считывать время появления узлов на дереве (время разделения видов). В редких случаях это делают и сейчас. Но в основном поступают более осторожно, обходясь без шкал. Рассчитывают (если это возможно) несколько различных вариантов r для разных пар видов и разных участков дерева, стремясь тем хоть как-то учесть неравномерность хода часов. затем, после длительных раздумий «выбирают»

32Это главным образом обусловлено тем, что наблюдаемое число различающихся нуклеотидов в сравниваемых последовательностях (nd) с увеличением различий начинает всё больше отличаться от истинного числа произошедших замен, которых оказывается значительно больше (см. раздел 3.2, ссылка 22). Сложные формы дистанций как раз и призваны математически реконструировать это число.

33Если на микроуровне определяется время разделения двух изолированных популяций полиморфных по анализируемому гену, зависимость [2] несколько усложняется, так как тут

необходимо пользоваться межпопуляционной средней дистанцией (то есть средней долей

p, рассчитываемой из межпопуляционных значений для всех вариантов последовательностей).

64

Рис. 24. Дендрограмма, иллюстрирующая вывод формулы [1]. А – предковый вид. В и С виды-потомки. d – дистанция между видами потомками; 1/2d – дистанция между предковым видом и одним из видов потомков.

наиболее реалистичные цифры, характеризующие время. Более осторожные дают лишь лимиты.

В заключение «рассказа» о дендрограммах, по-видимому, имеет смысл для наглядности привести отдельные их образцы. На рисунках 25–29 «за основу» взят один из «типичных» видов млекопитающих – северный олень (Rangifer tarandus). С его помощью и проиллюстрированы «филогении» и «схемы сходства-различия». Кроме того, с той же целью на рисунке 29 приведена одна из наиболее «реальных» на сегодняшний день «молекулярных» филогенетических реконструкций для млекопитающих, основанная на анализе более 20 генов.

Подробно ознакомиться с методами и существующими проблемами можно, обратившись к специальной литературе: Сокэл, 1968; Sneath, Sokel, 1973; Wiley, 1981; Песенко, 1982, 1991; Пасеков, 1983; Nei, 1987; Неи, Кумар, 2004; Пав-

линов, 1989, 2004; животовский, 1991; Емельянов, Расницин, 1991; Вейр, 1995; Алтухов, Салменкова, 2002; Гречко, 2002; Антонов,

2002, 2003; Петров, Алёшин, 2002; Банникова, 2004; Расницын, 2005; Лукашов, 2009; Шаталкин, 2012.

Рис. 25. Дендрограмма – «филогения» оленьих получена в результате анализа нуклеотидных последовательностей фрагмента гена бета-спектрина методом максимального правдоподобия в программе МеtaPIGA. Верхний коэффициент – поддержка методом максимального правдоподобия, нижний – поддержка методом максимальной экономии (Кузнецова и др., 2005).

65

Рис. 26. NJ-дендрограмма, характеризующая близость подвидов Rangifer tarandus по среднему различию в нуклеотидных последовательностях их гаплотипов. Приведены концовки подвидовых названий и географический район (Давыдов и др., 2007).

Рис. 27. Дендрограмма для 67 популяций северного оленя (Rangifer tarandus), полученная UPGMA-методом путём расчёта дистанций по частотам 5 аллелей трансферринового (Tf) локуса (Давыдов, 2003).

Рис. 28. Дендрограмма для 76 популяций северного оленя (Rangifer tarandus), полученная UPGMA-методом путём расчета дистанций по 5 промерам тела (Давыдов, 2003).

66

Рис. 29. Дендрограмма, характеризующая филогенетические взаимоотношения млекопитающих. Получена путём комбинированного анализа 19 ядерных и трёх митохондриальных генов (Murphy et al., 2001, по Банниковой, 2004). Числа над ветвями – апостериорные вероятности в методе Байеса; числа под ветвями – индексы бутстрэпа. Стрелками указано время дивергенции

Afrotheria/Xenarthra+Boreoeutheria (103 млн. лет) и Euarchontogliris/Laurasiatheria (88 млн. лет).

В этом списке приведена лишь ничтожная часть работ общего характера из «безбрежного моря» существующих. Тем не менее, они вполне могут служить исходным пунктом для дальнейшего углублённого внедрения в проблему.

3.4. КОММЕНТАРИИ К РИСУНКАМ 25–29

На рисунке 25 представлена «филогения» оленьих, полученная на основе анализа нуклеотидных последовательностей фрагмента гена бета-спектрина. Использовался один из наиболее прогрессивных методов (ML-метод) построения деревьев – «родос-

67

ловных». Тем не менее, морфолога полученный результат вряд ли полностью удовлетворит. «Наш олень» (R. tarandus) хотя и попал в требуемое окружение видов (в один кластер), однако сгруппировался с ними не совсем, так как следует из морфологических данных. В «двоюродном» родстве он оказался не только с лосём (A. alces), что в общем-то правильно, но и с «троюродной» косулей (Capreolus capreolus). Казалось бы (признавая истину только за молекулярными построениями) следует признать именно эту схему реальной, если бы не другие (известные из литературных данных) деревья, построенные с участием того же или иных генов, с тем же или с несколько иным набором видов и с использованием того же или других методов.

Многие из этих деревьев дают либо ещё больше разночтений с морфологией, либо значительно меньше. Так что, анализируя все материалы в совокупности, исследователь иногда и не знает, что и за истину принять.

Очевидно, что, как мы уже отмечали, все методы несовершенны (поэтому-то они постоянно модернизируются и изменяются математиками). Кроме того, функционально значимые гены видимо, как сейчас считают многие, могут эволюционировать (при сходстве требований к функциям этих генов) не только по правилам статистики, но и по чисто биологическим правилам – очень сходно (с одними и теми же нуклеотидными заменами) в разных линиях. Так что даже явно неблизкородственные виды могут по тому или иному гену оказаться в мнимом родстве.

На сегодняшний день, по-видимому, единственный способ, хотя бы как-то избавиться от подобного эффекта, а заодно и от другого важного источника ошибок – неравномерности скорости эволюции генов – взять их побольше, чтобы ошибки, наложившись на другие ошибки, нейтрализовали друг друга. Результат таких действий приведён на рисунке 29. Этой «родословной» уже веришь почти полностью. Почти только из-за того, что имеются подозрения, что в каких-то случаях не только отдельные гены могут видоизменяться в ходе эволюции с неравномерной скоростью, но и весь геном в целом может вести себя подобно.

Другую опасность такие тривиальные дендрограммы представляют для тех систематиков, которые сводят построение системы исключительно к реконструкции филогений. Велико искушение, скажем, корову или бегемота объединить с китом в один отряд (см. верхний кластер на рисунке 29, на этом же рисунке нетрудно отыскать и другие подобные же примеры). Только здравый смысл и принадлежность этих видов к общеизвестным всем млекопитающим не позволяет это сделать. Но та же ситуация для не столь заметных групп видов вполне может кончиться подобным исходом.

На рисунке 26 приведён пример совсем другого рода. Он в какой-то мере характеризует события, происходившие с нашим «эталонным» видом на уровне дальней микроэволюции, то есть событий, связанных с делением на подвиды, отличающиеся по наборам гаплотипов. Дендрограмма в данном случае уже не отражает в скольконибудь полной мере реальную филогению подвидов, так как между популяционными группировками время от времени происходят обмены особями (в том числе и между североамериканскими и евразийскими подвидами). Интенсивность этих обменов различна (минимальна для карибу), о чём можно судить по числу встреч чужеродных гаплотипов в популяциях.

Истинную филогению мы должны были бы изобразить в виде сети, густота которой усиливалась бы при увеличении количества обменов. Однако сделать это в общем-то невозможно.

Подвидовое дерево (рис. 26) строилось путём усреднения различий по нуклеотидным последовательностям в парах сравниваемых подвидов. Всего использовалось несколько десятков гаплотипов. И вот по ним-то вполне можно построить правдоподобное генное дерево – филогению нуклеотидных последовательностей, не задумы-

68

ваясь ни о каких сетях (ДНК митохондрий наследуется «бесполым» путём, передавая лишь один материнский вариант последовательности (гаплотип) от одного поколения к другому). здесь мы не приводим это генное дерево.

Дендрограмма на рисунке 27 ещё в меньшей степени отражает филогенетические связи между популяциями. Но, тем не менее, характеризует ближний микроэволюционный процесс на генетическом уровне, так как построена на основе «сходства-раз- личия» популяций по частотам аллелей. Частоты могут изменяться под действием сложившихся «сиюминутных» обстоятельств (направлений действий отбора, интенсивности случайных процессов и межпопуляционных обменов особями), что позволяет дифференцировать группировки друг от друга, но не восстановить их «родословные».

Дендрограмма на рисунке 28 практически не несёт никакой информации о филогении, являясь по сути дела лишь фенограммой, характеризующей сходство популяций по количественным морфологическим признакам, по которым отдельные группировки дифференцируются не только в силу перечисленных выше обстоятельств, но и в силу прямого влияния среды (модификационная изменчивость). Тем не менее, в отдельных случаях подобные дендрограммы бывают крайне полезны для выяснения того, как и каким образом популяции эволюционируют в пространстве и во времени. Для тех же целей по существу служат и дендрограммы, подобные изображённым на рисунках 26 и 27, а вовсе не для того, чтобы восстановить невосстановимые в принципе на микроуровне «родословные».

69