Биолог Георгий Базыкин о геноме человека, значении консервативных генов и вредных мутациях
Человеческий геном включает примерно 3,5 миллиарда нуклеотидов. Можно про него думать как про такой длинный текст длиной в 3,5 миллиарда букв. Каждая буква записана на некотором четырехбуквенном алфавите из, А, Т, Г и Ц, и такой текст примерно в тысячу раз длиннее, чем «Война и мир» Льва Толстого. Дальше можно задать вопрос: какая доля из этих букв действительно важна на своем месте, какая из них несет функцию, а какая неважная и можно их заменить на другие? На этот вопрос можно отвечать по-разному. Например, можно посчитать, какая доля человеческого генома занята кодирующими ДНК, то есть кодирует реальные белки, которые потом транскрибируются и являются функционирующими молекулами. Получится приблизительно 1%. Дальше можно посчитать, какая доля генома участвует в каких-то биохимических взаимодействиях: транскрибируются, или с ними связываются какие-нибудь другие белки, или как-нибудь модифицируются. Получится гораздо большее число, порядка 80%.
Недавно — если мне не изменяет память, в 2012 году — был завершен проект ENCODE — большой проект по функциональной аннотации генома человека. По результатам этого проекта авторы сказали, что 80% генома человека несут функцию. Это число было воспринято в штыки представителями сообщества эволюционных генетиков, потому что мы, эволюционные генетики, давно знаем, что важными не могут быть в геноме больше 10% нуклеотидов. Все остальное — это то, что можно смело называть «мусорной ДНК», то есть это ДНК, которая, возможно, для чего-токогда-то понадобится, но прямо сейчас никакой функции не несет. Откуда мы это знаем? Потому что эта ДНК, которая неконсервативна в ходе эволюции, легко заменяется, каждую букву можно заменить на что угодно еще. Мы можем прикинуть, какая должна быть консервативность у нейтральных последовательностей — последовательностей, которые не выполняют никакой функции, — и сравнить со скоростью эволюции участков ДНК, про которые мы думаем, что они функциональны. И окажется, что гены, например, очень консервативны, какие-нибудь функциональные участки, участвующие в регуляции, например сайты посадки транскрипционных факторов, довольно консервативны, а бо́льшая часть генома нефункциональна. По-видимому, цифра 80% просто неверна.
Совсем не любое участие в биохимической активности означает, что этот участок генома для чего-то нужен. Я сказал, что мы оцениваем важность по консервативности. Почему оказывается, что важные участки более консервативны? Потому что в ходе эволюции естественный отбор следит за тем, чтобы они не изменялись: они и так хорошо выполняют свою функцию и изменяться не должны. Можно заметить, что это совсем другая идеология, чем та, которая была в уме у Чарльза Дарвина, когда он предлагал идею естественного отбора, потому что думал, что естественный отбор — это в первую очередь агент изменения: в результате того, что нужно что-то новое, в ходе эволюции свойства организмов меняются. А я говорю, что свойства организмов оказываются законсервированными. Это связано с тем, что отбор, направленный на сохранение текущих свойств, гораздо более распространен, чем отбор, направленный на изменения, по той причине, что наш геном уже достаточно функционален, он уже достаточно хорошо выполняет свою функцию и редко когда случайные изменения этого генома делают его лучше. Как телевизор, если по нему ударить молотком, станет, скорее всего, работать хуже, иногда он будет работать так же, как до этого, и редко-редко он будет работать лучше — точно так же и наш геном: случайные мутации будут скорее вредными, чем полезными. Тем не менее доля мутаций в геноме полезна.
Мы знаем, что виды отличаются друг от друга разными признаками, в том числе и адаптивными. В чем генетическая основа адаптации и, главное, сколько этой генетической основы? Существует какое-то количество различий между разными видами. В какой доле случаев они важны? Мы можем попробовать искать гены, которые, наоборот, эволюционировали необычайно быстро. Допустим, сравним два вида, человека и шимпанзе, и будем искать те гены, которые очень быстро эволюционировали в человеческой линии после ответвления шимпанзе. Казалось бы, мы должны в такой постановке встретить гены, отвечающие за все уникальные признаки человека: за его большой мозг, прямохождение, отсутствие шерсти. Оказывается, первое, что мы видим, — это гены, которые участвуют, во-первых, в иммунитете, во-вторых, как-то задействованы в репродуктивной системе, то есть совсем не те группы генов, которые мы ожидаем.
Почему так? Когда мы ищем быстро эволюционирующие гены, мы ищем те гены, которые быстро эволюционируют постоянно, то есть эволюционировали ускоренно в течение всех 8 миллионов лет, которые мы прожили со времен нашего общего предка с шимпанзе. Почему так? Совсем необязательно размер нашего мозга увеличивался непрерывно в течение нашей эволюции. Возможно, было всего несколько мутаций в небольшом числе генов, которые делали наш мозг больше.
Эти мутации мы таким тестом не найдем, потому что редкие адаптивные полезные мутации будут происходить в генах, которые были функциональны, для чего-то нужны и по большей части консервативны, то есть на уровне этой общей высокой консервативности полезные мутации, которые происходили как-то ускоренно, мы просто-напросто не увидим. А вместо этого мы поднимаем те гены, которые эволюционировали очень быстро все время. Это оказываются гены иммунитета, потому что иммунная система — это то, что непрерывно встречается с постоянно изменяющимися условиями среды, то есть ей приходится вновь и вновь адаптироваться к новым условиям. В «Алисе в Зазеркалье» Льюиса Кэрролла была знаменитая Черная Королева, которая говорила, что в нашей стране нужно бежать как можно быстрее только для того, чтобы остаться на том же самом месте. Эти гены ведут себя ровно так: действительно, им нужно модифицироваться непрерывно, чтобы непрерывно отражать все новые и новые атаки патогенов на наш организм. Таким образом, мы находим не то, что мы ищем.
Очевидно, нужны какие-то более хитрые тесты, которые позволят определить, что в каком-то участке действовал положительный отбор, какой-то участок был важен. Это большое направление текущих исследований. Здесь полезно сравнивать не только геномы различных видов, но и также полезные данные по изменчивости внутри одного вида по тому, какое существует разнообразие (как говорят генетики, полиморфизм) генов в человеческой популяции. Сейчас уже финишировал проект «Тысяча геномов», есть тысяча полных прочитанных генотипов людей, скоро будет несколько тысяч. Я думаю, через пять лет их, возможно, будут десятки и сотни тысяч, и это замечательный набор данных, который позволяет смотреть, какие мутации были полезными в недавней истории человека. Например, если мы видим, что какая-то мутация имеет очень высокую частоту в человеческой популяции, притом что она у наших предков была редкой или отсутствовала вовсе, с большой вероятностью значит, что эта мутация была для чего-то нужна. Всякие канонические примеры естественного отбора, действовавшего на популяцию человека, именно так устроены, — например, изменение цвета кожи при изменении широты, на которой живет человек. Все это имеет в том числе прикладное значение, потому что эволюционная геномика такого рода помогает понимать, какие мутации в нашем геноме будут особенно вредны. Допустим, человек приходит к врачу, он страдает каким-то генетическим заболеванием. Врач может прочитать полностью его геном — сейчас это становится уже достаточно дешево — и увидеть, что в этом человеке произошло несколько десятков новых мутаций, отличающих его от родителей. Какая из этих мутаций вызывает данный синдром? Здесь можно посмотреть, куда попали эти гены — в кодирующие/некодирующие участки и так далее. Кстати, если бы данные ENCODE были верны, они бы означали, что каждый из нас наследует в среднем 80 вредных мутаций от своих родителей, а не 1–10, как мы думаем, что устроено на самом деле. Это действительно важное отличие. Тем не менее можно было бы смотреть на геном, видеть, что мутации попали в какие-то позиции, и дальше приоритизировать эти позиции по тому, насколько они консервативны между видами. Если у меня случилась замена буквы, А на букву Г в месте, которое было ужасно консервативно между всеми млекопитающими, было сохранено от человека до кенгуру, то тогда, скорее всего, эта замена была вредна, потому что эта буква действительно важна и действительно соответствующая замена для человека меняет функцию соответствующего белка, его экспрессию или что-нибудь в таком духе.
Можно пытаться разными способами оценивать, какая доля замен в нашей недавней эволюции реально была адаптивной. И удивительным образом здесь до сих пор не пришли к консенсусу. В течение всего XX века доминировала дарвинистская парадигма, считалось, что бо́льшая часть того, что происходит, для чего-то нужна и полезна, что если геном изменяется, то это кому-нибудь нужно. После этого в конце 1960-х годов возникла нейтральная теория Мото Кимуры, которая говорила, что не сходятся константы и, чтобы объяснить происходящее, нужно предположить, что бо́льшая часть мутаций, которые отличают нас от других видов, нейтральна, ни на что не влияет. Дальше встал вопрос, какая из этих двух крайностей верна. Истина явно где-то посередине, то есть какая-то доля замен нейтральна, какая-то доля замен полезна, но удивительным образом даже в научной среде консенсуса о том, сколько именно замен в недавней истории, например, человека были полезными, нет. Есть некоторые оценки, они довольно сильно разнятся. Например, модельный организм, всеобщий любимец drosophila melanogaster — похоже, у нее порядка половины замен была полезной, оставшаяся половина была нейтральной или, возможно, даже чуть-чуть вредной. Наоборот, в нашей с вами недавней истории, по-видимому, бо́льшая часть замен была нейтральной. Откуда такая разница между нами и дрозофилой — тоже интересный вопрос, отдельная большая тема, там не все ясно.
Но даже после того, как мы оценили, узнали, сколько именно замен важны, а сколько неважны, остается важный вопрос, к чему, собственно, являются эти замены адаптациями. Мы знаем для отдельных единичных замен, что они являются адаптациями к тому или иному изменению среды, но для подавляющего большинства, для миллионов из этих замен, которые, как мы думаем, были адаптивны, например, у дрозофилы, мы близко не понимаем, к чему они адаптировали эту муху. Возможно, это были адаптации тоже к каким-то новым патогенам, к каким-то изменяющимся условиям, или же это были коадаптации внутри генома, то есть изменения в одном локусе генома вели к изменениям в других локусах генома. Вот это важный открытый вопрос.