Зачем изучать белки и как это делать
У советских школьников в старших классах был учебник по биологии, на первых страницах которого было высказывание Фридриха Энгельса: «Жизнь есть способ существования белковых тел». По примеру людей того времени Энгельс был человеком всесторонне образованным, и какая-то правда в его словах есть. Если взять любое живое существо и извлечь из него всю воду, то белок в сухом остатке займет первое место по массе среди всех макромолекул. Получается, жизнь состоит из белка. Вся работа в клетках осуществляется белками. Они выполняют любую функцию, кроме, наверное, передачи информации. С их помощью можно настраивать работающие живые системы, поэтому белки обязательно надо изучать.
Как выглядит белок
В каждом организме есть определенное количество кодирующих белки генов. Они определяют число базовых белковых сущностей, которые выполняют различные функции. Но между генами и белками нельзя напрямую проводить знак равенства, потому что белки, после того как они сошли с синтетического конвейера из матричной РНК и рибосом, могут модифицироваться, разлагаться, расщепляться и образовывать новые функциональные фрагменты. К белкам присоединяются различные радикалы, которые играют роль сигнализации или функционализации. Присоединяются кофакторы, коферменты, если это фермент. Например, инсулин исходно синтезируется в совершенно другой форме, а расщепляясь, он уже становится функциональным.
Кофактор – небелковое соединение, часто ион металла, которое нужно ферменту для осуществления биологической функции. Кофакторы часто называют молекулами-помощниками, которые участвуют в биохимических превращениях.
Структура и функция многих кодируемых в геноме человека белковых продуктов неизвестны. Их никто никогда не видел, не выделял, не изолировал. Химически синтезировать белок по последовательности аминокислот нельзя: он чаще всего выпадет в осадок, и на этом все закончится. Это связано с тем, что при искусственном синтезе белки не принимают нужную пространственную форму. Самопроизвольно принимают нужную конформацию не больше 10% всех белковых продуктов, вообще известных в природе. Рабочая конформация достигается только в живой клетке под воздействием систем протеостаза – так называемых шаперонов.
Шапероны – это белки, главная функция которых заключается в восстановлении нативной третичной или четвертичной структуры белка, а также в образовании и диссоциации белковых комплексов. Шапероны есть в каждом живом организме, и механизм их действия – нековалентное присоединение к белку и его «расплетение» с использованием энергии гидролиза АТФ – также консервативен. Чем примитивнее организм, тем проще эта система, хотя она есть и у бактерий. По оценкам, на протеостаз клетка тратит около 30% энергии.
Структура шаперона дрожжей
Для некоторых белков нужна очень изощренная система протеостаза: по 20 молекул АТФ тратится, чтобы привести одну молекулу белка в функциональное состояние – настолько у нее изощренная конформация. Если эту систему отключить, белок прямо в клетках повалится в осадок и станет токсичным. В общем, прионные болезни или формирование амилоидов при болезни Альцгеймера – это недостаток системы протеостаза.
Практически все человеческие белки можно экспрессировать в гомологичной системе экспрессии, то есть в человеческих клетках. Человеческие белки можно нарабатывать и в бактериях, но для этого их нужно лишить интронов и создать тогда такие векторы, но впоследствии эти белки могут оказаться токсичными для бактерии и начать неправильно сворачиваться, образовывать тельца включения. И это помешает установить их правильную пространственную структуру.
Интрон – участок ДНК, копия которого удаляется из первичного транскрипта и отсутствует в зрелой матричной РНК. Интроны встречаются только в генах эукариот.
Компьютерное моделирование хорошо работает только в тех случаях, когда есть отличия максимум в несколько аминокислот от известной структуры. Все остальное нужно выделять в чистом виде, кристаллизовать, чтобы делать рентгеноструктурный анализ. Хорошо развиты для этого и методы ядерно-магнитного резонанса. Сейчас развивается криоэлектронная микроскопия – это довольно мощный метод, также позволяющий узнать пространственную структуру белка. Но у каждого метода есть свои ограничения. Например, мембранные белки плохо кристаллизуются, потому что очень сильно мешают липиды. Поэтому довольно сложно изучать структуру мембранных каналов или рецепторов, а это очень важная часть современной биологии.
Попытки создать белок с заранее заданными свойствами начались, как только появилась генная инженерия, в 1980–1990-е годы. Проблема в том, что для начала нужно создать белок, который не выпадет в осадок, примет стабильную конформацию, а дальше уже приниматься за свойства. Поэтому проще подойти к задаче с другого конца: секвенировать геномы всех известных организмов быстрее, можно оттуда взять белки с любыми нужными свойствами. Например, нужен вам термостабильный белок – нырнули вы к подводному вулкану, нашли обитателей горячих источников и определили, какой ген кодирует нужный вам белок. Проще найти организм с заданными свойствами, чем придумать белок, ведь у природы было больше времени на отбор, чем у нас с вами.
Как определить, сколько белка находится в организме В культуре клеток регистрируется примерно 10 тысяч белков, то есть продукты 10 тысяч генов. Из них получается намного больше протеоформ, потому что есть модификации. Разнообразие протеома особо не зависит от сложности организма. Конечно, у бактерий геномы меньше – у микоплазмы всего 700 генов, – поэтому и разнообразие протеома будет ниже. Но в целом взаимосвязь между разнообразием белков и степенью организации живого существа небольшая.
Есть два способа определить концентрацию белка. Самый распространенный – получить к нужному белку антитела, оттитровать их на стандарте, то есть на серии образцов с заведомо известной концентрацией белка, измеренной параллельным методом, и по степени связывания определить искомое содержание белка. Этот метод называется иммунным анализом, и он очень широко распространен, применяется даже в тестах на определение беременности. Получается, что мы с помощью одного белка можем измерить содержание другого белка.
Второй метод масс-спектрометрический. Нужно выделить чистые белки, расщепить их на фрагменты, и это уже можно идентифицировать в масс-спектрометре напрямую, то есть без связующего агента. И хотя кажется, что такая система более точная и не зависит от реагентов, все равно есть погрешность эксперимента. Тот же трипсин не всегда работает одинаково, потому что это своего рода живая система, фермент, а живые системы отличает гибкость.
Трипсин – фермент, разрушающий пептиды и белки
Что делать, если нужно определить содержание белка в одной клетке целой ткани? Клетки в культуре легко можно посчитать под микроскопом. Затем нужно взять всю культуру, разрушить клетки, получить экстракт и в этом экстракте уже измерить содержание белка. Полученное значение можно пересчитать на одну клетку, зная их исходное количество и объем одной клетки. Конечно, получится этакая средняя температура по больнице, потому что не все клетки одинаковы: в каких-то белок может вообще не продуцироваться, а какие-то клетки могут быть буквально им нашпигованы.
Как измерить белок в единичных клетках? Можно попробовать ввести в клетку флуоресцентные антитела и с помощью микроскопа оценить, сколько молекул антител у нас связались с белками-мишенями.
Антитела гликопротеины, находящиеся на поверхности B-лимфоцитов в виде мембраносвязанных рецепторов и в плазме крови, образующиеся в ответ на введение в организм человека или теплокровных животных бактерий, вирусов, белковых токсинов и других антигенов. Связываясь своими активными участками с бактериями или вирусами, антитела препятствуют их размножению или нейтрализуют выделяемые ими токсические вещества
Если мы считаем, что они связались со стопроцентной эффективностью, мы можем определить концентрацию нужного нам белка. За этим подходом будущее, потому что нужно все делать в единичных клетках. Сейчас авангард науки – определение транскриптома в единичных клетках. Так открывают новые клеточные типы: взяли ткань селезенки или другого органа, рассортировали клетки и увидели, что они по транскриптому очень сильно сегрегированы. То, что мы считали одной сущностью, на самом деле разные клеточные типы. Потом можно выделить уже каждый тип морфологически и описать, как они расположены в ткани.
Это возможно благодаря ПЦР и амплификации нуклеиновых кислот. Протеом одной клетки сделать гораздо сложнее, можно немного схитрить: взять какую-нибудь гигантскую клетку и попробовать определить все белки в ней. У виноградной улитки есть гигантские нейроны размером 0,4 мм – очень подходящий для этой задачи объект.
Чем различаются белки двух разных людей Изменчивость человеческих белков известна на уровне порядка 100 тысяч экзомов, то есть белок-кодирующих частей генома, и описана лучше, чем для любого другого организма. Разные белки живут в организме разное количество времени. Альбумин секретируется клетками печени и живет две недели, а некоторые белки могут персистировать месяцами. Какие-то белки живут часы. Антитела все время синтезируются и разрушаются, и вечный иммунный ответ возможен не за счет постоянной популяции белков, а за счет клеточной популяции. Если белок оказывается с дефектом, он в идеале тут же расщепляется. Время жизни белка зависит от внешних стимулов и последовательности. Например, существует N-концевое правило, по которому в зависимости от того, какая аминокислота находится на N-конце молекулы, белки живут разное время.
Существуют границы изменчивости белковых профилей внутри человеческой популяции. Это имеет отношение к геномному полиморфизму, который частично связан с естественным отбором. Люди отличаются друг от друга небольшим количеством мутаций, или вариантов относительно целого генома, и часть из них кодирующие. Одни популяции адаптивны к одним условиям, другие – к другим. Полиморфизм связан и с концентрацией определенных белков. Если даже последовательность остается консервативной, то может различаться уровень синтеза белка. Консервативные последовательности – это схожие или идентичные последовательности, встречающиеся в биологических полимерах: нуклеиновых кислотах, первичной структуре белков. Широко распространена точка зрения, что мутация в консервативной последовательности приводит к появлению или нежизнеспособного организма, или фенотипа, отсеивающегося естественным отбором.
С точки зрения медицины опасны не те мутации, которые сильно меняют структуру белка, потому что такой эмбрион не выживает и мы его не увидим, а те, которые оставляют человека жизнеспособным, но приводят к каким-то заболеваниям. Этим человек сейчас отличается от других видов, которые живут по принципу «все или ничего». Очищающий отбор у нас менее эффективен, чем у наших предков, но, видимо, это наш путь развития.
Помимо врожденных мутаций бывают приобретенные. Главный пример – это рак, который чаще всего возникает из-за того, что накопилось бремя мутаций. У пожилых людей, которые не больны раком, персистирует много мутантных клеток в кровотоке. Чем ты старше, тем больше у тебя накапливается ошибок, и часто это количество переходит в качество. В конце концов возникает прорыв, и раковые клоны начинают расти с большой скоростью. Таким образом, по белкам можно диагностировать разные заболевания. Но сейчас на первом месте остается ДНК-диагностика.
Участки нуклеиновой кислоты, обладающие специфичностью в отношении заболевания, можно амплифицировать всего лишь из одной копии, поскольку существует полимеразная цепная реакция. А чувствительность методов детектирования белков в разных биологических жидкостях человека ограничена: белки нельзя амплифицировать. Например, если образовалась опухоль размером с маленький орешек, то какой-нибудь опасный мутантный белок поступает в кровь в количестве нескольких копий, и его невозможно идентифицировать.Помимо врожденных мутаций бывают приобретенные. Главный пример – это рак, который чаще всего возникает из-за того, что накопилось бремя мутаций. У пожилых людей, которые не больны раком, персистирует много мутантных клеток в кровотоке. Чем ты старше, тем больше у тебя накапливается ошибок, и часто это количество переходит в качество. В конце концов возникает прорыв, и раковые клоны начинают расти с большой скоростью. Таким образом, по белкам можно диагностировать разные заболевания. Но сейчас на первом месте остается ДНК-диагностика.
Безусловно, в клинике измеряют белки, но такие, которые нарабатываются в большом количестве: C-реактивный белок, разные ферменты, щелочные фосфатазы, аспартатаминотрансферазы, аланинаминотрансферазы (АСТ и АЛТ). И обычно разброс концентраций достаточно велик, чтобы не давать ложноположительных результатов. Сложности в определении содержания белков возникают на разных уровнях. Например, масс-спектрометр имеет чувствительность в 6000 молекул, если их просто гарантированно туда загрузить. Но на каждой стадии переноса молекул в масс-спектрометр возникают препятствия. Уверенно при наличии инструментов можно детектировать белки в концентрации 10-9–10-10 моль на литр, но это зависит от образца, в котором мы его ищем.
В научных журналах часто можно найти исследования, которые позволяют выявить, скажем, 10 молекул белка, но поставить такие технологии на поток пока невозможно: когда мы начнем этот способ тестировать с метрологической точки зрения, то сегодня увидим 10 молекул, завтра 20, послезавтра вообще ничего. Пока наилучший результат, достигнутый в лаборатории, связан с детектированием в биологической жидкости белков в концентрации нескольких молекул в одном литре.
Поэтому встает вопрос, являются ли белки хорошими биомаркерами. В онкологии сейчас в связи с тем, что нуклеиновые кислоты детектировать гораздо удобнее, развиваются методы определения циркулирующих в плазме крови нуклеиновых кислот, несущих специфические мутации для раковых клеток. Раковые клетки разрушаются, и поэтому в организме можно обнаружить участки их фрагментированной ДНК, ведь проницаемость органов и тканей ненулевая. В практику это пока не перешло полностью, но пока есть старые маркеры, белки, конечно, гликопротеины, муцины, ферменты, которые меняют свою активность и свидетельствуют о наличии разных состояний.
Почему белки могут выполнять много разных функций
Нуклеиновая кислота состоит из четырех остатков с модификациями: аденин, гуанин, тимин, цитозин, а пятый – урацил, который заменяет тимин в составе РНК. Этого достаточно, чтобы обеспечить передачу наследственной информации в форме генетического кода. Белок состоит из двадцати таких кирпичей, и все они разных свойств. У них есть радикалы, боковые группы, которые несут разные свойства. Одни большие и жирные, другие маленькие и растворимые в воде, одни заряжены положительно, другие отрицательно. Возможны разные комбинации с разными свойствами: небольшие жирные, небольшие заряженные, большие заряженные, гетероциклические, склонные образовывать водородные связи и вступать в другие слабые взаимодействия, способные образовывать ковалентные связи и еще много разных вариантов.
На самом деле у нас 21 аминокислота, еще есть селеноцистеин, а у бактерий их даже 22: добавляется еще пирролизин. В геноме селеноцистеин кодируется не кодом, а специальной шпилькой, то есть вторичной структурой РНК. При наличии такой шпильки вместо цистеина вставляется селеноцистеин. Можно сказать, что эта конформация тоже записана на уровне ДНК, потому что есть некий паттерн, который воздействует на рибосому и программирует создание шпильки и подстановку селеноцистеина, хотя кодон в этот момент такой же, как и для цистеина.
Селеноцистеин – аналог цистеина с заменой атома серы на атом селена. Входит в состав активного центра фермента глутатионпероксидазы, а также в состав селенопротеинов и некоторых других белков.
По-видимому, такого набора аминокислот хватает на все. Решение принимает естественный отбор: то, что не нужно, просто отбрасывается, а все полезное сохраняется. Эволюция не спрашивает: «Что мне делать? Хватит ли мне возможностей для реализации всех функций?» То, что есть сейчас, – это результат эволюционного процесса разработки белков на протяжении почти 4 миллиардов лет. Этого хватило вполне, чтобы перебрать очень много вариантов и получить как паутину, так и кожу, и когти, и зубы.
Белки являются продуктом эволюции, поскольку они напрямую кодируются в геноме. Поэтому возможностей для комбинаторики именно эволюционным путем – путем внесения мутаций в геном – у них больше. Инструменты синтеза липидов и углеводов ограничены ферментативными системами, поэтому, наверное, возможностей для комбинаторики у этих соединений было меньше. К тому же аминокислотный состав белков позволяет им самостоятельно быть энзимами, ферментами, снижать энергию активации реакций. Что касается углеводов и липидов, они несут либо структурную функцию, либо функцию распознавания, то есть рецепторную. Они не могут сами быть ферментами.
Есть еще рибозимы – молекулы РНК с ферментативными свойствами. РНК тоже кодируется в геноме, и у нее тоже были возможности для эволюции, но белки более стабильны с химической точки зрения, а РНК разлагалась быстро. Весь мир полон РНКаз, потому что в борьбе с вирусами все организмы приобрели этот фермент для расщепления вирусных геномов. Поэтому РНК уступили белкам в гонке функциональности, если можно так выразиться. Но это только во внешней среде. Внутри клеток РНК выполняют огромное количество разных функций. Мы только недавно узнали обо всех этих свойствах, потому что научились работать в условиях, свободных от РНКаз и ДНКаз. Когда проводишь эксперименты с нуклеиновыми кислотами, нельзя ничего трогать голыми руками, потому что у нас на коже тоже огромное количество РНКаз.
Вопрос «Что важнее: белки или небелки?» сродни борьбе в старинной Академии наук, когда выходил один ученый и говорил: «Белки надо исследовать», а другой отвечал: «Зачем эти белки? Я всю жизнь исследую нуклеиновые кислоты, и в них гораздо больше информации». Определять, какие молекулы важнее – это политика. А для науки все важно. Нужно знать всю структуру клетки.
Об авторе:
Сергей Мошковский – доктор биологических наук, профессор кафедры биохимии медико-биологического факультета Российского национального исследовательского медицинского университета имени Н. И. Пирогова Минздрава России, заведующий отделом персонализированной медицины ФГБУ «Научно-исследовательский институт биомедицинской химии имени В. Н. Ореховича» РАМН.
Сергей Мошковский, ПостНаука
Портал «Вечная молодость» http://vechnayamolodost.ru