Меню Рубрики

Конформационная подвижность белка с точки зрения физики

В ответ на экстремальные внешние воздействия in vitro (повышение температуры) глобулярный белок может

потерять свою упорядоченную структуру? стать денатурированным. Исследование этого процесса является очень важным для выяснения механизмов стабилизации структуры белка. Но еще интереснее возможность изменения структурной формы при физиологических условиях? именно в этом смысле будем далее понимать конформационную подвижность белка.

Хотя нативная молекула белка? твердое тело, она довольно маленькой. То есть, в отличие от макроскопических твердых тел, молекула белка находится под действием теплового движения как части собственной молекулы, так и окружающих молекул. Небольшие конформационные изменения, прежде все изменения углов вращения основной цепи и боковых остатков на перемычках между элементами вторичной структуры, могут привести временных взаимных смещений участков вторичной структуры. Но если эти структурные блоки привлечены к формированию общего (и плотного) гидрофобного ядра, взаимодействие между ними быстро восстановит исходную конформацию (в случае, когда нет дополнительных факторов, которые могут нарушить баланс свободной энергии). Еще большая подвижность присуща мультидоменные и субъединичные белкам: отдельные домены (субглобулы) могут деформироваться и, что более важно, двигаться относительно друг друга. Итак, в основе конформационной подвижности белка лежит взаимное смещение крупных структурных блоков (субъединиц, доменов или элементов вторичной структуры) за счет небольших локальных деформаций. Иногда происходят также локальные перестройки вторичной структуры в различных структурных состояниях белка? разрушения или образования спиралей и т.п.. Радикальной структурным изменением является образование пространственной структуры в упомянутых неструктурированных белках в условиях их взаимодействия с другими молекулами. Понятно, что структурные перестройки изменяют форму рабочей поверхности молекулы, то есть влияют на выполнение белком своих функций.

Предположим, что организация белка позволяет существование двух структурных состояний? А и В. В общем возможно, что оба состояния не различаются по величине свободной энергии? тогда половину времени белок проводит в одном состоянии, второй? в другом. Но, как правило, свободная энергия одного из состояний (например, А) ниже, тогда конформационная равновесие сдвинута именно к нему (рис. 2.17, слева).

Как переключить это равновесие в пользу состояния В (если, например, именно он должен выполнять какую-то функцию)? Типичный путь такого переключения заключается в использовании определенной соединения (лиганда). Как лиганд может выступать органическая низкомолекулярная соединение, ион, другой белок? зависимости от конкретной системы.

Динамическая подвижность белков

Малые колебания атомов в твердом теле происходят с вы­сокими частотами w

10 13 — c — l (tau

10 13 с) и малыми амплитудами ха

0,01-0,1 А — (обычные гармониче­ские колебания). Такой подход неприменим для описания микро­движений белка с амплитудами ха » 0,1 А. Смещение отдельного фрагмента белка на вели­чину, большую чем 0,1 А, возможно только, если оно одновременно сопро­вождается образованием флуктуационной полости из-за сдвига других моле­кулярных групп, окру­жающих данный фрагмент. Фрагмент бел­ка как бы «расталкивает» соседние группы. Такое движение требует энергии активации для преодоле­ния потенциальных энер­гетических барьеров, препятствующих смеще­нию фрагмента. Посколь­ку переход из одного микросостояния в другое сопровождается больши­ми смещениями (

1А), то и ширина барьера должна быть довольно большой. Такой процесс перехода нельзя уподобить «одноактному» пере­скоку между двумя микроинформационными состояниями. Переход через широкий барьер — непрерывный процесс движения в потенциальном поле со сложным рельефом — частой потен­циальной гребенкой (картинка 1).

Т.о., движение фрагмента белка характеризуется двумя пространственными масштабами. Движе­ние по «частоколу» из частых потенциальных барьеров отражает взаимо­действие фрагмента с окружающими белковыми группами. Оно носит диффузионный характер и характеризуется коэффициентом конформационной диффузии D(x), зависящим от окружающей среды или от конформационной координаты х. Другой пространственный масштаб отражает результирующее медленное перемещение вдоль самой конформационной координаты и происходит в конформационном потен­циале и (х). Как Выход за пределы конформационной энергетической ямы [-ха, ха,] запрещен, так как связанный с остальной белковой молекулой фрагмент не может отойти как угодно далеко. Такое движение соответствует непрерывной ограниченной диффузии в вязкой среде, когда фрагмент испытывает действие случайных толчков или теплового шума. Временная зависимость среднего квадратичного смещения [x(t)] 2 в этом процессе определяется формулой

Здесь х 2 а — средний квадрат амплитуды смещения, тс — характерное время релаксации в процессе ограниченной диффузии, зависящее от трения при движении .

Где y — коэффициент трения, пропорциональный микровязкости белка, т — масса фрагмента, w — частота колебаний. Коэффици­ент трения зависит от микровязкости белка согласно формуле Стокса

где b — характерный линейный размер фрагмента (b

1 — 10А), ню — вязкость в пуазах (пз). Повышение температуры экспоненциально уменьшает вязкость –

(эпсилон — энергия активации вязкого течения).

С ростом температуры экспоненциально уменьшается и время тс.

Увеличение вязкости среды приводит к росту тс т. е. к уменьшению скорости диффузии. Отсюда можно понять влияние температуры на внутримолекулярное движение в белке и зависимость сред­неквадратичного смещения мессбауэровского атома от температуры. .

При низких температурах тс очень велико, и при поглощении у- кванта мессбауэровское ядро не успевает сместиться за время пребыва­ния в возбужденном состоянии. В этом случае происходит поглощение у- кванта без отдачи (f

1). В области высоких температур, где ню и тс малы, ядро успевает сместиться и f падает. Таким образом, при повышении температуры в точке излома температурной кривой изменяется величина тс, которая становится ниже критического значения. По температурной зависимости f’ (Т) можно найти величины микровязкости ню для белков, энергии активации (эпсилон) вязкого течения, ам­плитуды конформационных движений. Имеющие­ся в структуре белка альфа- и бета-элементы испытывают ограниченное диффузионное движение, зависящее от жесткости, микровязкости среды. Изгибные флуктуации альфа-спиралей имеют определенную форму, причем амплитуда и время релаксации резко зависят от линейных размеров спи­рали. В реальных условиях амплитуды изгибных флуктуаций могут дос­тигать нескольких ангстрем, а времена релаксации лежат в микросекундном диапазоне.

Наиболее быстрые и мелкомасштабные флуктуации присущи боковым группам. Эти группы образуют жидкоподобную опушку вокруг спиральных участков полипеп­тидного каркаса и играют роль демпфирующей среды. Иерархия во вре­менах релаксаций позволяет представить динамику белковой глобулы как флуктуации в жидкоподобной капле, армированной упругим поли­пептидным каркасом. Диффузия лигандов внутри глобулы происходит лишь при образовании флуктуационных полостей или «дырок». Появление «дырки» внутри гло­булы может быть инициировано образованием ее вначале в растворителе на поверхности глобулы. Вероятность этого процесса обратно пропорциональна вязкости растворителя. За счет конформационных движений поверхностная группа белка заполняет «дырку» в растворителе. «дырка» теперь оказывается уже в наружном слое белка. Далее, за счет движений групп второго и третьих слоев «дырка» диффундирует внутрь глобулы, обеспечивая появление дополнительных флуктуационных по­лостей. Форма этих полостей в белке непроизвольна, а имеет вид флуктуирующих щелей, параметры которых определяются геометрией жестких элементов белкового каркаса. Решение диффузион­ных уравнений позволяет вычислить скорость диффузии частиц через систему таких флуктуирующих щелей. Так, при диффузии в миоглобине лиганд СО должен пройти несколько «ворот», которые открываются за счет конформационных движений. Скорость диффузии зависит от диа­метра лиганда, амплитуды флуктуации и времени релаксации щели, которая определяется жесткостью и микровязкостью стенок. Общее время прохождения СО в миогло­бине составляет 10 -7 с и соответствует сложению времен конформационных релаксаций нескольких ворот в глобуле. В жесткой молекуле белка, где отсутствуют внутримолекулярные движения и структурные флуктуации, диффузия лиганда должна быть сопряжена с преодолением больших активационных барьеров (до 100 ккал/моль). Эти барьеры настолько замедлят движение лиганда, что оно практически станет бесконечно медленным в масштабах биологического времени. В реальных биополимерах с плотной упаков­кой именно структурные флуктуации делают возможным перенос лигандов внутри молекулы, что важно для ее функциональной активности.

| следующая лекция ==>
Структурная организация и функционирование фотосинтетических мембран. Фотосинтетическая единица. Два типа пигментных систем и две световые реакции | ОСНОВНЫЕ ТРЕБОВАНИЯ К РАСПРЕДЕЛИТЕЛЬНЫМ УСТРОЙСТВАМ И ЗАДАЧИ ИХ ЭКСПЛУАТАЦИИ. Распределительные устройства (РУ) станций и под­станций представляют собой комплекс сооружений и обо­рудования

Дата добавления: 2016-04-11 ; просмотров: 675 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ

Конформационная подвижность белка с точки зрения физики

K. V. SHAITAN ‚ „‰‡‚ ‚. ‚‡ The modern ideas in the theory of protein dynamics are considered. The elasticity and viscosity of Со времен знаменитой работы Ж. Перрена, посвященной броуновскому движению (1908 год) в protein globule are disнауке твердо установлено, что атомы и молекулы cussed. A general picture при температуре выше абсолютного нуля находятся of dynamical control of в непрерывном и самопроизвольном тепловом движении. Это движение играет исключительно важproteins functioning is ную роль практически во всех процессах и явлениях, presented.

так или иначе связанных с атомными и молекулярными частицами. Биологические системы и молекулы белков, в частности, не являются здесь исклю‡„‡fl ‚чением. Динамическое поведение молекул тесно ‰‡‚fl связано с их пространственной химической струк‡ ‰- турой. Особенности строения и основные степени свободы, определяющие динамическое поведение ‡ ·‚. ‡белков, кратко описаны ниже.

‡ Как известно, белковая глобула состоит из по‚‚‡ ·‚ „липептидной цепи, которая определенным образом уложена и образует уникальную пространственную ·, „ структуру белка. Рассмотрим фрагмент полипеп‚fl. ·‰‡ тидной цепи, состоящий, например, из двух амино ‰‡ ·‚ ‚ кислотных остатков аланина и тирозина (рис. 1).

Остаток аланина содержит CH3-группу, присоед臇 ненную к C углеродному атому. Остаток тирозина ‚‡fl.

содержит существенно более массивную группировку –CH2–C6H4OH, связанную с другим C углеродным атомом в пептидной цепи. C -атомы в основной цепи соединяются с помощью пептидной группы –CO–NH–. Пунктиром на рис. 1 обозначены места присоединения следующих аминокислотных остатков с образованием пептидной группы [1].

Длины полипептидных цепей молекул белков находятся в диапазоне от нескольких десятков до тысяч звеньев. В пептидной цепи различают два типа степеней свободы. Первый – высокочастотные ( 1013 с- 1) колебания длин жестких валентных связей и валентных углов с амплитудами смещений атомов до 0,1. Второй обусловлен значительно более мягкими конформационными степенями свободы, связанными с вращениями вокруг одинарных связей. Линейный масштаб смещений атомов при этом достигает нескольких ангстрем. При повороте на полный угол 360°, если нет дополнительных стерических ограничений, обычно преодолеваются от 2 до 4 небольших потенциальных барьеров высотой от 2 до 5 ккал/моль (рис. 2) [2]. Напомним, что при, ‹5, © ‡‡. Tyr Ala -структура Ala Tyr -спираль Рис. 1. Фрагмент полипептидной цепи, состоящей из остатков аланина (Ala) и тирозина (Tyr). Голубым цветом обозначены атомы углерода, синим – азота, красным – кислорода, серым – водорода. Пунктиром показаны места присоединения следующих аминокислотных остатков. Обозначены -углеродные атомы в основной цепи, к которым присоединены боковые группы. Вверху показан фрагмент в конформации -структуры. Вращением по торсионных углам, и осуществляется переход между различными конформациями. Внизу – тот же фрагмент 1, в конформации -спирали (атом водорода при -углеродном атоме тирозинового остатка не виден) комнатной температуре средняя тепловая энергия, как, причем n увеличивается по мере удаления от n C сосредоточенная на степени свободы, составляет -атома. Углы вращения вокруг связей между C атомом и CO- и NH-группами в пептидной связи 0,6 ккал/моль и вероятность тепловой флуктуации, обозначаются как и соответственно. Вращение необходимой для преодоления таких барьеров, вокруг пептидной связи CO–NH (торсионный угол весьма высока. (Смещения с подобной амплитудой ) обычно сильно заторможено.

для жестких степеней свободы требовали бы энергий свыше 100 ккал/моль.) Определенный набор значений всех двугранных торсионных углов, отвечающий одному из локальВ пептидах конформационные степени свободы ных минимумов потенциальной энергии, задает (двугранные или торсионные углы) имеют опредеконформацию молекулы. На рис. 1 показан дипепленные обозначения в соответствии с рис. 1. Двутидный фрагмент в конформациях отвечающих гранные углы, связанные с вращением в боковых спирали и -слою соответственно. Переход из одгруппах аминокислотных остатков, обозначаются ной конформации в другую или конформационный переход осуществляется за счет поворотов вокруг одинарных химических связей с преодолением поU,ккал/моль тенциальных барьеров, разделяющих локальные минимумы потенциальной энергии (см. рис. 2).

Наличие относительно мягких конформационных степеней свободы не является чем-то уникальным для белков и свойственно подавляющему, рад большинству органических соединений. Именно конформационные степени свободы определяют упругие свойства и гибкость полимерных цепей.

Рис. 2. Характерный профиль потенциальной Эти же степени свободы играют важнейшую роль в энергии при вращении вокруг одинарной химической связи. Высота барьеров около 4 ккал/моль структурообразовании и функционировании белков.

.. Особенно наглядно роль конформационной по- – движности можно проследить на примере сворачивания полипептидной цепи в уникальную третичную Итак, глобула сформировалась. В ней присутстструктуру, соответствующую белковой глобуле, ковуют элементы вторичной структуры, например доторой отвечает определенная конформация цепи. С статочно протяженные -спирали и -слои, уложенточки зрения физики это очень непростая проблема.

ные определенным образом и формирующие как бы каркас макромолекулярной структуры (рис. 3).

Хорошо известно, например, что в водном расМежду элементами вторичной структуры опредетворе при изменении pH многие белки денатурируленным образом уложены не спирализованные учают – переходят из компактной глобулярной формы стки полипептидной цепи, в части глобулы могут в форму рыхлого клубка, то есть структуры с пракприсутствовать молекулы воды, гидратирующие тически случайными конформациями звеньев. При полярные группы. Характерный линейный размер обратном изменении pH в течение десятков секунд глобулы, например миоглобина, около 40 (рис. 3).

происходит восстановление строго определенной Каковы общие физические характеристики белковой глобулы На что был бы похож материал, из котретичной структуры белковой глобулы. Понятно, торого сделана глобула, если глобулу можно было что процессы денатурации и ренатурации происбы взять в руки ходят за счет конформационных движений полипептидной цепи. Сделаем несколько простых чисОтвет на этот вопрос имеет непростую историю.

ленных оценок. Предположим, что белок состоит Практически до начала 80-х годов считалось, что примерно из 100 аминокислотных остатков, то есть белок скорее похож на органические кристаллы. В мы имеем примерно 400 конформационных степе- этом убеждали данные рентгеноструктурного ананей свободы. Допустим, что по каждому торсионно- лиза, которые показывали, что атомы в глобуле му углу имеются примерно три локальных минимума потенциальной энергии, отвечающие возможным F метастабильным конформациям. Легко понять, что общее число возможных конформаций полипептидной цепи составит порядка 3400, то есть 10191.

Fe Чтобы представить, сколь огромно это число, предE положим, что конформации перебираются с частоC той 1013 с- 1 – частотой атомных колебаний. Даже в этих сверхблагоприятных условиях полипептидной G B D H цепи весьма скромного по размерам белка приA шлось бы затратить на сворачивание порядка 10178 с, или примерно 10170 лет. Это совершенно неправдоподобное время, так как даже возраст Вселенной, по имеющимся оценкам, не многим более 1010 лет.

Читайте также:  Запрет работы на высоте по зрению

Возникшее несоответствие носит название параа докса Ливенталя и обусловлено предположением о 3 prop случайном характере сворачивания белковой глобулы за счет перебора примерно одинаковых по энерГЕМ гии конформаций полипептидной цепи. Разрешение лиганд данного парадокса состоит в очевидном неслучайFe Eном характере сворачивания полипептидных цепей.

EHis B Thr Отметим, что способностью свернуться в уникальную третичную структуру обладают полипептидные цепи не с любой аминокислотной последовательноHis = ECdстью. Конформационные движения при опредеM Phe ленном сочетании аминокислотных остатков ока- ES Val зываются определенным образом скоррелированы бв (взаимозависимы). Это одна из новых глав современной науки о физике белка, но ее обсуждение выходит далеко за рамки данной статьи. Мы только Рис. 3. Структура белка миоглобина (а); буквами обозначены -спиральные участки; схема канала хотим показать, что детали механизма конформадля диффузии лиганда в миоглобине (б); проникционной подвижности белка оказываются сущестновение лиганда через флуктуирующую щель, обвенными уже на стадии формирования глобулы. разованную аминокислотными группами (в), ‹5, уложены очень плотно и каждый из них, как в кри- кулярной динамики в приложении к белковым просталле, четко знает свое место. Так как периодично- блемам. Если задать все силы, которые действуют сти (как в кристаллах) в расположении атомов в между атомами в молекуле белка, то можно напиглобуле не наблюдается, то появился даже термин сать уравнения движения (уравнения Ньютона), редля описания физического состояния глобулы – шения которых определяют изменения координат “апериодический кристалл”. Этот термин был за- атомов во времени. Одна из проблем состоит в том, имствован из известной книги Э. Шрёдингера “Что что для белка нужно решить систему из многих тытакое жизнь с точки зрения физики” (“What is Life сяч взаимозависимых уравнений. В настоящее вреThe Physical Aspect of the Living Cell”), впервые из- мя такая проблема под силу мощному домашнему данной в 1943 году. Справедливости ради отметим, компьютеру, а 20 лет назад потребовались усилия начто в этой книге с апериодическим кристаллом иболее мощного суперкомпьютера. Результаты рассравнивалась хромосома, а не белковая глобула. чета выводятся на дисплей в виде “молекулярного кино”, где можно наблюдать за динамикой процесса.

Аргументом в пользу квазитвердотельного состояния белковой глобулы явились и измерения При моделировании динамики диффузии лиганмодуля Юнга глобулы. Напомним, что модуль Юн- да в миглобине оказалось, что если воспользоваться га характеризует упругие свойства материала. Ти- твердотельной моделью глобулы, то есть разрешить пичное значение этой величины для влажного бел- атомам только колебаться вблизи положений равнока составляет 1010 эрг/см3 (или около 1 ГПа), что весия, как это происходит в кристаллических реблизко к соответствующим значениям для молеку- шетках, то энергия активации диффузии лиганда лярных кристаллов и стеклообразных полимеров. достигает величин 100 ккал/моль и процесс при Для справки: модуль Юнга стали равен 200 ГПа, обычных температурах практически заморожен.

древесины – 10, оргстекла – 4, капрона и полипро- Однако если включить конформационные степени пилена – около 1, полиэтилена высокого давления – свободы полипептидной цепи, то оказывается, что 0,2, полиуретана – 0,01 ГПа. Отметим, что при де- процесс диффузии идет достаточно эффективно по гидратации белка его модуль Юнга повышается двум возможным путям (или каналам) внутри примерно в 5–6 раз, а при денатурации модуль Юн- глобулы с разумной энергией активации порядка га белка уменьшается примерно в тысячу раз и его 10 ккал/моль (см. рис. 3). Ситуация примерно таупругость становится близкой к упругости резины и кая, как если бы лиганд проходил через систему других материалов, состоящих из полимерных клуб- случайно распахивающихся и закрывающихся двеков. Итак, похожа ли белковая глобула на шарик из рей или через флуктуирующие щели. Причем акт капрона или органического стекла В конце 70-х го- диффузии наблюдается только тогда, когда просвет дов стало окончательно ясно, что непохожа. щели, образованной аминокислотными остатками, превышает ван-дер-ваальсовский диаметр лиганда.

Наглядно это обстоятельство было продемонстЭнергия активации диффузии при этом составляет рировано на примере диффузии лиганда (окиси порядка 10 ккал/моль – энергия раскрытия щели на углерода) в миоглобине. Схема эксперимента довеличину 1 (см. рис. 3).

вольно проста. Молекула СО связывается с атомом железа в активном центре (с гемом) миоглобина На этом примере видно, что модель капронового (см. рис. 3). Далее после короткой лазерной вспыш- шарика или микрокристаллика не очень подходит к ки происходит диссоциация комплекса СО–гем. белковой глобуле. В белке наблюдаются флуктуаМолекула окиси углерода выбрасывается на пери- ции положений отдельных групп с амплитудами 1, ферию глобулы и затем происходит рекомбинация что много больше амплитуд валентных колебаний и СО с гемом за счет диффузии лиганда в белке. Ока- колебаний атомов в узлах кристаллической решетзалось, что диффузия лиганда в миоглобине идет ки ( Pages: |

Торжество компьютерных методов: предсказание строения белков

Понимание механизма фолдинга белка — процесса, благодаря которому каждая белковая молекула приобретает уникальную структуру и свойства — является необходимым условием для создания надёжного и точного алгоритма теоретического предсказания пространственной структуры этих «молекул жизни»

коллаж основан на схеме сворачивания ингибитора химотрипсина из книги «Физика белка» [6] (приведённой также в статье в «Науке и жизни») и картинке amanky@Flickr

Знание пространственной организации белковых молекул является ключом не только к пониманию их функций и механизма работы, но и основой для разработки эффективных и безопасных лекарственных средств. В то же время, определять структуру белков в прямом эксперименте не всегда возможно или целесообразно — из-за сложности, дороговизны и ограниченности возможностей экспериментальных методик. Однако иногда удаётся преодолеть эти сложности, подойдя к проблеме «с другого конца»: структуру биомакромолекул можно «предсказать», используя теоретические подходы — основанные на физических или эмпирических приближениях. В этой статье даётся теоретическое обоснование возможности «предсказывать» структуру белков и коротко рассматриваются основные подходы к этой задаче.

Для чего требуется знать структуру белков?

Белки — универсальные биополимеры, из которых строится жизнь, — выполняют весь спектр биологических функций: от структурной до каталитической. (Их роль для жизни в целом признана даже классиками марксистско-ленинской философии.) Конечно, незаменимы и многие другие молекулы: «первенство» в хранении и передаче информации принадлежит нуклеиновым кислотам, а изрядную долю структурной и формообразующей функции берут на себя липиды — основные компоненты биомембран живых клеток. Рибонуклеиновым кислотам, кроме уже ставших для них привычными структурной и каталитической функций, приписывают всё новые и новые «роли», подкрепляя гипотезу о «мире РНК», возможно, существовавшем на заре эпохи зарождения жизни на Земле. Несмотря на всё это, именно белки играют максимум ролей в живом мире (по крайней мере, таком, каким мы его знаем теперь), и важность их изучения не ограничивается только фундаментальной наукой: сегодня и медицина, и промышленность — потребители знаний о функциях и структуре белков.

Понимание механизмов функционирования живых систем, а значит, и возможность влиять на них, например, с помощью лекарственных средств [1], требует знания структуры белковых молекул и глубокого понимания их функций. Благодаря работам Кристиана Анфинсена [2] — нобелевского лауреата по химии 1972 года «за работы по рибонуклеазе, в частности, за установление связи между последовательностью аминокислот и конформацией биологически активной молекулы», — нам известно, что «необходимая [для сворачивания белка] информация заключена в линейной последовательности аминокислот пептидной цепочки, и что никакой дополнительной генетической информации, большей, чем та, которая заключена в ДНК, не требуется» [2]. Однако физико-химические аспекты этого сложнейшего процесса, называемого также фолдингом белка, остаются до сих пор понятыми лишь приблизительно.

Кроме учёных, структура белка интересует и специалистов более практического профиля. Фармацевты и врачи, например, заинтересованы в производстве и выпуске на рынок новых поколений лекарственных средств. Однако в наше время уже нельзя рассчитывать на случайный успех, и нужно хорошо разбираться в молекулярных механизмах действия проектируемого лекарства, — направленного, скорее всего, на взаимодействие с каким-нибудь белком (рецептором или ферментом) в человеческом организме. Проектирование нового лекарства с учётом атомарного строения молекул-«мишеней», на которые это лекарство будет действовать — наукоёмкий и сложный процесс, называемый драг-дизайном [1].

В различных отраслях промышленности — например, химической и пищевой, а в перспективе и энергетической, и остальных, — также используются белки. Разработка новых биотехнологических ферментов, способных послужить на благо общества, кроме знания структуры белков и понимания механизмов их работы, требует ещё умения проектировать новые функции в белках, ранее выполнявших какую-то другую работу [3]. Здесь, правда, требуется умение решать обратную задачу — не определять структуру существующего белка, а создавать белок, структура (а значит, и свойства) которого будут заданы заранее, — но ведь решение этой задачи требует схожих знаний и навыков!

В чём же сложность?

По сравнению с периодом времени 30–40 летней давности, когда знание об устройстве биологических молекул было ещё крайне ограниченным, и определение аминокислотной последовательности инсулина или пространственного строения миоглобина было настоящим научным прорывом, сейчас поток биологической информации нарастает год от года стремительными темпами. Завершение геномных проектов, следующих один за другим [4], фактически избавило исследователей от рутины по «классическому» секвенированию белковых молекул — последовательности всех белков конвертируются из прочтённых геномов множества организмов в аннотированные базы данных, доступные через интернет. Так, число последовательностей в базе Swiss-Prot (версия 55.1 от 18 марта 2008 года), курируемой и аннотируемой специалистами вручную (!), составляет ≈360 000, а число записей в базе TrEMBL (версия 38.1), аннотированных автоматически по доступной геномной информации, приближается к 5,5 миллионам.

Получить такое фантастическое число последовательностей стало возможным благодаря современным высокопроизводительным технологиям секвенирования геномов [5], делающим задачу прочтения всей (ну или почти всей) ДНК нового вида (или даже отдельной особи!) лишь вопросом времени. Другая ситуация складывается с определением пространственного строения белковых молекул: инструментарий для решения этой задачи — рентгеноструктурный анализ (РСА) и спектроскопия ядерного магнитного резонанса (ЯМР) — ещё не достиг той степени зрелости, чтобы можно было получить структуру любого интересующего исследователей белка с ограниченными временными и материальными затратами.

Сложность заключается в получении нужных количеств белка, подготовке препарата, пригодного для изучения дифракции рентгеновских лучей или ядерного магнитного резонанса в меченном изотопами образце, и в анализе данных. Каждый этап этой задачи часто требует уникального подхода и поэтому не может быть полностью автоматизирован. Особенно сложно охарактеризовать структуру белков, образующих сложные молекулярные комплексы, и интегральные белки биологических мембран (составляющих до трети от общего числа белков в большинстве организмов). Поэтому, даже с учётом того, что расшифровкой структур белков занимаются не только научные коллективы по собственной инициативе, но и международный консорциум PSI (Protein Structure Initiative), задачей которого является максимально полная и широкая структурная характеризация всего белкового разнообразия в живом мире, число белков с известной структурой сравнительно невелико. По состоянию на 25 марта 2008 года, число структур в Брукхэйвенском банке белковых структур (PDB) немногим меньше 50 000, но если из этого множества исключить повторные эксперименты на одних и тех же белкáх в различных условиях, а также структуры искусственно модифицированных и близкородственных белков, это число сократится до менее чем 10 000, составляя ≈1–2% от общего числа практически важных белков.

Выход из сложившейся ситуации могут дать методики теоретического предсказания пространственной структуры, решающим преимуществом которых является сравнительно высокая скорость и низкая трудоёмкость получения моделей строения белков. Оборотной стороной этого преимущества оказывается «качество» моделей — точность предсказания, которая не всегда является достаточной для практически важных задач (например, изучения взаимодействия рецептора с лигандами). Однако, как уже было сказано, в условиях ограниченной доступности структурных данных по интересующему исследователей объекту, молекулярная модель оказывается разумной заменой — особенно учитывая тот факт, что более или менее реалистичные модели могут быть построены для >50% всех белков с неизвестной структурой.

Разумеется, работая с теоретически предсказанными моделями белков, надо критически относиться к полученным результатам и быть готовым к тому, что полученные результаты необходимо проверять с помощью независимых методов — что, в прочем, касается большинства научных областей, работа в которых ещё не превратилась в чистую технологию.

Далее мы рассмотрим базовые теоретические предпосылки, делающие предсказание трёхмерного строения молекул белков возможным и в общем виде основные методики, использующиеся сегодня в этой области.

Фолдинг: возможно ли предсказать структуру белка на компьютере?

Фолдинг — сворачивание белков (и других биомакромолекул) из развёрнутой конформации в «нативную» форму — физико-химический процесс, в результате которого белки в своей естественной «среде обитания» (растворе, цитоплазме или мембране) приобретают характерные только для них пространственную укладку и функции [6]. Фолдинг причисляют к списку крупнейших неразрешённых научных проблем современности — поскольку процесс этот далёк от окончательного понимания [7].

С термодинамической точки зрения самосворачивание белкá является переходом белковой молекулы в наиболее статистически вероятную конформацию (что практически можно приравнять к конформации с наименьшей потенциальной энергией). С кинетикой же фолдинга связывают так называемый парадокс Левинталя [8], согласно которому, если бы молекула белкá длиной хотя бы 100 аминокислотных остатков «перебирала» все возможные конформации, прежде чем свернуться в нативную форму, этот процесс потребовал бы времени, превышающего время существования Вселенной. Однако из практики известно, что максимальное время сворачивания ограничивается минутами, типичное время — порядка миллисекунд, а кратчайший требуемый срок, зарегистрированный для трёхлистового β-слоя — всего 140 нс [9]!

Само собой, парадокс Левинталя — кажущийся. Решение его заключается в том, что молекула, конечно, никогда не принимает подавляющего большинства теоретически возможных конформаций. Кооперативные эффекты фолдинга — одновременное формирование «зародышей» вторичной структуры, являющихся энергетически стабильными и уже не изменяющимися в процессе дальнейшего сворачивания — приводят к тому, что молекула белка находит «кратчайший путь» на воображаемой гиперплоскости потенциальной энергии к точке, соответствующей нативной конформации белка. Нативная конформация при этом отделена заметным «энергетическим промежутком» (potential energy gap) от подавляющего числа несвёрнутых форм, а ближайшая её «окрестность» (очень «узкая», впрочем) определяет естественную конформационную подвижность молекулы.

Читайте также:  С точки зрения социологии социальный конфликт есть

Ограниченность понимания механизмов фолдинга связана ещё и с тем, что его сложно наблюдать экспериментально: это достаточно быстрый динамический процесс, «разглядывать» который нужно на уровне отдельных молекул! И хотя сейчас уже проводят изучение сворачивания (а точнее, разворачивания) на отдельных молекулах [10], это не пока не привело к принципиально новому уровню понимания механизма фолдинга — а ведь такое понимание могло бы дать эффективный алгоритм теоретического моделирования этого процесса.

Биологические молекулы моделируют чаще всего с применением подхода эмпирических силовых полей [11], позволяющего, в отличие от «абсолютно корректного» квантово-химического подхода (см. врезку), рассчитывать энергетические характеристики и динамические свойства биомакромолекул в обозримые сроки. Однако такое радикальное ускорение времени расчётов не может даваться даром: хотя многие компьютерные эксперименты в эмпирических силовых полях и дают реалистичные результаты, некоторые важнейшие для фолдинга кооперативные взаимодействия — такие как гидрофобный эффект или влияние молекул растворителя — не сводятся к парным взаимодействиям между отдельными атомами и не могут быть корректно учтены в этом подходе.

Существует два основных препятствия тому, чтобы запустить моделирование молекулярной динамики (МД) какого-нибудь белка в необходимом окружении и «в кремнии» пронаблюдать фолдинг, получив в конце процесса желанную структуру. Во-первых, характерные времена сворачивания всё же находятся на уровне миллисекунд, а максимально достижимое время моделирования на данном этапе развития вычислительной техники редко превышает одну микросекунду. Но, даже если представить, что мы не ограничены в мощностях компьютеров, всё равно остаются сомнения в возможности современных энергетических функций эффективно справиться с фолдингом — точность этих функций, управляющих эволюцией молекулы внутри компьютера, может оказаться недостаточной для того, чтобы направить сворачивание в нужном направлении. Кроме того, алгоритм, моделирующий подвижность, может навсегда «зациклить» молекулу в локальном энергетическом минимуме, чего никогда не случается в реальном процессе сворачивания. (Однако определённые успехи в моделировании фолдинга с помощью молекулярной динамики всё же есть: небольшие белки — вроде 36-аминокислотного фрагмента виллина — удаётся свернуть в МД длительностью около микросекунды, запуская расчёты на суперкомпьютере или в распределённой вычислительной сети [12].)

Итак, использование метода молекулярной динамики как средства моделирования процесса фолдинга пока что нецелесообразно и практически не достижимо. Однако существует возможность предсказать результат фолдинга — то есть, трёхмерную структуру белка. Теоретические подходы, служащие этой цели, делятся на две большие группы: ab initio (или de novo) фолдинг — методики, не использующие в явном виде данных о структуре других белков, — и сопоставительное моделирование (или моделирование на основании гомологии). Далее обе эти группы будут рассмотрены подробнее с бóльшим акцентом на последнюю как учитывающую феномен белковой эволюции.

Квантовая химия в расчётах свойств белковых молекул

Как известно, уравнение Шрёдингера — «плоть и кровь» квантовых физики и химии — наиболее точный на сегодняшний день способ описать строение и динамику молекул. Однако точное (аналитическое) решение возможно получить лишь для крайне простых систем — например, атома гелия. Во всех более сложных случаях прибегают к численному решению приближений этого уравнения — так называемым полуэмпирическим методам квантовой химии.

Самое бóльшее, для чего обычно используют эти полуэмпирические методы в моделировании белков — оптимизация геометрии и зарядового состояния остатков реакционного центра белка, потому что системы бóльшего размера становятся «неподъёмными» для этих чрезвычайно сложных и ресурсоёмких подходов.

Методы эмпирических силовых полей (такие как молекулярная динамика [11]) не имеют никакого отношения к квантовой химии и «обращаются» с атомами моделируемых молекул (в частности, белков) как с классическими упругими частицами, связанными системой парных взаимодействий. Параметры этих взаимодействий (очень простых, надо отметить) как раз и называются силовым полем и определяют поведение системы при моделировании.

Электронные эффекты, такие как поляризуемость атомов, перенос электрона, образование и разрыв химических связей, а также кооперативные гидрофобные взаимодействия смоделированы в этом подходе быть не могут.

Фолдинг «из первых принципов»

Необходимо сразу отметить, что термин «ab initio фолдинг», часто применяемый для обозначения методов компьютерного предсказания структуры белка без использования структурных данных о других белках, не имеет отношения к тому ab initio, которое бытует в квантовой химии. Квантово-химический термин ab initio (лат. — «из первых принципов») обозначает расчёт свойств молекул с помощью решения уравнения Шрёдингера (точнее, одного из его приближений), а в области моделирования структуры белков тот же термин означает лишь, что в предсказании не используют в явном виде информации о структуре других белков. Однако все вычисления, как правило, производятся в эмпирических силовых полях, описывающих парные взаимодействия в классической системе частиц, представляющей молекулу белка. Сами же эти силовые поля в неявном виде включают данные о структуре молекул (не обязательно белковых) — такие как парциальные заряды и массу атомов, а также длины и углы валентных связей, — и к квантово-механическим методам отношения не имеют. Поэтому целесообразно будет в дальнейшем использовать термин «de novo фолдинг» (лат. — заново, с начала).

Наиболее «физически корректные» подходы из этой группы заключаются в основном в расчётах МД для моделирования процесса и результата фолдинга (см. тремя абзацами выше), однако эти методы из-за их огромной вычислительной сложности и неточности функций потенциальной энергии достигают успеха лишь для некоторых очень небольших белков. В остальных же случаях — тоже, впрочем, относящихся к маленьким белкам (не более 150 аминокислотных остатков), — прибегают к дополнительным приближениям с целью уменьшить вычислительную сложность расчёта.

Для увеличения вычислительной эффективности, в de novo подходах часто используются упрощённые модели представления белка — отдельные аминокислотные остатки, присутствующие в модели, представлены не так подробно, как в «полноатомных» подходах: вся боковая цепь моделируется лишь одним-двумя центрами («псевдоатомами»). Так, например, боковая цепь триптофана содержит 16 атомов, а в упрощённом виде их может быть всего два-три (и только один — для менее объемных остатков).

De novo фолдинг проводится в специальном силовом поле (также упрощённом по сравнению, например, с используемыми в МД), оценивая огромное количество вариантов укладки сворачиваемой молекулы по значению потенциальной энергии. Идентификация конформации, значительно (с «зазором») более «низкой» по потенциальной энергии, чем остальные, может служить признаком конца поиска — аналогично тому, как нативная конформация с некоторым отрывом отстоит от несвёрнутых промежуточных состояний.

Конечно, кроме корректной функции потенциальной энергии, требуется преодолеть «комбинаторный взрыв», создаваемый парадоксом Левинталя. Очевидно, что перебрать все конформации, чтобы выбрать самую низкую по энергии, невозможно, а из-за слабого понимания механизмов сворачивания белка повторить тот «кратчайший путь», который ведёт к нативной структуре, на компьютере пока не удаётся.

Чтобы как-то приблизиться к природному механизму сворачивания, исследователи пытаются выделить в последовательности моделируемого белка структурно консервативные фрагменты (аналогичные тем, что в природе сворачиваются первыми и в дальнейшем уже остаются неизменными) и как бы «собирают мозаику» из этих фрагментов. Эта процедура, тоже чрезвычайно ресурсоёмкая (всё равно требуется перебрать астрономическое число вариантов!), позволяет существенно сократить время расчётов, и для небольших белков уже получены обнадёживающие результаты (рис. 1).

Рисунок 1. De novo фолдинг: предсказание пространственной структуры небольших белков. Программа Rosetta генерирует ансамбль моделей, получающихся после «сборки» структурно-консервативных фрагментов молекулы в специализированном силовом поле. Короткие (4–10 аминокислотных остатков) фрагменты последовательности моделируемого белка выступают «зародышами» структуры будущей модели (причём в разных моделях они различаются и «перекрываются»), а конформацию этим фрагментам «назначают», используя конформации гомологичных фрагментов из белков с уже известной структурой. (В этом смысле, de novo не является моделированием «заново» в полном смысле слова, но «заимствование» локальных структурных фрагментов такой небольшой длины в данном случае не считается использованием структуры белков-гомологов целиком.)
Сверху на рисунке показаны наложенные экспериментальная структура белка Hox-B1 ( красным ) и соответствующая низкоэнергетическая структура, предсказанная программой Rosetta ( синим ). Видно практически идеальное совпадение конформаций ароматических остатков в центральной области белка. Внизу показана зависимость энергий моделей из полученного в расчёте ансамбля от среднеквадратичного отклонения (СКО) моделей от нативной структуры. (СКО в молекулярном моделировании используется в качестве меры пространственной близости двух моделей: низкое СКО (Å) обозначает близость двух структур.) Синим цветом показаны модели, сгенерированные из нативной структуры в качестве «контроля» (и естественно получившиеся очень близкими к ней по значению СКО), чёрным — модели, созданные в процессе предсказания. Красной стрелкой отмечена модель, структура которой дана сверху.
В данном случае, хотя чёткая зависимость СКО от энергии отсутствует, самая низкоэнергетическая конформация оказалась очень близка к нативной структуре; однако другая модель с энергией, очень близкой к оптимальной, имеет СКО от нативной структуры уже 4 Å (что достаточно много). Этот факт иллюстрирует не очень высокую надёжность предсказаний в практических применениях — потому что в реальных задачах, когда предсказываемая структура действительно неизвестна, сравнивать СКО модели будет уже не с чем — руководствоваться придётся только значениями энергии.

Одним из научных коллективов, активно занимающихся предсказанием структуры белков de novo, является вашингтонская лаборатория Дэвида Бэйкера (David Baker), также являющегося профессором Медицинского института имени Ховарда Хьюза. Разрабатываемая ими программа Rosetta уже неоднократно показывала себя с хорошей стороны в предсказании структуры белков небольшой длины (рис. 1) —

100–150 аминокислотных остатков [13], а также в дизайне ферментов с новыми функциями [3].

Похожий подход используется в программе TASSER [15], где короткие структурные фрагменты «собираются» в специализированном силовом поле, а результат (модель, предположительно близкая к нативной) выбирается из ансамбля предсказаний с помощью идентификации наиболее плотного структурного кластера — являющегося, по мнению исследователей, «гнездом» физически реалистичных моделей.

Упомянутые методы очень требовательны к вычислительным ресурсам — предсказание структуры белка длиной 112 остатков с помощью метода Rosetta [13] потребовало использования суперкомпьютера и распределённой сети Rosetta@Home из ≈70 000 персональных компьютеров. (Конечно, все эти мощности пошли не только на предсказание одной структуры — в исследование был включен не один белок.) Эта ресурсоёмкость лишний раз подчёркивает, что понимание механизмов фолдинга находится не на высоте: способ направленно двигаться в сторону нативной структуры, не перебирая множества нереалистичных вариантов, пока не найден. Да и функции оценки потенциальной энергии часто дают промашки: ведь на одно удачное предсказание, становящееся поводом к публикации в одном из ведущих журналов [13–17], приходится множество неудачных попыток.

Но и для предсказаний с не очень высокой точностью находится своё применение: ведь упомянутые алгоритмы могут не только предсказывать структуру «с нуля», но и оптимизировать модель, если в качестве отправной точки задать экспериментальную структуру, требующую уточнения — например, ЯМР-модель или данные из криоэлектронной микроскопии. Кроме того, предсказание структуры всех белков подряд из какого-нибудь организма может помочь идентифицировать белки с ещё неизвестным типом укладки — чтобы экспериментаторы могли сконцентрироваться именно на них и «расшифровать» строение ещё одного структурного семейства.

Итак, методики de novo фолдинга для небольших белков уже достигли определённой зрелости [17], а возможность создать белок с не встречающимся в природе типом укладки «с нуля» [18] дополнительно подчёркивает потенциал этой области — ведь свернуться способна далеко не каждая последовательность!

Однако для белков бóльшей длины успехи de novo подходов пока более чем скромны, и предсказать устройство таких белков без использования дополнительной информации и эмпирических подходов уже невозможно. И тут на помощь приходит сама Природа — ведь белки не независимы друг от друга, и между ними есть «родственные» отношения! Предсказание структуры белков, использующее эти отношения, называется сопоставительным моделированием, или моделированием на основании гомологии.

Сопоставительное моделирование

«Вселенная» белков велика (как уже было сказано, на сегодняшний день известно уже более пяти миллионов белков, идентифицированных в геномах множества организмов), но не безгранична. Многие белки имеют типичные мотивы пространственной организации — то есть, принадлежат к различным семействам, образуя «родственные» группы. Все белки с известной структурой подразделяются на ≈3 500 структурных семейств, образующих ≈1000 типов пространственной укладки (согласно классификации SCOP — Structural Classification of Proteins).

«Родство» между белками (обычно измеряемое степенью идентичности их аминокислотных последовательностей) не случайно: одна из наиболее распространённых гипотез белковой эволюции объясняет «родственные отношения» дупликацией генов, произошедшей когда-то в процессе эволюции организма и приведшей к появлению белка с новой функцией [19]. И, хотя «новый» белок приобретает другую функцию, а его последовательность понемногу эволюционирует и меняется, пространственная структура его остаётся до какого-то момента достаточно консервативной [20]!

Эмпирически установлено, что если последовательности двух белков идентичны друг другу более чем на 30%, то белки почти наверняка являются «родственниками» и степень эволюционной дивергенции ещё не столь велика, чтобы их структуры утратили общность. Эти наблюдения и являются основой методики предсказания пространственной структуры, называемой моделированием на основании гомологии.

Моделирование на основании гомологии

На настоящий момент моделирование по гомологии позволяет установить структуру более половины белков, чьё строение ещё неизвестно. Если же выбирать мишени для экспериментального определения структуры таким образом, чтобы в результате для каждого белка был получен хотя бы один структурный гомолог (с идентичностью последовательностей >30%), то окажется, что достаточно получить всего 16 000 структур [21], а «степень покрытия» при этом составит >90%, включая и мембранные белки. Моделирование по гомологии в этом случае поможет установить структуры бóльшей части оставшихся белков.

Процесс моделирования по гомологии [22], [23] включает несколько шагов (рис. 2), главными из которых являются поиск структурного шаблона и построение аминокислотного выравнивания. Решающим фактором, определяющим качество получаемых моделей, является степень гомологии (или идентичности) последовательностей моделируемого белка и шаблона. Высокая идентичность обозначает, что эволюционное расхождение обоих белков от общего «предка» произошло не настолько давно, чтобы эти белки утратили структурную общность.

Читайте также:  Что делать если зрение ухудшается после лазерной коррекции

Рисунок 2. Схема моделирования по гомологии на примере рецептора мелатонина MT1 человека:

  • Идентификация структурного шаблона — белка с известной пространственной структурой, гомологичного моделируемому (идентичность последовательностей >30%). Поиск производится с помощью серверов FASTA или PSI-BLAST (или их аналогов) в базе структур белков PDB (едином депозитарии структурных данных для биомакромолекул);
  • Построение выравнивания аминокислотных последовательностей шаблон-модель. Парное выравнивание служит «инструкцией» программам, осуществляющим моделирование. Множественное выравнивание может быть полезно для выявления консервативных остатков во всём семействе (показаны звёздочкой) или отдельных подсемействах белков (три верхних последовательности — рецепторы мелатонина). Множественное выравнивание и профили последовательностей позволяют идентифицировать более слабые гомологии, чем «обыкновенное» парное выравнивание. Выравнивание проводят с помощью сервера CLUSTALW (или его аналогов);
  • Построение модели заключается, главным образом, в «натягивании» последовательности моделируемого белка (рецептора мелатонина MT1) на «остов» шаблона (зрительного родопсина) согласно выравниванию. «Петлевые» участки (не имеющие гомологии с шаблоном) достраиваются независимо, положение боковых цепей оптимизируется с помощью методов эмпирических силовых полей. В первом трансмембранном сегменте наложенных структур модели и шаблона показаны боковые цепи остатков, «подсвеченных» на выравнивании.
    Моделирование проводят с помощью программы Modeller (и аналогичных ей) или сервера Swiss-Model (и ему подобных). В онлайн-базах ModBase и Swiss-Model Repositoryсодержатся автоматически построенные модели для всех белков из базы Swiss-Prot, для которых удаётся найти структурный шаблон;
  • Оценка качества, оптимизация и использование модели. Самый сложный этап моделирования по гомологии — оптимизировать модель с учётом всей доступной биологической информации по моделируемому белку. Вообще, моделирование структуры по гомологии с белком, выполняющим отличную функцию, не способно автоматически дать модель, пригодную для практически важных задач. Обязательно требуется аккуратная оптимизация, превращающая «заготовку» (которой, по сути, является модель «нулевого приближения») в рабочий инструмент, — задача, зависящая скорее от интуиции и опыта исследователя, чем от конкретных компьютерных методик.

В процессе проводимого уже около 15 лет с двухгодичным интервалом всемирного «соревнования» по предсказанию структуры белков — CASP (Critical Assessment of Techniques for Protein Structure Prediction) — выяснилось, что эмпирическим «барьером» можно считать 30%-идентичность. То есть, если последовательности белков идентичны более чем на 30% — то, скорее всего, их структуры будут похожими и качество итоговых моделей будет удовлетворительным (рис. 3). Если же гомология низка, то накопившиеся структурные отличия, скорее всего, уже слишком велики для аккуратного моделирования, или — больше того — реальной гомологии между двумя белками нет никакой, а наблюдаемый уровень идентичности последовательностей является лишь случайным событием.

Рисунок 3. Качество и сфера пригодности компьютерных моделей белков, основанных на различной степени гомологии. Чем выше идентичность последовательностей моделируемого белка и шаблона — тем более высококачественными получаются модели, и область их пригодности расширяется на чувствительные к точному расположению атомов приложения — такие как объяснение каталитического механизма, докинг лигандов и разработка новых лекарств.
Вертикальная ось представляет долю идентичности шаблон-мишень на выравнивании. Слева от вертикальных стрелок указаны методики, способные идентифицировать этот уровень гомологии. В правой части перечислены возможные сферы применения моделей, причём все «роли» моделей, основанных на низкой гомологии, относятся и к более «качественным» структурам. Слева от шкалы указана типичная точность моделей (даны среднеквадратичное отклонение от «нативной» структуры и доля остатков модели, удовлетворяющая этому качеству). В левой части рисунка показаны наложенные друг на друга кристаллографические структуры нескольких ядерных рецепторов в зависимости от идентичности по отношению к прогестероновому рецептору (дан красным сверху и на каждом совмещении): 54% — глюкокортикоидный рецептор ( зелёным ), 24% — эстрогеновый рецептор α ( фиолетовым ), 15% — рецептор трийодтиронина ( голубым ) [22]. Из сравнения структур видно, что, хотя структурная общность несомненно тем выше, чем выше идентичность последовательностей, внутри этого семейства рецепторов существует консервативный структурный мотив, сохраняющийся даже у низкогомологичных по последовательности белков.

Низкая гомология (из-за слишком большого числа накопившихся замен, «маскирующих» последовательность белка, который, возможно, всё же сохранил определённое структурное сходство с каким-либо известным белком-«шаблоном». В этом случае часто используют методики поиска по профилям последовательностей, в которых для «запроса» к базе последовательностей используется не одиночная последовательность, а профиль, сконструированный на основе множественного выравнивания — своеобразная метапоследовательность, кодирующая в себе эволюционную вариабельность данного белка [25]. С помощью этой методики иногда удаётся «вычислить» пригодный для моделирования структурный шаблон, несмотря на то, что идентичность последовательностей с ним составляет лишь 10–15%. Если же ни с помощью «традиционных» подходов поиска гомологичных последовательностей, ни с помощью профилей найти структурный гомолог не удаётся, единственный способ получить предсказание — это de novo методы, о которых уже говорилось выше.

Область применения предсказанных структур белков довольно разнообразна (рис. 3), и они оказываются полезными на различных этапах процесса разработки фармацевтических препаратов [1] (рис. 4).

Рисунок 4. Применение теоретических моделей белков в разработке новых лекарств. Возрастающее количество структурной информации интенсифицирует не только идентификацию и оптимизацию соединения-«прототипа», но и более ранние стадии — такие как выбор мишени для фармакологического воздействия и проверка её «причастности» к изучаемым процессам (валидация мишени).

Ограничения сопоставительного моделирования

В некоторых случаях основополагающая концепция метода моделирования по гомологии — «близкие последовательности упаковываются в близкие структуры» — нарушается. Белки, чьи последовательности практически идентичны и содержат лишь несколько замен, иногда могут принимать различные конформации. Некоторые белки при ди- или олигомеризации обмениваются доменами, в результате чего структура мономеров в составе олигомера и отдельно взятого мономера совершенно не похожи. За этими явлениями стоят очень тонкие эффекты, сопровождающие сворачивание белков, приводящие к тому, что небольшие замены в последовательности или молекулярном окружении стабилизируют различные конформации белка. Увы, прогнозирование таких событий пока что совершенно неподвластно ни сопоставительному моделированию, ни другим теоретическим методам предсказания пространственной структуры.

Вообще, как показывает анализ множества предсказаний структуры «вслепую», в подавляющем большинстве случаев структура моделей, созданных по гомологии, оказывается не ближе к нативной, чем шаблон, на котором она базировалась [26] — если сравнивать укладку белковых «остовов» в пространстве. Происходит это, очевидно, из-за того, что в структуре шаблона не может содержаться отличительных черт моделируемого белка, а используемые методы оптимизации скорее отдаляют структуру модели от нативной, нежели приближают к ней — опять-таки, из-за несовершенства современных эмпирических полей, неспособных воспроизводить тонкие конформационные явления, происходящие «вблизи» нативной структуры. Предпринимаются, впрочем, попытки преодолеть этот изъян, позволяя оптимизации взаиморасположения участков белкового остова модели протекать только в «эволюционно разрешённых направлениях», извлекаемых из семейства структур родственных белков [27], но этот подход пока не получил большого распространения.

Дух соревнования (Есть ли прогресс в моделировании структуры?)

В 1993 году впервые было проведено «соревнование» среди членов научного сообщества, занимающихся моделированием пространственной структуры белков — «Экспертиза методов по предсказанию структуры белкá» (CASP, Critical Assessment of Techniques for Protein Structure Prediction). Целью этого соревнования, проводимого с тех пор каждые два года, является протоколирование прогресса в данной наукоёмкой области. Чтобы не подвергать участников соревнования соблазну сфабриковать результаты, «на старт» выносятся белки с действительно неизвестной структурой — поскольку экспериментаторы, занимающиеся изучением этих белков, либо ещё не завершили работу над их структурами, либо «под честное слово» не раскрывают её результатов до окончания «забега». По результатам соревнования — когда все модели от всех участников получены и «правильные ответы» выложены в онлайн — определяется победитель и выпускается специальный номер журнала Proteins [26] с описанием достижений участников «соревнования». И, кстати, именно по итогам нескольких мероприятий CASP был установлен 30% эмпирический «рубеж», при опускании идентичности последовательностей ниже которого начинается «сумеречная зона», в которой найти шаблон для моделирования тем труднее, что не может быть чёткой уверенности в том, что он вообще существует.

Аналогичное испытание — «Экспертиза полностью автоматических методов предсказания структуры белка» (CAFASP, Critical Assessment of Fully Automated Structure Prediction) — проводится и для серверов, предлагающих свои услуги по 100%-автоматическому моделированию через интернет. «Состязание» среди серверов позволяет исключить из соревнования человеческий фактор и сравнивать чистые технологии.

И — что же вы думаете? — преимущество пока прочно удерживается за людьми, успех которых во многом зависит от интуиции и неформального опыта, нежели от технологий и программ, которые они используют. Для серверов же характерна другая закономерность: так называемые метапредсказатели — роботы, которые сами не моделируют строение белков, а, собрав результаты с других серверов в интернете, комбинируют их предсказания в собственные, — выдают результаты в среднем более правильные, чем сервера-«одиночки». Механизм как электронной «интуиции», так и многоопытности учёных мужей ещё предстоит обобщить, чтобы, может быть, ещё на один шажок приблизиться к пониманию механизмов фолдинга белка и к умению корректно предсказывать их структуру.

Протеомное моделирование

Хотя точность полностью автоматического моделирования, как правило, оставляет желать лучшего (как в абсолютном представлении, так и по сравнению с моделями, полученными «вручную»), прогресс в развитии «поточных» методов предсказания неизбежен. Во-первых, он позволяет суммировать весь накопленный опыт в одной технологической платформе, которой могут воспользоваться исследователи, не занимающиеся молекулярным моделированием, в том числе и через интернет. А во-вторых, «роботы» неутомимы, что позволяет им строить модели огромного количества белков — например, всех белков, идентифицированных в геноме какого-нибудь отдельно взятого организма — что вряд ли было бы под силу людям (если не рассматривать незаконную эксплуатацию азиатских студентов и аспирантов).

Сейчас уже существуют интернет-ресурсы, содержащие компьютерные модели огромного числа белков, полученные автоматически в результате запуска такого масштабного «геномно-протеомного» моделирования — и среди них уже упомянутые базы ModBase и Swiss-Model Repository. И если в этих базах содержатся модели, главным образом основанные на гомологии со структурами из базы PDB, то аналогичные инициативы с использованием de novo-«предсказателей» — упомянутых выше программ Rosetta и TASSER — моделируют и малоизученные белки, не имеющие ни структурных гомологов, ни ещё чётко определённой функции в клетке. De novo предсказания, помимо собственно моделирования структуры, могут оказать дополнительное подспорье проектам по структурной геномике, указывая белки с не найденным ранее типом укладки и, следовательно, являющиеся первоочередными «кандидатами» на экспериментальное изучение (в рамках стратегии структурно-геномных проектов).

Смысл такого крупномасштабного моделирования созвучен целям глобального проекта по структурной геномике, направленного на получение трёхмерной структуры всех известных белков — в результате прямых экспериментов или компьютерных расчётов. При этом стратегия выбора приоритетных мишеней для экспериментального изучения такова, чтобы «обеспечить» структурными шаблонами практически все известные белки — потому что ведь даже, несмотря на огромные усилия биологов-структурщиков, структура подавляющего числа белков будет смоделирована, а не получена экспериментально.

НеЗдоровый скепсис

В заключение следует добавить небольшую ложку дёгтя в радужную перспективу использования компьютерных моделей в практически важных научных задачах. Питер Мур (Peter Moore) — один из ведущих специалистов по структуре рибосомы — в своём эссе в ноябрьском номере Structure за 2007 год, озаглавленном созвучно популярной некогда песенке на мелодию Гершвина «Давай прекратим всё это» (“Let’s Call the Whole Thing Off”) [28], выражает скепсис относительно структурной инициативы (Protein Structure Initiative), финансируемой Национальными институтами здоровья США (NIH). Мур считает, что выбранная стратегия — определение строения максимального числа белков, концентрируясь в первую очередь на новых структурных мотивах, даже если функции соответствующих белков до сих пор неизвестны, — порочна по своей сути. Согласно Муру, лучше бы немаленький бюджет этой программы был потрачен на поддержку отдельных учёных, занимающихся изучением структуры белков, чья практическая значимость очевидна уже сегодня, и не рассчитывать, что эти структуры, когда они потребуются, могут быть получены на основе теоретических расчётов.

Он аргументирует свою позицию тем, что, если научные планы лаборатории связаны со структурой какого-то белка, то полагаться на компьютерную модель — с которой, скорее всего, придётся работать, потому что даже в случае выполнения задач инициативы PSI, бóльшую часть белков будет всё же смоделирована, а не изучена экспериментально, — было бы очень опрометчиво. «Если ваша лаборатория начинает исследование, основанное знании структуры какого-либо белка, и всё, что у вас есть — это только компьютерная модель, полученная из его последовательности, не лучше ли вам всё же ещё до начала этой работы задаться целью получить экспериментальную структуру этого белка? Я считаю, что вы будете просто сумасшедшими, если не сделаете этого, — пишет Мур. — Не важно, получена ли стартовая модель вашего белка с помощью сопоставительного моделирования или нет, — но вам всё равно нужно будет оптимизировать её, чтобы прийти к точному расположению всех остатков в модели, а делать это нужно будет с помощью эмпирических силовых полей. Но эти подходы базируются на парных взаимодействиях атомов, что просто не соответствует истине! В твёрдом теле поляризация атомов существенно влияет на поведение системы, но учесть этого вам никак не удастся. Только самые точные атомные модели, в которых положение отдельных атомов определено с точностью 0,5 Å или более высокой, достойны называться „структурами“, и только они могут быть полезными для высокоточных научных задач, основанных на знании структуры белка». Питер Мур считает, что нет смысла определять структуры максимума белков только потому, что они организованы ещё не описанным образом, — ведь в реальном исследовании, чтобы удостовериться в точности молекулярной модели, всё равно потребуется определить структуру интересующего белкá. «Однако если вы соберётесь делать это [определять структуру], зачем же тратить силы на то, чтобы моделировать его строение исходя из гомологии со структурами, полученными PSI? Вот из-за этого-то я и сомневаюсь, что „рай“, обещанный нам организаторами PSI, когда-нибудь наступит. Превед, Сизив!» — восклицает Мур, намекая на тщетность усилий этой международной программы. (Перевод мой. — А. Ч.)

Так или иначе, кое-какая польза от компьютерных предсказаний всё же есть, а станут ли они когда-нибудь надёжной заменой экспериментальным методам, — нам предстоит увидеть в будущем.

Источники:
  • http://helpiks.org/7-75171.html
  • http://knigi.dissers.ru/books/1/4071-1.php
  • http://biomolecula.ru/articles/torzhestvo-kompiuternykh-metodov-predskazanie-stroeniia-belkov