А.В. Финкельштейн, О.Б. Птицын - Физика белка - Курс лекций с цветными и стереоскопическими иллюстрациями и задачами (1123404), страница 69
Текст из файла (страница 69)
таким образом удается порой продвинуть «порог опознавания»до 10 % сходства между исходными последовательностями, если эти10 % сходства остатков приходятся на наиболее консервативные позициии подкрепляются сходными корреляциями между остатками в сравниваемых последовательностях.рисунок 22-2 показывает, что рибонуклеаза Н вируса иммунодефицитачеловека HIV имеет не очень высокое — «на уровне шума» — сходствос другими рибонуклеазами Н, если рассматривать всю цепь (так, из 60выровненных остатков у нее есть всего 9 одинаковых (15 % совпадений)с рибонуклеазой Н из RSV).
Однако это сходство проявляется именнов тех ключевых районах, где все остальные рибонуклеазы похожи другна друга. Это резко повышает достоверность такого сходства. А еслиеще учесть, что эти «ключевые районы» совпадений охватывают всеаминокислотные остатки активного центра, и что сходство концентрируется в участках вторичной структуры, и что оно охватывает около 30 %(а не 15 %) остатков гидрофобных ядер белка, — высокая достоверностьпереходит в уверенность в правильном опознании гомологии.320 для опознания гомологии «новых» последовательностей также удобнопользоваться «консенсусными последовательностями» (рис. 22-4), выведенными для уже изученных белковых семейств и подчеркивающимиих наиболее консервативные черты (если такие консенсусные последовательности снабжены данными по частотам встречаемости остатков в каждом месте цепи, то они называются «профилями первичных структур»семейств белков).для опознания пространственных структур белковых цепей особеннохороши профили, построенные на основе наложения друг на друга не первичных, а пространственных структур белков (такие профили собраны,в частности, в широко известной базе данных “Superfamily”, разработанной в группе с.
Чотиа). Именно такие профили наиболее четко выделяютсамые важные для поддержания структуры белка участки цепи.Рис. 22-4. Аминокислотный состав различных позиций в N-концевых фрагментах цитохромов c митохондрий эукариот. самые важные, самые консервативныеостатки цепи — те, что определены однозначно. Подчеркнута последовательность«сайта» Cys–X–X–Cys–His, отвечающего за связывание гема в подавляющем большинстве цитохромов (и не только c, и не только эукариот).
Выравнивание аминокислотных последовательностей взято из [6] При опознавании функционального сходства белков следует также обращать внимание на уже установленные для многих функций «сайты» — более или менее короткие последовательности, обеспечивающие эти функции(см. на рис.
22-4 сайт Cys–X–X–Cys–His, связывающий гем в цитохромах).такие сайты собраны в библиотеки, и их поиском занимаются специальныепрограммы, из которых PROSITE является наиболее популярной. При установлении структуры «нового» белка по его гомологии с ужеизученным надо ясно отдавать себе отчет, что сходство пространственныхструктур может не распространяться на районы, где последовательности сильно разошлись. В основном это (см. рис. 22-2) районы петель, нерегулярных321конформаций белковой цепи. Здесь, с весьма переменным пока успехом,приходится прибегать к конформационным расчетам и другим методамгомологического моделирования, на которых я останавливаться не буду.кроме того, опыт показывает, что даже полная идентичность фрагментов аминокислотных последовательностей не всегда гарантирует одинаковость их пространственных структур.
так, иногда одни и те же последовательности даже из 6–10 остатков входят в α-спираль в одних белкахи в β-структуру — в других. Перейдем к методам предсказания пространственной структуры «новых» последовательностей, не имеющих видимой гомологии с уже расшифрованными белками.к ним сейчас относится около половины «новых» последовательностей.Поэтому о пространственной укладке многих последовательностей, получаемых в ходе выполнения генетических проектов, мы не можем догадаться по их гомологии с белками уже известными — она или слишкомслаба для обнаружения, или отсутствует. тут-то и возникает настоятельнаяпотребность в основанном не на гомологии, а на физике решении задачипредсказания пространственной структуры, а, в перспективе, и функциибелка, по его аминокислотной последовательности (рис. 22-5).Рис. 22-5.
схема первичной и пространственной структуры маленького белка (панкреатического ингибитора трипсина). Ход главной цепи изображен на фоне общегоконтура молекулы; выделены α-спирали, β-тяжи, резкий поворот цепи (t) и цистеиновые мостики (– – –).
так как белок сворачивается сам собой, то, в принципе, всеэто можно предсказать по одной лишь первичной структуре белка. Боковые группыздесь не показаны, но, в принципе, и их конформации тоже можно предсказывать сразу скажу: сейчас нет надежных и точных методов предсказанияструктур белков, не имеющих гомологов с уже известной структурой.Причин тому (кроме технической: огромного, даже для современныхкомпьютеров, объема вычислений) — видимо, две: (а) ограниченная точ-322ность энергетических оценок и прочих параметров, на которых базируетсятеоретический расчет белковых структур, и (б) сравнительно малая (и потому уязвимая для всех неточностей расчета) разность энергий между одной«правильной» и многими «неверными» конформациями белковой цепи.речь идет, собственно, о сравнительно малой ширине уже обсуждавшейся«энергетической щели».
Если ширина щели — около 10 ккал/моль, а энергия плавления белка — около 100, то для верного предсказания (я позволюсебе опустить доказательство) нужна 90 %-ная корреляция энергетическихрасчетов с экспериментом — что пока, видимо, недостижимо. Я хочу особоподчеркнуть последнее обстоятельство, т. е. малую ширину щели, — онорезко отличает ситуацию в белках (и в рНк) от ситуации в дНк — к большому огорчению людей, занявшихся предсказаниями структур белковпо их аминокислотным последовательностям.
В дНк комплементарноеспаривание нуклеотидов наблюдается по всей длине двойной спирали, а онообеспечивается тем, что одна цепь по своей первичной структуре строгокомплементарна другой. Это и дает огромный свободно-энергетическийвыигрыш «правильной» структуры дНк над всеми «неправильными».такой же «комплементарный код» спаривания нуклеотидов есть и в рНк,но здесь комплементарные участки значительно короче, чем в дНк, а «код»не всегда строго соблюдается.
А в белках нет никакого однозначного «кода»слипания остатков: здесь не наблюдается ни какой-либо строгой попарнойкомплементарности длинных последовательностей контактирующих аминокислотных остатков, ни следующего из нее огромного энергетическогопреимущества «правильной» укладки цепи…Однако существующие методы дают все более полную и надежнуюинформацию о возможном строении (или, чаще, о возможных вариантахстроения) белка или, особенно, его структурных элементов.В прагматическом аспекте, вопрос о предсказании трехмерного строениябелка сейчас ставится следующим образом: похожа ли пространственнаяструктура рассматриваемой белковой последовательности на какую-либоиз уже известных пространственных белковых структур? Если да, то какрассматриваемая последовательность вписывается в эту структуру? Еслинет, можем ли мы указать какие-либо характерные детали пространственной организации рассматриваемой последовательности?Я знаю несколько случаев, в том числе и из собственной практики,когда ответы на эти вопросы существенно способствовали экспериментальному определению структуры и / или функции изучаемой аминокислотной последовательности, помогли планировать белково-инженерныеэксперименты и так далее.
Впрочем, должен сказать, что я бы с большиминтересом прочел хороший обзор о практическом применении предсказаний белковых структур…323 Перейдем теперь к методам предсказания белковых структур. рассматривая эти методы, я буду уделять особое внимание тем идеям, и в основном физическим идеям, что лежат в их основе.Есть две стратегии предсказания белковых структур. согласно первойстратегии, белковая структура ищется как результат кинетического процесса сворачивания.согласно второй, она ищется как структура с минимально возможнойдля данной цепи свободной энергией (или, что то же самое, как наиболеевероятная структура).В принципе, по-видимому, обе эти стратегии могут привести к правильному результату, так как самая стабильная структура белковой цепи,несмотря на опасения Левинталя, образуется достаточно быстро (этомувопросу была посвящена отдельная лекция, и сейчас я позволю себе егоне касаться).Важно, однако, что, рассматривая предсказание белковых структур, мыможем отвлечься от путей сворачивания и рассматривать только результат —стабильную структуру белка.
тем более, что первая стратегия — стратегияимитационного моделирования процесса сворачивания белка — пока систематического прогресса не дала: уж очень сложны все расчеты, и к тому же —все же весьма приблизительны все потенциалы взаимодействий. А все спекуляции о специфических (например, иерархически) принципах сворачиваниябелка (которые выглядели так привлекательно и сулили существенно упростить поиск нативной структуры) оказались неверными. Поэтому моделирование сворачивания белков мы рассмотрим позже.Вторая стратегия оказалась более успешной.Оценка стабильности (или, что то же, вероятности образования) разныхструктур базируется либо на потенциалах взаимодействий, либо (чаще)на частотах встречаемости разных структурных элементов и разных взаимодействий в белках.