А.В. Финкельштейн, О.Б. Птицын - Физика белка - Курс лекций с цветными и стереоскопическими иллюстрациями и задачами (1123404), страница 72
Текст из файла (страница 72)
[Senda et al., Proc. Jpn. Acad. Sci., ser. B, Biopys. Biol. Sci. (1990) v. 66, p. 77]. рисунок (б) дан в той же ориентации, что и предсказанная модель (а), и на нем даны те же имена больших спиралей(А, C, D), под которыми они значатся на рисунке (а). район В* спиралеподобен,но не α-спирален в интерфероне β, однако в родственном ему интерфероне γтам находится небольшая α-спираль [Ealick et al., Science (1991) v. 252, p. 698]. (в)топологии β (слева) и γ (справа) интерферонов по Ealick et al.
Интерферон γ состоит из двух субъединиц. Обратите внимание на «обмен» с-концевыми кусками[спиралями (E, F)] между двумя субъединицами γ интерфероновИмеет смысл подчеркнуть факторы, способствовавшие успеху предсказания пространственного строения интерферонов: сами по себе α-спиралипредсказаны здесь очень уверенно; и они одинаково расположеныв отдаленно-гомологичных цепях, что позволяет доверять полученнымпредсказаниям.
Однако столь уверенное и повторяющееся в гомологахпредсказание вторичной структуры встречается на практике не часто.Более типичны некоторые разночтения, как в с-концевом домене интерферонов (см. рис. 23-1), для которого — именно вследствие этого, оченьтипичного небольшого разночтения в предсказаниях вторичных структур — однозначного предсказания укладки цепи получить не удалось.И еще очень важная вещь для успеха предсказания строения интерферона.
когда мы искали наилучшую упаковку предсказанных α-спиралей,мы могли рационально организовать перебор всех возможных упаковок,так как располагали априорной классификацией α-спиральных комплексов (я об этом уже говорил) — она как раз была разработана к тому времени Мурзиным и А. В. Ф.334 Проблему предсказания белковой структуры можно представить себекак проблему выбора — из множества возможных — той пространственной структуры, которая наиболее стабильна для данной аминокислотнойпоследовательности. Откуда же можно взять «возможные пространственные структуры»?самый простой, прагматичный ответ — взять из Банка белковыхструктур, PDB.
тогда, в сущности, речь пойдет не о «предсказании»,а об «опознавании» пространственной структуры белка. Но в этом естьсвой плюс: «опознав» белок, мы можем надеяться одновременно опознатьи его функцию, а ведь именно она обычно и интересует биолога.В Банке белковых структур, конечно, нет еще всех возможных структур, но есть надежда, что там есть более половины всех существующихв природе мотивов укладки белковых цепей в домены. Эта надежда — ееобосновал сайрус Чотиа — основана на том, что вновь расшифровываемые белки (точнее, их домены) все чаще и чаще оказываются похожимина уже расшифрованные. согласно оценкам Чотиа, основанным на экстраполяции числа расшифрованных структур и числа разных мотивовукладки цепи, существует примерно 1500 мотивов укладки, большая частькоторых (причем самых «популярных») уже известна. Итак, предсказывая структуру белка, не имеющего видимой гомологиис белками уже расшифрованными, можно попробовать взять, одну за другой, все пространственные структуры из Банка, наложить (возможно,с некоторыми выпетливаниями, рис.
23-3, или даже с изменением порядка прохождения цепи через структурный каркас белка) цепь этого белкана каждую из них, и посмотреть, какая из этих пространственных структур даст — для нашей цепи — наибольший энергетический выигрыш.При этом мы должны разрешать цепи то идти по скелету структуры,то выпетливаться или «сокращать» имеющиеся в скелете выпетливания,если это увеличивает энергетический выигрыш.такой подход называют «методом протягивания» (threading method).Он был предложен А. В.
Ф. и Б. А. ревой в 1990 г. и — независимо, в более простом и более удобном, хотя и менее корректном физически, варианте — д. Айзенбергом и его группой в 1991 г. сейчас метод протягиваниястал весьма популярным методом опознавания структур «новых» белковпо их аналогии со «старыми».В общем, работа по протягиванию напоминает поиск гомологии, только на этот раз «выравниваются» не две первичные структуры, «новая»и «старая», а «новая» первичная структура со «старой» пространственнойструктурой белкового скелета.335И еще: интуитивный перебор вариантов! Он кажется старомодным в компьютерный век, но именно так А.
Г. Мурзин предсказал структуру многих«новых» белков, очень часто выигрывая в эти своеобразные белковые шахматы у самых лучших компьютерных программ.Внутренний голос: Предыдущая фраза была написана к первомуизданию «Физики белка», в 2001 г. Забавно, что за прошедшие годы,несмотря на огромный прогресс компьютеров, ситуация с «белковымишахматами» вовсе не изменилась кардинально (см.
статью “Predicting protein structures with a multiplayer online game” в Nature (2010) 466:756–770 икомпьютерную игру Foldit, http://fold.it/portal/node/).Рис. 23-3. схема, иллюстрирующая идею «протягивания» исследуемой последовательности по Банку белковых структур. жирная линия показывает те участки, гдепоследовательность идет по скелету, пунктир — те, где она выпетливается Прежде чем перейти к результатам, хочу подчеркнуть две принципиальные проблемы метода «протягивания». В сущности, аналогичные проблемы, в том или ином виде, возникают в любом «предсказательном» методе.Во-первых, конформацию даже тех кусков цепи, что наложены на скелет,мы рассматриваем с большой погрешностью: ведь мы не рассматриваемконформации боковых групп (разных у «старой» и «новой» цепи), а именноони, боковые группы, в основном, и взаимодействуют.
далее, мы не рассматриваем конформации всех выпетливаний. Оценка показывает, что при протягивании мы рассматриваем примерно половину взаимодействий в белковой цепи, а вторую не рассматриваем вообще. Значит, опять мы вынужденысудить о структуре белка по части взаимодействий, действующих в его цепи.Значит, опять наши предсказания могут носить только вероятный характер.Во-вторых, как перебрать все наложения и найти лучшее, или лучшие,среди них? Ведь их, возможных наложений, страшно много… скажу коротко: мощные математические вычислительные методы для этого уже развиты, но рассказ об этом занял бы слишком много времени.
Наверно, имеетвсе же смысл назвать эти методы по имени — может быть, кому-то из васпригодится (но большинству, конечно, нет). Итак: динамическое программирование и его вариант — статистическая механика одномерных систем(цепных молекул) для расчета протягивания цепи через скелет; теория самосогласованного поля — для расчета действующего на цепь молекулярногополя в каждой точке скелета; стохастическая минимизация энергии методомМонте-карло; а также — разные варианты метода ветвей и границ, и т.
д.336 как бы то ни было — какие же получаются результаты? для примерая покажу предсказанную методом протягивания укладку цепи в белке, терминирующем репликацию. Протягивая цепь этого «нового» белка по всемизвестным трехмерным белковым структурам, Зиппль и его коллегииз Зальцбурга показали, что укладка гистона Н5 наиболее «родственна»этой цепи (рис. 23-4).Рис.
23-4. Гистон Н5 цыпленка (1hstA, слева) и белок, терминирующий репликацию (rtp, справа); в последнем не показана с-концевая спираль, не имеющаяаналога в гистоне Н5. Предсказание сходства укладки цепи в этих двух белкахсделано методом «протягивания» в работе H. Flökner, M. Braxenthaler, P. Lackner,M.
Jaritz, M. Ortner & M. J. Sippl, Proteins (1995) 23:376–386; это предсказаниесделано в ходе «слепого» тестирования предсказательных методов (CASP-1994).средне-квадратичное отклонение между 65-ю эквивалентными сα-атомами в изображенных структурах — 2,4 Åтаким образом они правильно (несмотря на очень низкое сходствоаминокислотных последовательностей) опознали мотив укладки цепибелка — терминатора репликации.
Правда, предсказанное (при помощитеоретического протягивания) наложение цепи этого белка на структуругистона Н5 заметно отличается (рис. 23-5) от того, что получается при прямом наложении трехмерных структур этих молекул. Это еще раз показы-337вает, что все погрешности, о которых я говорил по ходу лекций — погрешности в параметрах стабильности, незнание точной конформации петельи т. д. — не позволяют выделить одну уникальную наилучшую структуру,а позволяют в действительности только найти более или менее узкий набор лучших структур. такой набор «лучших» пространственных структурможно выделить довольно надежно; а вот какая из них окажется, согласнорасчету, «наилучшей» — это дело случая. Нативная структура находитсягде-то в наборе «лучших» структур, она приблизительно соответствуетпредсказанной («наилучшей») — но это все, что можно реально сказать.Рис.
23-5. Последовательность гистона Н5 (1hstA), выровненная относительнопоследовательности белка, терминирующего репликацию (rtp) согласно рентгеноструктурным данным («наблюдаемая», верхняя пара последовательностей),и она же, выровненная согласно предсказанию методом протягивания («предсказанная», нижняя пара). серыми зонами показаны сдвиги, расхождения этихдвух выравниваний. Они хорошо видны по разным сдвигам вторичных структургистона Н5, приведенных в самой верхней и самой нижней строках в этих двухвыравниваниях. Вторичные структуры записаны в подчеркнутых строках (обозначения: Н — α-спираль, Е — β-тяж, Т — изгиб цепи). точками отмечены делеции,т.
е. пропуски в первичных и вторичных структурах, внесенные при их выравнивании. картинка, с минимальными изменениями ее формы, взята из статьи“Protein structure prediction by threading methods: evaluation of current techniques”.C. M. -R. Lemer, V. J. Rooman & S. J. Wodak, Proteins (1995) 23:337–355, в которойобсуждаются итоги CASP-1994Я, конечно, привел только «хорошие» примеры — примеры удавшихсяпредсказаний.