Попов, Демин, Шибанова - Проблема белка. т.2. Пространственное строение белка (947295), страница 74
Текст из файла (страница 74)
Наиболее предло ггительные оптимальные конформации каждого из трех начальных вариантов имели среднестатистические отклонения от кристаллографической структуры белка 2,5, 6,2 н 7,8 А. Минимизация энергии полностью развернутой цепи второго и третьего исходных структурных вариантов не привела к появлению каких-либо элементов белковой нативной конформации; конечный результат целиком определялся начальным приближением. Выбранная модель, таким образом, не сработала. В другой работе этих же авторов исследована пространственная структура миогена карпа (!08 аминокислотных остатков) (154), Ис- 288 Пользовалось такое же максимально упрощенное представление нолипептидной последовательности и ее силового поля. Вопрос о свертывании белка из полностью развернутой цепи, однако, уже не ставился; все исходные приближения содержали шесть а-спиральных сегментов, наблюдаемых в нативной конформации миогена.
Компьютерное воспроизведение упаковки заданных вторичных структур выполнено при трех условиях. В первом случае рассматривалось взаимодействие лишь пары а-спиралей. Было показано, что они предрасположены к достижению быстрого оптимального взаимодействия. Во втором случае аналогичная задача посгавлена для четырех а-спиралей (69 остатков). Она оказалась практически нерешаемой; было получено пять конформаций со среднестатистической ошибкой около 7,0 А.
3 третьем случае моделировалось свертывание всей молекулы миогена из шести жестких спиралей. После длительных поисков были найдены три структуры с ошибкой 8,5 А. Таким образом, первые попытки использовать сверхупрощенную геометрическую модель белковой цепи и условное силовое поле внутрнмолекулярных взаимодействий с учетом важнейших структурных особенностей нативиых конформаций не привели к обнадеживающим результатам, Много общего с методом Левитта и Уоршела имеет метод расчета укладки трехмерной структуры белка, предложенной Кунтцем и соавт.(1551. В данном случае белковая цепь представлялась последовательностью сфер, центры которых совмещены с атомами С'.
Радиус каждой сферы грубо эквивалентен ван-дер-ваальсову радиусу боковой цепи. В качестве независимых переменных выбраны Зл декартовых координат центров сфер (и — число аминокислотных остатков в белке). На свободу остатков в такой бусиничной (без подвесок) модели наложена система ограничений. Остатки могут подходить друг к другу только на определенные расстояния.
Между ними имеются взаимодействия, повышающие и понижающие энергию. Гидрофобные остатки должны находиться не более чем на 8 А от центра тяжести белка, где $ — функция размера молекулы и гидрофобного ядра. Метод Кунтца в соавторов был использован для описания свертывания белковых цепей панкреатического трипсннового ингибитора (58 остатков) и рубредоксина (54 остатка).При среднем расстоянии остатка от центра тяжести трипсинового ингибитора 10,3 А и рубредоксина 9,7 А среднестатистические отклонения опытных и рассчитанных структур составили соответственно 4Д вЂ” 6,0 и 4,0 — 6,0 А. Авторы отметили, что для белков большей молекулярной массы метод приводит к еще более неудовлетворительной точности результатов расчета. Расчеты Кунтца и соавторов, как и Левитта и Уоршела, являются формальными. Они не базируются на каких-либо физических соображениях в отношении механизма свертывания белковой цепи, и в них не учитываются экспериментальные данные о денатурации рассматриваемых белков.
Используемые в обеих работах методы минимизации энергии не позволяют исключить некорректно свертываемые структуры. Отсутствует обоснование сделанных допущений в модельном представ- 1Ц Проблема белка, т. 2 289 ленин полипептидной цепи и силового поля. По-видимому, выбор столь далеко отстоящих от реальности расчетных моделей продиктовал в обеих работах стремлением свести к минимуму машинное время счета. Полученные в этих исследованиях результаты показали, что задача компьютерного воспроизведения свертывания белковой цепи становится решаемой исключительно за счет упрощения расчетной модели, причем такого, которое приводит к потери моделью физн. ческого смысла.
Действительно, трудно рассчитывать на продвижение вперед в понимании механизма самоорганизации белка и особенности его трехмерной структуры, устраняя из анализируемой модели все то, что хотя бы отдаленно напоминает белковую молекулу, и представляя гетерогенную аминокислотную последовательность более простой, чем полиэтиленовая цепь. Было показано, что подобная модель расчета трехмерной структуры белка по своей точности не превосходит модель статистического клубки [195, 196]. Неудачу энергетических расчетов обычно видят, однако не в полном несоответствии модели и объекта исследования, а в неучете влияния растворителя, приближенности потенциальных функций, прогрессирующем накоплении ошибок с увеличением длины рассчитываемых фрагментов и множественности минимумов потенциальной поверхности, исключающей нахождение глобального минимума.
Конечно, все это не мнимые трудности, но к их разрешению нельзя подойти со сверхупрощенной моделью белковой цепи. Во многих последующих работах по компьютерному воспроизведению структуры белка дополнительно используются разного рода эмпирические соотношения, кристаллографическис данные, результаты статистического анализа и гомологи, В первом комплексном подходе к описанию свертывания белка Танаки и Шераги рассмотрение упрощенной расчетной модели полипептидной цепи сочетается с привлечением данных статистического корреляционного анализа и моделированием механизма укладки цепи [156). Авторы предполагают, что процесс образования конформации проходит через трн последовательных этапа. На первом этапе (А) полностью развернутая белковая цепь складывается за счет внутри- остаточных и ближних межостаточных взаимодействий в упорядоченнью вторичные структуры.
Затем (этап В) под влиянием средних взаимодействий между а-спиральнымн и [5-структурными сегментаин зарождаются небольшие контактные области. При этом образованные на первом этапе регулярные формы цепи могут претерпевать изменения. На третьем этапе (С) происходит ассоциация контактных областей этапа В за счет дальних взаимодействий и образование нативной конформации белка. Начальная форма полипептидной цепп с участками вторичной структуры получена Танакой и Шерагой с помощью эмпирических правил и механико-статистической обработка однонитчатой модели Изннга. Амипокислотные остатки представлены в виде сфер основной цепи ( — НХ вЂ” С~Н вЂ” СΠ— ) н сфер боковых цепей определенных ван-дер-ваальсовых радиусов.
Из анализа 25 белков известной структуры найдены частоты контактов между всеми парами 290 остатков (к и 1) и для каждого типа пар определены константы равновесия Ки и свободная энергия Гиббса ЬОм образования контакта между остатками К и !. Процедура поиска конформации белка состоит в следующем. На стадии А цепь представляется порядком символов !з, б и с, характеризующих области правой а-спирали (!9 = -20...-130', ф = — 10...— 90'), й-структуры Вр = — 40...— 140'; $ = — 140...— 100'), и клубка (все значения <р„ф, не попавшие в первые две области).
Остатки, идентифицированные с помощью предсказательного алгоритма, помечаются только одним символом (и нли В), а неотнесениые остатки — тремя (Ь, Д, с). Для свертывания цепи используется процедура Монте-Карло при последовательном введении средних (этап В) и дальних (этап С) взаимодействий и произвольном варьировании у отнесенных остатков значений углов д, ф в выбранной обрасти и или б и также символов ()Ь Д, с), а при каждом символе — значений углов <р, ф у неотнесенных на этапе А остатков. В ходе процедуры Монте-Карло через определенные промежутки времени отбираются конформации, в которых отсутствует перекрывание жестких сфер, и оценивается их энергия при учете всех взаимодействий.
Конформацию оставляют для следующего счета, если ее энергия оказывается меньше энергии предшествующей конформации. Так продолжалось до тех пор, пока энергия данного варианта не понижалась при последующих 1О 000 манипуляциях. Описанная схема использована Танакой и Шерагой для предсказания трехмерной структуры бычьего панкреатического трипсинового ингибитора.Первоначальная идентификация конформационного состояния каждого остатка символами и, В, и с и, следовательно, определение ограниченной области возможных значений <р, ф выполнены на основе не предсказательных алгоритмов, а рентгеноструктуриых данных.
Конформации белка на разных стадиях процедуры Монте-Карло представлялись в виде контактных треугольников, отражающих взаимодействия между всеми парами остатков. Сопоставление контактных треугольников опытной структуры н конечной теоретической конформации молекулы трнпсинового ингибитора обнаруживает существенные расхождения. В рассчитанном варианте отсутствует целый ряд контактов, присущих реальному белку, н в то же время имеется много лишних контактов. Неудовлетворительное совпадение при грубом, почти качественном способе сравнения имеет место даже в том случае, когда основная часть информации о структуре небольшого белка, а именно цдеитификация конформационных состояний всех остатков, была взята из эксперимента и использована в расчете на первом этапе.
Помимо расчетной модели, не отражающей конформационной специфики белковой цепи, метод Танаки н Шераги ограничен также возможностями предсказательных алгоритмов. Особенно настораживает то обстоятельство, что в случае рассмотрения белка с неизвестной структурой выбранные на этапе А для остатков конформационные параметры далсе не изменяются. Следовательно, допущенные при отнесении с помощью эмпирических корреляций ошибки (а они неизбежны и со- 10* 291 ставляют, как известно, около 50% отнесений) в последующем расчет~ (этапы В и С) не обнаруживаются.












