Попов, Демин, Шибанова - Проблема белка. т.3. Структурная организация белка (947296), страница 138
Текст из файла (страница 138)
Козном а соавт. [168, 169]. Ф. Коэн и соавт. [156-158] развили ступенчатый метод предсказания трехмерной структуры белка по известной аминокислотнои последовательности, получивший название комбинированного метода, Ов предусматривает проведение трех последовательных стадий: 1) предсказание на основе существующих алгоритмов регулярных вторичных струк. тур; 2) упаковку а-спиралей и [3-складчатых листов в конформацию, отражающую характерные особенности нативной структуры; 3) энергетический расчет отобранных конформаций с использованием моделей, подобных сверхупрощенным моделям Левитта и Уоршела [29-31], Кунтца и соавт.
[32], Робсона и Осгуторпа [170]. Схема комбинированного метода, на первый взгляд, выглядит достаточно логично. В действительности же она не может быть реализована а отношении всех своих положений, что следовало из уже имевшихся к моменту появления метода экспериментальных данных.
Первый пункт схемы невыполним, по крайней мере, по трем причинам. Во-первых, у большей части белков вторичные структуры составляют незначительную долю трехмерной структуры; в среднем, в а-спирали глобулярных белков входит 25-30% остатков, а в []-структуры — 15-20%. Во-вторых, встречающиеся в конформациях белков вторичные структуры, как правило, сильно искажены и лишь условно и при большом желании могут быть отнесены к регулярным. Насколько геометрические параметры реальных конформационных состояний остатков полипептидной цепи могут отличаться от параметров вторичных структур видно из табл.
19.16, в которой приведены значения двугранных углов остатков некоторых сегментов последовательностей а-химотрипсина и лизоцима. Во всех работах, посвященных поиску эмпирических корреляций, эти сегменты отнесены х а-спиральным или [3-структурным. И наконец, в-третьих, надежность существующих алгоритмов предсказания, несмотря на оптимистические сообщения (см. ниже), не >50%, что исключает их практическое использование. Быть может, по этим или иным причпнам Коэн, Стернберг и Тейлор [156-158] не стали обращаться к предсказательным алгоритмам, а сразу приступили к реализации второго пункта схемы, выбрав для демонстрации возможностей предлагаемого ими метода белки, изученные рентгеноструктурно, и взяв всю информацию о геометрии вторичных структур непосредственно из эксперимента.
Они рассмотрели все способы упаковки [3-структурных сандвичей в 11 иммуноглобулиновых доменах, содержащих от 6 до 9 [)-складчатых листов. Для каждого домена рассчитано порядка 10з-1Оа различных сочетаний опытных вторичных структур. Количество 508 Гпллиэм Ьч !6 значении двуграиных углов зр, 47 (грал) некоторых остатков а-химотрниснна н лнзокима нв участках, счнтавощихсв регулврнымн вторнчнымн структурами а-Химптрзщсип чяко А!а110 т рп' А78112 Азп'" Ага! 14 су5115 А5П тьгы С!П51 А!аз! тЭ 43 А5П Агасэ Азизе -57 -44 -62 -36 -67 -52 -60 -42 -85 -28 †1 -9 -113 — 51 -!ОО 120 -70 -15 -97 2 -60 !36 -142 151 -14! 125 -83 135 †1 151 вариантов, отобранных для нахождения структур, напоминающих соответствующие кристаллические конфорл!Пции доменов, составило от неОкольких единиц до 4 тыс.
комбинаций. Наименьшее среднеквадратичное отклонение атомов С" оказалось равным 5,0 А. Эта цифра, учитывая небольшие размеры доменов !34-53 остатка) и использование в расчете значительного экспериментального материала, свидетельствует о полной несостоятельности метода. Аналогичная задача, отвечающая второй стадии комбинированного метода, решалась в работе Бэржеса и Шераги [1321, которая уже рассматривалась. В ней также конформационные состояния всех остатков Панкреатического трипсинового ингибитора были отнесены не с помощью эмпирических корреляций, а на основе кристаллической структуры молекулы.
Оказалось, что рассчитанная с использованием такого идеального алгоритма предсказания, каким является эксперимент, конформация белка даже отдаленно не напоминала его нативную структуру. Следовательно, Попытки уложить вторичные структуры в супервторичныс и получить Ч51231 7Ь123 Аэвззз элпэм Чазззз Азпгм 237 ч !235 с!пззт С1п2'о тз 241 „242 А! 243 А!азы Азпг.з -59 -39 -49 -42 -73 -13 -127 -3 — 70 -25 -62 -45 -63 — 39 -58 -49 -58 -42 -65 -41 -61 -43 -66 -4! -57 -40 -85 -!30 20 Расэт Н!54о РЬе51 су542 С1усэ с!уы Вег45 !лом и 47 А5п С!псз А5П т,рз' чари чаун -110 13! -62 !16 -121 -!7 -161 !64 †1 !78 -170 172 -136 136 -75 133 -117 -15 -152 164 -71 -16 -112 -9 -136 147 -123 135 -108 137 грубое приближение глобальной конформации белка (второй этап ком. бинированного подхода), полагая успешно пройденным первый этап я считая известными не только а-спирали и [)-структуры, но даже конфор мационные состояния остатков нерегулярных сегментов цепи, сталкива.
ются с непреодолимыми трудносгямн. Цель не может быть достигнута в на третьем этапе при использовании найденных ранее структур в качестве нулевых приближений для сверхупрощенных моделей (разд. 17.1). Развитый в работах Ф. Коэна, М. Стернберга и соавт. [156-!58, 168 169, 171] подход не опирается на общую физическую теорию и единыя метод расчета, устанавливающие логические и количественные связи между аминокислотной последовательностью белка и координатами атомов натнвной конформации молекулы.
Каждая сгадия колзбпннроваиного подхода следует своим эмпирическим правилам, корреляционным соотношениям, предсказательным алгоритмам н методологическим приемам. Объединяющим (скорее, отягощающим) все его составные частя началом служит традиционное, сложившееся еще в 1950-е годы, пред ставление о пространственной организации белковой глобулы в виде ансамбля регулярных вторичных структур (концелция Полинга и Кори) с внутренним гидрофобным ядром и внешней гидрофильной оболочкой (концепция Козмана).
Несмотря на отсутствие заметного прогресса и разочаровывающие результаты предсказаний, стремление решить проблему пространственной организации белков на основе эмпирического подхода не ослабевает ни в 1980-е, ни в 1990-е годы [107. Гл, 6, 7]. Оставаясь на тех же идейных позициях, работы последнего десятилетия приобретают большее разнообразие. В течение многих лет выделение в кристаллических структурах глобулярных белков а-спиралей и ])-складчатых листов делалось в значительной мере произвольно, без использования количественных критериев.
Необходимость в них не ощущалась бы, если бы в нативных конформацпях белков вторичные структуры были действительно регулярными. Поскольку этого нет, то их идентификация субъективна и существенно отличается у разных авторов. Например, в лизоцил~е Чоу и Фасман [139] к а-спиралям и ])-структурам относят соответственно 54 и 21 остаток.
а Бэржес, Поннусвами и Шарага [39] — 46 и 4; в субтилизине ВРХ' (отнесения работы [39] даны в скобках) — 86 (69) и 27 (44), папаинс — 54 (50) я 30 (21). Подобных примеров можно привести много. Создание количественных методов компьютерного определения вторичных структур в опытных трехлзерных структурах белков необходимо также вследствие усложнения процедуры корреляционного анализа, увеличения количества исследованных рентгеноструктурно белков и по некоторым другим причинам, в частности,из-за неоднозначности результатов предсказании того или иного метода при использовании его разными исследователями. Первые алгоритмы идентификации [)-изгибов с помощью ЭВМ по экспериментальным данным были созданы И.
Кунтцем [142, 143] и П. Льюисом и соавт. [11!]. Позднее они усовершенствовались П. Чоу и Г. Фасманом [172], Г. Раузе и Дж. Селтцсром [173]. С. Лифсон и К. Сандер [174] разработали компьютерный метод определения [)-структуры, а М. Лсвитт и Дж. Грир [153] создали первый алгоритм установ- 510 ния протяженности а-спиралей, [)-структур и [)-изгибов по известным рдинатам атомов С". Еще большей универсальностью обладает алготм У. Кэбша и К. Сандера [144], в основу которого положены гсоетрические особенности вторичных структур и системы их водородных аввязей. Программа Кэбша и Сандера была использована для идентификации в известных трехмерных структурах 62 белков трех типов конфорй~ационных состояний остатков. Согласно полученным данным из 10763 со]атавляющих эти белки аминокислотных остатков 3047 [28%) входят в 1]х-спирали, 2295 [21%) — [)-структуры и 5421 [51%) — [)-изгибы и другие нерегулярные формы полипептидной цепи.
Считая свое отнесение объекпивным, авторы [144] проверили с его помощью предсказательные возможности трех широко распространенных корреляционных методов, и именно, методов П. с1оу и Г. Фасмана [138, 139, 172], Б. Робсона и еоавт. [175] и В.И. Лима [176, 177], предварительно автоматизировав всю процедуру предсказания вторичных структур, сопоставление с экспериментальным отнесением и расчет показателей достоверности. Точность предсказания рассчитывалась как отношение числа остатков, предсказанных правильно, к общему числу остатков, находящихся в данном конформационном состоянии.
Оказалось, что показатель качества метода Чоу и Фасмана равен 50%, а методов Робсона и Лима — 56%. Следовательно, около половины остатков, входящих в а-спираль и []-структуру, предсказываются этими методами неверно. Значения показателей качества, полученные У. Кэбшем и К. Сандером [144], хорошо согласуются с оценками аналогичных методов Б. Бусегты и М, Хоспитала [178] по 38 белкам [47% у метода П. Чоу и Г. Фасмана, 57% — Б. Робсона и 56% — В.И. Лима), а также с оценками Дж.
Ленстры [179] по 33 белкам методов К. Нагано [180, 181], В.И. Лима [176, 177], С. Танаки и Г. Шераги [182], П. Аргоса и соавт. [183]. Воспользовавшись для характеристики алгоритмов показателем качества Мэтьюза [О~) [184], Дж. Ленстра [179] показала, что достоверность предсказаний перечислен«ых методов как а-спиралей, так и [)-структур и [)-изгибов колеблется от 0 до 50%, поднимаясь в редких случаях немного выше, но и опускаясь ниже уровня беспорядочных отнесений. Обстоятельный анализ предсказательных возможностей корреляционного подхода был проведен К.















