Попов, Демин, Шибанова - Проблема белка. т.3. Структурная организация белка (947296), страница 140
Текст из файла (страница 140)
Точность Ягредсказательных алгоритмов одинаково низка во всех вариантах и не зависит от количества базовых белков. Во всех случаях качество предЯжазаний несколько выше, когда выбор делается из трех состояний. Однако при этом возрастает неопределенность самого предсказания. згеальная точность значительно ниже, чем следует из приведенных в таблице средних значений, из-за большого разброса. Так, при средней вочности варианта ООКП 46,5% (четыре состояния) у ферредоксина дравильно предсказаны 22,2% остатков, цитохрома с — 34,0%, цепи А Глб и М Ш гб Показателя качества методов нредсказання [Оз) вторичной структуры глобулярных белков по трем конформацнонным состояниям амннокислотных остатков Год публикации Лахоры метода П Чоу и Г Фасмаи [138. 139] Ф.
Максфилд, Г Шерага [2Ю] Дж. Гарнье. Д. Осгуторп, Б Робсон [207] О.Б Птицын, А В, Финкелынтейн [211) Дж. Гибрат, Дж. Гарнье, Б. Робсон )212] Н. Квиан, Т. Седжновский [2!3) Б. Робсон и соавт.[214] Дж. Левин, Дж. Гарнье[2!5] Д Кнеллер, Ф. Кози, Р. Лангридж [216] С Сольцберг, С. Кост[217) Х. Цханг, Дж.Месиров, Д.
Вольтц [218) Р Маклин,Дж. Шавлик [2!9) Б. Рост, К. Сандер, Р. Шнейдер [220) 1974 1976 1978 1983 1987 1988 !988 1988 1990 !992 1992 !993 1993 0,65 0,56 0,71 0,64 0.58 0.67 0,66 0,63 0,79 0,65 0,67 0,64 0.71 516 инсулина — 4,8тс. В случае ООМА[И (5),9%; четыре состояния) структура глюкагона правильно идентифицирована на )7,2%, крамбина — на 37,0%, цепи А инсулина — на 9,5% (209).
В последние годы интерес к поиску простых статистических корреляций между аминокислотной последовательностью и вторичными структурами не ослабевает. По-прежнему предпринимаются попытки создать новые методы предсказания, усовершенствовать предложенные ранее, реанимировать забытые. Принципиальных изменений в развитии этого направления, однако, не происходит. На протяжении вот уже трех десятилетий остается неизменной стратегия поиска, покоящаяся на вере в возможность эмпирическим путем и на основе вторичных структур решить одну из фундаментальных проблем молекулярной биологии. Поэтому неудивительно, что практически неизменной осталась и надежность предсказания.
В табл. [Ч.20 представлены показатели качества алгоритмов, разработанных с )974 г, по )993 г. и предсказывающих три конформационных состояния аминокислотных остатков (а-спиральное, )3-структурное и неупорядоченное). В качестве количественной характеристики использован показатель Оз, равный сумме долей положительных и отрицательных правильных предсказаний трех форм остатков (ш+ з). Применение этого показателя не вызывало бы особых возражений, не будь следующих трех обстоятельств. Во-первых, если бы гх-спирали, )3-структуры и нерегулярные формы входили в белковые третичные структуры приблизительно в равных долях.
Известно, что это условие не соблюдается и среднее содержание спиралей не превышает 30%, )3-складчатых листов — 20%, а нерегулярных сегментов — 50%. Во-вторых, если бы оценка показателей качества предсказания трех видов структур де. палась не последовательно, а одновременно, т.е, независимо. Несоблю денис обоих условий ведет к тому, что при идентификации а-спиралей Роятность отрицательного правильного предсказания в 2-3 раза выше оятности положительного правильного предсказания. Еще больший ад в показатель качества Яз вносят отрицательные правильные предзания ]3-структуры.
Поэтому наиболее распространенный способ оценки ества приводит к завышенным значениям Оз и переоценке эффекности корреляционных методов. Насколько может быть далеко от льности представление о возможностях алгоритмов предсказания, люстрируют Г. Шульц и Р. Ширмер [184] следующими типичными имерами идентификации вторичных структур.
В первом примере для ка с незначительным а-спиральным содержанием не было сделано нн пдного положительного правильного предсказания (вз = О) при сравэпггельно большой доле, что почти неизбежно в данном случае, отри- тельных правильных предсказаний (например, х = 0,7). При таком, залось бы, плачевном для использованного алгоритма результате (не лучено никакой информации о структуре белка) количественная оценка го эффективности по значению Оз получается тем не менее удовлеорительной (70% достоверных предсказаний).
Если же при этом сделано же небольшое число положительных правильных предсказаний (наример, аз = О,1), то показатель качества возрастает до 80%, что уже едставляется чуть ли не полным соответствием теории и эксперимента. Более объективен показатель надежности эмпирических корреляций Оъ едложенный Б. Мэтьюзом [221]. Он рассчитывается по усредненным аченням аз,х, у, ц т.е.
с учетом недопредсказания и сверхпредсказания. отмеченном выше первом примере его значение составляет — 0,17, а во ором — +0,38 прн изменении от -1,0 (в случае полностью неправильных редсказаний; вз =х = О) до +1,0 (вз =я = 1, у = г = О), Таким образом, в ервом примере предсказание хуже, чем среднестатистическое, спорядочное, Я = О), а во втором — несколько лучше.
Значения критерия этьюза для сегментов а-спиралей, [3-структур и [3-изгибов (неупорядоенное состояние) аденилаткиназы, рассчитанные по лучшим из имею- хся для этого белка предсказаниям, равны соответственно 0,56; 0,58; ,60, а для лизоцима Тя — 0,42; 0,28; 0,20 [184]. Наконец, в-третьих, использование показателя качества Оз вызывает з рьезное возражение, поскольку неупорядоченная форма остатка, в отлиие от а-спиральной и [3-структурной, не связана с конкретным конфорационным состоянием, и поэтому се идентификация является не редсказанием, а отказом от предсказания. Отмеченные три обстоятель- ва делают показатель качества Оз в значительной мере лишенным изического смысла.
В последние годы начинают проявляться новые элементы в развитии орреляцнонных методов предсказания вторичных структур и механизма адки белковой цепи [222]. Правда, они касаются не существа рас- атрнваемого явления, а скорее чисто формальной стороны эмпнриеского подхода, отражая вместе с тем определенное разочарование реультатами многолетних поисков. Неудовлетворенность чувствуется, апример, в обзоре Б. Роста, К. Сандера и Р. Шнейдера, написанном 1994 г. [223]. В нем авторы, отмечая преодоление предсказательными 5!7 алгоритмами уровня 70% по показателю качества Оз, приходят к выводу что конечная цель корреляционных методов — установление трехмернов структуры белка — нс может быть достигнута и при значении Оз = 100% т.е.
при "правильной" идентификации трех состояний всех остатков. Такое заключение было сделано еще в 1975 г. Бэржесом и Шерагой [132] которые показали, что даже в гипотетическом случае, при наличии совершенного алгоритма, задача получения структуры белка, напоми. нающего нативную конформацию, остается нерешенной. Примечательно также заключение Максфилда и Шераги, сделанное годом позже пря разработке очередного предсказательного алгоритма [210]. Обсуждая надежность результатов статистической обработки белков и понимание на этой основе принципов пространственной организации белковых молекул, авторы приходят к убеждению, что "поскольку любой метод„использующий данные о белках известной структуры будет сталкиваться с теми же статистическими ограничениями, то, по-видимому, невероятно, чтобы изменения в методе, использующем такие данные, привели к значительному увеличению точности, пока количество данных не возрастет", в далее: "...очевидно, имеющиеся предсказательные методы являются бесполезными для понимания структуры белков" [210.
С. 5150]. Выводы подобной направленности, предостерегающие от бесплодных поисков простых решений структурной проблемы белка, в литературе почти отсутствуют. Да и процитированное только что высказывание вскоре было дезавуировано одним из авторов в его работе с Немети, где написано о достоверности статистических предсказательных алгоритмов нечто противоположное: "Приложение этих параметров к белкам с известными аминокислотными последовательностями дает вероятные конформационные состояния, которые могут быть использованы в качестве исходных для минимизации энергии....Предсказательные схемы являются очень полезными как первый шаг в расчете конформационной энергии" [12. С, 340].
К сожалению, Немети и Шерага не поясняют, каким образом можно получить пригодную для уточнения белковую структуру, если все статистические алгоритмы (и тогда, и спустя двадцать лет) предсказывают неправильно конформационные состояния по крайней мере у половины остатков, причем в случае белка, неисследованного рентгеноструктурно, не известно, какой именно половины. Б. Рост, К. Сандер и Р, Шнейдер видят выход не в поиске новых, альтернативных путей, а в использовании несколько оригинального для науки способа, заключающегося в снижении предъявляемых к решению проблемы предсказания требований [222, 223].
Они предположили, что трехмерная структура белка может быть предсказана, если в банке данных содержится информация о пространственном строении белков с высокогомологичными последовательностями. К этой достаточно очевидной мысли ранее пришли К, Чотна н А. Леск [224], У. Тейлор в К. Оренго [225] и авторы других работ [226 — 231]. Однако, на первый взгляд, такой путь не кажется перспективным, так как более, чем у 80% белков, последовательности которых представлены в банке данных А.
Байроха и Б. Бекманна [232], трехмерные структуры неизвестны "Для этих белков, — пишут авторы обзора [223. С. 13], — предсказание 5!8 грехмерной структуры сталкивается с непреодолимыми трудностями. Выход заключается в упрощении проблемы до более простого уровня, воддающегося частичному разрешению". Б. Рост и К. Сандер решение видят в отказе от предсказания конформационных состояний отдельных остатков последовательности в пользу вторичных структур у целых сегментов, используя данные о гомологичном белке, трехмерная структура которого известна [222].










