Osnovy_biokhimii_Nelson_i_Kokh_tom_1 (1123313), страница 48
Текст из файла (страница 48)
С помощью таких методов можно создавать новые белки, в которых химические группы, в том числе и не встречаюгциеся в природных белках, расположены в строго определенных местах. Новые белки позволяют изучать механизмы фсрлсептативного катализа, создавать белки с новыми химическими свойствами и заданной структурой. Последнее окончательно убеждает нас в том, что есть связь между первичной структурой белка и его пространственной структурой в растворе. туру„функции, локализацию в клетке и эволюцию.
Важнейшую информацию можно получить, сравнивая амипокислотныс последовательности данного белка и других известных белков. В Интернете есть доступ к базам данных, содержащим тысячи известных на сегодняшний день последовательностей. Сравнение новой последовательности с этим банком данных часто позволяет выявить как определенные особенности, так в общие закономерности. До сих пор мы не знаем точно, каким образом аминокислотная последовательность определяет трехмерную структуру; мы также не в состоянии однозначно предсказать функции белка, исходя из его аминокислотной последовательности. Однако на основании сходства аминокислотной последовательности данного белка с другими белками его можгю отнести к одному из известных семейств белков, отличающихся определенными функциональными и структурными особенностями.
Члены семейства обычно имеют алшнокислотные последовательности, совпадающие как минимум на 25Ж, а также обладают некоторыми общими структурными н функциональными характеристиками. Существуют, однако, семейства, члены которых имеют лишь несколько илентнчпых аминокислотных остатков, необходимых для реализации опрсдсле1шой функции. Кроме того, многие белки, выполняющие различные функции, имеют сходные надыолскулярпые структуры (так называемые домены, см.
гл. 4). Эти домены часто образуют спсцифичес кие структуры, обладающие неожиданно высокой устойчивостьк> или приспособленные к существованию в определенном окружении. Кроме того, на основании структурного и функционального сходства между семействами белков можно сделать определенные заключения относительно их эволюционного развития. Некоторые аминокислотные последовательности служат сигналами, определяющими их клеточную локализацию, необходимости химической модификации и указывают на время жизни белков. Специальныс сигнальные последовательности, обычно расположенные на Х-конце белка, используются для маркировки белков, транспортируемых за пределы клетки; существуккт также белки, предназначенные для локализации в ядре, на клеточной поверхности или в других отделах клетки. 3.4 Структура белка: первичная структура 11551 Консенсусиые последователыккти можно изобразить несколькими различными способами.
Для иллюстрации двух вариантов представления данных мы используем два примера копсепсусных последовательностей, изображенных на рис. 1: а) ЛТР-свяаывакпсая структура, называемая Р-петлей (см. доп. 12-2); 6) Сам-связывающая структура, называемая ЕГ-рукой (см. рис. 12-11). Приведенные здесь правила — адаптированный вариант правил, используемых всб-сайтом РК051ТЕ (ехразу.огК/ргомсс); в этой программе для обозначения амииокиглотпых остатков применяется однобуквенный код.
В одном способе представления консенсусных последовательностей (верхняя часть рисунков а и 6) каждая позиция отделена от соседней позиции черточкой. Позиция, в которой может находиться любая аминокислота, обозначается через х. В случае неопределенности в квадратных скобках перечисляются все возможпыс аминокислоты. Например, в случае а 1АО! означает А!а или 01у.
Если в какой- либо позиции могут находиться практически любые аминокислоты за некоторым исключением, то иа месте этой позиции в фигурных скобках перечисляют именно те аминокислоты, которые нс могут здесь стоять. Например, на рис. 1, 6(ИГ) означает, что здесь ве может находиться аминокислота Тгр. Повторение какого-лиГю элемента последовательности обозна- чают с помощью числа или несишьких чисел, взятмх в скобки и стоящих после этого элемента.
Так, в примере (а) х(4) означает х-х-х-х, а (2,4) означает х-х, х-х-х или х-х-х-х. Если рассматриваемый участок является (л(-концом или С-концом послсдова- тельности, то запись соответственно начинают или заканчивают им (это не так в ланпых примерах). В конце фрагмента ставится точка. Применяя эти правила к консенсусной последовательности (а), получаем, что в первой позиции может стоять Л или О. В следующих четырех позициях могут располагаться любые аминокислоты, далее обязательно идут О и К, а последнюю позицию занимает 5 или Т. Система записи 5ес)попсе 1одоз обеспечивает возможность более информативного графического представления выравнивания множества аминокислотиых (или нуклеотидцых) последовательностей.
В каждой позиции указан определенный набор символов, ссютветствующий тем аминокислотам (или иуклеотидам), которые могут здесь располагаться. ~жт, Р-1%1-П)НЯ1-(плср%)-Пзенет61-П11Щснетс)-16Р)- ПЛ7МС1-П1Е1ЩЯТАСС1-х(21-П1Е1-!ЛЛ7МРУ%ь 4 23 Ц2 Ф1 1 2 3 4 3 6 7 8 9 10 11 12 13 б ы С Рис. 1. Представление двух консенсусных последовательностей. а) Р-петля — АТР-связывающая структура; 6) ЕР-рука — Са"-связывающая структура. Общая высота символа в позиции (в битах) отражает степень консервативности этой позиции, а высота каждого сггдельного символа внутри множества указывает на отпос:ительную частоту встречаемости именно этой аминокислоты (нуклеотида). В аминокислотных н<кледовательностях цветом обозначены характеристики аминокислот: полярные аминокислоты (Сз 5, Т, у, С, О, М) зеленые, основные (К, П, Н) синие, кислые (О, Е) красные, а гидрофобные (А, Ч, 1, 1, Р И( Г, М) черные.
Классификация аминокислот в данной схеме несколько отличается от той, что представлена в табл. 3-1 и на рис. 3-5. Лмипокислоты с ароматической структурой боковой цепи относят как к неполя рным (Г, Иг), так и к полярным (Ъ'). Глицин, который всегда трудно поддастся классификации, принято считать полярным. Если в одной позиции могут находиться одна или небольшое число аминокислот, редко бывает так, что они встречаются в этой позиции с равной вероятзюстькь Одна или несколько аминокислот обычно преобладают.
Данный способ представления делает это преобладание наиболее выраженным, а консервативную последовательность в белке — более очевидной. Однако при этом скрываются некоторые аминокислоты, которые могли бы находиться в определенной позиции, например Суз, который иногда встречается в п<ииции 8 в мотиве ЕГ-руки (рис. 1, 6). 1156] Чапь1. 3. Аяинокислогы, певтвды и белки Определенные последовательности служат участками связывания простетических групп, таких как остатки сахаров в гликопротеипах и липиды в липопротсинах. Некоторые из этих сигнальных последовательностей хорошо изучены и легко распознаются в аминокислотцой последовательности нового белка (гл. 27). КЛЮЧЕВЫЕ ДОГОВОРЕННОСТИ. Значительная доля функциональной информации, содержащейся в последовательности белка, заклн>чена в консенсусных последовательностях.
Этим термином обозначают соответствуя>щие послсдователыюсти не только в белке, но также в ДНК и РНК. При сравнении наборов родственных аминокислотных или нуклеотидных последовательностей выявляют позиции, в которых чаше всего стоят одни и те же аминокислоты или нуклеотиды; это и сеть консенсусные последовательности. Участки последовательности, отличающиеся наибольшим сходством в ряде организмов, часто соответствуют эволюционно консервативным функциональным доменам. Для анализа и поиска копсенсуспых последовательностей создан целый набор математических приемов и программ, доступных через Интернет.
В доп. 3-3 представлены общие принципы изображения коцсенсусных последовательностей. ° Белновыв последовательности проливают свет на развитие жизни на Земле Простая последовательность букв в амипокислотной последовательности нс дает полного представления о том богатстве информации, которое на самом деле заключено в этой последовательности. По мере роста числа известных белковых последовательностей появлян>тся все более мощныс методы, позволяющие извлечь из них самую разную информацию.
Анализ информации, хранящейся в постоянно расширяющихся биологических базах данных, содержащих последовательности генон и белков. а также структуры макромолекул, привел к становлению биоинформатики как новой области знаний. Олин из результатов развития этой дисцигиины заключается в появлении серий компьютерных программ, многие из которых доступны через Интернет и их могут использовать ученые, студенты и даже непрофессиона- лы. Функции каждого белка связаны с его трехмерной структурой, которая, в свою очередь, во многом определена первичной последовательностью.
Таким образом, биохимическая информация, отраженная в аминокислотной последовательности, в принципе ограничена нашими собственными знаниями о структурных и функциональных принципах организации белков. Постоянно развивающийся аппарат биоинформатики позволяет идентифицировать функциональные сегменты в новых белках и чстацовить как их последовательность, так и их структурную связь с уже известными белками. Кроме того, изучение белковых последовательностей с эволюционной точки зрения позволяет цам понять, как возникали белки и, в конечном итоге, как развивалась жизнь на нашей планете. Историк> молекулярной эволюции обычно связывают с работами Лайнуса Полинга и Эмиля Цуксркапдла, которые в середине 1960-х гг.
стали активно использовать нуклеотидные я амипокислотные последовательности для изучения эволюционного процесса. Основа этой пауки обманчиво проста. Если два организма родственны друг другу, то последовательности их генов и белков должны быть похожи. По мере эволюционного расхождения организмов зти последовательности начинают сильно различаться. Перспективы развития такого подхода стали проясняться в 1970-х гг., когда Карл Везе использовал последовательности рибосомных РНК для выделения архей в отдельную группу, не принадлежа>цую к бактериям или эукариотам (рис.
1-4). Белковыс последовательности часто предоставляют возможность лля уточнения имеющейся информации. По мере реализации проектов по изучению геномов самых разных организмов от бактерии до человека число доступных последовательностей растет с огромной скоростью. Эту информацию можно использовать, чтобы проследить ход эволюции. Проблема заключается в расшифровке генетических иероглифов. Эволюция нс следует простым линейным путем. Сложности возникают при каждой попытке извлечь связацпук> с эволюцией информацию, заключенную в белковых последовательностях. В каждом конкретном белке на протяжении всего хода эволюции неизменными оставались аминокислотные остатки, имек>щие наибольшее .Еелд ТОНКТ1КОХОСОООТГО1З11е1ОЕОООЕКТГЕУ> йтгООТН1ООГОЕОзас1нть Я.«иьц!о ОЕОЮТ1> ЬТОСОООТГО'*З> СЕСООО ТГЕЧ ЗтйОО>'.ВО>ЗООГГО у!1 ОНО 1 Пробел Рис.
3-30. Выравнивание белковых последовательностей с использованием пробелов. Здесь представлены короткие участки белка Нзр70 (широко распространенного класса белков-шапероиов) мз двух хорошо изученных бактерий — Е. со!> и Вас31из зиЬПЗ>а Введение пробела в аминояисяотную последовательность В. гиЬП1>з позволяет лучше Осуществить выравнивание с каждой стороны От пробела. Желтым цветом выделены идентичные амииокислотиые остатки. значение лля его функционирования. Остатки, ве игршошие такой важной роли в активности белка, люгли со временем менятын, т. е. одна аминокислота могла зал>епить другую, и именно зти изменившиеся остатки могут сказать что-то о ходе эволюционного процесса. Но аминокислотпыс замены не всегда случайны.