Диссертация (Исследование топологии гидратных оболочек белков), страница 8
Описание файла
Файл "Диссертация" внутри архива находится в папке "Исследование топологии гидратных оболочек белков". PDF-файл из архива "Исследование топологии гидратных оболочек белков", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 8 страницы из PDF
Вершинами графа являются атомы53Рис. 43: Белок убиквитина (после процедуры минимизации), толщина гидратного слоя 6Åкислородов водной оболочки, а рёбрами - водородные связи (если между молекулами водыесть водородная связь, то считаем, что соответствующие вершины графа соединены).В работе проведено сравнение гидратных оболочек белков и th-циклов с точки зрениятопологии связанных структур. Для этого необходимо установить наличие гексациклов вгидратных оболочках. Прежде всего, мы нашли простые циклы, то есть пути с неповторяющимися вершинами и рёбрами, кроме начальной и конечной вершины, начальная и конечнаявершины совпадают.В данной части работы проводилось моделирование гидратных оболочек белков следующих структур из быза Protein Data Bank (PDB):• 1A3I.pdb - фрагмент коллагена с повторяющейся последовательностью [Gly - Pro Pro], структура определена с разрешением 1.5Å• 1ITT.pdb - фрагмент коллагена с повторяющейся последовательностью [Gly - Pro Pro], структура определена с разрешением 1Å• 1UBQ.pdb - убиквитин, структура определена с разрешением 1.8Å543.1 Традиционный алгоритм поиска циклов в ширину (breadth-first search BFS)Рассмотрим традиционный алгоритм поиска циклов в ширину (breadth-first search BFS) [70]:1.
поместить узел, с которого начинается поиск, в изначально пустую очередь2. извлечь из начала очереди узел u и пометить его как развёрнутый3. в конец очереди добавляются все преемники узла u, которые ещё не развёрнуты и ненаходятся в очереди4. если очередь пуста, то завершаем обход - все вершины, достижимые из стартовой, ужерассмотрены. Вернуться к п.
2Для поиска циклов по очереди запускаем модифицированный алгоритм BFS из каждойвершины (на каждом таком запуске будем искать только циклы, содержащие стартовуювершину). Также заводим массив, в котором каждой вершине будем ставить номервершины родителя (из которого мы попали в вершину). Меняем пункт 2 алгоритмаBFS. Если приемник уже посещен, то пробуем составить цикл (пройдясь по массивуродителей до стартовой вершины, из которой запускали модифицированный BFS).Если длина цикла > 2 и ≤ MAX_CYCLE_LENGT H (= 6 в нашем случае, так какв первую очередь нас интересуют гексациклы) и ни одна вершина не повториласьдважды (кроме стартовой), то мы нашли цикл - добавляем его в множество циклов.Иначе - идем дальше.
Если же приемник не просмотрен, то добавляем его в очередь,запоминая родителя (текущую вершину).55На рис. 44 показаны примеры циклов с различным числом вершин.b)a)c)d)e)f)Рис. 44: Примеры простых циклов с четырьмя (a - b), пятью (c - d), шестью (e - f) вершинами56Нас интересуют циклы с числом вершин, не превосходящим N = 6.
На рис. 45 - 46показаны гистограммы распределения циклов с различным числом вершин.Рис. 45: Распеределение количества циклов с различным числом вершин, 1A3I.pdbРис. 46: Распределения количества циклов с различным числом вершин, 1ITT.pdbПосле того, как существование простых циклов в сетке водородных связей структурыгидратной оболочки белка было установлено, рассмотрим гексациклы в гидратных оболочкахбелка более подробно. Далее мы детально проанализировали распределение торсионныхуглов в гексациклах.57Приведём распределение конформаций гексациклов для гидратных оболочек различнойтолщины T (табл. 5 - 7), количество гексациклов обозначим как H_0, количество твист-ванн H_1, в исследуемых объектах гексациклы конформаций типа "кресло"и "ванна"отсутствуют.Таблица 5: Белок 1ITT.pdb, толщина гидратного слоя T, количество гексациклов в гидратнойоболочке H_0, число твист-ванн H_1T, ÅH_0H_18511710794912104914Таблица 6: Белок 1A3I.pdb, толщина гидратного слоя T, количество гексациклов в гидратнойоболочке H_0, число твист-ванн H_1T, ÅH_0H_18842121010192012155035Таблица 7: Белок 1UBQ.pdb, толщина гидратного слоя T, количество гексациклов в гидратной оболочке H_0, число твист-ванн H_1T, ÅH_0H_16153922Пусть Q - общее число молекул, Q_0 - число молекул, содержащихся по крайней мере водном гексацикле.
Тогда p =Q_ 0Q- доля молекул в гексацикле.Таблица 8: Отношение числа молекул, принадлежащих по крайней мере одному циклу, кобщему числу молекул в гидратной оболочке1ITT0.971A3I0.961UBQ0.95Таким образом практически все молекулы (∼ 95%, табл. 8) в исследуемых гидратныхоболочках принадлежат к хотя бы одному гексациклу. Это позволяет нам исследовать гид58ратные оболочки как систему гексациклов.Гексациклы могут соединяться друг с другом различными способами, 2 гексацикла могутиметь различное число общих вершин V: 2 (иллюстрация на рис. 47, a), 3 (рис.
47, b), 4(рис. 47, c) общие вершины.59a)c)b)Рис. 47: Возможные способы соединения гексациклов (с 2, 3, 4 общими вершинами)Приведём в табл. 9 количество гексациклов, которые соединены с соседним гексацикломопределенные способом, т.е. имеют друг с другом V общих вершин.Таблица 9: Распределение числа гексациклов, имеющих с другим гексациклом V общихвершинV=2V=3V=4V=51A3I27939694141351ITT23157803401261UBQ44381508709263Как мы видим, доминантный паттерн объединения гексациклов - это соединение подвум вершинам (рис.
47, a). По двум вершинам гексациклы могут соединяться различнымиспособами, обозначим E - число ребёр между вершинами, участвующими в соединении, E =1 в случае смежных вершин (рис. 48, a), другие созможные случаи: общие вершины следуютчерез 1 или 2 вершины циклов (случай E = 2 представлен на рис. 48, b, случай E = 2 - нарис. 48, c). В табл. 10 приведём соответствующие распределения.60a)b)c)Рис. 48: Возможные способы соединения гексациклов (по двум общим вершинам)61Таблица 10: Распределение числа ребёр E между двумя общими вершинами для соединениядвух гексацикловE=1E=2E=31A3I1099096861ITT9084100761UBQ17376236140Таким образом, из табл.
10 видим, что основной паттерн соединения гексацикловпредставлен на рис. 48 (c), и, соответственно, на рис. 47 (a).3.2 Итоги раздела.В данной части работы проведено изучение топологических характеристик гидратныхоболочек коллагенов и убиквитина, используя силовое поле CHARMM и модель водыTIP3P. Было показано, что сеть водородных связей может быть рассмотрена как структурагексациклов, так как 95% молекул воды принадлежат по крайней мере к одному гексациклу.Эти гексацилы можно разделить на классы в зависимость от их торсионных углов. Средиэтих гексациклов были выделены параметрические структуры - твист-ванны.624 Распределения ”валентных” и торсионных углов в гидратныхоболочках белковМы рассматривали структуры гидратных оболочек в рамках параметрической модели связанной воды Бульенкова, где сетка водородных связей может быть представленакак система гексациклов конформации твист-ванна. Твист-ванна не определяет жесткогеометрические параметры: это могут быть как водные кластеры, так и кристаллическиеструктуры, например, лёд.
В структуре льда все гексациклы эквивалентны, внутренниепараметры - межмолекулярные расстояния, валентные и торсионные углы - постоянны имогут изменяться только под действием температуры. При построении системы гексацикловс помощью только твист-ванн распределения геометрических параметров структуры должныискажаться.
Это происходит вследствие неевклидовой природы этих структур [71].Гидратная оболочка белка может состоять из твист-ванн согласно модели Бульенкова.Структура циклов построена из тетраэдрических частиц (водные молекулы, соединенныеводородными связями). Эти тетраэдрические частицы объединяются в гексациклы определённой хиральности, а гексациклы уже объединяются в th-циклы.Перечислим основные характеристики твист-ванны:• Евклидово пространство не может быть заполнено этими структурами• иерархичность: все структуры строятся по одним топологическим правилам (из одинаковых предпосылок) из тетраэдрических частиц• ограничение на связь твист-ванн в гексациклы, твист-ванна - это инвариант моделиTh-циклы имеют простые геометрические и топологические свойства, которые такжеявляются характерными для биосистем - макромолекул и макромолекулярных комплексов.Биосистемы, как и th-циклы, дисконтинуальны, иерархичны и обладают инвариантами (например, ограниченное число аминокислотных остатков и нуклеотидов, опредёленный способсоединения аминокислотных остатков друг с другом в аминокислотную цепь).
Предполагается, что поверхность белка и вода в прилегающей к белку области должна обладать схожимигеометрическими и топологическими характеристиками. В общем смысле - твист-ванна это только один пример нескольких возможных иерархических тетраэдрических систем,построенных на "биологических принципах".Равновесные гидратные оболочки, полученные путём минимизации системы в заданном63потенциале, могут быть рассмотрены с точки зрения соответствия их топологической моделиса моделью th-циклов.4.1 Распределение внутренних параметров структуры гидратной оболочкибелков (”валентные” и торсионные углы, статистика по гексациклам)Для вычислительного эксперимента были выбраны следующие структуры из базы ProteinData Bank (PDB):• 1BKV.pdb, 1CAG.pdb – тройные спирали коллагенов (количество окружающих молекулводы: 2588 и 3354 соответственно)• 1ITT.pdb, 1A3I.pdb - фрагменты коллагенов (количество окружающих молекул воды:1420 и 1539)• 1UBQ.pdb - убиквитин (количество окружающих молекул воды: 3210)• water-ball - фрагмент объемной воды ( число молекул: 7538)В связанной воде гексациклы являются важной структурной единицей.
Они существуютне только в конформациях типа кресло и ванна, но и в конформации типа твист-ванна[73]. В рамках модели Бульенкова связанная вода моделируется сеткой твист-ванн, атомыкислородов представлены вершинами графа, а водородные связи между молекулами воды –рёбрами этого графа.a)b)Рис. 49: Гексацикл "твист-ванна"в двух проекциях.64В гидратных оболочках всех исследуемых белков действительно были обнаружены гексациклы типа твист-ванна. Ранее было показано (табл. 8), что 95% молекул воды гидратныхоболочек принадлежат хотя бы одному гексациклу, что даёт возможность исключить израссмотрения оставшиеся 5% молекул (рис. 52).