Конформационная динамика нуклеиновых кислот при взаимодействии с лигандами (1098269), страница 36
Текст из файла (страница 36)
В обоих случаях минимальное среднеквадратичное отклонение выходит на плато, однако в случае моделированияот 300 К (красная кривая) выход на плато происходит в районе 30 нс, а уровеньопускается ниже 1Å. В случае же моделирования от 273 К (зеленая кривая) вы-А)Количество структур, шт.Количество структур, шт.ход на плато происходит в районе 25 нс, а уровень не опускается ниже 2Å.3210012Время, пс34·1043210012Время, псБ)34·104Рисунок 3.62: Количество реплик в ходе моделирования, среднеквадратичноеотклонение которых от нативной структуры не превышает 2 ангстрем.
А)Нижняя температура 300К Б) Нижняя температура 273К234Но появляются ли такие структуры лишь однажды в ходе моделированияили же происходит их накопление? Рисунок 3.62 показывает число реплик,среднеквадратичное отклонение которых от референсной структуры в данных момент не превышает 2 Å. Как в случае моделирования от 300 К (Рисунок 3.62А), так и в случае моделирования от 273 К (Рисунок 3.62Б) видно накопление конформаций, структурно близких свернутой, вплоть до 3 единомоментно.Может показаться, что 3 реплики из 38 или 42 —это довольно мало для наиболее представленного состояния.
Однако, нельзя забывать, что рассматриваемые траектории совершали случайные блуждания по пространству температур,и состояния, характерные для высоких температур, могут быть очень редкимипри биологически значимых температурах и практически не быть представленными в растворе. Также, вероятно, при продолжении моделирования может наблюдаться дальнейшее накопление свернутых конформаций.Поскольку в ходе обоих экспериментов минимальное среднеквадратичноеотклонение по всем репликам за последние 10 нс меняется слабо, этот отрезоквремени был выбран для анализа наиболее представленных состояний.В случае моделирования от 300 К наиболее представленным микросостоянием оказалась правильно свернутая шпилька (Рисунок 3.63). Среднеквадратичное отклонение составило 1.33Å, а доля среди всех микросостояний за последние 10 нс моделирования —3.4%.В случае моделирования от 273 К наиболее представленными микросостояниями оказались неправильно свернутые шпильки (Рисунок 3.64).
В каждой изнаиболее представленных структур одно из оснований инвертировано относительно N-гликозидной связи: в структуре 3.64А перевернут седьмой цитозин, вструктуре 3.64Б —третий гуанин, а в структуре 3.64В —первый гуанин. Пред235Рисунок 3.63: Наиболее представленное состояние в моделировании от 300 Кставленность данных структур в течение последних 10 нс моделирования составляет 2.9 – 3.6 %, а среднеквадратичное отклонение —1.75 – 2.15 Å.А)Б)В)1.96 Å1.75 Å2.15 ÅПредставленность: 3.6 %3.2 %2.9 %RMSD:Рисунок 3.64: Наиболее представленные состояния в симуляции от 237 К.Основания с неправильной ориентацией выделены оранжевым.Для каждого моделирования были посчитаны наиболее вероятные пути (смаксимальным потоком) конформационных переходов из стартового в наиболеепредставленные свернутые состояния (Рисунок 3.65 —моделирование от 300 К,Рисунок 3.66 —от 273 К).
В обоих случаях пути сборки образуют сеть c большим числом компонентов, указывая на сложность механизмов самосборки, чтосоответствует современным представлениям об образовании структуры биополимеров , проходящем через большое количество переходных состояний[402].236Рисунок 3.65: Моделирование от 300 К. 15 путей с наибольшим потоком, покоторым возможны переходы из стартового состояния в наиболеепредставленные.237Рисунок 3.66: Моделирование от 273 К. 15 путей с наибольшим потоком, покоторым возможны переходы из стартового состояния в наиболеепредставленные.238В ходе работы проведено 2 эксперимента по моделированию самосборкиДНК-шпильки с последовательностью 5'-GCGCAGC-3' по методу обмена репликами в температурных интервалах, различающихся нижней температурой.Возможность моделирования самосборки шпильки 5'-GCGCAGC-3' методомREMD продемонстрирована ранее [384; 385], однако пути сборки не анализировали.
Полученные данные о сложности образовании структуры шпильки5'-GCGCAGC и наличии большого числа переходных состояний хорошо согласуются как с экспериментальными данными [402], так и с результатом помоделированию самосборки РНК-шпильки похожего размера (8 нуклеотидов)[390]. Снижение нижней температуры моделирования привело к стабилизациигруппы структур с инвертированными парами оснований (Рисунок 3.64).239Глава 4Материалы и методы4.1Материалы и методы4.1.1Алгоритм построения крупно-зернистой модели РНКПервый этап сборки структурыНачальным процессом является анализ входного файла с описанием вторичной структуры РНК. На этом шаге проверяется принадлежность входныхданных более крупной структуре, что может выражаться в начале нумерациине с первого нуклеотида и/или наличии вторичных взаимодействий вне заданной структуры. В результате работы модуля происходит замена входного файла на аналогичный, с учетом внесенных изменений.
Далее происходит разборвторичной структуры. Условием исполнения всех последующих операций является длинна РНК не более 400 нуклеотидов. Это условие необходимо, для сохранения достоверности моделирования, так как точность построения моделиуменьшается при увеличении длинны молекулы, что связано с недостаткамиалгоритмов оптимизации геометрии.
Для больших структур сложнее добиться достижения минимума энергии, а это иногда может приводить к заведомо240неправильной упаковке молекулы. Также слишком длинные структуры требуют значительного времени расчета. На основании данных разбора структурыпроизводится поиск псевдоузлов и генерируется дополнительный файл с исключенными псевдоузлами. На основании этого файла производится построение схематической вторичной структуры, после чего эти данные преобразуютсяв форматы координат и топологии для пакета Gromacs.
При этом генерируетcяфайл топологии для вторичной структуры. Следующим шагом происходит минимизация энергии структуры и получается файл координат вторичной структуры без псевдоузлов. В том случае, если входной файл не содержал псевдоузлов, то эта структура является конечной. При наличии псевдоузлов модульTop2st.pm генерирует файл топологии вторичной структуры с псевдоузлами,и происходит еще одна минимизация энергии, что приводит к формированиюпсевдоузлов во вторичной структуре.На втором шаге генерируется файл топологии ``промежуточной'' структуры с заданными пользователем значениями ``gap'' и включением/выключением``автоматического поиска близких третичных взаимодействий''.
На основаниифайла координат вторичной структуры придается левое закручивание спиральным участкам. Результатом его работы является новый файл координат. Затемпроизводится минимизации энергии для получения промежуточной третичнойструктуры.Второй этап построения моделиНа данном этапе пользователь, при использовании веб-сервера, может наложить дополнительные ограничения на моделируемую структуру путем непосредственного задания третичных контактов, указать места принудительногостекинга или использовать сравнительное моделирования. Вводимые пользо241вателем данные записываются в соответствующие файлы. Далее проводитсяоптимизация геометрии на основании новой топологии и координат ``промежуточной'' структуры, результатом является модель третичной структуры РНКс заданными геометрическими свойствами.Состав пакета программ для моделирования трехмерной структуры малых РНКПакет программ состоит из 11 модулей, 1 файла базы данных и 4 скриптов.Два управляющих скрипта отвечают за две стадии процесса сборки структурыи используют указанные модули.
Два командных скрипта - исполняются сервером, загружают управляющие скрипты и генерируют веб-страницы. Файл базыданных содержит информацию о геометрии различных видов тройных взаимодействий, он используется если задан их автоматический поиск в структуре.Модули• Ctpp.pm: осуществляет первичную обработку входных файлов вторичной структуры. Позволяет пользователю в качестве входных данных указывать не только полные структуры, но и часть крупных молекул – осуществляет сдвиг нумерации входных структур к единице, удаляет все контакты вне введенной структуры.
В результате работы заменяет входнойCT файл новым с учетом указанных изменений.• Readct.pm: осуществляет анализ CT файла, заданного в качестве аргумента, также генерирует дополнительные файлы визуализации на основании данного файла, в том случае, если эта функция включена. На основании CT файла формирует ряд массивов. Данные множества экспортируются для использования другими модулями.242• Findpk.pm: осуществляет разбор CT файла, заданного в качестве аргумента.
Производит поиск псевдоузлов H-типа в структуре, генерирует дополнительный CT файла, в котором исключаются спирали второй ветвипсевдоузла путем преобразования в две петли.• Readss.pm: осуществляет преобразование файла координат вторичнойструктуры в формате SS в файл координат в формате GRO (файл пакетапрограмм GROMACS).• Top2st.pm: создает файл топологии вторичной структуры основываясь намножествах, генерируемых модулями Readct.pm и Findpk.pm. Структура двухцепочечных участков описывается дистанционными ограничениями характерными для A-формы РНК (расстояние между нуклеотидами,длинны связей пары, углы). Между всеми спиралями, каждой из ветвейпсевдоузла, задаются дистантные ограничения для принудительное формирование стекинга, в независимости от длинны петель между ними.• Top23st.pm: создает файл топологии ``промежуточной'' трёхмерной структуры основываясь на множествах генерируемых модулямиReadct.pm и Findpk.pm.
Структура спиральных участков описывается дистантными ограничениями характерными для A-формы РНК (расстояниемежду нуклеотидами, длинны связей пары, углы закрутки спиралей ит.д.). Дистантные ограничения A-формы были созданы на основе статистической обработки структур молекул тРНК, 16S, 5S, 23S РНК из PDBбанка, а также структуры 1QCU (классический РНК дуплекс). В качествеодного из аргументов функция модуля имеет ``максимальное расстояниесохранения стекинга'' (gap) – такое максимальное расстояние междусоседними спиралями по одной из цепи, при котором спирали сохраняют243стекинг, при этом расстояние по второй цепи может быть любым.
``Gap''может принимать значение 0 или 1. На основании заданного значения``gap'' производится атоматический поиск стекинга спиралей и созданиедля него дистантных ограничений. В том случае, если для данной спирали под условия формирования стекинга попадает более одного вариантавторой спирали, то стекинг не образуется, впоследствии пользовательможет реализовать стекинг вручную для выбранной пары спиралей.
Вкачестве другого аргумента функция имеет ``включение автоматическогопоиска близких третичных взаимодействий''. Если эта функция включена, то в структуре происходит поиск близких третичных взаимодействий(тройных и прочих) и создание для них дистантных ограничений. Дляпетель из 3-5 нуклеотидов, которые являются достаточно структурноинвариантными, задается геометрия, аналогичная структурам из PDBбанка. Для ``промежуточной'' структуры дистантные ограничения напетли не накладываются.• Gro23st.pm: на основании файла координат оптимизированной вторичной структуры и множеств, генерируемых модулями Readct.pm иFindpk.pm, создает файл координат ``промежуточной'' структуры.