Диссертация (Анализ данных атомно-силовой микроскопии с помощью компьютерного моделирования), страница 8
Описание файла
Файл "Диссертация" внутри архива находится в папке "Анализ данных атомно-силовой микроскопии с помощью компьютерного моделирования". PDF-файл из архива "Анализ данных атомно-силовой микроскопии с помощью компьютерного моделирования", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 8 страницы из PDF
Как видно из49гистограммы, характер распределения сохранился, однако среднее значениеувеличилось,чтодоказывает,чтоиспользованиетольколокальнойэнергетической минимизации не может быть универсальным методомуточнения структур разного разрешения.Исходные различия в структурах разного разрешения одного белкамогут быть обусловлены тем, что программы предварительного уточнения,используемые при подготовке структур из PDB-банка, неверно выбираютокончательные координаты атома в области, распознанной из анализадифракционной картины и значительно превышающей его размеры.
В такомслучае заметно увеличившиеся различия между минимизированнымиконформациями структур разного разрешения вызваны тем, что локальнаяэнергетическая минимизация сводит структуры разного разрешения в разныеминимумы энергетического ландшафта [61].Итак, ширина пика дифракционной картины задаёт лишь областьрасположения каждого из атомов белка, что соответствует области вконфигурационном пространстве координат всех атомов белка. Программыпредварительного уточнения лишь выбирают точку с наименьшей полнойэнергией белка в пределах этой области конфигурационного пространства.Различия в структурах PDB-банка большего и меньшего разрешения одногобелка показывают, что выбранная точка с наименьшей полной энергией непопадаетвуменьшеннуюобластьконфигурационногопространства,определяемую экспериментом с меньшей шириной пика дифракционнойкартины.
Это возможно лишь в случае наличия многих точек локальныхэнергетических минимумов со сходной энергией, существующих по крайнеймере в большей из областей конфигурационного пространства.Отсюда следует, что недостаточно найти какой-либо локальныйминимум в выделенной области конфигурационного пространства, чтобы50однозначно задать положение каждого из атомов структуры с точностьюформата PDB-банка.Принципиальная возможность введения критериев для выбора одногоиз локальных минимумов области определяется плотностью расположениялокальных минимумов в области, а также величиной барьеров между ними.Рисунок 2.2 Распределение значений RMSD (а) до энергетической минимизации, (б) послеэнергетической минимизации, (в) для случайно возмущенных структур51Наша следующая гипотеза предполагает невозможность созданияметодов уточнения на основе локальной энергетической минимизации иможет быть сформулирована таким образом: в случае слишком частогорасположения локальных минимумов и недостаточных барьеров междуними, когда задача их распознавания и применения критериев отбораявляется принципиально нерешаемой, поиск ближайшего локальногоминимума для начальной конформации статистически совпадает сослучайными возмущениями соответствующей амплитуды.
Применительно квыборке пар сравниваемых структур разного разрешения данная гипотезапредполагает, что распределение по RMSD, полученное в случае локальнойминимизации структур, будет совпадать с распределением по RMSD,полученномслучайныхдляслучайновозмущенийвозмущенных структур,атомовдлякаждогоеслибелкаамплитудысовпадаютсрасстояниями, на которые каждый из атомов этого белка был перемещен впроцессе его локальной минимизации.Для проверки данной гипотезы для каждой из структур нами былисгенерированы случайно возмущенные структуры.
Для этого использовалсярасчет приращений координат атомов белка при минимизации, основанныйна вычислении RMSD между исходной и минимизированной структурами.Важными особенностями вычисления RMSD для данной задачи являетсясопоставление всех атомов сравниваемых структур, а не только Cα, а так жеотказ от суперимпозиции структур, поскольку важно оценить суммарныеитоговые перемещения каждого из атомов, в том числе приводящие кпараллельному переносу или вращению структуры белка, как целого.Вычисленные значения RMSD далее использовались как предельные вгенераторе случайных чисел, когда через решение задачи, обратной квычислению RMSD, а так же с использованием функции распределениягенератора случайных чисел, были приданы случайные приращениякоординат каждому из атомов структур PDB-банка.52Таблица 2.2RMSD оценка изменения структур в ходе минимизации и случайныхвозмущений.PDB кодСтруктурная разница между структурамиисходная и минимизированнаяисходная и случайно возмущенная1C5H1,1031,0991C5I1,1351,0991GM42,9972,9091GMB2,3192,3041HAU1,3731,3951HAW1,3371,2951RCC1,9141,8971RCI1,8081,7941UP92,5172,5011UPD2,2252,2011XUF1,7841,7951XUG1,5251,4952AL10,9860,9982AL21,0320,9992UWT1,8121,7972UWV1,7601,7972UXJ1,5501,4972UXK1,5321,4972UXL1,8131,7972UXM1,7421,7034PCY2,0091,9995PCY1,9782,0006PCY1,9001,89953Как видно из Таблицы 2.2, последующее вычисление значения RMSDмежду случайно возмущенными и исходными структурами подтвердиловоспроизведение случайными возмущениями приращений координат приминимизации с 2% точностью.С использованием случайно возмущенных структур в парах сравненияструктур разного разрешения было получено распределение RMSD,представленное на рис.
2.2в.Анализ распределения показывает, что среднее значение RMSD вслучае сравнения пар случайно возмущенных структур значительно вышесреднего для распределения минимизированных структур.Средниевеличины распределений отличаются более чем вдвое, процент перекрытияраспределений, рассчитанный из гистограмм 1б и 1в, составляет примерно19%, что при ошибке подбора амплитуд возмущений не более 2% позволяетотвергнуть выдвинутую гипотезу об отсутствии перспектив использованиякак неверную.На основании отличий трёх распределений по их среднимзначениямможнозаключитьтакже,чтолокальнаяэнергетическаяминимизация заметно сохраняет близость исходных структур в паре посравнению со случайным изменением структур, несмотря на то, чтоминимизация каждой из структур происходит независимо.
Это открываетскрытые возможности уточнения структур PDB-банка через учет многихэнергетических минимумов.2.1.3 ВыводыВ результате данного исследования было показано, что локальнаяэнергетическаяминимизациянеможетиспользоватьсяуниверсального метода уточнения структур разного разрешения.54вкачествеМожно предположить, что моделируемый энергетический ландшафтсдвинут относительно реального, поскольку локальная минимизация сводитструктуры за пределы области рентгеноструктурных данных.Однако так как этот метод сохраняет близость исходных структур впаре по сравнению с их случайным изменением, он обладает перспективамиприменения для уточнения PDB структур в случае разработки критериеввыбора локальных минимумов.Дальнейшее развитие в данной области упирается в возможностикалибровки методов молекулярной механики путем проверки предсказанныхконформаций в эксперименте.2.2Исследование проблемы предсказания структурынерасшифрованных частей белкаВ структурной биологии в последние годы образовалась проблемарасхожденияколичествапоследовательностями,белковрастущегосвизвестнымиаминокислотнымиэкспоненциальномпорядке,иколичества белков с известными структурами, растущего в линейномпорядке[25].
Более того, 90% известных структур получены методом РСА. спомощью которого невозможно получить координаты подвижных частейбелка. Вследствие этого возникают пробелы в структурах. Восстановлениемкоординатнеизвестныхчастейструктурыбелказанимаетсяветвьмолекулярного моделирования, включающая несколько методов под общимназванием "Предсказание структуры белков" [62,63]. К ним относятсягомологическоемоделирование,использующеесуществующую"шаблонную" структуру, сходную по аминокислотной последовательности смоделируемым белком [64,65], а также метод предсказания структуры denovo,использующийквантово-механическиевычисления[66].Результативность этих методов проверяется каждые два года с помощью55экспериментов CASP (англ. Critical Assessment of protein Structure Prediction,критическая оценка предсказания белковых структур) [67].Даже самые лучшие программы по предсказанию структуры белка недают полного совпадения модельной и экспериментальной структур.
В этомнетрудно убедиться, построив в такой программе структуру белка, ужеполученную экспериментально. Поэтому, в каждом отдельном случаеисследователь должен решать для себя: моделировать белок с пропусками вструктуре,либозаполнитьэтипропускиаминокислотнойпоследовательностью, координаты атомов которой далеки от нативных.2.2.1 МетодыБелок σ70-субъединица РНК полимеразы E.coli представлен в RCSBPDB банке данных структур 23 вариантами. Из них 20 содержат практическивсю структуру за исключением небольших пропусков. Во всех вариантах σ70субъединица находилась в составе холофермента РНК полимеразы.Этопримечательный факт, поскольку в таком состоянии белок демонстрируетконформацию, наиболее удобную для выполнения своего функционала, а некристаллическую форму, часто далекую от нативной.