Конформационная динамика нуклеиновых кислот при взаимодействии с лигандами (1098269), страница 13
Текст из файла (страница 13)
Так, водородная связь с участием атома галогена не может бытьточно описана моделью точечного заряда из-за анизотропной плотности зарядана нём [161; 162], и это только некоторые проблемы в параметризации лигандов.Параметры для описания Ван-дер-Ваальсовых взаимодействий можно позаимствовать из силовых полей для биополимеров. Параметры для описания длины связей и углов слабо связаны с нековалентными взаимодействиями и могутбыть получены из экспериментальных данных и высококачественных вычислений КМ.
Заряды для атомов могут быть получены, исходя из рассчитаннойдля лиганда поверхности электростатического потенциала (RESP), на уровнетеории КМ HF/6-31G* [163; 164]. Вычисление частичных зарядов для атомовможет быть затруднено для сложных молекул. И, в итоге, исследователи вновьсталкиваются со сложной задачей по описанию торсионных углов. Единственная возможность провести строгое описание торсионных углов – это затратныевысококачественные КМ-вычисления.При моделировании, где биополимер описывается в силовом поле семейства``Amber'', принято использовать специализированное для описания малых молекул силовое поле GAFF [165].
GAFF является расширением силового поля``Amber'' с параметрами для широкого спектра органических молекул: в ос74новном, для молекул, схожих с известными лекарствами. Оригинальная версия этого поля использует 33 основных и 22 специальных типа атомов, включая атомы H, C , N, O , S, P, F, Cl, Br и I, таким образом, покрывая основнуючасть химического разнообразия. Был разработан алгоритм для автоматизированной процедуры для соотнесения типа атома, заряда и параметров силовогополя для широкого круга органических соединений [166]. Эта удобная процедура ни в коем случае не заменяет подробную ручную работу по параметризациисоединения.
Для точного моделирования можно использовать такие параметрыв качестве отправной точки и тщательно проверять их с помощью точных КМвычислений, а при необходимости – уточнять. Так как органические молекулысложны, а силовые поля являются по природе эмпирическими приближениями, то кажется нереалистичным создание автоматизированной процедуры длякачественной параметризации органических соединений [95].
Следует такжеотметить, что расчёты КМ, которые использовались при построении силовогополя GAFF в 2004 году, сегодня уже не удовлетворяют условию высококачественного расчёта.Вопрос параметризации также справедлив для моделирования химическихмодификаций в составе нуклеиновых кислот как в азотистых основаниях, таки в сахаро-фосфатном остове. Более подробно этот вопрос рассмотрен в главе,посвящённой остову НК.Многие исследователи пытаются вычислить изменение свободной энергиипри образовании комплекса G-ДНК-лиганд, и для этого чаще всего применяетсяпопулярный подход ММ-PBSA. Этот подход использует значительные упрощения (используется растворитель в неявном виде), и маловероятно, что заметноеулучшение точности данного подхода будет достигнуто в обозримом будущем.Одним из основных ограничений всех методов ММ и КМ, которые используют75неявное описание растворителя,– это возникновение ошибки при оценке энергии сольватации, которая зависит от атомных радиусов.
Атомные радиусы – этоэмпирически подобранные параметры, которые не соответствуют ``реальным''физическим свойствам. Неточность определения энергии сольватации напрямую вносит ошибку в расчёты изменения свободной энергии связывания. Лучшие результаты при использовании неявного описания растворителей были достигнуты, когда параметры оптимизировали для определённого класса молекули молекулярных комплексов при наличии экспериментальных данных. В качестве примера можно привести исследования Ли и коллег. Они сообщили, что,согласно методу PBSA, изменение свободной энергии при связывании G-ДНКс перилен-производным (Tel03) составляет ∼ -35 ккал/моль [146].
Это значениесильно отличается от экспериментального для связывания подобных соединений (∼-10 ккал/моль). Это указывает на то, что метод ММ-PBSA может задавать правильные тенденции, но вычисленные абсолютные значения изменениясвободной энергии часто завышены. В другой работе Аргвала и коллег былирассчитаны восемь различных комплексов G-ДНК с телометсатином, и изменение свободных энергий составило от -1 до -16 ккал/моль [151]. Такой диапазонзначений указывает на неприемлемый уровень ошибки в результатах обсчёта.2.3.6Перспективы применения моделирования к НККак долго надо наблюдать за НК в моделировании МД, чтобы получить биохимически осмысленные данные? Первые публикации сообщали о диапазоневремён наблюдения 0,5-5 нс.Даже такие короткие траектории моделированиямогут иногда предоставить полезные данные. К примеру, в приведённой работе была показана высокая жёсткость квадруплексного тяжа.
Тем не менее, с76ростом производительности компьютеров и накоплением опыта, предполагается, что минимальная длина отдельных траекторий должна быть порядка 25-50нс. В случае, когда исходная структура уже достаточно релаксирована, моделирование может правильно отражать многие её структурные особенности. Чтобы увидеть большую амплитуду движений и найти разные микросостояния,которые разделены небольшими энергетическими барьерами, продолжительность наблюдения должна быть в диапазоне времён 100-1000 нс для каждойтраектории. Принято считать, что моделирование со временем наблюдения 1нс может позволить преодолеть энергетические барьеры порядка 5 ккал/моль,а при времени наблюдения 100 нс преодолеваются барьеры не более 8 ккал/моль.Поскольку разные системы имеют разную сложность конформационногопространства, как с точки зрения термодинамики, так и с точки зрения кинетики, то нельзя заведомо сказать, сколько времени необходимо наблюдать за эволюцией системы.
Для каждого конкретного случая решение принимается индивидуально. Для определённых целей множественное (несколько траекторий)моделирование с длиной траектории 25 нс является достаточным, в то время,как для других систем микросекундный масштаб времени будет недостаточен.Хорошим советом является предложение работать на пределе современных вычислительных возможностей. Чем дольше наблюдения, тем выше вероятностьтого, что интересные события из динамики системы не будут пропущены. Очевидно также, что, чем дольше происходит наблюдение за системой, тем болеевероятно, что исследователи будут сталкиваться с несовершенством используемых силовых полей.Лучше иметь набор нескольких (скажем, 5-10) траекторий с достаточнымвременем наблюдения, чем полагаться только на одну очень длинную траекторию. Хотя моделирование МД основано на детерминистическом описании,77оно в действительности имеет стохастическую природу.
Опыт показывает, что сувеличением длины моделирования вероятность наблюдения структурного изменения может уменьшаться. Единственная траектория в самом начале можетбыть испорчена редким необратимым событием, что приводит к потенциальноневерной интерпретации результатов. В то время, как множественные повторения приведут к накоплению ценных результатов.
Например, при исследованиироли мутации в локальном окружении можно обнаружить статистически достоверные данные об изменении свойств в удалённой части молекулы [167].Очевидно, что даже после самых современных улучшений силовые поляостаются далеки от совершенства. Вполне вероятно, что увеличение выборкипоможет в будущем найти дополнительные артефакты в силовых полях, которые на данный момент скрыты из-за больших значений энергетического барьера между стартовой ``нативной'' конформацией и потенциально артефактнымсостоянием.
Надо быть особенно осторожным с методами моделирования, которые ускоряют накопление данных, а именно: метод обмена репликами, метадинамика и направленная МД. Такие способы, с одной стороны, крайне полезны. С другой стороны, их применение не является тривиальным. Во-первых,эти методы всегда основаны на значительных приближениях, в дополнение ктем, которые используются в стандартном моделировании МД. НаправленнаяМД применима к простым путям, таким, как переход из А-формы в B-формуДНК, но более сложные изменения могут легко выйти за пределы применимости метода [167]. Приближения, основанные на насыщении энергией так называемых коллективных переменных, не всегда в полной мере признаются сообществом исследователей.
Для неподготовленного исследователя сложной задачей является в полной мере понять значение таких расчётов, если авторы публикаций не сформулировали это явно и точно [168]. Всегда существует некоторая78погрешность, которая возникает при попытке решить проблему выборки. Темне менее, это очень ценные методы, но они не смогут заменить обычное моделирование МД, которое остаётся золотым стандартом.Несмотря на имеющиеся ограничения, точность хорошо откалиброванныхсиловых полей для нуклеиновых кислот достаточно высока, несмотря на ихпростоту. Учитывая трудности при разработке поляризуемых силовых полейи высокие требования достаточно точного описания в КМ, вероятно, что современные силовые поля будут доминировать в исследованиях по моделированию НК в течение следующего десятилетия.
Существуют дополнительныевозможности для дальнейшего улучшения современных силовых полей, и былобы справедливо признать, что ограниченная гибкость и нефизический характерописания НК в простой функциональной форме, определённо не позволяют создать идеальное силовое поле. Таким образом, рано или поздно возможностидля улучшения силового поля через торсионные углы будут исчерпаны.КМ-вычисления могут в будущем дополнить атомистическое моделирование, хотя они всегда будут отставать в производительности от ММмоделирования, что сказывается на размере систем и широте выборки. Довольно простой и распространённый подход к моделированию биополимеров – эторасчёт структуры методами КМ в газовой фазе, как это было сделано для оценкиэнергии взаимодействия G-квартетов с ионами [169—171].