Главная » Просмотр файлов » Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов

Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (1097754), страница 24

Файл №1097754 Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов) 24 страницаМоделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (1097754) страница 242019-03-13СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 24)

В принципе, это не противоречит выражению (88), поскольку определяемая этой формулой часть гиперболы действительно локально близка по форме к отрицательной ветви параболы.Тем не менее, относительно небольшое значение Mxx в сочетании с относительно большим (в сравнении с Mx) значением Dxx для EHOMO указывает на болеесложный характер нелинейной зависимости λ от EHOMO. Можно предположить,что причиной этого является сильное взаимодействие между EHOMO и XN, о чемсвидетельствует большое отрицательное значение перекрестного члена Mxy между ними. Это взаимодействие может быть объяснено большим вкладом атом127ных орбиталей азота в высшую занятую молекулярную орбиталь HOMO. Подобным же образом может быт объяснено отрицательно значение Mxy для EHOMOи XO, причем его меньшее значение (по сравнению с XN) может быть объясненоразницей в электроотрицательности между азотом и кислородом, ведущей кменьшейвовлеченностиатомныхорбиталейкислорода всистемуπ-электронную систему сопряжения в молекуле красителя.

По аналогии, большеезначение Mxy для EHOMO и XCC может быть объяснено прямым вовлечениемдвойной связи C=C в сопряжение, тогда как меньшее значение Mxy для EHOMO иXCCC можно объяснить отсутствием сопряжения между группой C(CH3)2 и πэлектронной системой в молекуле красителя.Из приведенного выше рассмотрения можно сделать вывод, что получаемая при анализе нейросетевой модели интерпретация вполне согласуется с основными физическими принципами теории поглощения света.Таким образом, при использовании статистических характеристик, описывающих распределение получаемых нейронной сетью значений частныхпроизводных переменных, соответствующих свойствам/активностям химических соединений, по отношению к переменным, соответствующим значениямдескрипторов, возможно извлечь из набора данных не только такую же информацию (например, о влиянии дескрипторов на свойства/активности), что и«традиционные» статистические подходы (например, методы линейного регрессионного анализа), но и получить дополнительную ценную информацию онелинейномхарактерезависимостейструктура-свойствоиструктура-активность.

Подобная информация является уникальной, поскольку ее крайнезатруднительно извлечь из набора данных как с использованием параметрических методов статистики (в которых тип нелинейности «зашит» в используемые параметрические уравнения), так и при помощи непараметрических подходов (которые довольно плохо аппроксимируют распределения частных производных). В то же время, ценность подобной информации несомненна.Таким образом, искусственные нейронные сети больше не являются«черными ящиками», не поддающимися интерпретации. Напротив, при исполь128зовании рассмотренных выше статистических характеристик, они являютсяценными инструментами анализа химических данных.4.3. Концепция обучаемой симметрииФормулировка проблемы. Классический подход к выявлению количественной зависимости структура-активность (QSAR) для узкой серии соединений,обладающих одинаковым скелетом, предполагает использование в качестве дескрипторов параметров заместителей (например, константы Гамметта σ, константы Тафта Es, константы липофильности π, параметров STERIMOL: L, B1, B2и др.).

В этом случае может возникнуть проблема тогда, когда несколько положений заместителей топологически эквивалентны (например на Рис. 27а положения 2 и 6, а также 3 и 5, топологически эквивалентны).Рассмотрим эту проблему на следующем простом примере. Пусть базаданных содержит монозамещенные пиридины A-D, приведенные на Рис. 27b.Соединения A и B несут заместители в положении 2, тогда как соединения C иD – в положении 6, которое топологически эквивалентно положению 2. Возникает вопрос: как можно построить единое уравнение QSAR для всей базы с использованием констант заместителей, находящихся в этих положениях? Наиболее очевидным решением для этого случая было бы введение канонической нумерации для положений замещения, при которой заместители во всех структурах оказались бы присоединенными к одному положению, например, к положению 2 (как в структурах G-H на Рис.

27b). Такая база данных могла бы бытьиспользована для разработки уравнений QSAR с использованием параметровзаместителей для положения 2 в качестве дескрипторов.Дополним теперь базу данных пиридинами I и J с двумя заместителями вположениях 2 и 6 (см. Рис. 27c). Решение проблемы для этого случая уже нестоль очевидно, как в предыдущем случае, поскольку различные критерии канонизации могут привести к различной нумерации положений замещения и,следовательно, к разным уравнениям QSAR. На Рис. 27c показана нумерацияположений замещения для двух критериев канонизации: (i) заместители с лек129сикографически «младшими» именами присоединяются в положения с меньшими номерами (структуры K и M), и (ii) заместители с меньшим числом электронов присоединяются к положениям с меньшими номерами (структуры L иN).

Очевидно, что применение подобных произвольных критериев не может составлять серьезную основу для исследований в области QSAR, поскольку построенные подобным образом уравнения QSAR зависят от факторов, не релевантных природе зависимости структура-активность.Альтернативный подход к решению этой проблемы заключается в использовании симметрических функций параметров заместителей в качестве независимых переменных в уравнениях QSAR (см. Рис.

28). Простейшим примером подобных функций является сумма σ-констант всех заместителей (см., например, работу [351]). На практике, однако, в подобных случаях успехQSAR/QSPR-анализа в значительной степени зависит от способности исследователя предложить по интуиции форму симметрических функций. В ряде случаев подобный подход действительно работает. Например, если величина какого-либо биологического эффекта строго аддитивна по всем топологически эквивалентным положениям замещения, то использование суммы констант заместителей, находящихся в этих положениях, в качестве симметрической функцииможет привести к построению хорошей QSAR-модели. Тем не менее, основанные на интуиции подходы не всегда приводят к наилучшему решению.130R4R3R5R6NR2(a)62N6NA66CHNE2INNDC62362BrClB2N62CH 362NCl2NBrGFIH(b)H CN3(i)6H C3KCl(ii)I62NClClCl(i)2N6CHCl3L2NMNBrJ(ii)6BrBr2NClN(c)Рис.

27. (a) Существуют две пары топологически эквивалентных положения заместителей в пиридинах: два α-положения, несущие заместители R2 и R6, и дваβ-положения для заместителей R3 и R5. (b) Выборка α-замещенных пиридиновдо канонизации нумерации положений замещений для критериев (i) и (ii), обсуждаемых в тексте.131Еще одним недостатком этого подхода является то, что простые наборысимметрических функций не всегда могут различить разные соединения и, следовательно, предсказать для них разные величины активности (см. пример наРис. 28).f 1 = σ2 + σ 6f2 = π2 + π6f3 = σ 3 + σ 5f4 = π3 + π5f5 = π2 + π3 + π4 + π5 + π6BrBrClNNOClPРис.

28. Примеры симметрических функций, которые могли бы быть использованы для построения QSAR-моделей. Значения этих функций не меняются приперестановках заместителей по топологически эквивалентных положениям:2Ù6 и 3Ù5. Очевидно, что значения всех пяти симметрических функций одинаковы для соединений O и P, хотя их биологическая активность может отличаться.Следует отметить, что эта проблема для случая 2,6-замещенных пиридинов и одного параметра заместителей может быть решена путем использованиядвух симметрических функций (а именно суммы и произведения параметровзаместителей) в качестве независимых переменных при построении зависимости структура-активность.

Действительно, из основной теоремы о симметрических многочленах [352] следует, что любая симметрическая функция от двухаргументов может быть представлена как многочлен от суммы и произведенияэтих аргументов:132(89)f ( x, y ) ≡ f ( y , x ) ⇔ f ( x, y ) = P ( x + y , x ⋅ y )где P – произвольный многочлен от двух переменных.В рассматриваемом примере мы принимаем, что переменная x – это σконстанта заместителя в положении 2, а переменная y – это σ-константа заместителя в положении 6. Следовательно, для решения проблемы необходимо: (a)создать две симметрические функции (сумму и произведение σ-констант) и использовать их в качестве независимых переменных при построении QSARмоделей, (b) применить статистический метод, способный выявлять нелинейные зависимости между переменными (поскольку многочлен в общем случаеявляется нелинейной функцией) для анализа количественной зависимости«структура-активность» произвольной функциональной сложности. Функция fв уравнении (89) является инвариантной относительно перестановки переменных x и y, тогда как функции x + y и x ⋅ y являются базисным набором инвариантов, поскольку через них может быть выражен любой инвариант.

В принципе, любой базисный набор инвариантов относительно группы автоморфизмовграфа, представляющего собой наибольший общий фрагмент (скелет) наборахимических соединений, и действующей на множестве положений заместителей на этом скелете, может быть использован для построения симметрическихфункций. Тем не менее, необходимые базисные наборы инвариантов известнылишь для простейших групп подстановок. Если мы добавим в нашу выборкухимических соединений пиридины, замещенные по другим положениям, либо,в дополнение к σ-константам, будем использовать еще и другие параметры заместителей, уравнение (89) уже не сможет быть применено, и нам придется либо формулировать и доказывать математические теоремы для каждого конкретного случая, либо искать альтернативные подходы к решению проблемы.Следует подчеркнуть, что существует одно непременное условие, которому должна удовлетворять любая функция, инвариантная относительно перестановки своих аргументов: ее общий вид должен быть нелинейный относительно этих аргументов.

Характеристики

Список файлов диссертации

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6417
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее