Главная » Просмотр файлов » Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов

Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (1097754), страница 28

Файл №1097754 Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов) 28 страницаМоделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (1097754) страница 282019-03-13СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 28)

Отметим, что во всехслучаях нами были построены модели, превышающие по качеству все, опубликованные ранее в литературе. В следующей главе диссертации будет также показано, что замена множественной линейной регрессии на аппарат искусственных нейронных сетей ведет к дальнейшему улучшению прогнозирующей способности полученных моделей.1585.2.1. Прогнозирование поляризуемости органических соединенийПоляризуемость, α, - одно из наиболее важных электрических свойствмолекул, характеризующее способность электронной системы деформироваться под действием внешнего электрического поля [358].

μиндуц. = α·ε. Посколькуполяризуемость является тензорной величиной, то, строго говоря, моделируемой величиной является инвариант этого тензора – среднее значение его диагональных членов (одна треть от следа матрицы тензора).Молекулярная рефракция является аддитивным свойством, и детальныеаддитивные схемы расчета этой величины были предложены как на основеатомных инкрементов, так и инкрементов связей [358].

Известно много методоврасчета поляризуемости разной степени сложности и точности [359-362]. В силу вышесказанного, очевидно, что принцип аддитивности можно было бы распространить и на поляризуемость. И действительно, тензор поляризуемостибыл приписан отдельным связям и функциональным группам в соответствии сгипотезой, что покомпонентное сложение групповых тензоров приведет к тензору молекулярной поляризуемости [360].

На этой основе был разработан полуэмпирический метод расчета компонент молекулярной поляризуемости, который для базы данных, включающей 120 структур (База 1) дал точность с величиной стандартного отклонения 3.5% [361, 362]. Однако наиболее неожиданными оказались данные работы [363], где было показано, что простой набортолько атомных поляризуемостей для десяти элементов позволяет хорошо вычислять молекулярную поляризуемость без учета каких-либо других структурных параметров [363]. Интересно, что применение квантово-химических методов, таких как MINDO, AM1, PM3 и даже DFT, дает худшие результаты, чемаддитивный подход.Целью нашей работы была проверка способности разработанных намифрагментных дескрипторов выступать, в сочетании с линейным регрессионныманализом, в качестве средства автоматического создания аддитивных схем физико-химических свойств химических соединений на примере прогнозированияполяризуемости.

Работа проводилась с использованием наших QSAR/QSPR159программ EMMA (см. раздел 8.1) и NASAWIN (см. раздел 8.2). Для данного исследования было создано несколько баз данных. Во-первых, по данным работ[361, 362] была сформирована База 1, состоящая из 293 структур, в которойпредставлены разнообразные классы органических соединений и некоторыхнеорганических веществ (как, например, H2, O2, N2, N2O, CO, SO2, H2S, H2O,NH3, Cl2 и др.).

Во-вторых, по данным работы [363] была создана База 2, содержащая 426 соединений, включающих C, H, O, N, S, P, F, Cl, Br, I (циклические иациклические неароматические углеводороды; ароматические углеводороды,галогенированные и перфторированные производные, спирты, фенолы, простыеи сложные эфиры, альдегиды, кетоны, карбоновые кислоты; амины, нитрилы,нитропроизводные, амиды, серу- и фосфорсодержащие соединения). Кроме того, была сформирована комбинированная база данных, База 3, которая объединяла две предыдущих базы и, после исключения дубликатов, состояла из 613соединений.На основе комбинированной Базы 3 нами был построен ряд моделей,наилучшая из которых следующее:αcalc = 0.04 + 1.08 ƒ1 +0.38 ƒ2 + 0.92 ƒ3 + 0.61 ƒ4 + 3.04 ƒ5 + 2.18 ƒ6+ 0.44 ƒ7 +2.34 ƒ8 + 3.35 ƒ9 + 5.49 ƒ10 + 0.38 ƒ11+ 0.15 ƒ12 + 0.34 ƒ13 + 0.36 ƒ14(2)n = 552, r2 = 0.9967, s = 0.38 A3, F = 10931где ƒ1, ƒ2, ƒ3, ƒ4, ƒ5, ƒ6, ƒ7, ƒ8, ƒ9, ƒ10 - число атомов С,.

Н, N, O, S, P, F, Cl, Br, I, соответственно; ƒ11 - количество тройных связей в молекуле, ●≡●; ƒ12 - количестводвойных связей в молекуле, ●=●; ƒ13 - количество ароматических связей, ●÷●;ƒ14 – количество атомов в сочленениях циклов в ароматической системе,СAr(CAr)3. Следует отметить, что ранее опубликованные аддитивные схемы показали на Базе 3 существенно более высокое значение стандартного отклонения(s = 0.61 A3).Таким образом, в рамках рассмотренной методологии нами построеныуравнения, позволяющие прогнозировать поляризуемость органических соединений различных классов с высокой точностью исходя из их элементного состава и числа фрагментов, отражающих наличие кратных и ароматических свя160зей, а также учитывающих конденсированные ароматические системы.

Этимпримером продемонстрировано, что предложенные фрагментные дескрипторыв сочетании со статистическим аппаратом множественной линейной регрессииявляются мощным инструментом для разработки аддитивных схем прогнозирования физико-химических свойств органических соединений.5.2.2. Прогнозирование энтальпий образования алифатических полинитросоединенийАлифатические полинитросоединения находят практическое применениеглавным образом благодаря своей высокой энергетической емкости [364].Именно поэтому из физико-химических свойств этой группы соединений наиболее хорошо экспериментально изучены термохимические свойства, в частности теплоты образования [364].

Цель настоящей работы – анализ пригодностиавтоматического метода создания аддитивных схем на основе использованияфрагментных дескрипторов и сравнение точности прогноза с результатами популярных методов молекулярно-механического и полуэмпирических квантовохимических расчетов для прогнозирования энтальпий образования алифатических полинитросоединений. В данной работе мы использовали экспериментальные данные по теплотам образования 31 алифатического полинитросоединения [364].Построенную нами в результате выполнения работы при помощи программного комплекса EMMA (см.

раздел 8.1) с использованием блока Fragment(см. раздел 8.3) эмпирическую схему расчета энтальпий образования алифатических полинитросоединений можно представить при помощи уравнения (вккал/моль):ΔH 0f = −13.2 − 6.29 f1 − 3.81 f 2 − 4.59 f 3 + 3.13 f 4 + 3.65 f 5 + 6.47 f 6 ,R = 0.9922; s = 2.65; F = 253.5,где f1 – число атомов углерода; f2 – число связей между вторичным и четвертичным атомами углерода; f3 – число связей между первичным и четвертичныматомами углерода; f4 – число пар первичных атомов углерода, присоединенных161к одному четвертичному атому углерода; f5 – количество комбинаций четвертичных атомов углерода и нитро-групп, присоединенных к одному четвертичному атому углерода; f6 – число пар нитро-групп, присоединенных к одномуатому углерода. Дескриптор f1 отражает атомные вклады в теплоту образования, дескрипторы f2 и f3 – вклады связей, а дескрипторы f4, f5 и f6 – поправки наневыгодное взаимодействие определенных групп, присоединенных к одномуатому.Для сравнения были проведены расчеты энтальпий образования этих жесоединений при помощи молекулярно-механического метода MMX (при помощи программы PCMODEL) и эмпирических квантово-химических методовAM1 и PM3 (при помощи программы Hyperchem).

В Табл. 3 приведены значения среднеквадратических ошибок прогноза для каждого из методов. Соответствующие диаграммы разброса приведены на Рис. 32. Для построенной намиаддитивной схеме она оказалась в несколько раз ниже, чем для MMX, AM1 иPM3.Таким образом, из всех рассмотренных методов наилучшие результатыдает применение подструктурных аддитивных схем. Однако область применения подобных схем ограничена теми классами соединений, на которых они были построены. Поэтому проводить прогноз по построенной аддитивной схемеможно только для алифатических полинитросоединений, в остальных же случаях из рассмотренных методов можно рекомендовать только PM3.Табл.

3. Среднеквадратические ошибки прогноза энтальпии образования алифатических полинитросоединенийМетодMMXAM1PM3АддитивнаясхемаСреднеквадратическая21.833.411.62.3ошибка в ккал/моль16250604040Эксперимент2010-60-50-40-30-20-100-10 0-20-30Эксперимент30200-50050100-20-40-40-50-60-60Прогноз по AM160604040200-40-20020-2040ЭкспериментЭкспериментПрогноз по ММХ200-80-60-40-20-2002040-40-40-60-60-80Прогноз по аддитивной схемеПрогнози по PM3Рис.

32 Диаграммы разброса для прогнозирования энтальпии образования алифатических полинитросоединений разными методами (в ккал/моль)5.2.3. Прогнозирование магнитной восприимчивости органических соединенийМагнитная восприимчивость – величина, характеризующая связь намагниченности вещества с магнитным полем в этом веществе. Намагниченностьвещества, J, прямо пропорциональна напряженности поля, H, вызывающегонамагничивание: J=χH, где χ - величина, называемая магнитной восприимчивостью вещества [365]. Поскольку магнитная восприимчивость является тензорной величиной, то, строго говоря, моделируемой величиной является инвариант этого тензора – среднее значение его диагональных членов (одна треть отследа матрицы тензора).Одним из наиболее простых и распространенных методов расчета магнитной восприимчивости является аддитивный способ, основанный на сум163мировании атомных и связевых вкладов (инкременты Паскаля) [366], а такжесхемы, учитывающие связевые взаимодействия [367].

Описаны также квантовохимические подходы, как относительно простые [368], так и метод DFT [369].Поскольку QSAR/QSPR метод успешно применялся для моделированиябольшого числа физико-химических свойств, то было бы также интересно использовать его для расчета магнитной восприимчивости. В литературе имеютсяданные по расчету магнитной восприимчивости с помощью основанного натеории графов подхода [367, 370], спектральных моментов топологическойматрицы связей [268], а также для элементоорганических галоидопроизводныхэлементов четвертой группы на основе топологических индексов [370].В данной работе мы исследовали применение фрагментных дескрипторов, генерируемых блоком FRAGMENT (см.

раздел 8.3), для прогнозированиямагнитной восприимчивости диамагнетиков.Составление баз данных. В качестве модельной базы экспериментальных данных по магнитной восприимчивости (База 1) были выбраны данныеработы [268]. Они включают обучающую выборку из 233 алифатических и 85ароматических соединений и контрольную выборку из 20 алифатических и 20ароматических соединений (всего 358 структур). Хотя часть данных по ароматическим структурам (28 соединений) в работе [268] была вынесена в отдельную таблицу, мы решили использовать эти данные совместно с данными Базы 1и включили их в выборку, в результате чего была сформирована База 2, котораяпосле исключения дубликатов составила 378 структур.

Далее мы сформировалиБазу 3 за счет дополнения Базы 2 некоторыми литературными данными по магнитной восприимчивости. Во-первых, мы использовали данные работы [370] помагнитной восприимчивости органических галогенпроизводных с целью увеличения набора уже имеющихся в базе структур такого типа. Именно эти соединения не очень хорошо моделировались в работе [268].

Во-вторых, мы дополнили базу данными по гетероциклическим соединениям, взятыми из источников [371-373]. Наконец, в базу были добавлены два примера циклопропановых структур, чтобы убедиться в способности модели работать с напряженными структурами.164Построение QSPR-моделей. QSPR-моделирование проводили с использованием QSAR программ EMMA (см. раздел 8.1) и NASAWIN (см. раздел 8.2).При работе с программой EMMA сначала рассчитывали все фрагментные (максимальный размер фрагментов до 6 атомов) и два дополнительных дескриптора(см. ниже), далее формировали обучающую и контрольную выборки, и на основе пошаговой регрессии и предварительного отбора из групп взаимно скоррелированных (R>0.9) дескрипторов тех, которые наилучшим образом коррелируют с моделируемым свойством, строили QSPR-модели.Прежде всего, мы решили повторить результаты работы [268], но с использованием фрагментных дескрипторов.

Характеристики

Список файлов диссертации

Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6372
Авторов
на СтудИзбе
309
Средний доход
с одного платного файла
Обучение Подробнее