Главная » Просмотр файлов » Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов

Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (1097754), страница 39

Файл №1097754 Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов) 39 страницаМоделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (1097754) страница 392019-03-13СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 39)

[418, 421] (в данном случае нейросеть с обратнымраспространением ошибки применяли в комбинации с электротопологическимииндексами), а также работа Тетте (Tatteh) и др. [386] (нейросеть функции радиального базиса сочетали с топологическими индексами). В работах [418-421]база данных содержала 298 органических соединений со специально отобранными высокоточными экспериментальными данными, однако в качестве результатов были приведены характеристики лишь одной «лучшей» модели(RMSEt = 5,4оС и RMSEv = 5,9оС), что ставит под вопрос статистическую достоверность результатов.

Как оказалось, сравнить полученные нами результатыможно лишь с данными работы [386]. Для меньшей по размере и менее разнообразной выборки Тетте и др. были получены следующие статистические показатели: RMSEt = 11,4oC, RMSEv = 15,1oC и RMSEp = 19,4oC, что хуже результирующих данных по моделированию, полученных нами.6.4. Прогнозирование температуры плавления ионных жидкостейТемпература плавления является одним из наиболее сложных для прогнозирования свойств химических соединений, далеко не полный список причинчего включает: плохая воспроизводимость экспериментальных данных, зависимость от типа кристаллической упаковки, сосуществование нескольких аллотропных модификаций кристаллов, зависимость от наличия микропримесей,существование эвтектик, возможность затвердевания в аморфное либо жидкокристаллическое состояния и др.

В то же время, температура плавления является важнейшей технической характеристикой, которая определяет сферу применения ионных жидкостей – материалов, широко используемых в качестве экологически-безопасных растворителей в химической промышленности. Именнопоэтому это «тяжелое» свойство является удобным объектом для сравненияразличных методик построения QSPR-моделей.Мы приняли участие в совместном исследовании, проведенном несколькими группами авторов, в ходе которого широкий набор современных методов223машинного обучения (ассоциативные нейронные сети, машины опорных векторов, метод ближайших соседей, метод частичных наименьших квадратов, нейронные сети обратного распространения и множественная линейная регрессия),реализованные в нескольких программных комплексах (VCCLAB, ISIDA иNASAWIN [см.

раздел 8.2]), в сочетании с разнообразными типами дескрипторов (несколько типов фрагментных дескрипторов, псевдофрагментные дескрипторы типа FRAGPROP [см. разделы 5.4 и 8.4], дескрипторы на основе электроно-топологических состояний атомов, а также все виды дескрипторов, генерируемых программой DRAGON) были впервые применены для обработкибольших и структурно разнородных баз по температурам плавления ионныхжидкостей [401].В данной работе были построены QSPR-модели для четырех выборок (см.Рис. 48), включающих: (1) 126 бромидов производных пиридинов (PYR, IV иV); (2) 384 бромидов производных имидазолов и бензимидазолов (IMZ, VI иVII); (3) 207 бромидов четвертичных аммониев (QUAT, VIII); (4) 717 соединений, входящих во все вышеупомянутые наборы (FULL).R2R2R1R1R2R1NNR4N+ R2R2NN++R3Br-R1IVN+Br-Br-N+Br-VIBr-R3R1VR3VIIVIIIРис. 48. Структуры ионных жидкостейОценка прогнозирующей способности построенных моделей проводиласьпри помощи процедуры 5-кратного внешнего (т.е.

при котором информация изконтрольных выборок никак не может участвовать в отборе лучших моделей)скользящего контроля по трем показателям (Q2, RMSE, MAE) для четырех выборок. В нашей части этой большой совместной работы в качестве методов машинного обучения мы использовали реализованные в программном комплексе224NASAWIN (см.

раздел 8.2) нейросети обратного распространения (BPNN, см.подраздел 1.2.4), метод БПМЛР (FSMLR, см. подраздел 4.1.5) и метод частичных наименьших квадратов (PLS), а в качестве дескрипторов – набор фрагментных дескрипторов, вычисляемых блоком FRAGMENT (см.

раздел 8.3), ккоторым был примешен набор псевдофрагментных дескрипторов (см. раздел5.4), вычисляемых блоком FRAGPROP (см. раздел 8.4). Использование псевдофрагментных дескрипторов было обусловлено тем, что как показали предварительные вычислительные эксперименты, они в данном случае значительно повышают прогнозирующую способность построенных моделей. Кроме того,следует отметить, что обучение нейросети велось на полном наборе дескрипторов (попытки использовать процедуру БПМЛР для их предварительного отборазаканчивались значительным падением прогнозирующей способности модели).Вследствие этого всякий раз проводился визуальный контроль синапсов нейросети и в случае «паралича» процедура обучения вручную останавливалась и перезапускалась заново.

В Табл. 18 представлены значения средней абсолютнойошибки прогнозирования (MAE), вычисленной при 5-кратном внешнем скользящем контроле. Отметим, что нейросеть обратного распространения приводитк построению лучших моделей по сравнению с БПМЛР и методом частичныхнаименьших квадратов PLS.Табл. 18. Значения средней абсолютной ошибки прогнозирования температурыплавления ионных жидкостей (в градусах)PYRIMZQUATFULLBPNN26.232.430.331.5FSMLR34.836.236.133.7PLS32.531.931.831.9Для сравнения QSPR-моделей, получаемых разными методами, каждойкомбинации выборки и статистического показателя оценивалось среднее значение этих показателей, и каждой модели присваивался ранг “0”, если по всемтрем показателям она оказывалась лучше средней, и “1” если хотя бы по одному показателю она уступала среднему.

Далее ранги полученных моделей скла225дывались, и результирующее число было использовано для сравнения методикпостроения QSPR-моделей. В Табл. 19 представлены полученные значения рангов для различных методов построения QSPR-моделей.Табл. 19. Сравнение различных методов построения QSPR-моделей дляпрогнозирования температуры плавления ионных жидкостейМетодBPNNASNN/E-countsASNN/DragonSVM/DragonSVM/E-stateSVM/E-countsASNN/E-statePLSMMLR/DragonMLR-CM/SMFkNN/DragonFSMLRkNN/E-stateMLR/E-statekNN/E-countsMLR/E-countsПрограммаNASAWINVCCLABVCCLABVCCLABVCCLABVCCLABVCCLABNASAWINVCCLABISIDAVCCLABNASAWINVCCLABVCCLABVCCLABVCCLABQ20000001223343344RMSE0000011123343444MAE0000111222344444Итого000012356891210111212Как видно из Табл. 19, нейросеть обратного распространения BPNN, реализованная в рамках программного комплекса NASAWIN, занимает первые дваместа наряду с ASNN/E-counts.

Если учесть, что ASNN построена на основенейросетей обратного распространения, а дескрипторы E-counts являютсяфрагментными, то можно сделать вывод, что именно комбинация нейросетейобратного распространения с фрагментными дескрипторами приводит к построению наилучших моделей для прогнозирования температуры плавленияионных жидкостей.226ГЛАВА 7. РАЗРАБОТКА ИНТЕГРИРОВАННЫХ ПОДХОДОВДанная глава посвящена рассмотрению предложенных нами подходов,которые включают разного рода интеграцию нейросетей: (а) с методами молекулярного моделирования; (б) с комбинацией дескрипторных описаний одно– имногокомпонентных химических систем и внешних условий; а также (в) междусобой.

Все это ведет к значительному расширению круга свойств химическихсоединений, поддающихся надежному прогнозированию с использованием разрабатываемых нами методов.7.1. Совместное применение методологии искусственных нейронных сетей иметодов молекулярного моделированияНа современном этапе научно-технического развития определяющуюроль играет практическое использование сложных молекулярных и супрамолекулярных систем, что со всей актуальностью ставит задачу прогнозированиявсего комплекса их практически значимых свойств и на основе этого проведение их целенаправленного дизайна.

Не менее актуальной является также задачакомпьютерной обработки накопленных экспериментальных данных, относящихся к подобным системам, и извлечения информации, необходимой для эффективного конструирования новых систем.В настоящее время для решения вышеуказанных задач все большее значение приобретают методы молекулярного моделирования, в основе которыхлежатразнообразныеметодымолекулярно-механическогоиквантово-химического расчета модельных молекулярных систем. Несмотря на успехи вобласти молекулярного моделирования, следует признать, что ни одна даже самая совершенная молекулярная модель неспособна охватить всего комплексавзаимодействий, в которые вовлечена реальная молекулярная система, равнокак и учесть эти взаимодействия с достаточной точностью. Это служит серьезным препятствием к практическому применению многих теоретических моделей.227В связи с этим особую актуальность приобретает проблема соотнесениятеоретически рассчитываемых характеристик молекулярных систем с проявляемыми ими в эксперименте свойствами.

Трудность решения этой проблемыобусловлена тем, что общий вид зависимости неучтенных в модели факторов отучитываемых молекулярных характеристик всегда является неизвестным, чтоявляется препятствием к применению стандартного аппарата математическойстатистики. Вследствие этого прогнозирование с достаточной точностью большинства практически важных свойств на основе теоретических моделей возможно в лучшем случае только внутри очень узкой группы молекулярных систем при помощи упрощенной линейной модели, параметризованной по имеющимся экспериментальным данным. Это делает невозможным применение полученной модели для большинства практически важных систем.Генеральным направлением в решении указанной проблемы нам видитсяиспользование математического аппарата обработки данных, позволяющеговыявлять любые сколь угодно сложные нелинейные зависимости неизвестноговида между теоретически рассчитываемыми молекулярными характеристикамии экспериментальными данными.

Наиболее подходящими для этого являютсяискусственные нейронные сети, которые позволяют проводить “интеллектуальную обработку” экспериментальных данных, содержащихся в химическихбазах данных, выявляя существующие (заранее неизвестные) корреляции между имеющимися экспериментальными и структурными данными, с одной стороны, и прогнозируемыми молекулярными характеристиками, с другой стороны.В данном разделе будет показано на нескольких примерах, что искусственные нейронные сети представляют собой мощный статистический аппаратобработки данных, который, в сочетании с элементами молекулярного моделирования, способен обеспечить надежный прогноз разнообразных свойств сложных молекулярных систем.

Характеристики

Список файлов диссертации

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6384
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее