Главная » Просмотр файлов » Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов

Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (1097754), страница 48

Файл №1097754 Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов) 48 страницаМоделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (1097754) страница 482019-03-13СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 48)

62. Повышение Q2 при переходе к многозадачному обучению взависимости от размера выборкиТаким образом, при дефиците экспериментальных данных многозадачноеобучение приводит к существенному росту прогнозирующей способности моделей «структура-свойство» по сравнению с традиционной методологией построения изолированных моделей.7.4. Нейронное устройство для проведения прямых корреляций «структурасвойство»7.4.1. ВведениеВ настоящее время поиск количественных соотношений между структурами и свойствами органических соединений в значительной мере основан наиспользовании инвариантов молекулярных графов, базисом которых, как былонами показано выше (см. раздел 3.2), являются ФД. Проблемой, однако, является наличие слишком большого числа ФД, что не дает возможность рассматривать их все в процессе моделирования, В определенной мере процедура БПМЛР(см.

подраздел 4.1.5) дает решение этой проблемы за счет предварительного отбора дескрипторов, однако ни одна процедура отбора дескрипторов не может в274принципе гарантировать оптимального решения, поскольку при этом обедняется описание химической структуры. Одним из наиболее перспективных направлений в решении этой проблемы мы видим в том, чтобы вместо отбора дескрипторов из заранее взятого их набора использовать процедуру извлечениянепосредственно из структур химических соединений наиболее ценных для моделирования исследуемого свойства дескрипторов ∗.Это привело нас к разработке альтернативного подхода к проблеме«структура-свойство», основанного на процедуре поиска зависимости исследуемого свойства непосредственно от элементов матрицы смежности молекулярного графа, однозначно идентифицирующей структуру органического соединения, либо, в более общем случае, от элементов матрицы, описывающейсвойства атомов и их пар (например, характеристики связей).

В качестве статистического метода анализа зависимости свойств органических соединений отих структуры нами выбран аппарат искусственных нейронных сетей, посколькус его помощью можно выявлять зависимости между переменными вне рамоккаких-либо заранее выбранных моделей. Универсальность аппроксимирующейспособности в этом случае обеспечивается промежуточным формированиемФД либо псевдофрагментных дескрипторов в процессе анализа структуры.Принципиальным же отличием от сочетания ИНС с ФД является то, что вместоиспользования предварительно отобранных дескрипторов, набор которых скорее всего является неоптимальным, происходит направленное «извлечение»наиболее ценных для построения моделей «структура-свойство» дескрипторовнепосредственно из первичного описания молекул в виде графа.Упомянем несколько подходов, связанных с анализом матрицы смежности молекулярного графа при помощи ИНС.

Эльрод, Маггиора и Тренари [486,487] использовали BE-матрицу Уги-Дугуджи [306] для формального представления химической структуры при нейросетевом прогнозировании реакционной∗В настоящее время вокруг решения подобных задач сформировалось специальное направление в теории машинного обучения, называемое «интеллектуальным анализом структурныхданных» (structural data mining), и, как частный случай, «интеллектуальным анализом графов» (graph mining). Рассматриваемая в данном разделе работа была нами опубликованараньше появления первых публикаций в этом направлении в математической литературе.275способности органических соединений. Расширенная форма этой матрицы былатакже использована Вестом при прогнозировании химических сдвигов на ядрах31P [488]. Для прогнозирования химических сдвигов на ядрах 13C Квасничка ис-пользовал специальную нейронную сеть со структурой, отражающую топологию молекул [489].

Нейронная сеть похожей структуры была также использована Вестом при прогнозировании химических сдвигов на ядрах31P [490]. Вовсех этих исследованиях, однако, проводился анализ только локальных свойств(т.е. свойств, отнесенных к определенному атому в молекуле), и эти подходывряд ли могут быть обобщены на прогнозирование глобальных свойств. Единственным исключением является разработанная Киреевым сеть ChemNet [491],в которой, как и в вышеупомянутых сетях, каждый нейрон соответствует определенному атому в молекуле, а связность нейронов отражает топологию молекул.

Хотя эта сеть позволяет прогнозировать, строго говоря, лишь локальныесвойства, однако автор принял, что атомный инвариант отражает и свойствамолекулы в целом, и поэтому использовал локальные инварианты, вычисляемые нейросетью для определенных атомов в молекуле, для корреляции с глобальными молекулярными свойствами. Тем не менее, полученные в работекорреляции [491] оказались значительно худшего качества по сравнению дажес линейно-регрессионными моделями при использовании топологических индексов в качестве дескрипторов.7.4.2.

Описание нейронного устройстваВ настоящей работе мы предлагаем схему нейронного устройства, специально предназначенного для поиска зависимости свойств органических соединений непосредственно от их структур без предварительного вычисления заранее заданного набора инвариантов молекулярных графов.

Вместо молекулярных дескрипторов, инвариантных к перенумерации атомов в химической структуре, мы используем числа, описывающие характеристики атомов и атомныхпар (в том числе связей) внутри молекулы. В предлагаемом подходе необходимая инвариантность прогнозируемых значений свойства относительно перену276мерации атомов достигается не за счет предварительного сворачивания матрицы смежности молекулярного графа в набор инвариантов, а благодаря особенностям конструкции нейронного устройства.Рис. 63. Архитектура нейронного устройства для проведения прямых корреляций структура-свойствоКак и всякая нейронная сеть, предлагаемое устройство состоит из нейронов (функциональных устройств, осуществляющих преобразования сигналов) исети связей между ними (синапсов), через которые они посылают друг другусигналы.

Так же, как и в других типах искусственных нейронных сетей, каждыйсинапс характеризуется числом (весом синапса), на которое умножается сигналпо прохождению через него. Каждый нейрон совершает 2 операции: 1) сумми277рует все пришедшие к нему сигналы; 2) формирует выходной сигнал путемфункционального преобразования полученной суммы:oi = f (−θ i + ∑ o jωij ) ,(90)jгде oi – выходной сигнал нейрона i, oj – выходной сигнал нейрона j, ωij – вес синапса, через который проходит сигнал, θi – порог активации нейрона, f – активационная функция, имеющая обычно сигмоидный вид:f ( x) = 1 /(1 + exp(− x)) .(91)Обучение нейронного устройства заключается в нахождении таких весовсинапсов и порогов активации нейронов, чтобы по предъявлению на ее входсигналов, описывающих химическую структуру, на ее выходе формировалисьсигналы, соответствующие прогнозируемым значениям свойств этого соединения.Предлагаемая нами нейросетевая конструкция состоит из трех основныхфункциональных блоков: 1 – «мозга», 2 – набора «глаз» и 3 – единого «сенсорного поля» (см.

Рис. 63). Информация о химической структуре воспринимается«сенсорным полем». Далее она поступает в «глаза» и подвергается обработке, впроцессе которой формируется набор сигналов, числовые значения которых независят от нумерации атомов в молекуле. Эти сигналы далее поступают в«мозг» для окончательной обработки, на выходе из которого формируются сигналы, соответствующие прогнозируемым значениям свойств для данного химического соединения. Таким образом, как и в традиционном подходе, промежуточно формируется набор инвариантов молекулярных графов, однако эти инварианты не являются заранее заданными и фиксированными, а «подстраиваются» под прогнозируемые свойства в процессе обучения.Рассмотрим отдельные части этой системы.

«Сенсорное поле» представляет собой квадратную матрицу, номера строк и столбцов которой соответствуют номерам атомов в химическом соединении. Размер «сенсорного поля» определяется максимальным числом неводородных атомов в рассматриваемыххимических структурах. Сенсоры, расположенные на диагонали матрицы(атомные сенсоры) на пересечении i-ой строки с i-ым столбцом формируют на278бор сигналов, соответствующих характеристикам i-ого атома в химическойструктуре. Такими характеристиками могут быть номер строки и столбца соответствующего элемента в Периодической системе Менделеева, заряд атома,число присоединенных к нему атомов водорода, значение электроотрицательности и т.д.

Сенсоры, расположенные вне диагонали на пересечении i-ой строки с j-ым столбцом (i ≠ j) сенсорной матрицы, формируют сигналы, характеризующие отношение между атомами i и j в химической структуре: порядок связи(если эти атомы связаны), вхождение связи в цикл, расстояние (топологическоелибо геометрическое) между атомами и т.д.Каждый «глаз» состоит из: 1) одного или нескольких «коллекторов» и 2)набора идентичных «рецепторов». Сформированные в «сенсорном поле» сигналы поступают на вход «рецепторов».

Характеристики

Список файлов диссертации

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6418
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее