Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (1097754)
Текст из файла
На правах рукописиБАСКИН Игорь ИосифовичМОДЕЛИРОВАНИЕ СВОЙСТВ ХИМИЧЕСКИХ СОЕДИНЕНИЙ СИСПОЛЬЗОВАНИЕМ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ИФРАГМЕНТНЫХ ДЕСКРИПТОРОВ02.00.17 – математическая и квантовая химияДИССЕРТАЦИЯна соискание ученой степенидоктора физико-математических наукМосква – 2009СОДЕРЖАНИЕСодержание.................................................................................................................. 2Введение....................................................................................................................... 9Глава 1.
Искусственные нейронные сети ............................................................... 131.1. Введение.............................................................................................................. 131.2. Основные принципы нейросетевого моделирования..................................... 141.2.1.
Общая терминология ...................................................................................... 141.2.2. Нейрон МакКаллока-Питтса .......................................................................... 151.2.3. Персептрон Розенблатта.................................................................................
171.2.4. Нейросети обратного распространения (backpropagation).......................... 191.2.5. Другие архитектуры нейронных сетей ......................................................... 341.3. Основные принципы применения искусственных нейронных сетей дляпрогнозирования свойств химических соединенй................................................. 601.4. Ограничения искусственных нейронных сетей .............................................. 62Глава 2. Фрагментные дескрипторы в поиске зависимостей структура-свойство.....................................................................................................................................
632.1. История фрагментных дескрипторов............................................................... 632.2. Типы фрагментных дескрипторов.................................................................... 672.2.1. Классификация по типам молекулярных графов......................................... 672.2.2. Классификация по типам молекулярны структур .......................................
872.2.3. Классификация по типам значений дескрипторов ...................................... 902.2.4, Класификация по типам дескрипторных наборов....................................... 912.2.5. Классификация по связности фрагментов.................................................... 9622.2.6. Классификация по уровням детализации молекулярных графов .............. 972.2.7. Фрагментные дескрипторы с выделенными атомами............................... 1002.3. Ограничения фрагментных дескрипторов..................................................... 101Глава 3. Математическое обоснование выбранного подхода ............................ 1033.1.
Химическая значимость поиска базиса инвариантов помеченных графов 1033.2. Две основные теоремы о базисе инвариантов графов.................................. 1053.3. Теоретические основы сочетания искусственных нейронных сетей ифрагментных дескрипторов ................................................................................... 108Глава 4. Разработка нейросетевых подходов .......................................................
1114.1. Подход к решению проблемы «переучивания» нейронных сетей.............. 1114.1.1. Суть эффекта «переучивания» нейросетей ................................................ 1114.1.2. Методы предотвращения «переучивания» нейросетей ............................ 1134.1.3. Трехвыборочный подход.............................................................................. 1154.1.4. Процедура двойного скользящего контроля ..............................................
1164.1.5. Быстрая пошаговая множественная линейная регрессия ......................... 1184.2. Подход к интерпретации нейросетевых моделей ......................................... 1194.3. Концепция обучаемой симметрии.................................................................. 129Глава 5.
Разработка фрагментных подходов........................................................ 1425.1. Принципы построения и генерации фрагментных дескрипторов .............. 1425.1.1. Типы фрагментов .......................................................................................... 1435.1.2. Иерархическая классификация атомов во фрагментах ............................. 1455.1.3. Построение фрагментного дескриптора .....................................................
1535.1.4. Генерация кодов фрагментов с обобщенными типами атомов................ 15435.1.5. Алгоритм генерации фрагментных дескрипторов..................................... 1565.2. Примеры прогнозирования физико-химических свойств органическихсоединений с использованием фрагментных дескрипторов и линейнорегрессионных моделей.......................................................................................... 1585.2.1. Прогнозирование поляризуемости органических соединений ................ 1595.2.2. Прогнозирование энтальпий образования алифатическихполинитросоединений ............................................................................................ 1615.2.3. Прогнозирование магнитной восприимчивости органических соединений...................................................................................................................................
1635.2.4. Прогнозирование энтальпии парообразования органических соединений................................................................................................................................... 1695.2.5. Прогнозирование энтальпии сублимации органических соединений..... 1715.2.6. Прогнозирование температуры вспышки органических соединений ..... 1765.2.7. Прогнозирование сродства азо- и антрахиноновых красителей кцеллюлозному волокну...........................................................................................
1805.3. Фрагментные дескрипторы с «выделенными» атомами.............................. 1835.3.1. Прогнозирование химических сдвигов в 31P ЯМР спектрах замещенныхмонофосфинов ......................................................................................................... 1855.3.2. Прогнозирование способности аналогов 1-[(2-гидроксиэтокси)-метил]–6(фенилтио)тимина (HEPT) ингибировать обратную транскриптазу вирусаВИЧ-1........................................................................................................................ 1875.3.3.
Прогнозирование констант скорости гидролиза эфиров карбоновыхкислот ....................................................................................................................... 18945.4. Псевдофрагментные подходы. FRAGPROP. Прогнозирование физическихсвойств полимеров .................................................................................................. 191Глава 6.
Сочетание искусственных нейронных сетей и фрагментныхдескрипторов ........................................................................................................... 1986.1. Первые свидетельства эффективности совместного использованияискусственных нейронных сетей и фрагментных дескрипторов....................... 1986.2.
Прогнозирование физико-химических свойств органических соединений сиспользованием фрагментных дескрипторов и нейросетевых моделей ........... 2036.3. Моделирование физических свойств органических жидкостей в рамкахпроцедуры трехвыборочного скользящего контроля.......................................... 2046.3.1. Общая методология моделирования ...........................................................
2056.3.2. Моделирование вязкости органических соединений ................................ 2076.3.3. Моделирование плотности жидких органических соединений ............... 2136.3.4. Моделирование давления насыщенных паров........................................... 2166.3.5. Моделирование температуры кипения разнородных органическихсоединений............................................................................................................... 2186.4. Прогнозирование температуры плавления ионных жидкостей .................. 223Глава 7.
Разработка интегрированных подходов................................................. 2277.1. Совместное применение методологии искусственных нейронных сетей иметодов молекулярного моделирования............................................................... 2277.1.1. Предсказание положения длинноволновой полосы поглощениясимметричных цианиновых красителей. .............................................................. 22957.1.2. Оценка значений констант ионизации для различных классоворганических соединений ......................................................................................
2337.1.3. Моделирование мутагенной активности замещенных полициклическихнитросоединений с помощью искусственных нейронных сетей ....................... 2387.1.4. Прогнозирование констант заместителей с использованиемискусственных нейронных сетей и квантово-химических дескрипторов......... 2457.2.
Корреляции структура-условия-свойство ..................................................... 2467.2.1. Концепция построения нейросетевых зависимостей структура – условия –свойство.................................................................................................................... 2467.2.2. Построение и анализ нейросетевых зависимостей структура-условиесвойство для физико-химических свойств углеводородов.................................
Характеристики
Тип файла PDF
PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.
Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.