Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (1097754), страница 50
Текст из файла (страница 50)
Описанное выше нейронноеустройство с минимальной конфигурацией, приведенной на Рис. 66, было ис285пользовано в этом вычислительном эксперименте. Для обучения нейронногоустройства было применено «обобщенное дельто-правило» [41] в рассмотренной выше модификации, параметр скорости обучения был взят равным 0.05, апараметр момента – 0.9 (см. [41]). Обучение было прекращено по достижениюзначения коэффициента корреляции между предсказанными и экспериментальными значениями температуры кипения равного 0.994 (когда значения коэффициента корреляции и среднеквадратичных ошибок на обоих выборках перестали меняться).
Эта величина больше любого коэффициента корреляции, которыйбыл достигнут на этой же выборке при использовании какого-либо одного топологического индекса в качестве молекулярного дескриптора, но сравнима скоэффициентами корреляции, которые на этой выборке могут быть полученыпри помощи множественной линейной регрессии сразу с несколькими топологическими индексами.
Этот же вывод можно было бы сделать и при рассмотрении среднеквадратичных ошибок на обеих выборках (5.2 градуса на обучающейвыборке и 5.1 градус на контрольной выборке). Тем не менее, этот результатхуже того, который был ранее нами достигнут для температуры кипения алканов при использовании стандартного многослойного персептрона и набора топологических индексов либо фрагментных дескрипторов [406]. Кроме того,обучение нейронного устройства происходило крайне медленно (несколько часов на компьютере Pentium-100).Для поиска путей улучшения работы нейронного устройства мы изучиливлияние его архитектуры на производительность.
Оказалось, что число «коллекторов» внутри каждого «глаза» существенным образом влияет на время (несколько минут вместо часов на компьютере Pentium-100) и на качество обучения. При использовании той же самой архитектуры нейронного устройства, нос пятью «коллекторами» внутри каждого из двух «глаз», было достигнуто оченьвысокое значение коэффициента корреляции, равное 0.9994, и очень низкиесреднеквадратичные ошибки на обучающей (1.6 градусов) и на контрольной(2.4 градуса) выборках. Подобная прогнозирующая способность находится науровне лучших результатов, которые были когда-либо достигнуты для температуры кипения алканов. Тем не менее, дальнейшее увеличение числа «коллекто286ров» ведет к ухудшению прогнозирующей способности нейронного устройства,по-видимому, вследствие неоправданного увеличения числа настраиваемых параметров при небольшом размере обучающей выборки.При изучении работы нейронного устройства мы также обнаружили, чтоскорость и стабильность обучения можно существенно улучшить при использовании отдельных значений параметра скорости обучения для «мозга» и«глаз».
Как оказалось, для стабильного обучения необходимо, чтобы параметрскорости обучения для «глаз» был на порядок меньше, чем для «мозга». Что жекасается абсолютных значений параметра фактора обучения для «мозга», то0.25 в начале и 0.05 в конце обучения являются, по-видимому, оптимальными.Вязкость углеводородов. В следующем примере выборка, состоящая из81 представителя разнообразных углеводородов С6-С21 [504] (циклических иациклических, насыщенных и ненасыщенных, ароматических и алифатических)была использована для построения нейросетевой модели, позволяющей прогнозировать их вязкость при 40 оС.
Как и в предыдущем случае, выборка была разбита на обучающую (65 соединений) и контрольную (16 соединений) выборки.Нейронное устройство, содержащее «мозг» с двумя скрытыми нейронами иодин глаз E2 с тремя скрытыми нейронами в каждом «рецепторе» и пятью«коллекторами», было выбрано для этого исследования. После 1100 эпох обучения коэффициент корреляции стал 0.996, среднеквадратичная ошибка на обучающей выборке достигла 0.15 сантипуаз, а на контрольной выборке – 0.18 сантипуаз. Подобные статистические показатели по предсказанию вязкости углеводородов до сих пор являются, по-видимому, одними из лучших.Теплота испарения углеводородов. В следующем примере выборка из267 углеводородов C4-C26 [505] (как и в предыдущем примере, циклических иациклических, насыщенных и ненасыщенных, ароматических и алифатических)была использована для обучения нейронного устройства прогнозированию теплоты испарения.
Из этой выборки 54 соединения были случайным образом отобраны в контрольную выборку, тогда как оставшиеся 213 соединений образовали обучающую выборку. Нейронное устройство, содержащее «мозг» с тремяскрытыми нейронами и два «глаза», E1 и E2, каждый из которых содержит по287три скрытых нейрона и три «коллектора», было применено в этом исследовании. Как и во всех предыдущих примерах, «сенсорное поле» состояло только изсенсоров NH, формирующих сигналы, соответствующие числу атомов водорода, присоединенных к соответствующему атому.
Поскольку не наблюдалось«переучивание», обучение было остановлено через 2600 эпох, когда статистические показатели модели перестали меняться, и обученное нейронное устройство обеспечивало коэффициент корреляции 0.996 и среднеквадратичнуюошибку 1.44 кДж/моль на обучающей выборке и 1.26 кДж/моль на контрольнойвыборке. В данном случае прогнозирующая способность нейронного устройства оказалась лучше, чем у ранее опубликованной модели, построенной по этимже данным [505].Плотность жидких углеводородов. В следующем примере нейронноеустройство было обучено прогнозировать плотность жидких углеводородов.Выборка из 141 углеводорода C5-C8 [504] (насыщенные и ненасыщенные, циклические и ациклические, ароматические и алифатические) была случайно разбита на обучающую выборку из 113 соединений и контрольную выборку из 28соединений.
В этом исследовании было применено нейронное устройство, содержащее «мозг» с пятью скрытыми нейронами и два «глаза», E1 и E2, каждыйиз которых содержит по пять скрытых нейронов в каждом из рецепторов и пятьколлекторов. Тип «сенсоров» был тот же, что и в предыдущих примерах. После1700 циклов обучения значение коэффициента корреляции достигло 0.971, асреднеквадратичная ошибка стала 0.018 г/см3 на обучающей выборке и 0.019г/см3 на контрольной выборке.
Подобная прогнозирующая способность является очень неплохой.Теплота сольватации разнообразных органических соединений вциклогексане. В отличие от предыдущих случаев, в выборку для данного примера (взятую с работы [505]) вошли органические соединения, принадлежащиек различным классам. В соответствие с общей методикой проведения исследований, исходная выборка была разбита на обучающую, содержащую 112 соединений, и контрольную, содержащую 28 соединений. Кроме того, в соответствиис результатами предварительных исследований, одно из соединений, перфтор288бензол, было отброшено как «аутлайер». В данной работе было использованонейронное устройство, содержащее 3 «глаза»: E1, E2 и E3.
«Глаза» E1 и E2 аналогичны рассмотренным выше, тогда как «глаз» E3 содержит рецепторы, принимающие сигналы от трех атомов, соединенных двумя связями. Чтобы различать типы атомов, в дополнению к использованному во всех предыдущих примерах «сенсор»у NH добавлен еще «сенсор» PQN, который определяет главноеквантовое число соответствующего атома. Как для «мозга» нейронного устройства, так и для всех его «рецепторов», было задано по три скрытых нейрона.
Вкаждое из трех глаз было помещено по три «коллектор»а. После 10000 цикловобучения значение коэффициента корреляции составило 0.990, среднеквадратичная ошибка составила 1.77 кДж/моль на обучающей выборке и 2.46кДж/моль на контрольной выборке. В работе [505] на этой же выборке былоранее показано, что обычно используемые топологические индексы неспособны обеспечить хорошую корреляцию с теплотой сольватации в циклогексане, ипоэтому был разработан специальный сольватационный индекс [505], хорошокоррелирующий с теплотой сольватации в циклогексане (в рамках линейнойрегрессии коэффициент корреляции на всей выборке составляет 0.985, а стандартная ошибка 2.1 кДж/моль). Таким образом, в приведенном примере нейронное устройство оказалось способным составить конкуренцию специальноразработанному под свойство топологическому индексу.Поляризуемость разнообразных химических соединений.
В следующем примере для обучения нейронного устройства была использована выборка[361], содержащая как разнообразные органические соединения (размером до26 неводородных атомов), относящиеся к разным классам, так и простейшиенеорганические соединения, например, N2O, SO2, H2S, O2, N2, NH3, Cl2 и т.д.Исходная выборка была случайно разбита на обучающую (235 соединений) иконтрольную (58 соединений). После серии компьютерных экспериментов мыостановились на нейронном устройстве, содержащем «мозг» с тремя скрытыминейронами и всего один «глаз» E1, содержащий, в свою очередь, «рецепторы» стремя скрытыми нейронами и пять «коллекторов». В «сенсорное поле» былипомещены три вида «сенсоров»: NH, AR и NE.
«Сенсор» NH формирует сигна289лы, соответствующие числу атомов водорода, присоединенных к данному атому, «сенсор» AR формирует сигналы, соответствующие атомному радиусу, а«сенсор» NE формирует сигналы в соответствии с числом электронов в атоме.После 2000 эпох обучения нейронного устройства значение коэффициента корреляции составило 0.995, среднеквадратичная ошибка на обучающей выборке0.86 см3 и на контрольной выборке 0.71 см3. Этот результат значительно лучшевсего того, что удается получить на этой выборке при использовании стандартных топологических индексов в качестве дескрипторов. Хотя в данном случаехороших результатов можно добиться также и при помощи аддитивных схем[506], однако применимость последних ограничена лишь молекулами, все типыатомов или группы которых достаточно представлены в обучающей выборке,тогда как для нейронного устройства это условие необязательно. Именно этимпоследним обстоятельством выражается потенциальное преимущество применения разработанного нами нейронного устройства для прогнозированиясвойств химических соединений по сравнению с использованием аддитивныхсхем или фрагментных дескрипторов.Анестетическое давление газов.