Моделирование свойств химических соединений с использованием искусственных нейронных сетей и фрагментных дескрипторов (1097754), страница 44
Текст из файла (страница 44)
Объединенный набор дескрипторов, состоящийиз полученных в результате модификаций значений наряду с исходными значениями дескрипторов и давления, был подвергнут процедуре отбора наиболеесущественных параметров с помощью процедуры БПМЛР. В результате отбораосталось 346 дескрипторов, причем в этот набор вошли все 5 модификаций параметра «давление».Все характеристики нейросети (за исключением количества входных нейронов) были такими же, что и для модели, использующей немодифицированные дескрипторы в качестве исходных параметров нейросети. Таким образом,была получена нейросетевая модель зависимости температуры кипения углеводородов от их структур и давления со следующими параметрами (см.
такжеРис. 53): число итераций 2374, R = 0.9996, St = 2.7997, Sv = 2.8003.Рис. 53. Результаты нейросетевого моделирования зависимости структура –давление – температура кипения.Для оценки качества прогноза нейросетевой модели произвольно отобрали несколько соединений из контрольной выборки, для которых определилитемпературы кипения в зависимости от давления с помощью номограммы давление – температура [468, стр.
46] (см. Табл. 28). Соединения и давления были251отобраны так, чтобы они попадали в область действия номограммы: температуры кипения при атмосферном давлении должны были принадлежать интервалуот 100 до 700оС; давления - интервалу от 0,01 до 700 мм рт. ст.Таким образом, нейросетевая модель позволяет определять и прогнозировать температуру кипения углеводородов произвольной структуры с более высокой степенью точности, чем широко используемая номограмма, причем дляболее широкого интервала значений давления.Табл. 28.
Сравнительные результаты определения температур кипения (оС)Давление,мм рт. ст.Экспериментальные значенияНейросетеваямодель0,01219,700218,2242-метилгептан1418,05017,89415(117,6471)н-гептакозан25290,400290,629287(427,3001)цис-декагидронафталин3093,00091,23197(195,7001)псевдокумол100103,355101,851100(169,3511)3,4-диметилгексан30087,23086,03585(117,7251)500167,151166,022165(183,4231)Название соединениян-октатриаконтан1,2-диэтил-бензолНомограмма206 (524,9001)1) – экспериментальные температуры кипения при 760 мм рт. ст., использованные при определении температур кипения по номограмме.Хочется отметить также, что значения температур кипения в области глу-бокого вакуума определяются по номограмме с большой погрешностью, в товремя как небольшая ошибка нейросетевого прогноза постоянна во всем диапазоне значений давления.Когда данная работа была полностью завершена, в печати появилась статья [471], в которой авторы приводят результаты нейросетевого моделирования252зависимости давления насыщенных паров от температуры и структуры для 274углеводородов (структуры описывались топологическими индексами и значением молекулярного веса).
Однако число нейронов в скрытом слое нейросети,использованной для проведенного моделирования (29 нейронов), свидетельствует об избыточном количестве настраиваемых параметров модели и ставитпод сомнение прогнозирующую способность этой модели.7.2.2.2.
Моделирование зависимости «структура - температура – плотность»При построении нейросетевой модели были использованы значенияплотности углеводородов разнообразной структуры в температурном интервалеот –180 до 300оС [467, С. 87 - 110]. Для всех структур из исходной выборки были выделены фрагменты с максимальной длиной, равной 4 атомам. Все рассчитанные фрагментные дескрипторы затем были подвергнуты модификациям«квадратный корень из величины», «квадрат величины», «логарифм величины», «обратная величина» и «величина, деленная на количество неводородныхатомов в молекуле». В качестве входных параметров были также использованызначения температур, возведенные в квадрат, и значения температур, деленныена количество неводородных атомов в молекуле.
Объединенный набор дескрипторов, состоящий из полученных в результате модификаций значений наряду с исходными значениями дескрипторов и температур, был подвергнут процедуре отбора наиболее существенных параметров с помощью метода БПМЛР(см. подраздел 4.1.5). В результате отбора осталось 478 дескрипторов.Исходная выборка соединений, содержащая 3056 записей структура –температура - плотность, была разбита случайным образом на обучающую(2751 запись) и контрольную (305 записей) подвыборки. В работе была использована трехслойная нейросеть с 10 скрытыми нейронами.
Она обучалась по методу устойчивого распространения ошибки с коэффициентами уменьшения иувеличения шага, равными соответственно 0,5 и 1,2. Таким образом, была получена нейросетевая модель зависимости плотности углеводородов от ихструктуры и температуры со следующими параметрами (см.
также Рис.25354):число итераций 9950, R = 0.9977, RMSEt = 0,0063, RMSEv = 0,0063, где R –коэффициент корреляции между предсказанными и экспериментальными значениями, RMSEt и RMSEv – абсолютные среднеквадратичные ошибки дляобучающей и контрольной выборок (г/мл).Рис. 54. Результаты нейросетевого моделирования зависимости структура –температура - плотностьТаким образом, нейросетевая модель позволяет определять и прогнозировать плотность углеводородов произвольной структуры при произвольных значениях температуры с высокой степенью точности.7.2.2.3.
Моделирование зависимости «структура - температура – динамическаявязкость»При построении нейросетевой модели были использованы значения динамической вязкости (в сантипуазах) углеводородов разнообразной структурыв температурном интервале от –180 до 300оС [467, С. 136 - 159]. Для всехструктур из исходной выборки были выделены фрагменты с максимальнойдлиной, равной 4 атомам. Все рассчитанные фрагментные дескрипторы и значения температур затем были подвергнуты модификациям «квадрат величины»,«логарифм величины», «обратная величина» и «величина, деленная на количество неводородных атомов в молекуле».
Значения динамической вязкости углеводородов были прологарифмированы.254Объединенный набор дескрипторов, состоящий из полученных в результате модификаций значений наряду с исходными значениями дескрипторов итемператур, был подвергнут процедуре отбора наиболее существенных параметров с помощью метода БПМЛР (см.
подраздел 4.1.5). В результате отбораосталось 307 дескрипторов. Исходная выборка соединений, содержащая 3426записей, была разбита случайным образом на обучающую (3084 записи) и контрольную (342 записи) подвыборки.В работе была использована трехслойная нейросеть с 10 скрытыми нейронами. Она обучалась по методу устойчивого распространения ошибки с коэффициентами уменьшения и увеличения шага, равными соответственно 0,5 и1,2. Таким образом, была получена нейросетевая модель зависимости динамической вязкости углеводородов от их структур и температуры со следующимипараметрами (см.
также Рис 55): число итераций 10387, R = 0,9949, St = 0,1411,Sv = 0,1642, где R – коэффициент корреляции между спрогнозированными иэкспериментальными значениями, RMSEt и RMSEv – абсолютныесреднеквад-ратичные ошибки для обучающей и контрольной выборок (натуральный логарифм значения динамической вязкости).Рис. 55. Результаты нейросетевого моделирования зависимости структура –температура - логарифм динамической вязкости.255Таким образом, нейросетевая модель позволяет определять и прогнозировать динамическую вязкость углеводородов произвольной структуры при произвольных значениях температуры с высокой степенью точности.7.2.3. Построение и анализ нейросетевых зависимостей «структура – условияреакции – константы скорости» для реакции кислотного гидролиза сложныхэфиров карбоновых кислотКинетика и механизмы кислотного гидролиза сложных эфиров карбоновых кислот уже давно привлекают внимание исследователей.
На базе именноэтой реакционной серии Гамметтом было предложено уравнение для количественного описания электронных эффектов заместителей для пара- и метазамещенных фенилов. Позднее Тафт использовал эту серию для описания стерических эффектов заместителей.
К настоящему времени накоплен большойобъем данных по константам скоростей реакций и их зависимости от температуры и параметров среды для широкого спектра структур сложных эфиров[397]. В литературе [397] были предложены следующие возможные механизмыреакции гидролиза - ацильный (AAc2) и алкильный (AAlk1) (Рис. 56).AAc2:OC OR2 + H+ + H2OR1k1R1OHK1R1CO+ R2OHHk1R1COOH + R2OH + H+C+(OH)2 + R2OHAAlk1:OR1C OR2 + H+K2OR1CO+ R2k2Hk2R1COOH + R2++H2OR1COOH + R2OH + H+Рис.
56. Возможные механизмы реакции кислотного гидролиза сложных эфиров карбоновых кислот256Оба механизма включают 2 стадии: 1-ая стадия - равновесная, 2-ая стадия- необратимая. На первой обратимой стадии реакции происходит протонирование эфирного атома кислорода, а на 2-ой стадии – гетеролитический разрывсвязей. Предложенные механизмы различаются типом разрыва связей: дляацильного механизма характерен разрыв связи между карбонильным углеродоми эфирным кислородом, в то время как при протекании реакции по алкильномумеханизму разрыв происходит по связи эфирный кислород – атом углеродаэфирного остатка. В обоих механизмах присутствует стадия гидратации, но дляацильного механизма гидратация происходит на стадии образования реакционного комплекса, а для алкильного механизма – на стадии, следующей за распадом реакционного комплекса.Общая скорость процесса зависит от исходной концентрации сложногоэфира и значения pH. В качестве катализатора выступает соляная кислота. Константы скоростей для предложенных механизмов вычисляются следующим образом:AAc2:kAB = K1k1aH2OAAlk1:kAB = K2k2Оба рассмотренных механизма вносят свой вклад в протекание реакции, иописываются суммарной схемой: kAB = K1k1aH2O + K2k2, где: А = R1COOR2; B =H+;kAB – наблюдаемая константа скорости реакции; K1 и K2 – константы рав-новесия; k1 и k2 – константы скорости для элементарных стадий реакции.Несмотря на большой объем экспериментальных данных, ранее былипредприняты лишь разрозненные попытки линейного моделирования константскоростей гидролиза эфиров для узких серий соединений при постоянных условиях проведения реакции.
Для такого моделирования с успехом может бытьприменено уравнение Гаммета. Так, с помощью этого уравнения были описаныконстантыскоростейкислотногогидролизадлясериибензгидрил-р-нитробензоатов в среде вода-ацетон [472]. Каждое уравнение строилось для серии соединений (число соединений варьировалось от 4 до 7) при заданной температуре и концентрации ацетона.