Полак__Применение_вычислительной_математики_в_химической_и_физической_кинетике (972294), страница 20
Текст из файла (страница 20)
При увеличенииЯ(0) на каком-либо шаге интерполяцией определяются координаты наиболее низкой точки, в которой необходимо найти новое направление движения. Ход спуска ясен из рис. 29, иллюстрирующего случай двух параметров. Окончание Рис. 29. Движение к минимуму суммы квадратов отклонений о (Ог, Ов) методом крутого спуска циэры на кривых — номера последаватспьнмх шагов спуска; ог — точки минимума на папранлеиннх крутого спуска; 3! — точка ума З <Ео Е,) расчетов определяется величиной производных дЯ (О)/00;. Различные подходы к машинной реализации такой проверки обсу>кдаются в работах [51, 55, 55а, 561.
Если число отыскиваемых параметров невелико (р ~( 4), то для локализации минимума применяют квадратическую аппроксимацию Я (О) по О [10, 541. Метод крутого спуска, впервые примененный к задачам химической кинетики в 1956 г. [541, использовали для изучения кинетики процессов окисления бутенов в малеиновой ангидрид !181, получения фталевого ангидрида и каталитического риформинга бензиновых фракций нефти [211. Это метод применяли также для определения констант устойчивости медных комплексов ряда дипептидов [241. б) Метод градиента и его модификации. Основное отличие метода градиента от метода крутого спуска заключается в том, что определение направления движения к минимуму Я (О) производится на каждом шаге спуска. При этом составляющие градиента, как правило, нормируют (14) Последовательные значения параметров О; находятся по формуле (15) (] =1,2,..., р), где а — шаг в направлении спуска; т — номер итерации.
Выбор пгага а обсуждается в статьях [51, 55]. Для ускорения сходимости итераций в условиях плохо выраженного минимума предложен ряд модификаций, аналогичных методу оврагов ]51, 55]. Градиентные методы разрабатывались в основном в Институте физической химии им. Карпова и были применены для изучения кинетики окислительного аммонолиза пропилена [16, 29, 55] и гидрирования бензола ]22, 23, 57!.
В работе [58] рассмотрена модификация метода градиента, которая, по данным [48], обеспечивает более быструю сходимость процесса вычислений. При атом составляющие градиента находят по формуле р аг=(1+О]) ~з(~) ~Х ~(1+О!) ~~~(О]~'~ " 1=-1 г (] = 1, 2, ..., р). (16) * См. стр. 105 настоящей книги. 95 Выбор шага спуска производится автоматически, в зависимости от угла между последовательными направлениями движения (см. [58], а также стр.
103). Эта модификация метода градиента была использована для определения констант скоростей изомеризации и окислительного дегидрирования бутенов в дивинил [59, 60!. Она применялась также для осуществления градиентных спусков при изучении методом оврагов кинетики радиационного изотопного обмена дейтерия с гидроксильными группами силикагеля [61] и кинетики превращения смеси трет-бутилфенолов и фенола [62]з. Применяя градиентные методы поиска констант скоростей на аналоговых вычислительных машинах, приходится находить направление движения вручную [18].
Иногда обсуждение направления очередного шага проводится физико-химиками и при вычислениях на цифровой машине ]63]. Такой подход целесообразен лишь в тех случаях, когда на определение всех производных дЯ (О)/дО~ затрачивается значительное машинное время ( — 1 час). в) Метод сопряженных градиентов. Направление спуска на (т + 1)-м шаге можно выбирать в зависимости от того, какое направление было на предыдущем шаге т.
В методе сопряженных градиентов вектор очередного на- правления движения Х) выбирается таким образом, чтобы вектор градиента в (т + 1)-й точке был перпендикулярен 11'„, г .1'.» а „,=О, (17) где Т обозначает транспонирование. Вектор Х> находится по формуле $с Р +)а (18) где ЦС// — длина вектора С. В начальной точке принимают .Ов= — С . Последовательные значения параметров О; находятся по формуле О; " = О; + а в); (в ==.
1, 2,..., р), (19) г) Метод нелинейных оценок. Разложим в выражении (9) с„(0) в рядно 0 в окрестности некоторой точки Ов, ограничившись при этом линейными членами с„(0) с„(0') + ~~~~~ (О,' — О;) к,'л в=-1 (и=1,2,...,ДЯ), где ,в дв„(0) / дев !в-в, (и = 1, 2,..., )в'; 1 = — 1, 2,..., р). (21) где а выбирается таким образом, чтобы удовлетворить условию (17). Метод сопряженных градиентов обладает тем преимуществом, что здесь используется вся информация о предшествующих итерациях, поскольку направление движения определяется рекуррентным соотношением (18).
Недостатком этого метода является то, что при значительном удалении начальной точки поиска Ов от точки минимума в процессе вычислений по уравнению (18) происходит накопление ошибок, скааывающееся на быстроте сходнмости метода. Другой недостаток заключается в трудности выбора единичного шага а в выранвении (19).
Метод сопряженных градиентов не нашел такого широкого применения, как метод крутого спуска и метод градиента. В литературе имеется пример использования этого метода для обработки данных ИК-спектров [64). Метод сопряженных градиентов сравнивался также с методом модифицированного градиента (58) при поиске констант скоростей реакций окислительного дегидрирования бутенов (59, 60). Константы, определенные этими двумя методами, оказались близкими друг к другу.
Подставляя выражение (20) в (9), приходим к обычному методу наименьших квадратов относительно неизвестных нам разностей ле,=е,' — е,: л р э Я(О) = ~ (г„—,Я Ле,х~~), а=1 ~=1 (22) где г = с„— с„(О'). (2З) где ЛΠ— р-компонентный вектор разностей Ле; = Е'; — Е; (1 = =1, 2, ..., р); Х вЂ” (7т' х р) — матрица производных (21); 2 — 7У- компонентный вектор отклонений (23) опытных концентраций от вычисленных в точке О"; Т вЂ” знак транспонирования. Если бы выражение (20) выполнялось точно, тогда вектор ЛЕ, полученный решением (24), характеризовал бы расстояние от исходной точки О' до точки минимума О.
В практических задачах в разложении (20) моясет оказаться необходимым учет квадратичных членов. В этих условиях вектор ЛО, вычисленный по формуле (24), может и не быть направленным в сторону минимума. Можно показать, однако, что ЛО будет направлен в общем случае в сторону крутого спуска (65). Направление крутого спуска противоположно направлению градиента, компоненты которого определяются выражением (10). Вектор антиградиента запишется в виде 2Хт2 (25) Покажем, что Ле имеет положительную проекцию на направле- ние антиградиента ЛО ( — С) = — С~ЛО) О. (26) Из формулы (24) имеем Х г = (Х Х) ЛО. Подставим это выражение в (25), затем транспонируем вектор антиградиента и его значение введем в (26) — СтЛО = 22тХЛО+ 2ЛО Х ХЛО = 2(ХЛО) (ХЛО) ье, (27) а заказ ы ым Значения Ле;, обращающие (22) в минимум, находятся решением системы линейных алгебраических уравнений, получаемой дифференцированием (22) по ЛЕ; и приравниванием нулю производных.
Решение этой системы удобно представить в матричной записи: ЛО=(Х Х) Х 2, Равенство в выражении (27) достигается лишь в случае, когда все составляющие вектора ЛО равны нулю, т. е. когда начальная точка Оэ совпадает с точкой минимума. В противном случае, двигаясь в направлении ЛО, можно добиться снижения суммы квадратов отклонений. Таким образом, ОГ'~=О.; +а ЛО;, (28) где а выбирается из условия выполнения формулы (20). Практические рекомендации по выбору п приводятся в работах [66 — 711. Сходкмость итераций (28) к ближайшему от Ос минимуму 8 (О) показана Хартли [661.
Для доказательства сходимости метода потребовалось существование первых и вторых производных 8 (О) по О; и непрерывность 8 (О). Недавно было показано [721, что итерации (28) сходятся к минимуму со скоростью геометрической прогресии. По оценке Бокса [731, применение этого метода сокращает число вычислений в сравнении с градиентными методами в среднем в (р+2)(2 раз, где р — число определяемых параметров.
Ясно, что чем ближе зависимость (20) к линейной, тем быстрее будет достигнут минимум. В связи с этим приобретают интерес такие преобразования параметров (29) Ф = Ф(О), при которых разложение в ряд с (Ф) с (Фю) + Х(Ф; — Ф ) дъ (Ф)~ (30) справедливо для более широкого интервала ЛО. Например, если отыскиваются параметры уравнения Аррениуса для константы скорости к = О,ехр( — О,!Т), где О, = й„ О, = К7Л, то целесообразно ввести следующие преобразования [741 Е, = О,ехр [ — О,т-[1 Фз — — Оз (32) 98 где Т вЂ” среднее значение температуры. .Преобразование параметров (32) улучшает вид поверхности 8 (Ф) [$01, что приводит к сокращению вычислений при использовании любого градиентного метода. Общая теория преобразований (29) еще только разрабатывается [75, 761.