Диссертация (Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению), страница 7
Описание файла
Файл "Диссертация" внутри архива находится в папке "Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению". PDF-файл из архива "Математическое моделирование и оптимизация квазилинейных динамических стохастических систем диффузионного типа, нелинейных по управлению", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 7 страницы из PDF
Затем процесс z̃ принимается за следующее приближение оптимального процесса. На этом итерация завершается. Как обычно в градиентных методах, если значение критерия не уменьшается, уменьшим шаг θв формуле (2.14) и пересчитаем итерацию заново. Если несколько итерацийпроведены успешно, значение θ можно увеличить. Закончить вычисленияможно например тогда, когда изменение критерия становится достаточномалым.Общий алгоритм поиска оптимального управления заключается в выборе некоторого начального значения u(·) (во многих случаях удаётся использовать, например, значение u(t) ≡ 0), определении соответствующегоему процесса z и функции ψ 0 и последующем итеративном примененииописанной выше процедуры.Интегрирование дифференциальных уравнений будем осуществлятьчисленно, разбив интервал времени T на отрезки фиксированной длины.Все функции будем представлять значениями в соответствующих точкахразбиения.
Множество таких точек обозначим через T . Тогда контроль точности приближения к оптимальному решению будем осуществлять при по-48мощи величиныm XX ∂I.||∇I|| =(t,m(t),K(t),u(t)) ∂ ũr(2.19)r=1 t∈TШаг градиентного метода θ будем изменять его по следующему правилу: в случае двух подряд успешных спусков по градиенту, когда новые значения ũ(t), вычисленные по формуле (2.14), уменьшают значениефункционала качества J, значение θ увеличивается вдвое при переходек следующей итерации, а в случае неудачного спуска θ уменьшается вдвое(сама итерация при этом повторяется заново).Завершение работы программы осуществим при выполнении одногоиз условий: ||∇I|| < ε1 или θ < ε2 .Сконструированный таким образом градиентный метод можно формально представить в следующем виде.Алгоритм поиска оптимального управления.Ш а г 1. Произвольным образом или из дополнительных соображений задать θ – шаг градиентного метода, ε1 , ε2 – требуемые максимальныепогрешности приближения, u(0) – начальную точку приближения, и положить номер итерации k = 0, количество успешных итераций i = 0.Ш а г 2.
Решить (численно) задачи Коши сперва в прямом, а затем и в обратном времени для системы уравнений (2.9), (2.10), (2.4)-(2.6)с условиями (2.11), (2.7), используя управление u = u(k) .Ш а г 3. Вычислить значение критерия J (k) по формуле (2.8). Если k = 0, перейти к шагу 5. В противном случае проверить выполнениеусловия J (k) < J (k−1) : если условие выполнено, увеличить i на единицуи перейти к шагу 4, иначе положить i = 0, u(k) = u(k−1) , уменьшить θ49вдвое, уменьшить k на единицу и перейти к шагу 6.Ш а г 4. Если i = 2, увеличить θ вдвое, положить i = 0.Ш а г 5.
Для всех r = 1, m вычислить ∂I/∂ur по формуле (2.16).Ш а г 6. Вычислить величину ||∇I|| по формуле (2.19) и проверитьвыполнение условий ||∇I|| < ε1 , θ < ε2 : если любое из условий выполнено, искомое значение u положить равным u(k) и закончить расчет, иначевычислить u(k+1) по формуле (2.14) и перейти к шагу 7.Ш а г 7. Увеличить k на единицу и перейти к шагу 2.
Данный алгоритм является основным и отличается от алгоритмов,описанных далее в главах 3 и 4, только в деталях. При решении модельных и прикладных задач из разделов 2.6, 5.2, 5.3 применяется комплекспрограмм, разработанный на основе этих алгоритмов. В нём для интегрирования дифференциальных уравнений в основном используется методРунге–Кутты 4-го порядка точности с шагом 0.005.
Начальное значениешага градиентного метода θ берётся равным величине 0.1. Значения ε1 иε2 выбираются равными 1 и 10−5 соответственно. Более подробное описаниеразработанного комплекса программ приведено в разделе 5.1.2.6.Модельный примерПусть на интервале времени T = [0; 1] процесс управления описыва-ется скалярным уравнениемdx(t) = (ax(t) + b)dt + cu2 (t)dw(t)с начальным условием x(0) = x0 , где x0 – случайная величина с математическим ожиданием m0 = 0 и дисперсией K0 = 1.50Требуется отыскать управление u(t), минимизирующее функционалкачестваZ1 Z+∞Z+∞1 2J=ku3 (t)p(t, x)dxdt +qx p(1, x)dx.20 −∞−∞Здесь a, b, c, k, q – некоторые числа.Уравнения (2.9), (2.10) для описания моментных характеристик m, Kслучайного процесса x(t) с учётом начальных данных примут видdm(t)= am(t) + b,dtm(0) = 0,dK(t)= 2aK(t) + c2 u4 (t),dtK(0) = 1.В свою очередь, система уравнений (2.4)-(2.6) с условиями (2.7), определяющая функции γ, λ, M , запишется в видеdγ(t)1= −bλ(t) − ku3 (t) − c2 M (t)u4 (t),dt2γ(1) = 0,dλ(t)= −aλ(t) − bM (t), λ(1) = 0,dtdM (t)= −2aM (t), M (1) = q.dtНаконец, формула (2.16) для вычисления значений ∂I/∂ ũ будет иметьвид∂I(t, m(t), K(t), u(t)) = 2c2 M (t)u3 (t) + 3ku2 (t).∂ ũРазрешив уравнение ∂I/∂ ũ = 0 при почти всех t относительно u(t),будем иметьu1 (t) = 0,u2 (t) = −Заметимдалее,что3k2c2 M (t)полученная.системадифференциально-алгебраических соотношений после подстановки любого из управлений51u1 (t), u2 (t) становится аналитически разрешимой при интегрированииуравнений начиная с последнего для функции M (t).В частности, могут быть получены решения для функций γ, λ, Mb2 q 2a(1−t)a(1−t)γ(t) = γ1 (t) = 2 e− 2e+ 1 , при u(t) = u1 (t),2a9k 4 6a(t−1)e− 1 , при u(t) = u2 (t),γ(t) = γ2 (t) = γ1 (t) +64ac6 q 3bq 2a(1−t)a(1−t)λ(t) = λ1 (t) = λ2 (t) =e−e,aM (t) = M1 (t) = M2 (t) = qe2a(1−t) .Определив функцию M (t), окончательно заключаем, что управлениеu2 (t) имеет видu2 (t) = −3k 2a(t−1)e.2c2 q(2.20)Найденные управления u1 (t) и u2 (t) удовлетворяют необходимымусловиям оптимальности теоремы 3.
При этом легко убедиться в том, чтофункционал J в данной модельной задаче ограничен снизу, если выполнены условия c 6= 0 и q 6= 0. Для этого перепишем его в видеZ11 J = k u3 (t)dt + q K(1) + m2 (1) .20Здесь значения K(1) и m(1) вычисляются аналитически и имеют видZ1K(1) = e2a 1 + c2 u4 (t)e−2at dt ,0m(1) =b a[e − 1] .aПодставляя полученные значения в формулу для J, будем иметь соотношение Z1 21b1k + qc2 e2a(1−t) u(t) u3 (t)dt,J = q e2a + 2 (ea − 1)2 +2a2052в котором первое слагаемое в правой части не зависит от u, а подынтегральная часть во втором слагаемом может стать отрицательной толькопри выполнении условия ограниченности величины u(t) нулём с одной сто2k 2a(t−1)роны и значением − qcс другой.
Но в этом случае подынтегральная2eфункция в точках отрезка [0, 1] будет также ограничена, как композицияограниченной и непрерывной функций. Следовательно, значение J ограничено снизу, что и требовалось доказать.Теперь выбор среди решений u1 (t) и u2 (t) единственного оптимального можно осуществить, сравнив соответствующие значения функционалакачества J1 и J2 , вычисленные по формуле (2.8), которая для данного примера имеет вид1J = M (0) + γ(0).2Таким образом, подставляя найденные значения функций при t = 0,имеем9k 4−6aJ2 = J1 +e−1.64ac6 q 3Положим a = −1, b = c = k = q = 1. В этом случае из соотношения9k 49−6ae−1=(1 − e6 ) < 06364ac q64можно сделать вывод, что управление u(t), имеющее вид3u(t) = u2 (t) = − e2(1−t) ,2является оптимальным, а оптимальное значение функционала качества Jдля него равноJ2 = e−2 − e−1 +91+ (1 − e6 ) ≈ −56.3.2 6453При этом значение J1 , соответствующее управлению u1 (t), существеннобольше, и приблизительно равно величине 0.3.Заметим также, что необходимым условиям оптимальности удовлетворяет любое решение вида u1 (t),u(t) = u2 (t),при t ∈ T,при t ∈ T \ T,где T – произвольное борелевское подмножество T .Сравним полученные результаты с приближённым оптимальным решением, найденным градиентным методом.
Для этого используем программную реализацию предложенной в разделе 2.5 итерационной процедуры.В качестве начального приближения управления u(t) рассмотримнесколько вариантов.Вариант 1: u(t) ≡ −5.Полученное значение критерия: −56.1; количество итераций: 64.Таблица 1. Численные результаты применения метода по итерациям№ итерации01232364Jθ||∇I||10.4 0.1 10432-37.2 0.025 3214-54.0 0.025 1002-55.7 0.05309-56.1 0.0513-56.1 0.025154Рисунок 1. Сравнение с оптимальным решением u2 (t)Вариант 2: u(t) ≡ −3.Полученное значение критерия: −56.3; количество итераций: 32.Таблица 2. Численные результаты применения метода по итерациям№ итерации0123432Jθ||∇I||-9.20.12411-25.5 0.05 2195-52.8 0.11098-56.2 0.025 156-56.3 0.02593-56.3 0.025155Рисунок 2.
Сравнение с оптимальным решением u2 (t)Вариант 3: u(t) ≡ 5.Полученное значение критерия: −0.7; количество итераций: 30.Таблица 3. Численные результаты применения метода по итерациям№ итерацииJθ||∇I||0260.40.13683413.8 0.0125 144721.9 0.0125 92650.20.053009-0.30.25415-0.50.28517-0.60.11830-0.70.11Рисунок 3. Сравнение с оптимальным решением u2 (t)Вариант 4: u(t) = 10 sin 20t − 5.Полученное значение критерия: −29.2; количество итераций: 43.Таблица 4. Численные результаты применения метода по итерациям56№ итерацииJθ||∇I||01755.20.11216651443.30.00337184270.60.0031228630.10.00652564-10.00.006325010-25.30.0529312-25.90.0552615-27.50.059116-27.70.0510419-27.80.053035-29.20.0512043-29.2 0.000019Рисунок 4. Сравнение с оптимальным решением u2 (t)Изменение управления u(t) в процессе применения метода особенноинтересно для последнего варианта.
Приведём для него сравнительные графики первых 3-х итераций.57Рисунок 5. Начальное приближениеРисунок 6. Итерация 158Рисунок 7. Итерация 2Рисунок 8. Итерация 3Последующие итерации приводят решение к виду, представленномуна рис. 4.Из приведённых графиков видно, что в зависимости от выбранногоначального приближения, градиентный метод на разных участках интервала T может сходиться как к оптимальному решению u2 (·), так и к решению59u1 (t) ≡ 0, которое в данном случае является ещё одной стационарной точкой.