Ф.П. Васильев - Методы решения экстремальных задач (1981) (1158203), страница 23
Текст из файла (страница 23)
(19) о В правую часть неравенства (18) подставим оценку (19); после приведения подобных членов получим т -2 ~ ~бх(з, Т) 1'гЬ+(а'ю — 2 поте, — /е~) ~ !Лх(1, 1) ('о(1* о о + (а' — /оео) ~ ~ ( Лх, 1о оЬ о(/ ( т ,— ~ ~ 1р(~Н'ж+,— ~ ~ ~~Гам. (20) о е' Пользуясь произволом в выборе чисел е,)0, е,)0, положим во=а'е, н 0<о,< ппп(1//о; 2т/(ъ+ 21)), Тогда из' (20) получим оценку (17) с константой С„= щах (аоо/е,; 1/(аое,)).
Из формулы (1б) для приращения функции (1) и оценки (1?) следует, что функция (1) дифференцируема в Н и ее градиент имеет вид ,/'(и) =(аооф(1, 1, и); ф(з, /, и)) ен Н, (21) причем первая компонента пары (21) является «частной» производной функции (1) по переменной р, вторая компонента — по переменной /.
121 Как видим, для получения градиента функции (1) при фиксированном и ен Н нужно решить две краевые задачи: сначала из (2) — (5) надо определить функцию х(з, г, и), затем в (15) подставить получившееся х(з, Т, и) и из (13) — (15) найти ф (з, 1, и) и, наконец, полученное ф(з, 1, и) подставить в (21). На практике для численного решения краевых задач используют разностные схемы [33, 153, 154, 190, 193 — 198, 213) и вместо формулы (21) получают ее разностный аналог. Можно показать, что функция (1) принадлежит классу С' '(Н), т. е.
),г ' (и+ Ь) — Г (и) 'и = г ,на =~ а'т'~ ! Лф(1, 1) ~'й+~ ~ ~ Лф(з, 1) !'дзг(1) О г ,пя «7.,'~ !Лр(1)!х(1+~~~й)(з, 1)!'г(з (1~ =Е,.й(„, ~о е (22) где Лф(з, 1) =ф(з, 1, и+й) — ф(з, 1, и). Для доказатель- ства неравенства (22) нужно выписать с помощью усло- вий (13) — (15) краевую задачу для Лф(з, 1) и по анало- гии с соотношениями (18), (19) получить —,' ~ Лф(, 0)! ( + ° ~ ~Лф(1, 1)!Ч(+ о о +а'$) ! Ьф!'сЬЖ=$ ! Лх(з, Т) !'дз, $) !Лф(з, 1) /'йп(= ~ 2(г$ $ ~ йф !гг(зг(1 ! 21 ~ ! ать(1 !) и (! Отсюда и из оценки (17) сразу следует искомое неравенство (22); читателю предлагаем выписать явное выражение для константы 1. из (22).
Заметим, что приведенные выше доказательства равенства (12), оценок (17), (20), (22) нельзя признать вполне строгими, так как существование некоторых встретившихся в выкладках интегралов, законность операций интегрирования по частям не всегда вытекают из определения реше- 122 ния рассматриваемых краевых задач и остались необоснованными.
Для строгого доказательства нужно было бы сначала сгладить функции и(1), ср(з), 7" (з, 1), р(з), провести указанные преобразования для классических решений соответствующих сглаженных краевых задач, а затем перейти к пределу по параметру сглаживания и прийти к требуемым соотношениям для обобщенных решений краевых задач.
Полная реализация намеченной здесь схемы строгого доказательства соотношений (12), (17), (20), (22) довольно громоздка для изложения, поэтому мы здесь вынуждены ограничиться приведенными выше рассуждениями, а читателя отсылаем за подробностями к руководствам и монографиям по уравнениям с частными производными [139, !57, 2131. Это замечание сохраняет силу для аналогичных рассуждений, которые будут встречаться в последующих параграфах настоящей главы. 2.
Имея формулу (21) для градиента, можно написать условия оптимальности для задачи (1) — (7), изложить методы ее решения. Заметим, что функция (1) при условиях (2) — (5) выпукла на Н. В самом деле, в силу линейности краевой задачи (2) — (5) и единственности ее обобщенного решения имеем х(з, 1, аи+(1 — а) о) = =ах(з, 1, и)+(1 — а)х(з, 1, р); з, (с=Д, (23) при всех и, о евН и всех действительных а. Отсюда и из выпуклости функции (х — р!' переменной х следует, что функция (1) при условиях (2) — (5) выпукла на Н=Ь,[0, Т)хЕ,(Я). Кроме того, из (6), (7) следует выпуклость множества К Согласна теореме 2.5 тогда для оптимальности управления и =(р„((), !" (з, !)) сна в задаче (1) — (7) необходимо и достаточно, чтобы (l'(и„), и — и„)и= Т =~ а'т4(1, У, и„)(р(() — р, (!)) й+ о + Я ф (з, 1, и,,) (! (з, Х) — ! (з, 1)) сЬ Ж ) 0 123 при всех и=(р(1), ~(в, 1))~У.
С учетом равенства(12) это условие оптимальности может быть переписано в виде ~(х(в, Т, и ) — у(в)) (х(в, Т, и)- о — х (в, Т, и )) с(в ) О, и е= У. Для численного решения задачи (1) — (7) могут быть использованы методы проекции градиента и условного градиента (см. 2 4).
Метод проекции градиента в задаче (1) — (7) сведется к построению последовательности (ид = (рд (1), 7»(в, з))) по правилу р,(1) — адазтф(1, 1, ид) при р ы(рд(1)— — адазтзР(1, 1, ид) (Р,„, ропп при рд(1) ади У>р(1» > ид) (рзяо> (24) ро>ах при р» (г) — а»а'т>р (1> г> ид) ) ртах> р»>д (г) = 7»(в, () -адф(в, (, ид) при ~~ ~1»(в, 1)— - ад ф (в, 1, и,) ~з с(в с(1 ( Кз, (25) Ц /Рд (з, 0 — а»>1> (з, >> и») ~з>>з>и)ц при Д / ~д (в> 1) — ад>р (в> Е> ид) (з Ш дв ) Рз 0(ео(ад(2,>(Ь+2е), е)0. (26) Метод условного градиента в задаче (1) — (7) сведется к построению последовательности (ид = (рд (1), 1» (в, с))) по правилу рд„,(()=р (~)+ад(рд(() — рд(()), 0(>(Т, ~„, (в, 1) = (д (в> 1) + аЯ» (в, 1) — 1 » (в, 1)), (в, 1) ен Я, (27) 124 (ср.
с формулами (4.18) и (4.18')); выбор параметра ад можно проводить с помощью одного из описанных в 2 4, п. 2 приемов. В частности, наличие оценки (22) указывает на возможность выбора ад из условий (4.15): где Р.() =,( Р!о!и пйи ф (1, 1, и») ) О, (23) Рта» при Ф (1 1 и») (О Ф ~ Ф !ь й и»1 !» !!о !и) и а параметр ам 0 =.а» --. 1, может быть выбран одним из указанных в 3 4, п. 3 приемов, Вспомогательное приближение й» вЂ”вЂ” (Р»(г), !»(э, 1)) она здесь определено из условия минимума линейной функции (!" (и»), и)и = $ аотф(1, 1, и») р(1) !11+ о +!)о)ф(а, Г, и„) г(а, Г)»ЬЙ при ограничениях (б), (7), Заметим, что из равенства (23) следует, что функция 7» (а) = / (и, + а (и, — и,)) = ! =/(и»)+2а~ (х(э, Т, и»)-й(э))х о х(х(э, Т, и») — х(з, Т, и»)) йз+ ! +а»~!х(э, Т, й») — х(э, Т, и,) (о!(з о при х(э, Т, й») ~х(э, Т, и,) является квадратным трех- членом относительно переменной а.
Поэтому, рассуждая так же, как при выводе формулы (4.25), из условий 1»(а»)= ппп 1»(а), 0(а»<1, (30) о<о<1 получаем а»=пп'п(1; аЦ, (31) !25 где ~(х(х, Т, их) — у(х)) (х(х, Т, йх) — х(х, Т, их) ) йх а ах— ~х(5, Т, йх) — х(я, Т, ах), йх г ) а2ю) (6 6 ах) Фх()) — Рд 90) й) О + 2~ к(х, Т, й„) — х(х, Т, ах) Дух ~~Ф(5, П ах) (1х(5* )) )х(5, ))) ахат + »0. 2 ~, х (х, Т, йх) — х(х, Т, ах),хах В случае, когда х(э, Т, их)=к(э, Т, ид), 0(э(1, или а$=0, то и„=и, — оптимальное управление задачи (1)— (7).
Согласно теоремам 4.4 и 4.6 последовательность (их), построенная методом (24) — (26) илп (27) — (31), является минимизирующей для задачи (1) — (7) и слабо в Н сход яки„. На практике приходится пользоваться разностными аналогами этих методов: встречающиеся в (24) — (26) и (27) — (31) интегралы вычисляются с помощью формул численного интегрирования (например, формулы прямоугольников или трапеций), а при решении краевых задач (2) — (5) и (13) — (15) можно пользоваться, например, неявной разностной схемой в сочетании с прогонкой 12, 32, 33, 153, 154, 190, 193 — 198, 2131. 3.
Перейдем к рассмотрению более сложной задачи минимизации функции (1), когда наряду с условиями (2)— (7) требуется, чтобы температура стержня не превышала некоторой заданной величины Х, т. е. к(э, г, и)(х, (э, () енЯ. (32) Такие задачи возникают при исследовании таких тепловых процессов, когда перегрев материала выше определенной критической температуры Х не допустим. Для решения задачи (1) — (7), (32) можно воспользоваться методом штрафных функций, Для учета ограниче- 126 ния (32) возьмем штрафную функцию Ра(и) =Аа')) ~ гпах(х(з, (, и) — х; О) РсЬ с(1, где (Аа) — заданная положительная последовательность, (А,)- со и при каждом )с=1, 2, ...
будем рассматривать задачу минимизации функции Фа(и) =$,'х(з, Т, и) — у(з) ~аасз+Р„(и) (33) а при условиях (2) — (7). Функция (33) дифференцируема на Н и ее градиент имеет вид Фа(и)=(а'чфа(1, С, и); сРа(з, 1, и)) а= 0, (34) где фа(з, (, и) — решение уравнения ф,= — аа$„— 2А„шах(х(з, (, и) — Х; О), (з, С) еиЯ, (35) при краевых и начальных условиях (14), (15). В самом деле, приращение ЛФа(и) =Фа(и+)с) — Фа(и) здесь представимо в виде ЛФа(и) =~2(х(з, Т, и) — у(з)) Лх(з, Т) сЬ+ а +)) 2А,шах (х(а, С, и) — х; О) Лх(з, С)сЬЙ+)7», (36) где Лх(з, () =х(з, с, и-с-и) — х(з, С, и) — решение краевой задачи (8) — (10), а остаточный член )7„оценивается так: с ~)са)«=~/Лх(з, Т)(ас(з+2Аа)) )Лх(з, (),"сЬс(С.
(37) а о При выводе соотношений (36), (37) мы воспользовались тем, что функция у(г) =(снах(г; О))' имеет производную д'(г)=2шах(г; О), и неравенством ~шах(г+Лг; О)— — пшк(г; 0))( Лг Справедливо равенство с ~2(х(з, Т, и) — у(з)) Лх(з, Т) сЬ= а т = ~ асаф,(1, (, и) Лр(() с(с+с)а )сра(з, 1, и) Л)Ь, В с(зс((в а о — )) 2А„спад(х(з, с, и) — х; О) лх(з, с) сЬсИ, е 127 которое следует из условий (8) — (1О), (35), (14), (!5) и доказывается так же, как аналогичное равенство (!2).
С учетом этого равенства из (36) получим г 7»Ф»(и) = ~ азттр»(1, 1, и) Лр(1) с(1+ о +))ф»(з, 1, и)Л)(з, 1)8зс(1+)7». (38) Из оценок (37), (19), (20) следует, что 1Р» ~ ( С» !Ь(и, С» = сопз1) О. Отсюда и из (38) вытекает дифференцируемость функции (33) и получается формула (34). Как видим, формула (34) вполне аналогична формуле (21), и поэтому нет ничего удивительного в том, что методы проекции градиента и условного градиента для задачи (33), (2) — (7) реализуются по тем же формулам (24), (25) и (27) — (29) с заменой ф на тр». 4. В рассмотренных задачах прн выводе формулы градиента важную роль играли вспомогательные краевые задачи вида (13) — (рз) и (35), (!4), (15), которые принято называть сопряженными краевыми эадачамн, соответствующими исходной задаче оптимального управления. Возникает вопрос, откуда берется сопряженная краевая задача, по каким правилам она сосгавляетсяр Здесь мы приведем некоторые эвристические соображения, помогающие в составлении сопряженной краевой задачи, установим связь между решением сопряженной краевой задачи и множителем Лагранжа задачи оптимального управления, Все построения проведем на примере задачи (1) †(5), считая, что =(р, )) и=Н=6,!О, Т!хк.,(Е.