Ф.П. Васильев - Методы решения экстремальных задач (1125244), страница 23
Текст из файла (страница 23)
Это замечание сохраняет силу для аналогичных рассуждений, которые будут встречаться в последующих параграфах настоящей главы. 2. Имея формулу (21) для градиента, можно написать условия оптимальности для задачи (1) — (7), изложить методы ее решения. Заметим, что функция (1) при условиях (2) — (5) выпукла на Н.
В самом деле, в силу линейности краевой задачи (2) — (5) и единственности ее обобщенного решения имеем х(з, 1, аи+(1 — а) о) = =ах(з, 1, и)+(1 — а)х(з, 1, р); з, (с=Д, (23) при всех и, о евН и всех действительных а. Отсюда и из выпуклости функции (х — р!' переменной х следует, что функция (1) при условиях (2) — (5) выпукла на Н=Ь,[0, Т)хЕ,(Я).
Кроме того, из (6), (7) следует выпуклость множества К Согласна теореме 2.5 тогда для оптимальности управления и =(р„((), !" (з, !)) сна в задаче (1) — (7) необходимо и достаточно, чтобы (l'(и„), и — и„)и= Т =~ а'т4(1, У, и„)(р(() — р, (!)) й+ о + Я ф (з, 1, и,,) (! (з, Х) — ! (з, 1)) сЬ Ж ) 0 123 при всех и=(р(1), ~(в, 1))~У. С учетом равенства(12) это условие оптимальности может быть переписано в виде ~(х(в, Т, и ) — у(в)) (х(в, Т, и)- о — х (в, Т, и )) с(в ) О, и е= У. Для численного решения задачи (1) — (7) могут быть использованы методы проекции градиента и условного градиента (см. 2 4).
Метод проекции градиента в задаче (1) — (7) сведется к построению последовательности (ид = (рд (1), 7»(в, з))) по правилу р,(1) — адазтф(1, 1, ид) при р ы(рд(1)— — адазтзР(1, 1, ид) (Р,„, ропп при рд(1) ади У>р(1» > ид) (рзяо> (24) ро>ах при р» (г) — а»а'т>р (1> г> ид) ) ртах> р»>д (г) = 7»(в, () -адф(в, (, ид) при ~~ ~1»(в, 1)— - ад ф (в, 1, и,) ~з с(в с(1 ( Кз, (25) Ц /Рд (з, 0 — а»>1> (з, >> и») ~з>>з>и)ц при Д / ~д (в> 1) — ад>р (в> Е> ид) (з Ш дв ) Рз 0(ео(ад(2,>(Ь+2е), е)0. (26) Метод условного градиента в задаче (1) — (7) сведется к построению последовательности (ид = (рд (1), 1» (в, с))) по правилу рд„,(()=р (~)+ад(рд(() — рд(()), 0(>(Т, ~„, (в, 1) = (д (в> 1) + аЯ» (в, 1) — 1 » (в, 1)), (в, 1) ен Я, (27) 124 (ср.
с формулами (4.18) и (4.18')); выбор параметра ад можно проводить с помощью одного из описанных в 2 4, п. 2 приемов. В частности, наличие оценки (22) указывает на возможность выбора ад из условий (4.15): где Р.() =,( Р!о!и пйи ф (1, 1, и») ) О, (23) Рта» при Ф (1 1 и») (О Ф ~ Ф !ь й и»1 !» !!о !и) и а параметр ам 0 =.а» --. 1, может быть выбран одним из указанных в 3 4, п. 3 приемов, Вспомогательное приближение й» вЂ”вЂ” (Р»(г), !»(э, 1)) она здесь определено из условия минимума линейной функции (!" (и»), и)и = $ аотф(1, 1, и») р(1) !11+ о +!)о)ф(а, Г, и„) г(а, Г)»ЬЙ при ограничениях (б), (7), Заметим, что из равенства (23) следует, что функция 7» (а) = / (и, + а (и, — и,)) = ! =/(и»)+2а~ (х(э, Т, и»)-й(э))х о х(х(э, Т, и») — х(з, Т, и»)) йз+ ! +а»~!х(э, Т, й») — х(э, Т, и,) (о!(з о при х(э, Т, й») ~х(э, Т, и,) является квадратным трех- членом относительно переменной а.
Поэтому, рассуждая так же, как при выводе формулы (4.25), из условий 1»(а»)= ппп 1»(а), 0(а»<1, (30) о<о<1 получаем а»=пп'п(1; аЦ, (31) !25 где ~(х(х, Т, их) — у(х)) (х(х, Т, йх) — х(х, Т, их) ) йх а ах— ~х(5, Т, йх) — х(я, Т, ах), йх г ) а2ю) (6 6 ах) Фх()) — Рд 90) й) О + 2~ к(х, Т, й„) — х(х, Т, ах) Дух ~~Ф(5, П ах) (1х(5* )) )х(5, ))) ахат + »0.
2 ~, х (х, Т, йх) — х(х, Т, ах),хах В случае, когда х(э, Т, их)=к(э, Т, ид), 0(э(1, или а$=0, то и„=и, — оптимальное управление задачи (1)— (7). Согласно теоремам 4.4 и 4.6 последовательность (их), построенная методом (24) — (26) илп (27) — (31), является минимизирующей для задачи (1) — (7) и слабо в Н сход яки„. На практике приходится пользоваться разностными аналогами этих методов: встречающиеся в (24) — (26) и (27) — (31) интегралы вычисляются с помощью формул численного интегрирования (например, формулы прямоугольников или трапеций), а при решении краевых задач (2) — (5) и (13) — (15) можно пользоваться, например, неявной разностной схемой в сочетании с прогонкой 12, 32, 33, 153, 154, 190, 193 — 198, 2131.
3. Перейдем к рассмотрению более сложной задачи минимизации функции (1), когда наряду с условиями (2)— (7) требуется, чтобы температура стержня не превышала некоторой заданной величины Х, т. е. к(э, г, и)(х, (э, () енЯ. (32) Такие задачи возникают при исследовании таких тепловых процессов, когда перегрев материала выше определенной критической температуры Х не допустим. Для решения задачи (1) — (7), (32) можно воспользоваться методом штрафных функций, Для учета ограниче- 126 ния (32) возьмем штрафную функцию Ра(и) =Аа')) ~ гпах(х(з, (, и) — х; О) РсЬ с(1, где (Аа) — заданная положительная последовательность, (А,)- со и при каждом )с=1, 2, ... будем рассматривать задачу минимизации функции Фа(и) =$,'х(з, Т, и) — у(з) ~аасз+Р„(и) (33) а при условиях (2) — (7). Функция (33) дифференцируема на Н и ее градиент имеет вид Фа(и)=(а'чфа(1, С, и); сРа(з, 1, и)) а= 0, (34) где фа(з, (, и) — решение уравнения ф,= — аа$„— 2А„шах(х(з, (, и) — Х; О), (з, С) еиЯ, (35) при краевых и начальных условиях (14), (15).
В самом деле, приращение ЛФа(и) =Фа(и+)с) — Фа(и) здесь представимо в виде ЛФа(и) =~2(х(з, Т, и) — у(з)) Лх(з, Т) сЬ+ а +)) 2А,шах (х(а, С, и) — х; О) Лх(з, С)сЬЙ+)7», (36) где Лх(з, () =х(з, с, и-с-и) — х(з, С, и) — решение краевой задачи (8) — (10), а остаточный член )7„оценивается так: с ~)са)«=~/Лх(з, Т)(ас(з+2Аа)) )Лх(з, (),"сЬс(С.
(37) а о При выводе соотношений (36), (37) мы воспользовались тем, что функция у(г) =(снах(г; О))' имеет производную д'(г)=2шах(г; О), и неравенством ~шах(г+Лг; О)— — пшк(г; 0))( Лг Справедливо равенство с ~2(х(з, Т, и) — у(з)) Лх(з, Т) сЬ= а т = ~ асаф,(1, (, и) Лр(() с(с+с)а )сра(з, 1, и) Л)Ь, В с(зс((в а о — )) 2А„спад(х(з, с, и) — х; О) лх(з, с) сЬсИ, е 127 которое следует из условий (8) — (1О), (35), (14), (!5) и доказывается так же, как аналогичное равенство (!2). С учетом этого равенства из (36) получим г 7»Ф»(и) = ~ азттр»(1, 1, и) Лр(1) с(1+ о +))ф»(з, 1, и)Л)(з, 1)8зс(1+)7».
(38) Из оценок (37), (19), (20) следует, что 1Р» ~ ( С» !Ь(и, С» = сопз1) О. Отсюда и из (38) вытекает дифференцируемость функции (33) и получается формула (34). Как видим, формула (34) вполне аналогична формуле (21), и поэтому нет ничего удивительного в том, что методы проекции градиента и условного градиента для задачи (33), (2) — (7) реализуются по тем же формулам (24), (25) и (27) — (29) с заменой ф на тр». 4.
В рассмотренных задачах прн выводе формулы градиента важную роль играли вспомогательные краевые задачи вида (13) — (рз) и (35), (!4), (15), которые принято называть сопряженными краевыми эадачамн, соответствующими исходной задаче оптимального управления. Возникает вопрос, откуда берется сопряженная краевая задача, по каким правилам она сосгавляетсяр Здесь мы приведем некоторые эвристические соображения, помогающие в составлении сопряженной краевой задачи, установим связь между решением сопряженной краевой задачи и множителем Лагранжа задачи оптимального управления, Все построения проведем на примере задачи (1) †(5), считая, что =(р, )) и=Н=6,!О, Т!хк.,(Е.
Следуя уже известной нам процедуре исследования задач на условный экстремум (см. 44 2.2, 4.8, 4.9, 6.2 иэ !4! и 4 2), составим функцию Лагранжа задачи (1) — (5): 1. (х, и, ), ф) =! ! х (3, т) — р (з) 1» Фз+)! ф (з, 1) ( — хг (3, 1)+ э +а'х„(з, 1)+) (з, 1)) пз п1, (39) где ф (э, 1) — множитель Лагранжа, соответствующий ограничению (2) Будем предполагать, что функции х (з, 1), ф (з, 1) являются достаточно гладкил~и на Я=((з, 1): 0(з<1, 0~1(Т). Поскольку уравнение (2) уже учтено в (39), то от функций х(з, 1) н р(1) будем требовать лишь удовлетворения граничным и начальным условиям (3) — (5); дополнительные условии на функцию ф(з, 1) будут наложены ниже.
Дадим приращения (вариацин) переменным х, р, й т. е. рассмотрим функции х(з, 1)+бх(з, 1), рр)+бр(1), !(з, 1)+6)(з, гп (з, 1) сн й, удовлетворяющие условиям (3) — (5). Тогда бхз /з з=О, бх, !»„г=т(бр(1) — бх(1, 1)), бх 9 е — — О. (40) Вариация функции Лагранжа (39), представляющая собой главную линейную часть приращения этой функции, имеет вид 66 ~ 2 (х (з, Т) — р (з)) бх (з, Т) аз+)) ф ( — бхг+аабх +6() азо1. Учитывая условия (40), преобразуем двойной интеграл с помощью интегрирования по частям. Получим 6(. ) (2(х(з, Т) — у(з)) — ф(з, Т))бх(з, Т)с(з.(- о +~~ (фг+а ф,з) бх бз с(1+ай) оз о1+ Т +аэ~ (тф(1, 1)+фз(1, 1)) бх(1, 1) М+ +аэт ~ ф 11, 1) бр(1)б1+~ ф,(0, 1)бх(0, 1)з(1. Считая что в оптимальной точке выполняется условие стационар. ности 61.
О, и пользуясь достаточно большим пйоиэволом в выбоу))е х(з, 1), приравняем нулю коэффициенты при вариацняк бх(з, ), х(з, 1), бх(1, 1), бх(0, 1) и придем к условиям для множителя Лагранжа ф(з, 1), полностью совпадающим с сопряженной краевой задачей (13) — (16); приравнивая нулю нозффициенты при бр(1), и 61(з, 1), получим условия ф(1, 1) О, ф(з, 1) О, которые согласно формуле (21] означают равенство Л (и) 0 — условие оптимальности в задаче (!) — (5) при и ш 13=Н. Изложенный на примере задачи (1) — (б) подход к получению сопряженной краевой задачи применим для шнроното Класса задач оптимального управления процессами, описЫваемымй как обыкнобенными дифференциальными уравнениями, тай и урйииениями с частными производными.
Этот подход кратко можио Еформулировать в инде следуЮщих правил: 1) сначала нужно записать задачу минимизации р виде э(и)-~(п(, Ц(х, и, $) О, бси01, 1 Т, Ж( 11(х, и) О, 1 Г7, где Ог-эаданнаЯ область иэ евклидова ппостРанствй Е"Н х .х(6) * (хт(6), ..., х" Я)) — фаэовые переменные, и (ит($), ..., иэ(й))— управления, 1л — дифференциальными оператор 11 ~Япераэоры тра. ннчнык и начальных условий, и соетавить фун)сциЮ агранжв Е(х, и, ф) з (и)+ ~, '') ф,(й) 1.1(х(б), иф)~ й) ой1 5 Ф П Васчаьев 2) затем нужно найти вариацию функции Лагранжа по фазовым переменным и управлениям с соблюдением граничных и начальных условий 1, (х, и) =О, 1=1, р, и с помощью интегрирования по частям (или с помощью формулы Гаусса — Остроградского для сложных многомерных областей) с учетом граничных и начальных условий преобразовать полученную вариацию тзк, чтобы выражения под зна- ками интегралов по областям 6; не содержали частных производных вариаций фазовых переменных; 3] наконец, пользуясь условием стационарностн функции Лаг- ранжа и провзволом в выборе вариаций фазовых переменных, при- равнять нулю коэффициенты при соответствующих взриациях; сово- купность полученных при этом равенств представляет собой условия на множители Лагранжа и образует искомую сопрянгенную краевую задачу.