Ф.П. Васильев - Методы решения экстремальных задач (1981) (1158203), страница 20
Текст из файла (страница 20)
Поскольку здесь функция Гь(х, и) удовлетворяет условию (40) при х = =1/2, то функция г'(и) сильно выпукла на Е,[0, Т) и достигает на Е,[0, Т! своей нижней грани в единственной точке и, =и„(1) енЕ,[0, Т). Поскольку Н(х, и, ф) = — (х'+и')(2+ф( — ах+и), то сопряженная задача (36) (нли (12), (13)) здесь имеет вид ф(()=аф(1)+х(1, и), 0==(=.Т; ф(Т)=0, а градиент согласно формуле (35) (или (11)) равен г' (и) = и (1) — ф ((, и), О (1 ( Т. Условие (39) для оптимального управления тогда приведет к равенству и (1) =ф(1, и ), 0(1(Т. Этот же результат был получен в примере 6.2.3 из '41 с помощью принципа максимума.
В силу теоремы 4 пос- 102 леднее равенство является не только необходимым, но и достаточным для оптимальности управления и, = и (1). Заметим, что, пользуясь условием (37) выпуклости функции )'(х, и, 1) и теоремой 2.1, неравенство (38) можно переписать в эквивалентном виде т ~(Н (х(1, и„), и, ((), 1, ф(1, и„))— и — Н(х(1, и„), и(1), 1, ф(1, и„))1Ж)0, и(1) ен У, (41) где Н (х, и, Е, ф) = — )~ (х, и, 1) + (ф А (У) + В (1) и+ ) (()), Предлагаем читателю установить связь между принципом максимума и условием оптимальности (41) — это может быть сделано так же, как в э 2 при исследовании задачи (2.7) — (2.10). 4. Рассмотренная выше задача (1) — (3) является частным случаем задачи оптимального управления, когда правый конец траектории свободен.
Более общие задачи оптимального управления, когда, например, правый конец траектории закреплен или подвижен, или имеются какие- либо другие ограничения на фазовые координаты и управление, могут быть сведены к задаче вида (1) — (3) с помощью штрафных функций (см. й 5.12 из 14) или э 4, п.
8). Например, если задача (1) — (3) рассматривается при дополнительном условии х(Т) =х~ (правый конец закреплен), то в качестве штрафной функции для этого условия можно взять Р„(и)=Азах(Т, и) — х~~', й=1, 2...,, и рассмотреть задачу минимизации функции т Фа (и) = ~ 7а(х (1, и), и ((), () ~((+ +Ф(х(Т, и))+Аз(х(Т, и) — х,(з при условиях (1) — (3); здесь и ниже (Ад) — некоторая заданная положительная последовательность, стремящаяся к бесконечности. Нетрудно видеть, что если функции )а, 1, Ф удовлетворяют условиям теоремы 1, функция Фа(и) дифференцируема и ее градиент определяется той же формулой (11), нужно лишь условие (13) для ф(Т, и) 103 заменить на ф(Т, и) = — Ф„(х(Т, и)) — 2Ад(х(Т, и) — х~). Если задача (1) — (3) рассматривается при дополнительных фазовых ограничениях вида а;(х'(1, и)(Ьь 1»(1(Т, »=1, т, т =п, (42) где аь Ь; — заданные постоянные, то штрафом может служить функция т Рд(и)=Ад '5~ )1(шах(х'(1, и) — Ь;; 0))'+ с=ьи +(шах (а; — х' (1, и); О))д) й.
Тогда задача (1) — (3), (42) сведется к решению последо- вательности задач минимизации функции Ф» (и) = 1 (и) + Рд (и) = ~ Рд (х (1, и), и (1), 1) й+ -)-Ф(х(Т, и)), 1=1, 2, ... (43) при условиях (2), (3), где Р»(х, и, 1)=1»(х, и, 1)+А»,У', '1(шах(х' — Ьп 0))'+ »=» +(шах (а; — х'; 0))д). Р'„с(х, и, 1) =ф (х, и, 1)+ +2А»шах(х' — Ь»1 О) — 2А»шах(а,-х'; О), 1 1, т; Р'„„»=1"„.д, 1=т+1, и. Рди =~й~ Отсюда ясно, что если функции 1», ), Ф удовлетворяют условиям теоремы 1, то и для задачи (43), (2), (3) также будут выполнены условия теоремы 1, и формула градиента для функции (43) будет определяться теми же формулами (4), (11) — (13), нужно лишь в них (д заменить на Рй.
Если задача (1) — (3) рассматривается при дополнительном условии т д (и) = ~ 6(х(1, и), и((), 1) й+Ф,(х(Т, и))» О, 1О4 При каждом Ь=1, 2, ... задача (43) (2), (3) имеет тот же вид, что и задача (!) — (3). Заметим, что то штрафной функцией для этого неравенства можно взять Рь (и) = Аь (!пах (д (и); 0))з. Возможно использование и других штрафных функций, аналогичных приведенным в 3 5.12 из 14]. Комментарии к методу штрафных функций, сделанные в ч 5.!2 из [41, сохраняют силу и для задач оптимального управления. Отметим, что метод штрафных функций может быть использован не только для численного решения задач оптимального управления при самых различных ограни- чениях, но и для получения условий оптимальности в таких задачах, для доказательства принципа максимума и т.
д. (217, 218). У п р а ж н е н и я. 1. Рассмотреть задачу минимизации функции т а (и) =) ия (1) Ш о при условиях (23) — (27) н с закрепленным правым концом траекто- рии: х(Т)=х,; моменты Т и точка х! заданы, Применить метод штрафных фувкций для учета условия на правом конце; найти гра. диент штрафной функции.
2. Доказать, что при выполнении условий теоремы 1 функция (1) прн условиях (2) дифференцируема по переменной хе ш Е", и по совокупности переменных (х, и) гв Е" 7(И'["Го, Тт; найти градиент. 3. Рассмотреть функцию г 7(ю)=~ )а(х(б ш), ю, 1) о(+го(х(Т, ш)) при условиях х (1) =1 (х (1), и, Г), Ге ( 1 ~ Т; х (Ге) = хе, ю = (шт, ... .„, ш') — управляющие параметры, йе зависящие от времени.
Пока- зать, что сели функции )е, й гв непрерывны н имеют непрерывные частные производные по х, ш й ! /(х+Лх, ш, 1) — 1(х, ш, 1) '~Е!Лх! при всех (х+Ьх, ш, Г), (х, ю, 1) шЕ" ХЕ'Х[)„Т), то функция 2(ш) аифференцируема н ее градиент равен г Х' (ш)=) Н, (х(С, ш), ю, й ф(1, ш)) Л, где Н(х, и, 1, ф)=р(х, ш, 1)+([(х, ш, 1), ф), ф (1, и) — ре~иение задачи рр)= — ех(х(0 ш), ш, г,ф(1)), 1,«1 т; ф(т)=гр„(х(т, . )), У к а з а и и е: воспользоваться техникой доказательства теоре- мы 1. 4 Пусть выполнены все условия теорем 3,4 (кроме, быть может, условия (40)) и пусть (7=[и=и(1) ш 1.',(Гш Т) и(1) ~ю)г почти всюду на [гз, Т)~, где г' — выпуклое множество из Е'. Доказать, что тогда принпип чакснмул~а является необходимым и достаточным условием оптимальности в задаче (1) — (3), (34).
103 У к а з а н и е: доказать выпуклость функции Н (х, и, Д ф) по и и воспользоваться неравенством (38) ! 5. Пусть у(и)=[(из(1) — ахз(Г)) с(д где Х(1)=и(1) !иЕ [О, 1), о х(0)=0, а — постоянная. При каких значениях параметра а функцйя У (и) будет выпуклой или сильно выпуклой на Ее [О, Т)7 Показать, что У (и) !нС~'(Ез), и найти градиент. 6. Пусть функции [е(х, и, 1), [(х, и, (), Ф(х) непрерывны по (х, и, 1) ~юЕлхЕ'х[(е, Т), выполняется условие (5) и )е(х, и ! й, 1)— — [е(х, и, 1) ! (1 ( й,з+, 'и ! !й ), (,=сола!»О, при всех (х, и+й, (), (х, и, () гыЕ" ХЕ" !с[(е, Т[. Локазать, что тогда функция (1) при условиях (2) непрерывна на Е'[(а, Т) в метрике етого пространства.
7. Пусть функции )е(х, и, 1), Ф(х) непрерывны по (х, и, () см щ Е" !сЕ'Х[Е„Т), [е(х, и, () выпукла по переменной и ~ Е' при каждом фиксированном (х, 1) щ Е" к [(„Т). Локазать, что тогда функция (1) при условиях (34) достигает своей нижвей грани на любом выпуклом замкнутом ограниченном множестве (У щ Е'[(е, Тт. У к а з а н и е: установить, что У (и) слабо полунепрерывна снизу на Е;[(,, Т.( 8. Пусть выполнены все условия теоремы 4 (кроме, быть может, условия (40)), (/ — выпуклое замкнутое ограниченное множество из Езг[(а, Т~, фУнкциЯ а(х, () непРеРывна по (х, () !ы Е" Х[(а, Т) и вы. пукла по хе Е" при каждом фиксированном 1я [1,, Т). Пусть существует хотя бы одна траектория х ((, ие) задачи (34], и, ен (у, такая, что а(х(1, и„), 1) ( 0 при всех 1 щ [1,, Т). Локазать, что тогда функция (!) при условиях (34) и ограничении д(х(6 и), ()«=.О, (ес( ~ Т, достигает на (У своей нижней грани.
9. Пусть )е (х, и, 1) = а (х, Г) + ( Ь (х, (), и ), [ (х, и, () = А (х, Г) + + В(х, () и и пусть матрицы А(х, 1), В(х, (), Ь(х, 1) — порядков лх1, лхг, лк! соответственно и функции а(х, 1), Ф(х) непрерывны по (х, Г) ен Ели [(„Т), [ А (х, () [! » Се ! х !+ С„ /! В (х, 1) ,'!( =С,, где ффС,— неотрицательные постоянные Пусть (I — выпуклое замкнутое ограниченное множество из ь'[(а, Т1 и существует управление ие ~ (У такое, что соответствующее решение х(1, ие) задачи (2) удовлетворяет условию х(Т, и„)=-х!. Показать, что тогда функция (!) при условиях (2) и дополнительном условии х(Т, и) = = х, достигает своей нижней грани на (7 У к а з а н и е: установить, что если (игй — минимизирующая последовательность, слабо сходящаяся к точке и, то у (иа)-!- у (и,). й 6.
Градиент в одной дискретной задаче оптимального управления 1. Рассмотрим следующую задачу оптимального управления с дискретным временем: минимизировать функцию к — ! у ([иг)) = ~ Ег!(хь и!)+(Р (хл!) ([) г=е 106 при условиях х.;,!- — -Ро(х!, и!), !'=О, й>-1; хо=а, (2) [и]=(ио ° ° ° их !); и! ен 1'!, !'=О, У вЂ” 1> (3) [Рь) =[Ем!» ° ° ° Е>ил)> (ЕСо) =[Ее> ° ° ° > Еы )> [Ф)г=[Ф! ..., Ф „). Через Ео [О, У] обозначим гильбертово пространство вектор-функций дискретной переменной [и!] =(и„им ..., их !) Л вЂ” ! со скалярным произведением ([и;], [о!])>,= У, '(иь о!), >'= о '!о — ! >,!го и с нормой !~ [и!] 1 ~х ~ и> ~~а~) Пусть У множество !г=о всех дискретных управлений [и!]=(ио, ..., их !), удовлетворяющих условию (3); очевидно, У ~Е,'[О, У].