Ф.П. Васильев - Методы решения экстремальных задач (1125244), страница 19
Текст из файла (страница 19)
Отсюда и из леммы 2.2 следует )ф(1, и) — гр((, о) )с«Сг,ес <т-!л(и — о)с,= = С„( и — о )с,. (33) Наконец, из формулы (11), оценок. (29) — (33) и условий (8), (9) получим требуемое неравенство (28): ),)'(и) — Г (о)(!у., = т = ~ ~Н„(х(1, и), и(1), 1, ф(1, и)) — Н„(х((, о), !.
(1) 1 Ч (1 )) !г Ю!!г )т 1нг «У.(1+!1Я(1, и) !1с)Д (/ Лх(1)~+/и(() — о(() /)г!((~ + Й~ )т ~!/2 +С,((~Лф(()~ (1) (.,1 — ~,„и, о -=и. Теорема 2 доказана. 3. Отдельно остановимся на одном частном случае задачи (1) — (3), когда система (2) линейна по х, и, т. е. х (Г) = А (1) х (Г) + В (Р) и (1) + Г (У), гь < 1-= Т, х (1,) = х„ (34) где А(1), В(г), 1(1) — заданные матрицы порядка пхп, пхг, пх! соответственно. Для задачи (1) — (3), (34) принадлежность классу Сгл (У) может быть установлена при меньших требованиях, чем в теореме 2, и, кроме того, удается сформулировать условия, гарантирующие выпуклость и сильную выпуклость функции (1).
Теорема 3. Пусть функции гь(х, и, 1), Ф(х) удовлетворяют условиям теоремы ! и матрицы А(1), В(Г), Г(!) кусочно непрерывны на отрезке 1Г„Т). Тогда функция (Ц при условиях (34) принадлежит классу Сгл на всем пространстве Ц[Гь, Т1 причем ее градиент Г(и) в точка и=и(1) ен Ц 1г„Т! вычисляется по формуле Г(и)=Г„"-(х(Г, и), и(1), 1) — Вп(1)ф(1, и), гь(Г(Т, (35) где х (1, и) — решение задачи (34), ф (1, и) — решение задачи ф(г)=~,'(х(1, и), и(1), г') — Аг(1)ф(1) (ь=-1-=Т; ъ'~(Т) = — Ф„(х(Т, и)). (36) Доказательство. В рассматриваемой задаче условия (6), (8), очевидно, выполнены. Далее, оценка (29) совпадает с ранее доказанной оценкой (2.!8).
С помощью оценки (29), дословно повторяя доказательство теоремы 1, приходим к соотношениям (35), (36). Для Лф (1) = ф(1, «)— — ф(1, о) с учетом условий (7), (10), (36) будем иметь Ьф (г) ! ~ А вал ~ ! пф (т) ! с(т+ Е ! Лх (Т) ! + г + Ь ~ (~ Лх (1) (+ ! и (1) — о (1) !) д(. Отсюда и из леммы 2.2 следует опенка (33). Наконец, из формулы (35) и условия (9) с учетом оценок (29), (33) 100 получим ,',,l' (и) — Г (о)[с, ~ ~т !!/г ~~~![1(х(1, и), и(С), 1) — [1(х(1, о), о(1), (!)ос(1) + !т ~ пг +В.„~~!ф(1, и) ф((, о)!гд!) Укажем достаточные условия выпуклости и сильной выпуклости функции (Ц при условиях (34), кратко обсудим условия оптимальности в задаче (1) — (3), (34).
Теорема 4. Пусть матрицы А (С), В(!), !'(С) кусочно непрерывны на отрезке [йь Т), функция Ф (х) выпукла на Е", а то(х, и, () выпукла по совокупности переменных (х, и), т. е. [о (ах+ (1 — а) у, сои + (1 — а) о, 1) ( ~а[о(х и ()+(! — а)[о(у о, () (37) при всех (х, и, (), (у, о, 1) енЕокЕ'х[1„Т1, 0(а-=.1, и, кроме того, T(х((), и(!), !) онЕ,[(„Т! при каждой непрерывной функции х (!), !о((( Т, и (() еп Ь; [~о, Т) Тогда функция (1) при условиях (34) будет определена и выпукла на Ь,'[(„Т~. Если при этом функции [о(х, и, !), Ф(х) удовлетворяют условиям теоремы 1, то функция (1) при условиях (34) достигает своей нижней грани на всяком выпуклом замкнутом ограниченном множестве У с: Е.,[!о, Т) причем для оптимальности управления и„= ио (!) е= У необходимо и достаточно выполнение неравенства т ~ (7„'(х ((, и ), и (1), !)— и — В (()ф((, ио), и(() — и (())с(!)О (38) при всех и(!) ен У.
Если и — внупгренняя точка множества (7, то условие (38) равносильно условию )о(х(1, и,), и,(1), !) — В (игр(1, и„)=0, !о-=(=-Т. (39) Если же вместо (37) справедливо неравенство [о (ах + (1 — а) у, аи+ (1 — а) о, !) ( ~а[о(х и !) 1 (1 а)[о(у о т) а(1 сс)я!и о!о х= — сопз1)0 (40) !О! при всех и, 0(а(1, (х, и, г), (у, о, () ен Е" хЕ" х[йь Т) то функция (1) при условиях (34) является сильно выпуклой на Ц[гь, Т'1 и будет достигиепь свогй нижней грани на любом вьнуклом замкнутом множестве (I: — Е.,[~ь, Т) причем оптимальное управление единственно. Показательство.
В 4 2 было доказано, что решения задачи (34) обладают свойством х(С, аи+(1 — а) о) с ах(1, и)+(1 — а)х(1, о) при всех и, о яЦ[ть, Т'1 и аен [О, 11. Тогда выпуклость (сильная выпуклость) функции (1) при условиях (34) является простым следствием выпуклости Ф(х) и условия (37) (условия (40)).
Остальные утверждения теоремы вытекают из теорем 2.6, 3.6, 3,8. Пр имер 2. Пусть требуетсяминимизироватьфункцию г ,) (и) = — ~ ( ' (1) + и' Я) а( ь при условиях х(() = — ах(1)+и(Р), 0((( Т; х(0) =х,; и=и(1) енЬ,[0, Т~=(7, где а, х„Т) 0 — заданные числа. Эта задача является частным случаем задачи (1) — (3), (34) при )ь=(х'+и')/2, бз(х) — О, )= — ах+и, п=г=1 и к ней применимы теоремы 1 — 4. Поскольку здесь функция Гь(х, и) удовлетворяет условию (40) при х = =1/2, то функция г'(и) сильно выпукла на Е,[0, Т) и достигает на Е,[0, Т! своей нижней грани в единственной точке и, =и„(1) енЕ,[0, Т).
Поскольку Н(х, и, ф) = — (х'+и')(2+ф( — ах+и), то сопряженная задача (36) (нли (12), (13)) здесь имеет вид ф(()=аф(1)+х(1, и), 0==(=.Т; ф(Т)=0, а градиент согласно формуле (35) (или (11)) равен г' (и) = и (1) — ф ((, и), О (1 ( Т. Условие (39) для оптимального управления тогда приведет к равенству и (1) =ф(1, и ), 0(1(Т. Этот же результат был получен в примере 6.2.3 из '41 с помощью принципа максимума. В силу теоремы 4 пос- 102 леднее равенство является не только необходимым, но и достаточным для оптимальности управления и, = и (1).
Заметим, что, пользуясь условием (37) выпуклости функции )'(х, и, 1) и теоремой 2.1, неравенство (38) можно переписать в эквивалентном виде т ~(Н (х(1, и„), и, ((), 1, ф(1, и„))— и — Н(х(1, и„), и(1), 1, ф(1, и„))1Ж)0, и(1) ен У, (41) где Н (х, и, Е, ф) = — )~ (х, и, 1) + (ф А (У) + В (1) и+ ) (()), Предлагаем читателю установить связь между принципом максимума и условием оптимальности (41) — это может быть сделано так же, как в э 2 при исследовании задачи (2.7) — (2.10).
4. Рассмотренная выше задача (1) — (3) является частным случаем задачи оптимального управления, когда правый конец траектории свободен. Более общие задачи оптимального управления, когда, например, правый конец траектории закреплен или подвижен, или имеются какие- либо другие ограничения на фазовые координаты и управление, могут быть сведены к задаче вида (1) — (3) с помощью штрафных функций (см. й 5.12 из 14) или э 4, п.
8). Например, если задача (1) — (3) рассматривается при дополнительном условии х(Т) =х~ (правый конец закреплен), то в качестве штрафной функции для этого условия можно взять Р„(и)=Азах(Т, и) — х~~', й=1, 2...,, и рассмотреть задачу минимизации функции т Фа (и) = ~ 7а(х (1, и), и ((), () ~((+ +Ф(х(Т, и))+Аз(х(Т, и) — х,(з при условиях (1) — (3); здесь и ниже (Ад) — некоторая заданная положительная последовательность, стремящаяся к бесконечности. Нетрудно видеть, что если функции )а, 1, Ф удовлетворяют условиям теоремы 1, функция Фа(и) дифференцируема и ее градиент определяется той же формулой (11), нужно лишь условие (13) для ф(Т, и) 103 заменить на ф(Т, и) = — Ф„(х(Т, и)) — 2Ад(х(Т, и) — х~). Если задача (1) — (3) рассматривается при дополнительных фазовых ограничениях вида а;(х'(1, и)(Ьь 1»(1(Т, »=1, т, т =п, (42) где аь Ь; — заданные постоянные, то штрафом может служить функция т Рд(и)=Ад '5~ )1(шах(х'(1, и) — Ь;; 0))'+ с=ьи +(шах (а; — х' (1, и); О))д) й.
Тогда задача (1) — (3), (42) сведется к решению последо- вательности задач минимизации функции Ф» (и) = 1 (и) + Рд (и) = ~ Рд (х (1, и), и (1), 1) й+ -)-Ф(х(Т, и)), 1=1, 2, ... (43) при условиях (2), (3), где Р»(х, и, 1)=1»(х, и, 1)+А»,У', '1(шах(х' — Ьп 0))'+ »=» +(шах (а; — х'; 0))д). Р'„с(х, и, 1) =ф (х, и, 1)+ +2А»шах(х' — Ь»1 О) — 2А»шах(а,-х'; О), 1 1, т; Р'„„»=1"„.д, 1=т+1, и. Рди =~й~ Отсюда ясно, что если функции 1», ), Ф удовлетворяют условиям теоремы 1, то и для задачи (43), (2), (3) также будут выполнены условия теоремы 1, и формула градиента для функции (43) будет определяться теми же формулами (4), (11) — (13), нужно лишь в них (д заменить на Рй. Если задача (1) — (3) рассматривается при дополнительном условии т д (и) = ~ 6(х(1, и), и((), 1) й+Ф,(х(Т, и))» О, 1О4 При каждом Ь=1, 2, ... задача (43) (2), (3) имеет тот же вид, что и задача (!) — (3). Заметим, что то штрафной функцией для этого неравенства можно взять Рь (и) = Аь (!пах (д (и); 0))з.
Возможно использование и других штрафных функций, аналогичных приведенным в 3 5.12 из 14]. Комментарии к методу штрафных функций, сделанные в ч 5.!2 из [41, сохраняют силу и для задач оптимального управления. Отметим, что метод штрафных функций может быть использован не только для численного решения задач оптимального управления при самых различных ограни- чениях, но и для получения условий оптимальности в таких задачах, для доказательства принципа максимума и т. д. (217, 218).
У п р а ж н е н и я. 1. Рассмотреть задачу минимизации функции т а (и) =) ия (1) Ш о при условиях (23) — (27) н с закрепленным правым концом траекто- рии: х(Т)=х,; моменты Т и точка х! заданы, Применить метод штрафных фувкций для учета условия на правом конце; найти гра. диент штрафной функции. 2. Доказать, что при выполнении условий теоремы 1 функция (1) прн условиях (2) дифференцируема по переменной хе ш Е", и по совокупности переменных (х, и) гв Е" 7(И'["Го, Тт; найти градиент. 3.