Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 114
Текст из файла (страница 114)
Рассмотрим случай, когда и„+,(т)Фи„(т) в некоторой точке тш(1,, Т1 являющейся точкой непрерывности этих управлений, ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА [ГЛ, В и, кроме того, Н(хо(т), ио+о(т), т, о)оо(т)) — Н(х„(т), и„(т), т, оьо(т))> 2ВВ>0. (15) Можно ли ожидать, что тогда о(ио+,)(7(ио)7 Для ответа на зтот вопрос полезно обратиться к формуле приращения функции (8): т Х (и + Ли) — Х (и) = — ~ (Н (х(В; и), и (~) + Ли (В), 1, ор(В; и))— оо — Н(х(1; и), и(й), В, ор(Е; и))1 й+В, (16) где В=В,+В„ В, = (до(х(Т; и) + О,йх(Т)) — О~о(х(Т; и)), Лх(Т)), т В = — ~ (Н„(х(Ц и) + ОВЛх(В), и(о) + Ли(Г), В, о)о(Ц и))— оо — Н„(х(1 и), и(В), г, оР(В; и)), Лх(В)) йт, (17) йхЯ=х(Е; и+Ли) — х(1; и), 1,(1(Т, 0<ОП Оо<1, х(о; и), х(Е; и+ Ьи) — решения системы (11) при и = и(о) или и =и(г)+ йиЯ соответственно, оР(1; и) — решение задачи (12) при и = и(В).
Формула (16), (17) выводится совершенно так же, как аналогичная формула (3.42), (3.33), (3.43) при ло(х, р)= й' (У), 8 ...=д'=О, Лхо=О, а,„=1, а,о=...=а,„=О, А,=1. Из формулы (16), (17) при и=ио(1), Ли=ио+о — ио(В) имеем Х(из+,) — Х(иь) = = — ) (Н (хь (о), иь+г (о), о, ~Ъ (о)) — Н (хь (о), ™В (о), о, орд (о))) ооо + В. 10 (18) Так как функции хо(1), оро(о), Н(х, и, Х, о)о) непрерывны по совокупности своих аргументов, а ио(В), ио+,(С) кусочно-непрерывны на (1,, Т), то из (15) следует существование отрезка (т, т+ з)— — [г„Т), з>0 (или отрезка 1г — з, т) при т=Т), такого, что РЯ=Н(хЯ, ио+,(о), 1, Ь(1)) — Н( о(1), ио(1), г, Ьо(1))>а>0 (19) при всех 1 (т<1<т+е).
Из (14) и (19) заключаем, что первое слагаемое из формулы (18) для Х(иоо.,) — У(ио) отрицательно. Это значит, что если остаточный член В в (18) достаточно мал, то У(ио+,) ( У(ио), т. е. управление и„+, «лучше» управления и„, Однако может случиться, что У(ио+,)>Х(ио). Что тогда делать7 В атом случае вместо управления ио+,(1) можно указать 5 5) ПРИНЦИП 55АКСИМУМА И ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ 485 ДРУгое «лУчшее» УпРавление по+,(5), ДлЯ котоРого У(иео,)< У(ио). Л именно, возьмем игольчатую вариацию ид«,Я вЂ” ио(о), т~~1е т+ е, Ли»(5) = О, Г е= (5, Т]'~]т, т + е], и полон«нм и«о,(1)=и«(о)+ Ли«(о) (Ю, <1< Т).
Из формул (16), (17) при и = и„, Ли = Ли, и оценки (3.9) при и = ио(о), п = = ио(о)+ Ли„(т), уо = х, с учетом непрерывности производных го о У„, /„, до имеем «+е У(ио+,) — Х(ио) = — ~ у(5)515+ В, В = о(е), 1пп — = О. о (е) е о е Отсюда и из (19) следует У(по«,) — У(и,) < е [ — со+ о(з)lе] < О, если с ) 0 взять достаточно малым. Таким образом, при выполпении условия (15) всегда можно подобрать управление поое = Роо,(5) такое, что У(го+,) < У(и„).
Описанный итерационный метод может быть применен для решения более сложных задач оптимального управления, когда имеющиеся ограпиченпя на управление н фазовые координаты удается учесть с помощью штрафных функций и свести задачу к задаче впда (8) — (10). Например, если функцию (8) нужно минимизировать при условиях (9), (10) н закрепленном правом конце х(Т)=х, плн фазовом ограничении вида х'(о)<1 («о < о < Т) и т. и., то можно ввести штрафную функцию Р,(и)= т ='Ао<х(Т) — х,~е или Р„(и) =А» ) (шах(х'(5) — 1; 0))»А5 и пе"о рейти к рассмотрению последовательности аадач минимизации функции Ф,(и) = У(и)+ А,Р,(и) при условиях (9), (10), )па АА = оо.
Более подробно об описанном итерационном методе, о о приемах ускорения его сходимости, о его возможностях см. в ]204, 326]. в 5. Связь мен«ду принципом максимума и класспчсским вариацнонным исчислением Основной задачек классического вариационного исчисления, как известно ]64, 74, 108, 172, 181], является следующая задача: среди всех непрерывных кривых х=х(оо) («о <1< Т), имеющих кусочно-непрерывные производные х(Ц и удовлетворяющих УсловиЯм х(ео)~ Я„х(Т)~Яо найти такУю, котоРаЯ ДоставлЯет функции (функционалу) т У = ~ Уо(х(5), х(5)) Ю ЦРинцип млксимумл понтРягинА 486 !Рл, 6 мипимальное значение. Здесь х(~)=(х'(~), ..., х" (~)), Я, и Я,— заданные множества в Е". Будем предполагать, что функция /„'(х, и, ~) непрерывна и имеет непрерывные производные Й„(, /ио, 1«оо«~ 1«««««при (х, и, ~) «н Е" Х Е" Х [8о, оо).
Далее, в этом параграфе для простоты мы ограничимся рассмотрением случая закропного левого конца: х(1о) = х„8о — задано, а правый конец х(Т) либо закреплен: х(Т)=х„Т вЂ” задано, либо свободный: Я, — = Е", Т вЂ” задано, либо является подвижным и лежит на заданной гладкой кривой Е,=Е,(7)=(у Е: л(у, 7)=д — р(7)=О), 7 «и В = ( — оо С 1 С +оо). Обозначим х(~)= и(Ц н запишем рассматриваемую задачу в эквивалентном виде как задачу оптимального управления: т э' (и) = ~ )о (х (О), и (8), 8) Й$ -э ш «о х(й) = и(Е), йо < Е ( Т, х(Ео) = хо, х(Т) ы Я«(7) ° Для исследования этой задачи воспользуемся принципом максимума Понтрягина.
Выпишем функцию Гамильтона — Понтрягина Н(х, и, ~, оу, а,)= — а4'(х, и, 1)+ <оР, и> (4) и сопряженную систему ф = — Н„= аоД (х, и, ~), ао ) О. (2) Для решения (и(~), х(~)) (~«~~< Т) рассматриваемой задачи должно выполняться необходимое условие Н(х(~)о и(~), ~, о)о(~), аз) = зпр Н(х(~), и, ~, о)1(1), а,), (3) зп з" Фо ~~ 1 ~( 7, где о)1(~) — решение системы (2) при и = и(Ю), х = х(й, и) (Со < =. С < Т). Так как в данном случае множество )г совпадает со всем пространством Е", то условие (3) может соблюдаться лить в стационарной точке, т. е. ̈́— = — аоЩ„(х(~), и(1), ~) + ф(~) = О, ~о(~~~ Т.
(4) Отсюда ясно, что а, Ф О, так как прн ао = О из (4) получим ф (~) = О, что противоречит теоремам 2Л, 2.2. Следовательно, можно считать, что а, = 4. Тогда соотношения ($) — (4) пере- а 5~ ПРИНЦИП О!ЛКСИМУМЛ И ВЛРИЛЩ1ОНИОЕ ИСо1ИСЛЕИИЕ 487 пишутся соответственно в виде Н(х, и, ~, о)о)= — )о(х, и, ~)+ <оР, и>, (5) ~Р (~) = ~х (х (г), н (т), т), то <» г » <Т, (6) П(х(Е), и(й), Е, о)1(1)) = зпр Н(х(1), и, 1, о)1(8)), Ко» (Е<»Т, (7) яме" р(т) =Д(х(г),и(г), г), т,<ю<Т. (8) Из УРавнениа (6) имеем: оу(й) = ) 7о(х(1), и(Х), 8) 111+ о)>(~о).
оо С учетом (8) отсгода получаем с г ' (х(о)о и (т)о т) = ) ~'„(х (т), и (т), т) 1(т + ого (го) ~о< »~ < »т (9) оо Уравнение (9) называется уравнением Эйлера в интегральной форме; здесь и(1)=х(~) (~, <1< Т). Если (9) продифферепцировать по ~, то получим уравнение Эйлера классического вариационного исчисления в дифференциальной форме — (У~(х(~), и(К), 1)) — )~1'(х(1), и(1), Е) = О, и(о)=х(о), оо<Е<Т. Далее, необходимым условием достижения функцией Н(х(~), и(1), 1, о)1(1)) максимума при и =и(~) является неположительпость следующей квадратичной формы: а ~ Н 1„;(х(1), и(1), 1, о(о(о)) $1с,<О Ц1=1 при любых $=($1 $2 ...
$ ) т ($(Т Отсюда, учитывая выражение (5) для Н, имеем в ~ /'1 (х(й),и(1), й)СД;>О, КЕИЕ", го(й<Т. (40) 1оо 1 Условие (4О) называется необходимым условием Лежандра. В частности, при п = $ отсюда имеем Уйо(х(~)~ п(т)о т)>~О, то»<т»<Т. Теперь выведем необходимое условие Вейерштрасса. Для этого перепишем условие (7) с учетом (5), (8) в следующем виде: О < Н (х (1), и (1), Е, оР (о)) = Н (х (1), Р, Е, 1)о (Е)) = = ~'(х(й), и, ю) — )'(х (г), и (г), г) — (о — и (г), )"„(х(й), и (г), й)). (11) Это неравенство справедливо при л1обыл и 1МЕ", ~ ~ [оо, Т), если пРинцип мАксиыуыА понтРягинА 188 [гл, з (и(1), х(1)) (аа <1< Т) — решение исходной задачи. Введем в рассмотрение функцию Е (1, х, и, Р) — = Уе (х, Р, 1) — )е (х, и, 1) — (и — и, ~" (х, и, 1)), (12) называемую функцией Вейерштрасса.
Известно в классическом вариационпом исчислении необходимое условие Вейерштрасса Е($, х(1), и(1), Р)~0, 1,(1(Т, Р~Е", является следствием неравенства (11). Далее, из теорем 2.1— 2.3 следует непрерывность функций 1(а(1) и 11'(а) = зпр О(х(1), а-ь и и, 1, ар(а)) на отрезке (1„Т). Поэтому с учетом соотношений (5), (7), (8) имеем [1'а,(х(К), и(1), Ю]1= О, (13) [(и(а), /'(х(З), и(с), 1)) — (а(х(1), и(1), Е)111= О, Еа(С<7; здесь принято обозначение: (з(1)), = г(1+ 0) — з(1 — 0).
Поскольку равенства (13) выполнены при всех 1 (1а < 1 < Т), то опи сохраняют силу, в частности, н в те моменты Д когда функция х(1) может иметь излом, т. е. производная х(1) терпит разрыв. Таким образом, если учесть связь и(1) = — х(1), условия (13) превращаются в известные из классического вариациоппого исчисления условия Эрдмана — Вейерштрасса в точках излома кривой х(1) (аа < 1 ~~ Т) ° Перейдем к рассмотрению условий па правом конце оптимальной кривой х(1) (11<1< Т).
Если конец х(Т) свободен, то в силу условия (2.26) ф(Т)= О. Отсюда с учетом выражения (8) имеем ~" (х(Т), и (Т), Т) ==.. О. (11) голи правый конец х(Т) подвил еп, точнее, х(Т) ан Я, (Т) = =(уаиЕ": д'(у, Т) — уа — ара(Т)=0, 1=1, ..., и), то согласно условиям (2.30), (2.41) существуют постоянные а„..., а„такие, что ар1 (Т) = — ~~' ,а;д'„1 (х (Т), Т) = — а1, 1=-1 аа Е(х(Т), и(Т), Т, а(а(Т)) = ~ аад((х(Т), Т) = 1=1 аа аа = — ~~ а;ар. (Т) =- ~а а(11 (Т) ар. (Т) = а',ар(Т), с~(Т)). 1=1 1=1 Так как й(х, и, 1, а)а)= (1(а, и> — аа'(х, и, 1) и ф(1) выражается формулой (8), то последнее неравенство моязно переписать так: ~" (.1(Т), и(Т), Т) + (1д',(х(Т), и(Т), Т) аэ(Т) — и(Т)) = О, (15) з з! пРинцип мАксимумА и ВАРиАционное исчисление 499 Условия (14), (15) при учете связи й(1)~и(г) выражают собой известные в классическом вариационном исчислении условия трансверсальности для свободного и соответственно подвижного правого конца.