Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 108
Текст из файла (страница 108)
Тогда Н(й+ Лй) =Н(й+ пй, и(й+ М) )> ~ Н(й+ Лй, у(й) ), Н(й) = Н(й, у(й) ) > Н(й, и(й+ М) ). Поэтому Н(й+М, о(й)) — Н(й, и(й))~Н(й+М) — Н(й)( (Н(й+Лй, и(й+ М)) — Н(й, и(й+Лй)). (59) Так как функции х(й), ф(й), Н(х, и~, й,фа,) непрерывны по совокупности своих аргументов, то функция Н(й, й)= Н(х(й), ю, й, чр(й), а,) непрерывна по (й, и~)ж [й„Т~Х У. Поэтому переходя к пределу при Ьй- +О или Лй- — О, из (59) получаем Н(й)- =Н(й+0)= Н(й — 0), где Н(й~О) =Н(й, и(й~О)).
Тем самым, непрерывность функции Н(й) на отрезке [й,, Т~ установлена. Кроме того, показано, что в (57) верхняя грань достигается как при Р(й) = и(й+ 0), так и при и(й) = и(й — 0). Пусть теперь функции ]'(х, и, й) имеют непрерывно частные производные по (х, й). Тогда, как следует из (5), функция Н(х, и, й, ф, а,) непрерывно дифференцируема по (х, й, ~р). Далее, как видно из (2), (6), функции х(й), ~р(й) непрерывно дифференцируемы при всех й ж А. Тогда сложная функция Н(й, ю)=Н(х(й), ю, й, ф(й), а,) также непрерывно днфференцируема при всех й жА и ее производная равна = (Н„(х(й), ю, й, ф (й), ае), ) (х(й), и (й), й) + + (~(х(й), ю, й), — Н„. (х (й), и (й), й, ф(й), ае)) + + Н~ (х(й), ил, й, ф(й), а ), й ~ А.
(60) Из этой формулы видно, что при сделанных предположениях относительно функций й'(л, и, й) производная АН(й, и)/й непрерывна по совокупности (й, и>)ыА Х У, причем существуют ЫН(й+М, ) ЫН(й+О, и) односторонние пределы Пш А~- ЬО Ви (й -)- Ай, и О+ Ай)) ан (й + О, и (й + О)) Пш — — при всех й ~а [й„ ы ~о ей лй Т], ю ~и У. Из (60) также следует, что ) = Нз(х(й), и(й), й, 1р(й), ае), й еи А, (61) ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА 457 откуда = Но (х ((), и (1 ~ 0), 1, оР (о), ао)~ 1 ен (1о~ Т) (62) Возьмем в (59) йг> О, Р(1)= и(1+0); получим Н(1+Ее, и(1+0)) — Н(1 и(1+0)) < Н(1+ Ь()- Н(1) < < Н((+ Ю, и(1+ Л() ) — Н(7, и((+ Л() ), По теореме Лагранжа о конечных приращениях отсюда имеем йн(о+ 0 ад и (о+ О)) й( ( Н (1 + Л 1) — Н (1) ( аН (о+ В,ао, и (о+ Ао)) где 0< 9, Оо < 1.
Разделив эти неравенства на й( > 0 и устремив йо- +О, получим Н(1+ 0) = ' ж . Далее, взяв ИН(Ц и(О+О)) в (59) йг<0, Р(1)= и(1 — 0) рассуждая аналогично, имеем Н (г — 0) = ', Отсюда и из (61), (62) следует йН (О, и (Π— О)) формула (58) и непрерывность Н(1) при гжА. Теорема 3 доказана. Нетрудно видеть, что теорема 3 остается верной и для задачи (37) — (40). 7. В следующем параграфе будет приведено доказательство теорем 1, 2. Здесь мы хотим привести эвристические соображения, которые помогают понять, откуда появляется сопряженная система, условия максимума, условия трансверсальности, фигурирующие в теоремах 1, 2, и установить связь между принципом максимума Понтрягина и правилом множителей Лагранжа.
Для простоты рассмотрим задачу (1), (2), (4) при дополнительном предположении, что и =Е', у'(х, у)=д'(у), условия на правом конце траектории имеют вид д' (х(Т)) = О,..., д'о (х (Т)) = О, (63) на левом конце (64) Ьг (х (го)) = О,..., й'о (х((о)) = О. Воспользуемся процедурой исследования задач на условный экстремум (см. $ 2.2, 4.8) и введем множители Лагранжа: непрерывную вектор-функцию ор(Г)=(оРо(1), ..., ор.(()) для учета ограничений (2), постоянные (а„°, а, ) =а для учета ограниче- ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА [ГЛ.
З ний (63), постоянные(Ь1, ..., Ьв,) = Ь вЂ” для учета (64), постоЯннУю а,— Длн фУнкЦии (1)в и составим фУнкЦию ЛагРанноа 2' (х( ° ), и(.), ф ( ), ао, а, Ь) = Гт — — .~~ВОО1.О),Омов О(в11, + ) (о(о (й), ~ (х (в), и (ю), 1) — х ( в)) Й х— Вв во — Д аваЗ (х(Т)) — ~~~ Ьввв' (х(во)). 2=1 С помощью функции Гамильтона — Понтрягина (6) можно за- писать функцию Лагранжа в следующем виде: „'Р(х(.), и( ° ), ву(.), а, а, Ь) = т = ~ (Н(х(С), и(Ю), Ю, вР(С), а,) — < Р(1), х(т)>] а— в во —,,'~~ авдо (х (Т)) — ~ ЬвЧ (х Я) в а=о 3=1 Все аргументы функции Лагранжа считаются независимыми переменными. Дадим приращения (вариации) переменным х(Г), и(1), т.
е. рассмотрим х(Е)+ бх(1), и Я+ би(1) (г, ( г ( Т), здесь и(Ь), би(т) — кусочно-непрерывны, а х(1), бх(1) — непрерывно дифференцируемы на (Г„Т). Тогда вариация функции Лагранжа, представляющая собой главную линейную часть приращения этой функции, имеет вид т 6Я = ) ((Н„, бх) + <Н„, би> — (в(ов бх)) й— во вв во — ~ а, (д„' (х (Т)), бх (Т)) — ~~"„Ь, (Ь~~ (х (йо)), бх (йо)); Я=о для краткости аргументы у функций под интегралом опущены.
Интегрируя по частям, находим т т ) (ор(й), бх(1)) овв= (вр(й), бх(й)) ~~', — ~(вр(й), бхай) вй. о Ф, 3 2] ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА Тогда бЯв = ) ((Н„+ ср, бх) + (Нт би)] с](в Со .Г' — ~ а]д„'(х(Т)) + зр(Т), бх(Т) с-о зо + ~ч — с~ бА' (х (Со)) + Р ('о) бх (Со) ]=1 Пользуясь независимостью вариаций бх( ), би( ), из условия стационарности бЯ" 0 имеем о(]+Н„(х, и, С, о)с, а,)=0, Н„(х, и, С, с(], а,) О, ос оо ф(Т) = — ~ аСЕсх(х(Т)), зр(С ) = ~ Ь]й~ (х(С,)). с=о Таким образом, получены почти все основные соотношения тео- ремы 1, кроме условий (8), (9). Вместо условия (9) мы по- лучили равенство Н„=О, являющееся следствием (9) при У-' Е'.
Подчеркнем, что приведенные здесь рассуждения, конеч- но, не могут считаться строгими и являются литпь полезными наводящими соображениями при получении необходимых усло- вий оптимальности. В заключении заметим, что принцип максимума выше был сформулирован для задач оптимального управления, не содер- жащих фазовые ограничения при Со < С< Т, и в предположении, что область управлений — множество У вЂ” не зависит от време- ни.
Принцип максимума может быть сформулирован и для за- дач с фазовыми ограничениями и с переменной областью уп- равления [31, 77, 137, 166, 206, 306), одпако, надо отметить, полу- чающаяся отсюда краевая задача принципа максимума будет иметь более слолсный вид. Другой подход к исследованию задач с фазовыми ограничениями и с переменной областью интегри- рования будет изложен в главе 7.
Упражнения. 1. С помощью птвинципа максимума решить задачу быстродействия при условиях х' = х, хо = и(с), х(0) ш Я„х(т) сн Яа и(С) сн у = (и св Ес: ( иу(< ц, где яо = (х си йч: Ь(х) от (х)с = ц или яо = = (х си Ез: А(х) ю )х') < Ц, или Ео = ((О, 0)), или Яо = ((1, 0)), а Яю = = (х си Ез, я(х) = х' = О), или Яс — — (х ш Еьс Г(х) = )хР = 4) или Е, = = (х св йс: Г(х) ! х]з < 4), 1 2. Применить принцип максимума к задаче: з (и) =) ( и 00( с]С-~- 1п]; з о х' = х' хт = в (с), хз = х', х" = взОΠ— Г (О < с < ц; х(0) = ( — 1, О, О, 0). х(Т] = (О, О, О, 0).
Здесь х = (х', хо, хз, х4), и = (и', и'); д = сопзь) О. 3. Применить принцип максимума к задаче о мягкой посадке космиче- ского корабля на Луну с минимальной затратой горючего ((308), с. 36, 44, 54): у(и) = т(Т)-азор; й(С) = и(С), а(С) = — д+и(С)/т(С), т(С) = = — ]си(с), и(с)снУ=(вснЕ'. 0<в<а) (0<с<Т); Ь(0)й йо>0, ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА (ГЛ. 6 г(0) = им ж(0) = те ) 0; Ь(Т) = О, а(Т) = 0; момент Т заранее не задан. Здесь вс(с) — масса корабля, Сс(с) — высота, и(с) — вертикальная скорость корабля над Луной, и(с) — тяга двигателя, д — гравитационное ускорение Луны, а ) О, й ) 0 — постоянные (ср. пример 1.2). 4. Рассмотреть аадачи из примеров 7 — 11 для малых колебаний маятника, считая юп х' аи х', соз х' см 1. Найти решения краевых аадач принципа максимума. 5.
Рассмотреть задачи из примеров 1, 2 при дополнительном ограничении и (с) ш У = (и ш Е'. (и( < Ц. 6. Применить принцип максимума к вадаче: 7(и) = х'(Т) -~-1п(; х = и(с), и(с) см у = (иене'. (и( ( Ц (О ( с(т); х(0) = хо', момент т ) ) 0 вадан. Сколько решений имеет эта задача при хз —— О? х, = Т? 1 7. Показать, что в задаче а'(и) = ~(х (С) — й(С)) ЫС-~ш1; х = и(С), е и(с) сн У= (и сиеЧ (и) < Ц (О <с < Ц; х(0) = О, оптимальное управление не существует, ш(7(и) = — 1 (см.
пример 7.4.2). Что дает здесь применение принципа максимума? 1 8. найти минимум функции а (и) = ) з(п и (с) ссс при условии х = о соз и (с), и(с) сн у = (и сн Е'. ) и( < и/2) (О < с ( ц; х(0) = О, х(ц = 1. Показать, что и(с) 0 (О ( с ( Ц, — оптимальное управление, и убедлться в том, что в принципе максймума здесь надо принять а, = О. т 9.
применить принцип максимума к задаче: х (и) = ) (х (с) (з ссс -~ 1п1; о х'=и(с), и(С)шу=(иснЕ; (и(<ц (0<С<Т); х(0)=1, х(Т)=0; момент Т ) 0 задан. Показать, что при Т ) 1 оптимальное управление: и(с) ю — 1 (О < с < 1); и(с) = 0 (1 < с < Т) на участке 1 < с < Т является особым, т. е. его нельзя определить из принципа максимума. 1 10. Применить принцип максимума для У (и) = ~ и (С) соз — сИ-~. ях(с) 2 о -+1п(;а=и(с), и(с)с=у=(ишЕЧ (ф~(Ц (0(с(Ц; х(0)=0.