Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 105
Текст из файла (страница 105)
(26) Аналогичные рассуждения показывают, что если в задаче (1), (2), (4) левый конец траектории свободный, правый конец закреплен, то соответствующая краевая задача принципа максимума представляет собой систему (15), которая должна решаться при условиях х(Т) = х„1Р(2о) = у'„(хо х(Т)), ао = 1 (27) Если в задаче (1), (2), (4) оба конца траектории свободны, то краевая задача принципа максимума состоит из системы (15) и условий 1Р(со) = у~(хо х(Т)) $(Т) = уо(хо х(Т)) ао = 1.
(28) Далее, рассмотрим задачу (1), (2), (4) в случае, когда ле- вый конец траектории закреплен: х(1,)=х„а правый конец под- вижный и удовлетворяет условиям у'(х(Т))(0, 1=1, ..., т,; у'(х(Т))=0, 1=т,+1, ..., г,. (29) Здесь мы имеем дело с задачей (1) — (4), в ноторой функции у1(х, у) определены так: до(х, у) = у'(у) (1 = 1, ..., г,); у1 (х, у) = хо — хо (1 = г, + 1, ..., г, + п = г, т = т, ) . Условия (10), (11) на правом конце траектории с учетом (8) запишутся в виде о ф(Т) = — аоу„(х„х(Т)) — ~ а;дг'(х(Т)), 1=1 (30) а1уо(х(Т))= О, а1> О, 1 =1, ..., т,; но~ О, на левом конце — в виде: ф(го) = "оУг(хо х(Т)) + (а, е„..., а, +„).
(31) Условие а = (ао, а„..., а, е„) ФО здесь может быть заменено условием (а„а„..., ао,) чь О. В самом деле, если бы (ао, а„... ..., а,,) = О, то в силу (30) 1)1(Т) = О, и однородная система (6) бУДет иметь тРивиальное Решение оу(1) — 0; тогДа $(го)=0 и из (31) будет следовать (а, о.1, ..., а, .о ) = О, что противоречит условию а чь О. Поэтому условие нормировки (18) можно заменить на ао + а1 + ... + а, = 1, (32) пгинцип максим ма понтгягинл ~гл.
в а условие (31) и параметры а, +и..., а, в исключить из рассмотрения. В результате, краевая задача принципа максимума будет состоять из системы (15), начального условия х(1о) = х„ условий (29), (30), (32). Аналогично показывается, что в задаче (1), (2), (4), когда левый конец траектории свободный, а на правом конце заданы условия (29), краевая задача принципа максимума будет состоять из системы (15), условий (29), (30) на правом конце, условия нормировки (32) и условия на левом конце $(1о) = аодх (х, х(Т)) (33) Рассмотрим задачу (1), (2), (4), когда оба конца траектории подвижны, причем условия на правом конце задаются в виде (29), на левом конце пусть Ь'(х(то) ) ~ О, $ = 1, °, то; Ь'(х(1о))=0, 1=то+1, ..., го.
(34) Здесь мы имеем дело с задачей (1) — (4), в которой функции до(х, у) определены так: до(х, у) = д'(у) (Х = 1, ..., т,); у'(х, у)=Ь* ~(х) (о=т,+1,..., т,+т,=т), до(х, у) = = д' о(у) (о = т, + то + 1, ..., т, + г,); уо(х, у) = Ь' *1 (1 = = то+ г, + 1,..., го+ г, = г). Условия (10), (11) на правом конце траектории с учетом (8) запишутся в виде (30), а на левом конце получим оо Ф(1о) = вой(хо х(Т)) + ~ Ьой~(хо) о=1 Ь Ь'(х,) = О, Ьо ) О, 1 = 1, ..., т,. (35) Таким обрааом, краевая задача принципа максимума, соответствующая задаче (1), (2), (4), (29), (34), состоит из системы (15), условий (29), (30), (34), (35), условия нормировки аоо + а, + ...
+ ао + Ьо + ... + Ьо = 1. Если в (1), (2), (4) левый конец удовлетворяет условиям (34), а правый конец закрепленнып, то систему (15) нужно решать при условиях (34), (35), х(Т) =х„условии нормировки а,'+Ь',+ ...+Ь,' =1. (36) Если в аадаче (1), (2), (4) левый конец удовлетворяет условиям (34), а правый конец свободный, то система (15) решается при условиях (34) — (36), оу(Т) = — аод"„(х„х(Т)).
4. Сформулируем принцип максимума для задачи оптимального управления, когда начальный или конечный моменты вре- ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА 445 $21 мени не закреплены. А именно, пусть требуется минимизировать функцию т Х(х„и( ), х( ), („Т) = ~ 7о(х(~), и (~), г)дс+ во(х„х(Т), ~„Т) о„ (37) (41) зпалН(х(йо) и,го ф(Ео) ао) = — Х аФ(хо х(Т), 1о Т) (42) оит з=о (если 8о закреплено, то условие (42) отсутствует); тпах Н (х(Т), и, Т, ф(Т), а,) = ~Э~ а;дт(х„х(Т), оо, Т) (43) ояг 2=о (если Т закреплено, то условие (43) отсутствует) и условию дополняющей нежесткости аУ'(х„х(Т), Се Т)=0, 1=1, ..., т. (44) при условиях х(о) )(х(Е), и(о), Ю), Ео < ~( Т; х(Е,)=хо, (38) у'(х„х(Т), 1е Т)<0, 2=1, ..., т; у'(х„х(Т), о„Т)=0, 1=и+1, ..., з, (39) и=и(г)жр, йо<Е~Т, (40) где один из моментов Е, или Т или оба зги момента заранее неизвестны и подлежат определению вместе с управлением и(г) и траекторией х(т) из условия минимума функции (37); у'(х, у, й, Т) (1 = О, 1, ..., и) — заданные функции переменных хоиЕ", ужЕ", ~жй, Тонй, ~<Т; остальные обозначения те же, что и в задаче (1) — (4).
В (39) не исключаются возмож- ности, когда отсутствуют ограничения типа неравенств (т = 0), типа равенств (з = т ) 1) или все ограничения (39) (з = т = 0) . Теорема 2. Пусть функуии Р(х, и, г) ()=О, 1, ..., и); У'(х, У, Сг Т) (7 = О, 1, ..., 2) меют частные производные 1„и з з, уо (о = 1, °, п)1 уо, ут и непрерывны вместе с этими производными по совокупности своих аргументов при х ои Е", у жЕ", иж т', 1 жй, Тжй, ~< Т. Пусть (х„и( ), х( ), 8„Т)— решение задачи (37) — (40).
Тогда необходимо существуют числа а,, а„..., а, и вектор-функция зр(о)=(о(Н(г), ..., ор„(г)) (о,< < г < Т), удовлетворяющие условиям 1) — 3) теоремы 1, усло- виям трансверсальности рИо) = Х а4х(х„х(Т), ~„Т), 4=о ф(Т) = — Х аэуо(хо (Т) " Т) [ГЛ. В ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА С помощью теоремы 2 задачу (37) — (40) можно свести к краевой задаче принципа максимума, действуя по той же схеме, что и в задаче (1) — (4). Это снова приведет нас к конечномерной задаче максимизации (12), функции (13) и к системе 2п дифференциальных уравнений (15) относительно функций х(1), ф(~). Для определения 2п параметров, от которых зависит общее решение системы (15), и параметров аи ао ..., а, имеем 2п условий (41), т условий (44), г — т условий типа равенств из (39), условие нормировки (18), а наличие неизвестных моментов ~„ Т здесь компенсируется появлением дополнительных условий (42), (43); разумеется, поиск упомянутых параметров нужно вести с учетом неравенств из (8), (39).
Расшифровка условий трансверсальности (41), (42) для различных режимов на концах траекторий, когда каждый из концов может быть за. крепленным, свободным или подвижным, проводится точно так же, как и выше; в частности, условия (41) здесь приведут к тем же условиям (21) — (36). Естественно, в задаче оптимального управления с незакрепленным временем функции ~', Й' из условий (29), (34) наряду с х, у могут зависеть еще от переменных 1„, Т, как например, в (1.22), (1.23). 5. Для иллюстрации теорем 1, 2 рассмотрим конкретные примеры задач оптимального управления. П р и м е р 1. Пусть требуется минимизировать функцию т ,/ (и) = ) (и'(К) +хзЯ)сй при условиях х(~)=и(г), 0<1< Т, о х (0) = х (Т) = О.
Здесь момент Т ~ 0 задан; У = Е'. Задача, конечно, несложная: пара (и(С)=0, х(С)= — 0) (0 <1< Т), очевидно, является единственным ее решением. Продемонстрируем на этой простой задаче изложенную выше схему использования принципа максимума — теоремы 1. Выпишем функцию Гамильтона — Понтрягина Н(х, и, ф а,)= — а,(и'+х')+фи и сопряженную систему ф = — Н = 2а,х. Если а, = О, то функция Н=~ри может достигать своей верхней грани на множестве У'=Е' лишь при ф = О. Однако соотношения а, = 1~ = 0 противоречат условию (23).
Следовательно, а, ) О. Тогда можем считать, что а, = 1. В этом случае функция Н= — и' — х'+ фи достигает верхней грани на Е' при и =ф/2 — вот какой вид имеет функция (13) в рассматриваемой задаче. Тогда краевая задача принципа максимума запишется в виде х = ~~/2, ~р = 2х, 0 < Е < Т; х(0) = х( Т) = О. Отсюда однозначно определяем х(й) = ф(г) — = 0 (О < г < Т) . Тогда и(Г) =1~(Г)/2 — = 0 (О < Ю < Т) — получили уже известное нам оптимальное управление. 5 21 ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА 447 Перейдем к рассмотрению более интересной задачи оптимального управления, которая в зависимости от величины конечного момента Т имеет единственное решение или бесконечно много решений, или не имеет решения.
Эта задача любопытна такнсе и тем, что даже в том случае, когда она не имеет решения, краевая задача принципа максимума будет иметь одно или даже бесконечно много решений. П р и м е р 2. Пусть требуется минимизировать функцию т у(и) = ~ (и' (2) — х'(2)) й при условиях х(~)=и(~), 0<~< о < Т, х (0) = х(Т) = О, Т > О. Функция Гамильтона — Понтрягина здесь имеет вид Н = = — а,(и' — х')+ ~р(и), сопряженная система такая: $ = — Н„= = — 2а.х. Если а, =О, то Н= ~и достигает своей верхней грани на $" = Е' лишь при ф = О, что противоречит условию (23). Следовательно, а,>0.
Можно считать, что а„=1. Тогда Н=х'— — и'+ фи и зпр Н достигается при и = ф/2. Краевая задача лнк принципа максимума имеет вид х = ф/2, ~ = — 2х, 0 < г < Т, х(0)=х(Т)= О. Общее решение этой системы дается формулой х(2) =Сз1п С+1)сов 8, ф(2)= 2С сов 2 — 2Нз1пй, где С,  — произвольные постоянные.