Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 102
Текст из файла (страница 102)
Из (14) с учетом условия (13) имеем )Ах( )(Ю) — Ау( )(1) ! = 1~ (7" (х(т), и(т), т) — ~(у(т), и(т), т)) с)т ( (сс (~Т (т))х(т) — у(т))с)т( псах )х(т) — у(т)) ~7 (т)сст. (16) с с а Оценка (15) при и = 1 доказана. Пусть оценка (15) верна для некоторого т~1. Тогда с помощью неравенства (16) получим )А "'х( )(с) — А +су( )(с) ! = ~А(А х( ))(с) — А(А у( )) (с)~ ( с я:, ~ Ь(т)!А х( )(т) — А у( )(т))сста <(~с) —, * !*се — исс)и (~ссср) с'< Щ' 10~4 с сс 'О ( —, спал )х(9) — у(9)! ~ Х(т) ) 1 ($)сС$ с)т= ~) с,~з~с с, а-~-1 ("'+ С)) с ~с~с гаах ) х(т) — у(т)) — "Ь(9) ссз сст = ,т о с ' с та+1 - ~*с'с — ~с с~((~с'сс (ссс + 1)! о 10 для любых 1ж ')с„Т1.
Оценка (15) доказана. Из этой оценки ПРИНЦИП МАКСИМУМА ПОНТРЯГПЫА 1гл, в следует, что т т [А"х( ) — -4 у( )[с~ (— ', ~Ь(т)[т ~[х( ) у(.)[[с. 0 т т т.« «. рр —,~[р()р.) =р...,р,,р„„,„„р,„ ри «р т т будрем иметь —, ) Ь(т) р[т (1. Таким образом, отображение Ф А" является сжимающим. Из принципа сжимающих отображений ([179, с.
82)) следует существование единственной функции х(.) рн С" [г„Т), для которой х( ) =Ах( ), что равносильно выполнению равенства (12). Из свойств интеграла Лебега с переменныи верхним пределом (см. [179, с. 3441) и из (12) следует, что получившаяся функция х(Г), др <1~ Т, абсолютно непрерывна, ее производная х(Г) ~ Ь" [р„Т), и уравнение (8) удовлетворяется почти всюду на [1р, Т~. Теорема 1 доказана. 3 а м е ч а н и е 1. Вместо условия (13) можно потребовать ду [ д['(х, и, 01 непрерывность — = ~ '. ' ) (~, у = 1,..., и) при дх ([ дхР ) (х, и, 1)~Е" ХЕ'Х[гт Т1, однако в атом случае существование решения задачи (8), (9) можно гарантировать, вообще говоря, лишь на отрезке [»р, Гр+ а), где а — достаточно малое число.
Замечание 2, Если управление и = и(1) ен Ер[Г„Т) (1<р( ), то теорема 1 и ее доказательство останутся в силе, если, например, дополнительно потребовать [[(х, и, с) [ к С,([х[+ [и[ )+ С,(г) (17) для всех (х, п, р) ри Е" Х Е" Х [г„Т1, где С, = сопз1 > О, С, (р) дв хм О, С, (г) ~ Л, [г„Т) . Условие (17) нужно для обеспе зепия включения ((х, и(Г), 1) ркрт [го Т) для любых х( )се С" [дт Т), и ( ) е= Е~ [г„Т], чтобы отображение (14) имело смысл. Более тонкие теоремы существования и единственности решения задачи (8), (9) для управлений и(1) ен Ьр[1, Т) (1е р( ~ (ио) можно найти в [2, 77, 104, 166, 1991. Остановимся еще на случае лннепной системы, когда виесзо (8) имеет место Ар(Г)=А(Г)х(1)+В(Г)и(1)+7(Г), Гр(1~Т, (18) где А (1) =(ае(Г) ), В(Г) (Ьи(Ю) ) — матрицы порядков п Х п, и ПХ г соответственно, У(1)=()'(д),, 7 (г)) (Е, (1~ Т), 6 г] ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 431 Теорема 2.
Пусть элементы (ао(1)), (Ь>,(г)) лгатриг) А(>), В(г) принадлежат Х„'1>„Т1 а [Я ее Хг" [>„Т). Тогда для каждого управления и = и (1) ~ Х "р [гз, Т), где р — какое-либо фиксированное число, 1 < р <, и любой точки х, >и Е" зада.и Коши для системы (18) с начальным условием х(г,)=х, имеет, и притом единственное, решение х = х(Т) в смысле определения 1, определенное на всем отрезке [г„Т). Это решение имеет производну>о х(г) почти всюду на [>„Т1, х(г) ~ Хг [гз, Т) и удовлетворяет уравнению (18) почти всюду на 1>„Т~. Если кроме перечисленных условий, еще имеет место включение Х(г) е= Х р [гз, Т), >по х(1) е= Х р [цз, Т[.
Д о к а з а т е л ь с т в о. Нетрудно видеть, что правая часть уравнении (18) удовлетворяет условию (13) с Х (г) = ~~А (г) ~) ж ж Х „[1„Т). Кроме того, у (г)юА (г) х (г)+В (1) и Я+ [ (Е) я Х г Т[ для любых х (г) з= С" [гз, Т), и (г) зн Х р [й„Т[. Дальнеглгаее доказательство проводится так же, как доказательство теоремы 1. 4.
Вернемся к постановке задачи оптимального управления. Как видно из примеров 1, 2, не только на управляющие параметры объекта, но и на его фазовые координаты могут накладываться некоторые дополнительные ограничения, которые не вытекают из свойств системы (8) и ограничений на управленкя. Такие ограничения можно описать условием х(1)=х(Г, и( ), х )~ 6(г), 1, <1< Т, (19) где С(1) — некоторое заданное множество из Е" при каждом т гн [г,, Т1.
Ограничения (19) часто называют фазовыми ограничениями. Далее, начальный и конечный моменты времени г, и Т, г, < Т, характеризующие продолжительность движения объекта, могут зависеть от управления (например, в задачах быстродеиствия) и не всегда могут быть заданы заранее. В таких случаях обычно указывают ограничения 1, гн >В„Т ж Во (20) где >о„ 8> — заданные множества на числовой оси В =(гг †"-р < < 1 < + ) (не исключается возможность, что с>, = К или 8>г = В) . Наконец, остановимся на условиях, которым должны удовлетворять левый и правый концы траектории. Собственно говоря, из включений (19) при 1=1, и Т Т уже следуют условия х(1,)ы 6(Г,), х(Т)>И С(Т), и в некоторых случаях нет необходимости как-то еще иначе выделять ограничения па концы траектории. Однако могут возникнуть ситуации (например, при 6(1)= Е" (г, < 1< Т)), когда такие ограничения удобнее выделить и рассматривать самостоятельно.
В таких случаях будем считать, что в Е" при каждом С,>н 6, задано множество Б,(гп) 432 ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА [ГЛ. Е и при каждом Т ~ 6, — множество Я>(Т), и условия на концах траекторий будем записывать в виде х(гю)>и Ею(гю)> Гю ж 6ю, 'х(Т)жЯ>(Т), Т юк 6,. (21) В задачах оптимального управления принята следующая классификация условий (20), (21).
Если множество 6, состоит из единственной точки 1„ то начальный момент называ>от закрепленньм; если 6, состоит из одной точки Т, то конечный момент называ>от закРепленным. Если множество Яю(сю) 1нлн О>(Т)1 СОСтОИт ИЗ ОДНОЙ ТОЧКИ И НЕ ЗаВИСИт От Г„т. Е. Яю(гю)= =(хю), 1, ж 6> 1или соответственно Я> (Т) =(х,), Т ы 6>1, то говорят, что левый 1прав>зй) конец траектории закреплен.
Если Яю(сю)=— Е", Гююи6, (или $,(Т)— = Е", Тюк 6,), то левый ~прагьпю) конец траектории называют свободным. В остальных случаях левый )соответственно правый1 конец траектории называют подвихсным. Примером того, как могут задаваться множества Яю(гю), является ~ю(гю) (У' У ы С(гю)ю ь>(у> Гю) ~ Ою > = 1 >и Ь~(у Г ) = О, $ = тю+ 1, г ) (22) где функции Ь (У >) (>=1, гю), определены при у =-С( ), 1 ж 6,. Аналогично, примером множества Я>(Т) служит Я>(Т) =(х: х ы С(Т), д>(х, Т)( О, > = 1, ..., тп д,(х, Т)= О, > = >и>+ 1, ..., г,), (23) где функции д,(х, Г) (>' = 1, ..., г,), определены прн х ~ С(Г), г ы 6,. В приложениях нередко возникают также задачи, в которых левый и правый концы траектории должны выбираться согласованно, в зависимости друг от друга.
Это требование можно записать в виде (х(г,), х(Т) ) >н Я(г,, Т), е, ы 6„Т ы 6„(24) где Я(>„Т) при каждом (гю, Т) >и 6ю Х 6> представляет собой заданное множество нз Е" Х Е'. Примером такого множества является Я(Г„Т)=((х, у)ыЕ" ХЕ": д>(х, у, Г„Т)<0, >=1, ..., т, дю(х, у, Г,, Т)= О, > = т+ 1, ..., г), (25) где д>(х, у, 1, Т) — заданные функции переменных (х, у, 1, Т)юи ы Е" Х Е" Х 6, Х О,. Понятно, что множества (21) явля>отея частным случаем мнонюества (24), когда Я(Г„Т)= Ею(сю)ХЕ (Т) ' мнояюества (22), (23) — частный случай (25).
5. Теперь перейдем к непосредственной формулировке задачи оптимального управления. Пусть заданы множества 6>, О, на числовой оси В, 1П16, < зпр6,; у(1) юк Е", С(г)~ Е" при всех Г, 5 ц постАнОВкА 3АдАчи ОптимАльнОГО упРАВления 433 (26) й,=11»(хв), (), (), С„Т), где нижняя грань берется по всем допустимым наборам. Допустимый набор(хзю и„( ), хв(.), Сзв, Тв) назовем решением задачи оптил~альнозо управления, и„( ) — оптимальнызз управлением, х ( ) — оптимальной траекторией, если с (хзв, ив ( ), хв( ), С„, Т,) =Х,. Сформулированную задачу оптимального управления можно записать в следующем кратком виде: » (хз и (') х (')т Сз1 Т) т = )»з(х(С), и(С), С)ЗС+ дв(х„х(Т), С„Т)-ьСП1, (27) о х(С)=»(х(С), и(С), С), С, < С < Т, (28) х(С) - =С(С), С < С < Т, (29) х(С,)=хе х(Т)жЗ(Сн Т), С,~и6., Тю6„(30) и(С)ж р(С), Ср » <С » ~Т, (31) СП16,<С <зпр6,; о'(С„Т), С, ю 6„Тж 6,.
Пусть движение фазовой точки х =(х', ..., х") описывается системой обыкновенных дифференциальных уравнений (7), где функция»(х, и, С) определена при хю Сз(С), иж т'(С), Сж(С„Т|. Набор (См Т, х„и( ), х( )) назовем допустимым, если С ж 6, Тчи 6„С, < Т, управление и = и( )=(и'(С), ..., и" (С)) определено и кусочно-непрерывно на отрезке (С„Т) и удовлетворяет ограничению (10) на атом отрезке, а х=х( )= =х(, и( ), х,) — траектория задачи (8), (9) (см. определение 1), которая определена на отрезке (С., Т'1 и удовлетворяет фазовому ограничению (19), (х(С,) = х„х(Т) ) ю З(С„Т).
Будем предполагать, что множество допустимых наборов непусто. Пусть на множестве допустимых наборов задана функция (или, как часто говорят, целевая функция или функционал) з (хз1 и ( ), х ('), Св, Т) = т = )» (х(С), и(С), С)АСС+ вв(хз, х(Т), С„Т), зз где»'(х, и, С), д,(х, у, С, Т) — заданные функции при хю 1" (С), и ~и )т(С), Сп1 6, < С < зпр 6„Т ю 6ь Задача оптилзальнозо управления заключается в том, чтобы минимизировать или максимизировать функо,ию (26) на мнозсестве допустимых наборов. Мы ограничимся рассмотренпем лишь задач минимизации, так как задача минимизации з всегда может быть сведена к эквивалентной задаче минимизации ( — з).
Обозначим пРинцип мАксимумА понтРягинА 434 [гл. 6 подразумевая (если не оговорено другое), что управление и = и( ) — кусочно-непрерывно па отрезке (г„ Т). Если ~'— = 1, де=О, то 1(1о Т, х„и( ), х( ))= — Т вЂ” й— в этом случае задачу (27) — (31) называют задачей быстродейстеня.