Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 103
Текст из файла (страница 103)
Если Т(х, и, 8)=у'(х, и) (6=0, 1, ..., п), д,(х, у, 1, Т)ее д,(х, у), мноясества Я(г„Т), Р(г), С(1) не зависят от времени, то задачу (27) — (31) называют автономной или стационарной. Если начальный момент закреплен, т. е. Вг =(г,), то в формулировке задачи (27) — (31) включение г,~и 6, опускают, вместо У(хо и(-), х( ), 1„Т) пишут короче: г(хо и( ), х( ), Т) или г(х„и( ), Т), вместо Я(1„Т) пишут Я(Т).
Аналогично поступают, если закреплены конечный момент Т или один нз концов траектории. В том случае, когда С(г)=Е" при всех или Б(г„Т) = Я,(г,)Х Я,(Т), где Я,(1) = Е", или Я,(1) — = Е", илн г'(г) Е', то соответствующие из условий (29), (ЗО), (31) в постановке задачи (27) — (31) также явно не указывают. Если Б(Го Т) = 8,(1,) Х Я,(Т), где Я,(Г,) С(г,) или Я,(Т) — = С(Т), то включение х(г,) гн Я,(1,) нли соответственно х(Т) ~н Я,(Т) будут учтены в условии (29), поэтому в (30) этп включения можно опустить.
В приложениях встречаются задачи оптимального управления более общего вида, чем задача (27) — (31). Возможны ситуации, когда наряду с ограничениями на управления и фазовые координаты, записанными, так сказать, в разделенном виде (29), (31), имеются более сложные ограничения вида (и(г), х(1))жИг(1), 1,(1< Т, (32) где И'(г) — ааданные множества из Е' Х Е". Ограничения (29), (31), (32) накладываются на значения функций и(г), х(6) в каждой точке 1, поэтому нх можно назвать точечными ограничениялги. Наряду с точечными ограничениями возможны также ограничения вида Уг(хо и(.), х(.), гь Т)(0, У~(х„и( ), х( ), 1о Т)= О, (33) где т Хг (хг, и (. ), х ( ° ), 16, Т) = ) 766 (х (1), и (1), г) йг + д1 (хг, х (Т), 16, Т), О 76(х, и, г), ясг (х, у, 1, Т) (г = 1, ..., 6,) — заданные функции.
Ограничения (ЗЗ) накладываются на функции и( ), х( ) = = х(, и(х), х,) в целом, поэтому их, в отличие от точечных, можно назвать интегральными ограничениями. Кстати, заметим, что ограничения вида (11) относится к интегральным. В теории оптимального управления рассматриваются также задачи, учитывагощие запаздывание информации, задачи с пара- ФОРМУЛИРОВКА ПРИИЦИПА МАКСИМУМА 435 метрами, с дискретным временем, с более общим видом целевой функции, задачи для интегро-дифференциальных уравнений, для уравнений с частными производпыии, для стохастичеспих уравнений и др. С некоторыми из этих задач мы познакомимся ниже, Важнейшим обобщением задач оптимального управления являются дифференциальные игры, описывающие конфликтно-управляемые системы, управляемые системы в условиях неопределенности, При исследовании управляемых систем наряду с задачами оптимизации описанного выше типа рассматрива«отея также и другие важные проблемы, такие, как управляемость, наблюдаемость, инвариантность, чувствительность, устойчивость, стабилизация, идентификация, фильтрация и т.
д. У нас здесь нет возиожности хотя бы бегло остановиться на перечисленных аспектах теории управляемых систем, и по этим вопросам иы отсылаем читателя к литературе, упомянутой во введении к настоящей главе. $ 2. Формулировка принципа максимума. Примеры 1. Начнем с рассмотрения задачи оптимального управления с закрепленным временем.
А именно, пусть требуется миниинзировать функцию т У (хю и ( ), х ( )) = ~ »~ (х («), и («), «) ~««+ ««' (хю х (Т)) (1) «о прп условиях х.(«)=»(х(«), и(«), «), «,<«<Т; х(«,)=х„ а" (х„х(Т) ) < О, « = 1, ..., т, д'(х„х(Т))=0, «=т+1, ..., г, и = и(«) ~и )г, «, < «< Т, (2) (3) (4) где моменты «„Т предполагаются заданными, и=(и', ..., й), х = (х', ..., х" ), » = (»', ..., » ); управление и = и (. ) является кусочно-непрерывной функцией на отрезке («,, Т); »'(х, и, «), д'(х, у) — заданные функции. Подчеркнем, что в задаче (1) — (4) множество Г~=.Е' не зависит от времени и фазовые ограничения при «, < «< Т отсутствуют. Очевидно, задача (1) — (4) является частным случаем задачи (1.27) — (1.31).
В (3) не' исключаются возможности, когда отсутствуют ограничения типа неравенств (т=0), типа равенств (а=т~1) или все ограничения (3) (з = т = 0). Предполагается, что функции»'(х, и, «), 4" (х, У') имеют частные производные д»'/дх'= »„'И дЮ'/дх*= к'„ь дИ'/др =к (« = 1,,, и). Обозначим»' = (»„'~,..., »'„„), д', = (д„',..., а'„'~), а', = (а„'., ", а'„.). пРинцип мАксимумА понтРИГинА [ГЛ. 3 Для формулировки принципа максимума введем функцию ХХ(х, и, г, ))), а,) = = — ао)х(х, и, 1)+ ))ч)'(х, и, 1)+...+)()„1" (х, и, 1)= = — а,)'(х, и, 1)+ <)р, 1(х, и, 1) >, (5)' называемую функцией Гамильтона — Понтрягина; здесь =()()о ..., )()„), а, — вспомогательные переменные, определяемые ниже.
Пусть и = и(1) — кусочно-непрерывное управление на отрезке [Го Т), х(1)=х(1, и, х,) — решение задачи (2), соответствующее этому управлению и = и( ) и начальному условию х, и определенное на всем отрезке (1„Т). Паре (и(Г), х(1)) (1,< < г< Т) поставим в соответствие следующую систему линейных дифференциальных уравнений относительно переменных =р(г)=И.(г),.-., р-(г)): дн(х, х, 6$Щ, а') ч(Ц =— дх' и хи), х=хи) х = аз)„)(х(1), и(С), Е) — ~ ))))(г) 7„') (х(1), и(Ю), К), сз(~1((Т, (6) д=) называемую сопряженной системой.
Систему (6) можно записать в векторной форме )()(1)= — Н„(х(1), и(1), г, )))(1), а,), 1,<1<Т, (7) где ХХх = (Нх„..., Нх„). Подчеркнем, что в (6), (7) и всюду ниже запись вида Н„)(х(г), иЯ, 1, )р(1), аз), д')(х„, х(Т)), ~'„') (х„х(Т)), как это обычно принято, означает, что сначала вычисляется соответствующая частная производная функций Н(х, и, г, )(), а,), ф(х, у) и затем вместо аргументов подставляются нх конкретные значения. Если система (2) линейна относительно х,и, т.
е. х(г)=А(с)х(г)+В(1)и(1)+ ХЯ, 1, <1< т (см. обозначения в (1.18)), то Н(х, и, г, ))), а,)= — а,/'(х, и, 1)+ + <))), А(1)х+В(1)и+7(Г)> и сопряженная система (7) может быть записана в виде )() (1) = а 1х (х (1), и (Г), й) — (А (Ю)) ))) (1), сз ~ (1~ (Т, где (А (1) )' — матрица, полученная транспонированием матрицы А(1). Из теоремы 1.2 следует, что если зафиксировать постоянную а„момент времени ~о г,< г, < Т, и точку )(),жР, то линейная з г) ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА 437 4) выполнены условия о ф; (С,) = ~ а;у~ о (хо, х (Т)), С=о о оус(Т) .= — ~ а;я'„;(хо, х(Т)), С=о алло(хо, х(Т))=0, 1=1, ..., пс.
(10) С = 1, ...,и, (11) Условия (10) принято называть условием трансверсальности, условие (11) — условием дополняющей нежесткости, В том случае, когда управление и( ) является ограниченной измеримой фуикцией, т. е. и( ) ~ Е" [Со, Т[, то формулировка теоремы 1 полностью сохраняется, по равенство (9) (как и включение (4)) будет выполняться, вообще говоря, лишь почти всюду па отрезке [Со, Т[.
Центральное место в теореме 1 занимает условие максимума (9): оказывается, если и( ) — оптимальное управление, а х(.)— оптимальная траектория, то иепремеиио Найдутся такие числа а„а„..., а, и такое решение ор(С) системы (6), (10), что функция Й(х(С), и, С, оу(С), а,) перемеииой и будет достигать своего система (7) будет иметь и притом единственное решение ор(С) = = ф(С, и, Х„СЬ туо), удОВЛЕтВОряЮщЕЕ УСЛОВИЮ О[О(С,) =О[Ч И ОПрЕ- деленное иа всем отрезке [С„ Т[. Теперь моноем перейти к формулировке теоремы, выражающей Необходимое условие оптимальности — принцип максимума для задачи (1) — (4).
Теорема 1. Пусть функции ~о(х, и, С) (1=0, 1, ..., и), к (х, у) (1=0, 1, ..., г) имеют частные производные ф, д'и дц (С = 1, ..., и) и непрерывны вместе с этими производными по совокупности своих аргументов при хоп Е", у оп Е", и ш У, Сои оп [С„Т). Пусть (х,, и(С), х(С) ) (С, ( С < Т) — решение задачи (1), (4). Тогда необходимо существуют числа а,, а„..., а, и вектор- функция оР(С) =(ф(С), ..., ф„(С) ), С, < С ( Т, такие, что 1) а = (а„а„..., а,) ть О, а, 1 О, а, ~1 О, ..., а э~ 0; (8) 2) ф(С) является решением сопряженной системы (6), соответствующей рассматриваемолоу решению (х„и( ), х( )); 3) для всех Сои [С„Т), являющихся точками непрерывности оптимального управления и(.), функция Н(х(С), и, С, оР(С), а,) переменной и=(и', ..., и') достигает своей верхней грани на множестве У при и = и(С), т. е. зпр Н (х (С), и, С, ог (С), ао) =- иег = Н(х(С), и(С), С, оу(С), а ), Со(С(~ Т; (9) лгннцип максимума понтгягпнА ~гл.
6 максимума на У именно при и=и(Г) во всех точках Гш[го т) непрерывности управления и( ). Поэтому теорему 1 и нижеследующую теорему 2, дающие необходимое условие оптимальности, принято называть принципом максимума. 2. Однако как практически пользоваться теоремой 1 для поиска решения задачи (1) — (4)? Здесь обычно поступают следующим обрааом. Рассматривают функцию Н(х, и, г, ф а,) как функцию г переменных и=(и', ..., и")ш 1г, считая остальные переменные (х, г, ф а,) параметрами, и при каждом фиксированном наборе (х, г, ф, а,) решают задачу максимизации: Н(х, и, г, ф а,)- зпр, иш г'.
Отсюда находят функцию и=и(х, р, ф а,)ш$', (13) на которой достигается верхняя грань в задаче (12), т. е. Н(х, и(х, Р, ф а,), 1, ф а,) = зпр Н(х, и, ~, ф аа). (14) им у Если исходная задача (1) — (4) имеет решение, то, как следует из (9), функция (13) определена на непустом множестве. В ряде случаев функция (13) может быть выписана в явном виде. Например, если Т 1'(х, и, г) = Д(х, р) + ~ ф (х, ~) и', ? = О, 1, ..., и, а=1 г' = (и = (и', ..., и') ш Е'. щ < и' < ре 1 = 1, ..., г), где аь р, — ваданные числа, то Р Н (х, и, г, ~р, а ) .= — аа/з а(х, 1) + У.
~р.Д (х, г) + ~~ ц; (х, ~, ~р, а )и', ?=1 з=1 адесь для краткости обозначено и ср; (х, 1, ф аз) = — — аз)ц (х, Г) + ~~З ф?[з (х, 1), 1 = 1,..., г. Ясно, что решением задачи (12) тогда будет вектор-функция и(х, г, ф а,) с координатами ср; (х, р, ф, ац) > О, и' = и' (х, й, ф, аа) = аи цч (х, С, ф а,) ( О, 1 = 1,..., г. В частности, если щ= — 1, ~с=+1, то й =з1яп<р,(х, г, ~р, а,) (1 = 1, ..., г) .
Полученная формула дает довольно много информации о структуре оптимального управления: 1-я координата оптимального управления является ступенчатой функцией со 439 ФОРМУЛИРОВКА ПРИНЦИПА МАКСПМУЪ|А значениами Рл или ~ь пРичем точки пеРеключениа опРеДелЯютсЯ условием ф,(х, С, ф ао) = О. Обратим внимание читателя на возможный особый случай, когда ф;(х(С), С, ф(С), а,)=0 на каком- либо промежутке [а, р]~ [С„Т]. В этом случае функция Н пе будет зависеть от и' и из условия (9) не удастся извлечь пикакоп полезной информации об 1-й координате управления и( ) при Сон[и, р]; некоторым источником информации об и'( ) на этом особом участке [и, 3] здесь может служить само равенство ф;(х(С), С, ф(С), а,)=0.