XV Ванько В.И., Ермошина О.В., Кувыркин Г.Н. Вариационное исчисление и оптимальное управление (1081425), страница 26
Текст из файла (страница 26)
Но тогда управление, составленное из управления и на участках [1ы г1], [гз, 1з] и управления п(1) на участке [гы гв], переводит систему из положения х в положение х и придает целевому функционалу значение 1~+1„+1з <1, т.е. и'(1) не является оптимальным управлением. Аналогичные рассуждения можно провести для фазовых траекторий. Перейдем теперь к основным соотношениям, необходимым для того, чтобы сформулировать принцип максимума. 203 7Л. Литоиомиоя система управления Включим фазовое пространство ~в в (и+1)-мерное простран- ство Ки ~1, присоединив к координатам хп ..., х„дополнитель- ную координату хе. При этом потребуем, чтобы функция хе(1) удовлетворяла соотношению .
е11) = 1 (~,л)ит. Тогда функция хе(~) будет решением уравнения =1 (х,и). Присоединим это уравнение к системе (7.1): ох — = у(х,и), (7.5) — 1 = О,п.. (7.6) а дх,, и=-О относительно неизвестных функций ф,(1). Эту систему иногда называют сопряженной системой к системе (7.5), а переменные ф; — сопряженными переменными. гДе х = (хе, х) = (хем хп ...., х„):, У" = (~е, 7"', ..., 1") . Заметим, что правые части системы (7.5) не зависят от хш Целевой функционал 1 (7.4) рассматриваемой задачи теперь можно записать в виде У~х, и~ = хе(~з), т.е. он оказался равным конечному значению координаты хе.
Рассматриваемая задача тем самым свелась к задаче выбора такого допустимого управления и(т), которое осуществляет переход точки х(1) в т (и+1)-мерном пространстве из положения х1 = (О, х1) в блит жаюшую точку х~ = (х~~, хя) на прямой, параллельной оси Охе и проходящей через точку (О, хт) (ближайшая точка в смысле минимума координаты хш рис. 7.3). Рассмотрим вспомогательную систему 204 7. ПРИНЦИП МАКСИМУМА Рис.
7.3 Если и(г) некоторое допустимое управление, х(1) соответствующая этому управления> фазовая траектория, то, подставляя эти функции в правые части уравнений (7.6), получим линейную однородную систему дифференциальных уравнений с известными кусочно непрерывными коэффициентами. Поэтому при любых начальных условиях эта система имеет единственное решение [ЧШ]. Так как функции 70(х., и), о = О, н, не зависят от хсч то первое уравнение системы (7.б) имеет простой вид щго — =О, ~Й из него получаем фз = сопв1. Составим функцию Понгпряеина Н(Ф,х,и) = ~ ф 7" (х,н) = (Ф, у(х,и)), (7.7) а.=з т где Ф = Оде, ..., ф„) вектор сопряженных переменных.
При фиксированных значениях Ф и х функция Понтрягина есть функция от и Е Г. Точную верхнюю грань значений этой функции обозначим через М(Ф,х): М (Ф, х) = вир П(Ф, х, и). иеп 205 7.К Автонпягная систегга управления Если точная верхняя грань значений непрерывной функции Н достигается в некоторой точке области управления Е7, то М(Ф, х) является максимумом значений функции Н при фиксированных Ф и х. Теорема 7.1 (принцип максимума).
Если управление и'(1), 1с ~1мЯ, и соответствующая ему фазовая траектория х*(г) оптимальны, то найдется такая ненулевая вектор- функция Ф*(1), соответствующая функциям х'(1) и и*(г) (т.е. удовлетворяющая сопряженной системе (7.6) при подстановке в нее х*(1) и и'(с) ), что: 1' при каждом значении 1 е [1 и сг) функция Н (Ф* Яг х" Я г и) от переменных и достигает максимума в точке и = и*(г): ЕХ(Ф'(1) г х*(1), и*(1)) = М(Ф*(с), х* (1) ); 2' в конечный момент времени 1г выполнены соотношения гггс~Ьг) <О, М(Ф*(1е)гх*1гг)) =О 7Е В заключение отметим., что системы (7.5) и (7.6) с помощью функции Понтрягина могут быть записаны как гамильтонова система следующим образом: агхг дН г1т юг ' г1ф; дН дхг г=Огп; (7.8) г = О,п.
Очевидно, что если вектор-функция х(1) удовлетворяет системе (7.1), то она удовлетворяет и первой подсистсмс в системе (7.8), поскольку все уравнения, кроме первого, в этой подсистеме как раз и образуют систему (7.1). Замечание 7.1. Если Ф(1), х(1)г и(1) удовлетворяют системе (7.8) и условию 1', то функции грс(1) и М(Ф(г),х(1)) 206 7. ПРИНЦИП МАКСИМУМА дМ ~ дМдхс ~ дМаарй Ж ~- дх; сН х-'дФ й + ~ 1=1 у=о дМ дН дМ дН дх; дщ,, д1р дх (7.1З) При дифференцировании учтено, что функции Н(Ф,х,и) и М(Ф,х) не зависят от хо. Так как дМ дН дМ дН дт,, дх дзд: дф то из [7.9) получаем дМ ~ дНдН ~ дН дН М ~-; дх, д41 х-, дф; дт, Из условия постоянства функций 4о(т) и М(Ф(т),х(т)) следует, что условие 2' в теореме (7.1) можно проверять в любой момент времени 1 е [11, тз).
7.2. Обсуждение принципа максимума Остановимся на достаточности соотношений принципа максимума для решения поставленной задачи оптииальноео управления. Набор условий теоремы 7.1 в некотором смысле явля- 'Доказательство существования у функпии М(йо11),х(1)) производной по ссн всюду смг Понсорягин Л.С., Болньянекий В.Г., Гамкрслийзе. Р.В., Мищенко В.Ф. переменного 1 являются постоянными.
Действительно., как уже было отмечено, из системы (7.6) следует, что зро = сопв1. Покажем, что функция М(Ф®,х[т)) постоянна, предполагая, что она имеет производную*, которую можно вычислять по правилу дифференцирования сложной функции. Зафиксируем Ф(т) и х(е) и рассмотрим функцию М(Ф(е),х(е)) переменного 1. Вычислим производную этой функции в силу системы (7.8): 207 7.2. Обсуждпнио принципа максимума ется полным. Он позволяет из всех траекторий, проходящих через две заданные точки х и ж, выделить отдельные (или одну) траектории, среди которых находится оптя иаяьноя траектория, если, конечно, она существует.
Действительно, вся совокупность траекторий определяется 2п+ 1 дифференциальными уравнениями (7.8) (если опустить первое уравнение — = 7" (т,н)) и и алгебраическими урав4ио О пениями, которые дает условие 1' теоремы 7.1. Например, если максимум функции Н достигается во внутренней точке, то необходимым является обращение в нуль г частных производных. Если максимум достигается на (г — 1)-мерной поверхности, лежащей на границе пбяасши управления Г, то по методу Лагранжа для поиска условного экстремума функции многих переменных ~Ъ1 получаем г уравнений, приравнивая нулю частные производные функции Лагранжа, и одно уравнение связи при дополнительном неизвестном —.- множителе Лагранжа. После исключения множителя Лагранжа остается и алгебраических уравнений.
Аналогичен общий случай, когда максимум достигается на а-мерной поверхности, расположенной на границе Г. Итак, всего имеется 2п+ 1+ и уравнений., связывающих 2п, + 1+ г переменных Ф, щ, и. Так как из этих соотношений и --. алгебраические уравнения, решения зависят от 2п+ 1 параметров начальных условий.
Один из параметров лвляется несущественным, поскольку функция Н однородна относительно переменных Оуа, а все функции уу„(1) определены лишь с точностью до общего множителя. Кроме того, один из параметров определяется условием в момент времени ~1 (или в любой другой момент): шахН(Ф(гч),т(г1).,и) = О. не и Таким образом, все многообразие решений зависит от 2п, — 1 параметров. Время ~2 также является параметром. Следовательно, искомая оптимальная траектория, если она существует, 208 7. ПРИ1ЩИП Ъ|А1<СИЪ|УА|А Ф(ж(1~)) = ш(||) — ж'., 0 ('в(|я)) = т(|з) — т~. (7.10) В этом случае зада |а (6.16) — (6.18) преобразуется к виду (7.1), (7.3), (7.4). определяется 2п, параметрами. Чтобы определить эти параметры, мы имеем и начальных условий а(1~) = х и и конечных условий в(1э) = шз.
Значит, есть полная гас|пег и условий, которая позволяет найти одну или несколько потенциально оптимальных траекторий. Однако пока нельзя утверждать, что траектории, найденные в результате решения упомянутой системы соотношений, являются оптимальными; использованные упювия являются необходимыми, но не достаточными. Требуется проверка найденных траекторий на оптимальность. В простейшем случае, когда выявлена только одна траектория., а из каких-либо соображений известно, что оптимум существует, можно утверждать, что найденная траектория и есть оптимальная.
Если принципу максимума удовлетворяют несколько траекторий, то для выявления среди них оптимальной нужны дополнительные условия. Иногда удается отделить посторонние траектории, сравнивая значения целевого функционала Заметим при этом, что оптимальная траектория может быть не единственной, а отброшенные траектории, не являясь оптимальными, могут оказаться локально оптнмильнаяии. Сравним принцип максимума с условиями оптимальности, вытекающими из классического вариационного исчисления. Для этого вернемся к задаче Лагранжа е форме. Понтряепна (6.16) (6.18). Остановимся на частном случае, когда правые части уравнений (6.16) и интегрант целевого функционала (6.17) не зависят от 1, правый конец 12 отрезка ~1ч, 1з) свободен, а краевые условия (6.18) имеют вид (7.3)., т.е.
209 7.2, Оосуждонно принципа максимума Запишем вспомогательный функционал (6.19). С учетом (7.10) имеем сл п п с[*, )=)ай- 2,[;[~ ) — *;')а '-с [;(1 ) — *,)ч, [7п) )=1 л=-1 с) где Х(х.,х,и) = Хв(х,и) + Л (х — Х(х,и)). В канонических переменных необходимые условия оптимальности, полученные с помощью метода Лагранжа, имеют вид (6.32), (6.33). К ним следует добавить условия трансверсаяьностпи (6.34), (6.35): р,(~)) = ио рл($2) = †)а, л' = 1,и, (7.12) и, учитывая свободное изменение 12, соотношение (6.29) для к = 2, которое с учетом равенств р; = Л;, л = 1, и (см.
(6.31) ), в канонических переменных принимает вид п Х (х(с2)1х(с2)~и(~2)) ~~~ р[(с2)х)(с2) = 0; з.=1 где (х(с), и(х)) точка экстремума функционала. Переходя по формулам (6.31) к функции Понтрягина ХХ, находим ХХ(х(12),р(12), и(12)) = О. (7.13) Здесь р(с) — - вектор канонических переменных., соответствующих точке экстремума (х(с), и(с)). Соотношения (6.32), (6.33), (7.12), (7.13) представляют собой необходимые условия экстремума, функционала в задаче Лагранжа, полученные вариационными методами. Отметим, что в рамках рассматриваемой задачи условия (7.12) являкотся бессодержательными и для полного решения задачи (7.1), (7.3), (7.4) достаточно систему дифференциальных уравнений первого порядка (6.32) относительно 2п неизвестных функций 210 7.
ПРИНЦИП МАЕСИМУМА дополнить 2н краевыми условиями (7.3). Таким образом, получаем полную систему необходимых условий (6.32), (6.33),. (7.3), (7.13) для решения задачи, Лагранжа в форме Понтрягина с дифференциальной связью (7.1) и целевым функционалом (7.4). Сравним эти условия с условиями принципа максимума в рамках теории оптимального управления. Очевидно, что функция Понтрягина (6.31) совпадает с аналогичной функцией (7.7), если в последней положить фв = — 1. Это всегда можно сделать согласно условию 2' теоремы 7.1, поскольку сопряженные переменные, как уже было отмечено, определены лишь с точностью до общего множителя, а значение срв = О соответствует вырожденной зада се, в которой поиск экстремума теряет смысл, ибо построение решения никак не зависит от целевого функционала.
С учетом этого система (6.32) полностью эквивалентна системе (7.8), если в последней отбросить два очевидных уравнения — = 7~(ж,и) и = О. Вектор сопряженных педть о див дс ' дс т ременных Ф = (фы ..., ср ) имеет здесь тот же смысл, что и т канонические переменные р = (ры ..., р„) Указанное совпадение уравнений для фазовых координоет полностью соответствует выводам в 6.5. В рассматриваемой задаче оптимального управления отсутствуют фазовые оеранинения, а фазовые координаты ж,(1) описываются непрерывными функциями.