XV Ванько В.И., Ермошина О.В., Кувыркин Г.Н. Вариационное исчисление и оптимальное управление (1081425), страница 32
Текст из файла (страница 32)
7.10 показывает, что на плоскости х~Охэ выделяется область О, которая представляет собой полосу между прямыми х~ + хэ = — 1 и х~ + хэ = 1, не содержащую указанных прямых (рис. 7.11). Если точка х' находится в этой области, то по некоторой гиперболе из этой точки можно перейти на кривую АОВ, и в результате для такого начаяьного состояния оптимальная траектория существует. Если же точка х' находится вне области Я, то попасть на кривую АОВ не удается, так что для такого положения оптимального решения не существует. Учи- Рис.
7.11 тывая это, область Я можно назвать областпью рправллемостпи данной системы. Напомним, что, согласно теореме 7.6, оптимальная траектория существует, если существует хотя бы одна допустимая траектория, переводящая фазовую точку из заданного положения в начало координат. Отсутствие оптимальной траектории для начального положения фазовой точки вне области Я на самом деле свидетельствует о том, что из точек вне Я вообще ни при каком допустимом управлении попасть в начало координат нельзя. Теорема 7.6 говорит о том, что задачу поиска оптимального управления имеет смысл решать только в области управляемости объекта. Т. ПРИНЦИП ЪР КСИМУД1А Итак, из любого состояния х' Е Я можно наискорейшим образом попасть в начало координат.
Оптимальная траектория состоит из двух участков, на которых управление постоянно. Как и в предыдущей задаче, здесь можно зэписать синтезирующую функцию: 1, (хмхг) Е 1,) ниже АОВ или на ОА; и (хь ег) = — 1, (хмхг) Е Я выше АОВ или на ОВ. 7.6.
Задача с подвижными концами В за<)аче е подвижными концами или начальная точка х', или конечная точка хг, или обе эти точки не известны. Заданы лишь множества М1 и Мг, содержащие эти точки. Чтобы прийти к формулировке необходимых условий, желательно использовать геометрическиепредставления. В дальнейшем под еиперпоеерхпосгпью мы понимаем множество всех точек х = (хм ..., х„) в гС", которые подчиняются соотношению Дхм...,х„) = О, где 1' скалярная дифференцируемяя функция многих переменных. В частном случае, когда 1 линейная функция, гиперповерхность описывается уравнением а1х1+ агхг + ...
+ а х„+ 5 = О (7. 52) и ее называют еиперплоспосгпью. При 5 = О гиперплоскость (7.52) является (и — 1)-мерным линейным подпространством в К" ~1У]. Любое (и — Й)-мерное подпространство Н С К" может быть задано как множество решений линейной однородной системы Й уравнений с п неизвестными, матрица которой имеет ранг Й: апх1+а1гхг+... + а1„х„= О, аг1х1 + аггхг +... + Огп ха = О, В.д(а, ) = я. вых1 + аегхг +... + аьвхв = О, 249 7.6. Задача с нодиижныии концами Такое линейное подпространство будем называть (и — а)-мерной плоскостью. Множество решений системы нелинейных уравнений 71(хм...,ха) = О., уз(Х1 ° ° ° х ) = О Яхм...,х„) =О, гДе фУнкЦии 7м ..., Л, ДиффеРенЦиРУемы и Ранг матРиЦы Якоби этой системы функций равен «о представляет собой (и — й)-мерное гладкое многообразие ~Ъ').
Используем эти геометрические понятия для того, чтобы сформулировать задачу оптимального управления с подвижными концами. Эта задача состоит в том, чтобы найти такое допустимое управление иЯ для системы с законом движения х = у(х,и), х Е кл", и Е )а', которое переводит фазовую точку из некоторого, заранее неизвестного, положения х на гммерном многообразии М1 1 (г1 < п) в некоторое положение х~ на га-мерном многообразии Мз (те < п) и при этом придает функционалу с2 Т~х,и1 = 7 (х,и)дс минимальное значение. Ранее рассмотренную задачу оптимального управления с фиксированными концами можно интерпретировать как частный случай этой задачи при г1 = гз = О, т.е.
когда многообразия ЛХ~ и Мз вырождаются в точку. Возможен и промежуточный вариант, когда лишь одно из этих многообразий вырождается в точку, и тогда в задаче один конец фиксированный, а другой подвижный. Как и в классическом вариационном исчислении, управление, оптимальное в задаче с подвижными концами, является 250 7. ПРИНЦИП МАИСИМУМА оптимальным и в задаче с фиксированными концами. Поэтому нриниип мансилсржа (см. теоремы 7.1 и 7.2), рассмотренный нами для задачи с фиксированными концами, дает необходимые условия и в этой задаче, имеющей более общую постановку. Но отсутствие уравнений, указывающих начальное и конечное состояния, приводит к тому, что система необходимых условий перестает быть полной.
Недостающие уравнения, как и в вариационном исчислении, получают из условий трансверсальности. Будем говорить, что вектор сопряженных переменных Ф1с) = (йв(1), ..., й1ь(1)), существование которого утверждается в приципе максимума, удовлетворяет условию пьрансверсальности на левом конце траектории тЯ, если вектор Фсс1с) = ссг1 (1с ), ..., у~„(с1)) ортогонален касательной плоскости к многообразию ЛХ1 в "точке х(Хч), т.е. (7.53) (Ф(1с), х) = О, где х произвольный вектор, лежащий в касательной плоскости.
Аналогично формулируется условие на правом конце. Условие трансверсальности на левом конце равносильно ортогональности Ф(Хс) каждому из г1 векторов базиса в касательной плоскости, т.е. дает гс уравнений. В совокупности с условием принадлежности точки х® многообразию Мс (это условие определяется и — гс уравнениями) мы имеем ровно п уравнений, как и в задаче с фиксированным левым концом. Аналогичная ситуация возникает и на правом конце.
Теорема 7.7. Если (х*(г), и*(г)), 1 Е [ь~,.1г), оптимальный процесс в задаче с подвижными концами х(1~) Е Мм х(сг) Е ЛХсн то ненулевая вектор-функция Ф (с), существующая согласно теореме 7.1, удовлетворяет на каждом из концов траектории условиям трансверсальности. Замечание 7.3. В случае задачи оптимального быстродействия с подвижными концами в сформулированном утверждении ссылку на теорему 7.1 нужно заменить ссылкой на теорему 7.2. 7.о'.
Задача с подвижными концами 351 Отметим частный случай задачи с подвижными концами, когда, например, правый конец траектории свободен (это означает, что М2 = 1с" ). Тогда условия трансверсальности сводятся к соотношению Ф(12) = (ф1(12), ..., ф„(12)) = О. Полный вектор СОПРЯЖЕННЫХ ПЕРЕМЕННЫХ Ф(12) = (фв(12), Ф(с2)) ОПРЕДЕЛЯЕТСЯ с точностью до произвольной постоянной. Поэтому в данном случае можно полагать фв(12) = — 1 (согласно принципу максимума, уев < 0) и Ф(12) = ( — 1, О, ..., 0). Это облегчает применение принципа максимума, так как обеспечивает недостающее начальное условие для вектора сопряженных переменных.
Как отмечено выше (см. 7.3), именно отсутствие краевых условий для сопряженных переменных . главная трудность в использовании принципа максимума. Как видим, в задачах с подвижными (и, в частности, со свободными) концами можно ожидать, что процедура решения будет более простой. Пример 7.3. Вернемся к задаче о быстрейшей остановке движущейся точки в заданном месте (см. 7.5) и изменим ее постановку. Потребуем, чтобы точка не останавливалась в начале координат, а достигала его за наименьшее время.
Значение скорости в конечный момент времени нас теперь не интересует. В фазоввгл ноординап1аи ж1 = ж, и2 = й закон движения системы имеет вид (7.48) с с1 аг2; а2 начальное состояние а1(11) = ш' считаем заданным, а про конечное состояние х(12) известно лишь, что оно находится на оси Ох2, так как т1(12) = О. Пусть )и( < 1 ограничение на управление. Итак, поставлена задача с правым подвижным концом. Многообразие М2 описывается уравнением и1 = О. Это одномерное многообразие, в каждой его точке касательное пространство одномерно, а любой касательный вектор в точке (О, х2) имеет вид я = (О, 1,2), 1",2 Е К. Условие трансверсально- 252 7. ПРИНЦИП МАКСИМУМА сти на правом конце можно записать следующим образом: 0' 41712)+~212(12) = О, откуда ~2(г2) = О.
Функция Н и сопряженная система имеют тот же вид, что и вьппе (см. 7.5). Поэтому функция у2(е) линейна. Из условия ф2(е2) = 0 следует, что она на интервале (11, 12) сохраняет знак. Значит, оптимальное управление и* (1) = = я1Ипф2(1) не имеет переключений и постоянно в течение всего движения, т.е. или и*(г) = 1, или и*(е) = — 1. Материальная точка движется по параболе семейства (7.50) в первом случае и по параболе семейства (7.51) во втором. Пусть точка х' начального состояния находится в правой полуплоскости ж1) О. Через эту точку проходят две траектории, удовлетворяющие первому условию принципа максимума - - по одной из каждого семейства траекторий.
По параболе семейства (7.50) движение направлено снизу вверх. Если точка т1 расположена выше дуги ОЛ параболы семейства (7.50), проходящей через начало ко- В ординат (рис. 7.12), то по параболе семейства (7.50) точка не достигает оси Охз, так что оптимальным может быть х, только движение по параболе семейства (7.51).
Если же точ- А ка а' расположена на дуге ОА или ниже, то достичь оси Охз Рис. 7.12 можно по любой из двух парабол. Однако из этих двух траекторий только одна удовлетворяет второму условию принципа максимума. Покажем это. Для задачи оптимального быстродействия второе условие принципа Понтрягина выглядит следующим образом: М(Ф*(12),т'(12)) > О. Учитывая, что в нашем случае М(и (12) ~с (12)) т1(12)х2И2) + ~Ф2 (12) ~ 253 7.7. Неавтономные снстемы и фу[72) = О., получаем ~~1 [1з)х,;[17) > О, или, согласно виду решения сопряженной системы [ф,* = С1 = сопя~)., С1х~[~я) > О. Из построений следует [см.
рис. 7.12), что в случае, когда начальная точка х расположена в правой полуплоскости, выполняется неравенство х~[17) < О. Поэтому С1 < О. Равенство С~ = О невозможно, так как тогда ф2 — — С2 = сопв1 и, в силу условия ф~[~з) = О, решение Ф является тривиальным. Остается случай С1 < О. Из решения сопряженной системы имеем 4>2 [~) = Сз — С1 ~. Так как С1 < О и Ф~ [ЬД = Сз — С~ ~7 = О, то ф~[1) < О на отрезке [ем 1з). Следовательно, единственное допустимое управление, удовлетворяющее принципу максимума, имеет вид в*1е) в1яп~2 И) Таким образом, если х' находится правее оси Охз, то оптимальным будет управление и*[г) = — 1. Аналогично рассуждая, заключаем, что при начальном состоянии левее оси Охг оптимальным будет управление и*[1) = 1. Конечно, рассмотренная задача элементарна и не имеет большого практического значения.