Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 28
Текст из файла (страница 28)
Рассмотрим теперь всевозможные траектории системы (60)т, оканчивающиеся в точках линии М„(рис. 65). Эти траектории заполняют некоторую поверхность М„+ „ имеющую в качестве своего края линию М„. Аналогично, 184 линзяныв оптимальныв выстгодвиствия ~гл, з траектории системы (60), оканчивающиеся в точках линии М+„, заполняют некоторую поверхность М„„имеющую в качестве своего края линию М„. Объединив М„+ и М„, вместе, мы получаем поверхность, которую обозначим через М„, (рис. 66). Ясно, что последние два этапа всякого оптимального движения совершаются по поверхности М„„ибо только по траекториям этой поверхности можно попасть на линию М„, по которой совершается заключительный этап движения. Рве.
66, Далее, траектории системы (60), оканчивающиеся в точках поверхности М,, образуют трехмерноемногообразие М„+ „краем которого служит поверхность М„,. Траектории системы (60), оканчивающиеся в точках поверхности М„+„образуют трехмерное многообразие М„с краем М„,. Вместе М+, и М, образуют трехмерное многообразие М„„в котором совершаются последние три этапа всякого оптимального движения. Продолжая таким образом, мы построим многообразия М„, М„„..., М„причем многообразие М' имеет размерность и — ~ + т.
Многообразие Мьы расположено целиком в многообразии М,. и разбивает это многообразие на две области Мт и М, При этом область М» образована всевозможнь|мн траекториями системы (60)+, оканчивающимися на М,.+ы а область М, образована всевозможными траекториями системы (60), оканчивающимися на Мт+н Последнее многообразие Мг либо совпадает со ПРИМЕРЫ 185 всем фаэовым пространством Х, либо представляет собой некоторую область этого пространства, содержащую начало координат. Внутри атой области М, и осуществляется синтез оптимальных управлений. Этот синтез осуществляется следующим образом: во всех областях М;. управляющий параметр и принимает значение +1, а во всех областях Мй он принимает значение — 1. Фазовая точка двигается в области М„причем и = + 1, если она находится в М", и и = — 1, если она находится в М,, В момент попадания на многообразие М, происходит переключение, и все дальнейшее движение совершается по многообразию М,.
Следующий момент переключения наступает тогда, когда точка, двигаясь по М„попадает на многообразие М,. После этого точка продолжает двигаться по М, и т. д. Заключительный этап движения, завершающийся попаданием в начало координат, происходит по линии М„. Таким образом, всего за время движения происходит л — 1 переключений.
разумеется, при некоторых начальных положениях фазовой точки число переключений может оказаться и меньшим, чем п — 1 (например, может оказаться, что точка л» расположена на многообразии М„или же на многообразии М и т. и.). Пример 1 в з 5 является частным случаем укаэанного общего построения. Пример 4 Поставим следующую задачу. В л-мерном евклидовом пространстве движется управляемая точка, причем «двигатель» ее может сообщать этой точке ускорение, не превосходящее по модулю единицы и направленное в любую сторону. Как следует управлять движением этой точки, чтобы, имен заданное начальное положение и заданную начальную скорость, она за кратчайшее время попала в начало координат (с произвольной конечной скоростью)? Для решения этой задачи обозначим координаты движущейся точки через х', х», ..., з", компоненты ее скорости — через х"+', ..., х'", а компоненты ускорения— через и', ..., й.
Массу точки примем равной единице. 166 линейные оптимальные Быстгодействия ' 1гл, з Тогда уравнения движения точки запишутся в виде 2х1 = х" +' ш — =х хХ2 „+ 1Й лх" — х22 71 ) 11х"'"1 Л1 1 ~~хЮ 2 =из сМ \ (61) Лх22 — = и". ш Так как ускорение и = (и1, ..., й) должно по модулю не превосходить единицы, то область управления У определяется неравенством (и1)2+ (и2)2+ + (их)2 т (62) Далее, так как начальное положение и начальная скорость точки заданы, то в фазовом пространстве Х переменных х', х2, ..., х", ..., хз" задано начальное положение х,= (х1, ..., хз"). Требование попадания в начало координат (с произвольной конечной скоростью) означает, что в конечный момент движения должны быть выполнены соотношения х' = х' =...
= х" = 0 (63) а величины х"+', ..., х'" могут быть произвольными. Иначе говоря, задача заключается в быстрейшем попадании объекта, управляемого уравнениями (61), (62), из начальной точки х2~Х в какую-либо точку многообразия Я„определяемого в Х уравнениями (63). Многообразие 31 представляет собой, очевидно, и-мерную плоскость. Функция Н имеет в рассматриваемом случае следу1ощий вид: Н = 2р1х"+1 + 2рзх"1 2 +... + 2р х'" + 2)1„„и1 +...
+ 2рх„и"; (64) 187 ПРИМЕРЫ 2 21] с помощью этой функции находим систему уравнений для вспомогательных переменных фр — ",," =О, — '„'," =О, 'ф" =О 21 ~ФН-1 „у, 71 Ч11 74;,+1 ф21 'Ч22 Л1 2' Из этой системы вытекает, что в течение всего оптимального движения величины 2р„ф2, ..., 28 сохраняют ПОСТОЯННЫЕ ЗНаЧЕНИЯ, И ПОТОМУ ВЕЛИЧИНЫ 2~„Ы, ф„+„... ..., фз„являются линейными функциями времени. Напишем теперь условие трансверсальности в правом конце оптимальной траектории. Для того чтобы вектор ф = (ф1, ..., ф„, ф„„1, ..., фз„) был ортогонален к многообразию Я„ойределяемому уравнениями (63), очевидно, необходимо и достаточно выполнение условий 2)1Я+1 фл22 ' ' ' 2)'22 Таким образом, условие трансверсальности в правом конце оптимальной траектории имеет вид ф, 1(г1) = 2р„+2(г1) =...
=2р„,(~1) = О, (65) где ~1 — момент попадания фазовой точки на многообразие Я1. Вспоминая теперь, что функции 2р„„2р„~2, ..., 282„ линейны, мы 'находим из (65), что имеют место формулы ф21 1 = а1 (81 — ~), 22„.,2 —— а2 (~1 — ~),..., т2„= а„(~1 — 8), (66) где а„а„..., а„— постоянные величины. Так как величины 2р определены лишь с точностью до общего положительного множителя пропорциональности, то мы можем 188 линвиныв оптимлльньдв Быстголенствия [гл, з при этом предполагать, что вектор а = (а„а„..., а„) является единичным, т.
е. (а,)д+(а )д+...+(а„)'= 1. Подставляя найденные значения (66) в формулу (64), мы получаем Н =... + (~д — ~) (адид + азиз +... + а„и"), где многоточием обозначены члены, не зависящие от и', ..., й. Так как 1д — ~ ) О (ибо 1, — п о с л е д н и й момент движения), то условие максимума функции Н означает, что в течение всего движения величина а,и'+ а,и'+... + а„и" = (а,и) должна быть максимальной, а это, в силу (62), означает, что и(1) = а, т. е.
что величины ид, и', ..., и" в течение всего движения сохраняют постоянные значения ид=ад, д=1, ..., и. Итак, в рассматриваемом случае оптимальность движения означает, что ускорение и п о с т о я н н о и величина его равна единице. Это позволяет однозначно определить искомое ускорение (т. е. найти направление вектора ускорения и). В самом деле, траектория движения точки в рассматриваемом евклидовом пространстве представляет собой параболу дда хд = хд+х"+д1+ид —, д = 1,...,п, д д 2' где и = (и', ..., й) — постоянный вектор ускорения, равный по величине единице, т.
е. удовлетворяющий условию (ид)д + (ид)з + + (й)д (67) Для того чтобы эта траектория прошла через начало координат, должны выполняться условия хдд+х",+дд+и' — = О, д = 1,..., п. (68) Соотношения (67), (68) представляют собой систему из и + 1 уравнений относительно неизвестных и', и', ..., й, ~, причем для 1 мы должны получить положительное значение. В случае, если таких решений окажется несколь- моделиРОВАнне 189 2 22) ко, мы должны взять решение с н а и м е н ь ш и м поло«кительным значением 2 (ибо речь идет о б ы с т р е й ш е м попадании в начало координат).
Из (68) мы получаем и 2(з~+»+'1) 1 1 л (69) 12 ~'''Ф \ и подстановка в соотношение (67) дает уравнение 4»«', (я«+ х"+12)2 — 2' = 0 (70) относительно неизвестного К При 2 = 0 левая часть этого уравнения принимает значение 4 ~Ч , '(х«)2)0 (разумеется, 1=1 мы считаем, что точка (х'„х'„, ..., Е») не совпадает с началом координат, так как в противном случае решение оптимальной задачи очевидно: Г = О).
При 2 — оо левая часть уравнения (70) отрицательна. Следовательно, уравнение (70) имеет хотя бы один положительный корень. Обозначим через т (х») = т (х,', х'„..., х",, х"+1, ..., з,'") н а им е н ь ш и й положительный корень этого уравнения. Тогда из (69) мы находим искомые значения компонент ускорения 2 (х1 ', х»+ 12 (х ) ) к (" (»ю)) Это и дает синтез оптимальных управлений в рассматри- ваемом случае.
(Функция т (х,), а следовательно, и функ- ции к1 кусочно-непрерывны.) й 22. Моделирование линейных оптимальных быстродействий при помощи репейных схем Возвратимся снова к задаче о линейных оптимальных быстродействиях, рассмотренной в 9 $7. В силу теоремы 9 каждая экстремальная траектория (см. стр. 440), исходящая в момент 2» из точки х„определяется начальными значениями «)«(22) решения «)«(2) уравнения (5). Именно, если задан произвольный отличный от нуля вектор ф>, то однозначно определено решение «р (2) уравнения (5) $9О линейные ОптимАльные Быстгодействик ~гл, з с начальным условием»р (»») = »р». После этого, в силу теоремы 9, соотношение (6) однозначно определяет соответствующее экстремальное управление и(»).
Наконец, зная управление и(1), мы из уравнения (2) находим и соответствующую траекторию х(с), исходящую из точки х,. Таким образом, в конечном счете экстремальная траектория х(1) однозначно определяется выбором начального аначения ф». Если бы нам удалось найти именно такое начальное значение ф„ что траектория х(1) и р о х одит через начало координат О, то управление и(с) и траектория х(1), полученные указанным выше способом, будут оптимальными. В самом деле, полученная траектория х(») будет идти в этом случае из точки х» в требуемую точку О, и потому оптимальное управлелие существует (теорема 13). Это оптимальное управление единственно (теорема 11) и удовлетворяет принципу максимума, т.