Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 25
Текст из файла (страница 25)
В самом деле, пусть хо~ — У и и (8), 8з( 1 ( Ты — оптимальное управление, переводящее фазовую точку иа положения хв в начало координат. Пусть, далее, У вЂ” такая окрестность начала координат, из каждой точки которой можно (с помощью надлежащего управления) попасть в начало координат.
В силу теоремы о непрерывной зависимости решений дифференциальных уравнений от начальных аначений существует в Х такая окрестность Иг точки х„ что фазовая траектория, соответствующая тому же управлению и (с), с, ( Т =4, и исходящая в момент 8, из любой точки у,~йг, оканчивается в момент Е, в некоторой точке множества У. Следовательно, любая точкау,~Иг может быть при помощи надлежащего управления переведена в начало координат, т. е. гУс:У. Таким образом, множество У открыто. Далее, так как из любой точки х,~У можно за к о н е ч н о е время попасть в начало координат, то (см. следствие из теоремы 14) У= () Х., т=1 т. е.
У представляется в виде объединения возрастающей последовательности выпуклых множеств и потому само является в ы и у к л ы м множеством. Итак, множество У всех тех точек пространства Х, из которых можно попасть в начало координат, представляет собой открытое выпу лое множество пространства Х. Внутри этоса множества У задача синтеза оптимальных управлений допускает решение. ПРИМЕРЫ 257 2 26 4 21. Пр ры (47) Пример 1 (Система второго порядка с двумя управляющими параметрами и комплексными собственными значениями.) Рассмотрим систему уравнений х2 —, = а,'х'+ а(хз+ Ь2и'+ Ьзиз, (45) = а,'хг+ азха+ Ь,'ит+ Ь,'из й в предположении, что собственные значения матрицы (а') комплексны, т.
е. (а1 — аз)2 + 4а1а1 (О. Область управле- ния У пусть определяется неравенствами ) и') ( 1, )из( ( 1. (46) Если ранг матрицы (Ь!) меньше двух, то столбцы этой матрицы пропорциональны, т. е. Ь,' = ЙЬ', ((=1, 2), и потому система (45) записывается в виде х2 — = а',хг+ а,'х'+ Ь, '(и'+ Йи") . й Здесь иг + Йи' есть величина, которая может принимать произвольные значения, подчиненные неравенству ! иг+ Йиз ) (1+ ! Й !.
Таким образом, система (45) представляет собой в этом случае систему с о д н и м управляющим параметром и = = и' + Йи'. Мы исключаем этот случай иа рассмотрения, т. е. будем предполагать, что определитель матрицы (Ь') отличен от нуля. Собственные значения матрицы (а!) обозначим через Х.+- ()», где р ~ О; можно считать, что р ) О. Все даль- нейшие рассуждения не аависят от знака Х, но для опре- деленности мы будем рассматривать случай Х ( О. Линейным преобразованием переменных 3 ( х + 8 2 х у' = 21х'+ а,'хз $58 линейные ОПтиМАЛьНые БЫСТРОДеЙСТВИя ~гл, з систему (45) можно привести к виду ~~е1 + = Ху' — ру'+ с,'и'+ с,'и', Н 3 = пут+ Ау'+ с',и'+ с,'и', ~й (48) с'и~+ с'и' = с', ! Я с1 и1 + сэиэ = сз, (49) мы сможем записать систему (48) в виде ые Нс =ру'+Ху +с .
(50) При этом из (49) следует, что точка (Р', сэ) при всевоа- можных значениях и', иэ, удовлетворяющих неравенствам (46), описывает в плоскости и и а р а л л е л о г р а м м с вершинами в точках (с,'+ с,', с,'+ с,'), (с,' — с,', с,' — с,'), ( — с, '+ с,', — с,'+ с,'), ( — с) — с,', — с', — с'.,). Этот параллелограмм мы обоаначим через У (рис. ЗЗ). Итак, мы приходим к задаче о синтезе оптимальных управлений для системы (50) при условии, что точка где коэффициенты с! очевидным обрааом выражаются чеу рез элементы матриц (Ь,'.) и (а1). Так как независимое переменное Т (время) не подвергается преобрааованию, а формулы (47) однородны, то оптимальные траектории системы (45), ведущие в начало координат, переходят при преобразовании (47) в оптимальные траектории системы (48), ведущие в начало координат.
Ввиду этого мы можем рассмотреть лишь синтез оптимальных траекторий системы (48), откладывая переменные у' и у' по осям координат. Получив этот синтов, мы с помощью аффинного преобразования (47) найдем и синтез оптимальных управлений для системы (45). Плоскость переменных у', уз мы будем обозначать через а. Положив пгимш ы г59 гги с = (ег, иг) пробегает в плоскости п переменных у', у' некоторый параллелограмм К с центром в начале координат.
Эту вадачу мы и будем рассматривать. Система (5) принимает в случае управляемого процесса (50) следующий вид: Непосредственно находим общее решение атой системы: ф, = се — "' сов ()ге+ а), Фг= се- мв1п((ге+ а), где с ) 0 и а — постоянные интегрирования. Так как координаты вектора ~р = (гр„~рг) мы рассматриваем лишь Рис. 34. Рис. 33. с точностью до общего положительного множителя пропорциональности (ибо функция Н однородна относительно величин грг), то мы можем отбросить положительный множитель пропорциональности се и и считать, что вектор гр вадается соотношениями: гр, = сов()ге+ а), фг = вгп ()ге+а). Иначе говоря, вектор гр = (гр„ грг) равномерно вращается (вокруг начала координат)против часовой стрелки с угловой скоростью р (напомним, что )г ) 0).
$60 линейныв оптин»льныи Быстгодвнствия [Гл з Обозначим теперь вершины параллелограмма «' через ею е„е„е„нумеруя их против часовой стрелки. Далее, проведем из начала координат прямые, перпендикулярные сторонам параллелограмма г',и обозначим образуемые этими прямыми углы через а„ а„ а», а, (рис. 34).
Так как функция Н в рассматриваемом случае имеет вид Н =... +»»»э» + ф»з» =... + (»з, г) (многоточием обозначены члены, не содержащие и' и и»), то из рис. 35 ясно, что если вектор ф находится в угле а, (Е = 1, 2, 3, 4), то мак- «3» симум функции Н при »~К достигается в вершине з= ее Вспомнив теперь, что вектор Ф равномер.у но вращается с угловой « ~~р~ скоростью р, мы приходим .ф к следующему выводу от- Ф носительно оптимальных » управлений. В течение вре- ан мени — ' управляющий па- И раметр и имеет значение сн затем э «переключается» в Рис. 35.
вершину е;д, где находится в течение времени— а«»» И (при 1 = 4 следует считать, что 1 + 1 = 1), после этого «переключается» в вершину е;+з и т. д. При этом первый и последний отрезки времени могут быть меньше соответствующих величин — *, так как в начальный момент Р движение могло начаться не в момент «переключения», а в конце движение может прекратиться (т.
е. фазовая точка попадет в начало координат) до момента очередного переключения. Обозначим теперь через е такую точку (а, а,') плоскости»«, координаты которой удовлетворяют соотношениям Ха) )»а1 э( ) (51) ра)+Ха,'= — з», ~ где з), з; '— координаты вершины е«параллелограмма У. ПРИМКРЫ 161 2 20 7'огда мы получим четыре точки е1, ез, ез, е1, являющиеся вершинами некоторого параллелограмма У' (ибо соотно1пения (51) линейны). Из вида формул (51) легко вытекает, что параллелограмм У' получается из У подобным преобразованием (с центром в начале) и поворотом на некоторый угол (рис.
36). Из формул (50), (51) вытекает, что в то время, когда управляющий параметр Р принимает значение ка изменение координат ут, ут описывается уравнениями — „, =Л(у' — а,') — р(ут — ат), (при р=ес). (52)1 = р (у1 — а,') + л (у' — а$) Сравнивая систему (52) с системой оу' А = Лу — ру, аут аг ру1+ Лу2 (53) 6 Л. С, Понтрягин и др.
мы видим, что «фазовые портреты» систем (52)1 и (53) получаются друг из друга параллельным переносом; именно, положение равновесия системы (52)1 расположе- У но не в начале координат е' с, (как у системы (53), рис. 37), а в точке е;. ' с.', Вспоминая скааанное выше о характере оптимальных управлений, мы получаем следующее утверждение о структуре оптимальных траекто- ат Рис. 36.
рий. В течение времени — тточ- 11 ка описывает дугу фазовой траектории системы (52)1, затем в течение времени — "' ее движение описывается системой (52)1т„после этого вступает в действие система (52)1„2 и т. д. (первый и последний отрезки времени могут быть а1 '1 меньше, чем соответствующие величины — -).
Р 1" 1с2 линеЙные оптимальные Быстгоденствия ~гл, » Теперь уже нетрудно построить на плоскости я «линии переключения», определяющие синтез оптимальных управлений. Обозначим через А,О (» = $, 2, 3, 4) дугу Рис. 37. траектории системы (52);, оканчивающуюся в точке О и соответствующую отрезку времени — "' (рис. 38). Тогда М ясно, что з а к л ю чи тел ь ны й зтап оптимального движения фазовой точки происходит по одной из дуг А;О, причем точка может пройти не всю эту дугу, а лишь некоторую ее часть Х«О (так как последний отрезок вре- а;~ мови может быть меньше, чем — ' ) .
Далее, так как в точке . Х«произошло «переключеиие», и фазовая точка после «переключения» стала двигаться согласно системе (52),, 163 ПРИМКРЫ «»Н Ряс. 38 р = сед', др = рд + а, где е ) 0 и а — постоянные интегрирования. Если точка 6' то и е р е д моментом переключения фазовая точка двигалась по закону (51)д д. Таким образом, предыдущий отрезок У»Х» оптимальной траектории представляет собой дугу траектории системы (52), „оканчивающуюся в точке Х. и соответствующую отреаку времени ~'=д. Когда точка р Хд пробегает всю дугу уг А,.О, дуги УдХ» указанного вида заполняют А е' «криволинеиныи четырехугольник» (рис.
39), одна из «сторон» ко- У' е„' торого совпадает с ду- -ъе гой А д,О (ибо при Аг А, Хд = О дуга УдХ; совпадает с А; дО). Таким образом, три вершины рассматриваемого криволинейного четырехугольника находятся в точках Ад, О, А»,; четвертую вершину обозначим через В, д.