Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 25
Текст из файла (страница 25)
Ниже мы покажем, каким образом с помощью принципа максимума можно при и = 2 построить синтез линейных систем оптимального управления с двумя управляющими параметрами. В этом параграфе мы изложим общие соображения о задаче синтеза оптимальных управлений. Мы будем считать, что выполнены условия, сформулированные в теореме 14. Тогда для каждой точки ха АХ существует и притом только одно оптимальное (кусочно-постоянное) управление и„ч((), переводящее фазовую точку из точки х, в начало координат 0 е= Х.
Единственность имеет место, конечно, только с точностью до сдвига времени и до значений управлсния и,ч(г) в его точках разрыва. Так как в каждый момент времени нас, естественно, интересует, каким будет оптимальное управление п о ел е этого момента времени, то (в отличие от ранее принимавшихся соглашений — см.
стр. 15 и сноску па стр. !34) целесообразнее всего считать в каждой точке разрыве (' управления и„,(0 его значение равным и,„(1'+О). При этом соглашении во все моменты времени (кроме конечного, когда значение управления не играет роли) выполняется соотношение и,, (1) = и„, (г+ О), благодаря чему устраняется неоднозначность управления и„,(г) в начальный момент и в точках разрыва. Величина и„,((В) зависит, таким образом, только от точки хм а не от случайно выбранного начала отсчета времени (В, и потому можно положить и (хО) = пх, (~0). Пусть х(1) — решение уравнения (2), соответствующее управлению и„.
(1), а (В ( ( ( Й вЂ” промежуток времени, в течение которого точка, двигаясь при этом управлении, переходит из положения хв в начало коор. динат. Так как для любой точки т, взятой из этого промежутка времени, управление и„, (1), рассматриваемое на отрезке х(1 = Гь оптимальным образом 158 липеиные оптимкльныГ выстьолгиствия 1гл. 3 переводит фазовую точку из положения х(т) в начало координат (иначе все управление в целом не было бы оптимальным), то имеет место соотношение и,„(т) = о(х(т)). Таким образом, — х (г) = Ах (1) + Во (х (1)), и мы видим, что решение уравнения Нх — = Ах+ Во(х) (38) а функция и,(г) опредсляется из уравнения (ф(1), Ви Я) =Р(ф(1)). Пусть, далее, х(Г) — решение уравнения (2) с нием и=им(1), удовлетворяющее начальному х((ь) =хь (39) управле- условию (40) и конечному условию х(1,)=0, так что — = Ах(1)+ Ви..
(1). нх (г) (41) (42) Тогда функция о(х) удовлетворяет условию (ф((ь) Во(х(1ь))) =Р(Ф(Гь)). (43) с произвольным начальным условием х(1ь) = хь дает закон оптимального движения фазоной точки из положения хь в начало координат. В этом смысле функция о(х) синтезирует оптимальное управление, переводящее фазовую точку из любой точки хь в начало (ср. ф 5). В нахождении функции о(х) и заключается решение задачи синтеза оптимального управления (для линейной системы (2)). Дадим метод построения функции о(х). Пусть ф(1)— то (нетривиальное) решение уравнения (5), которое в силу теоремы 2 соответствует управлению их,(1), так что Ф м! синтез оптим4льного упелвления 159 Из теоремы существования и единственности следует, что существует, и притом только одна (с точностью до сдвига времени), пара функций и„,((), х((), заданных на отрезке 1~ (1( 11 и удовлетворяющих условиям (38)— (42).
Ввиду возможности сдвига времени числа 1о и 1, этими условиями не определены однозначно, но число 1~ — (а определено. Совершенно не ясно, как искать функции и„,(г), х(1), удовлетворяющие всем условиям (38) — (42), но легко найти все функции и„,(г), х(1), удовлетворяющие лишь условиям (38), (39), (4!), (42). Для этого поступим следующим образом. Ввиду возможности произвольного сдвига времени зафиксируем число 1ь положив 1, = О. ПУсть тепеРь Х = (Хь Хь..., Х„) — пРонзвольпый вектоР, отличный от нуля, и ф(Г,Х) — решение уравнения (38), удовлетворяющее начальному условию Ф (О, Х) и определенное при 1(0. Определим, далее, функцию и((,Х) из условия (ф(1 Х), Ви(1, Х)) = Р(ф(1, Х)).
1(0, и функцию х((,Х), удовлетворяющую начальному уело. вию х(О,Х) = О,— из уравнения Х Ах(г Х)+Ви(1 Х) Согласно сказанному выше, функция о(х) определится соотношением (чр (1, Х), Во (х (1, Х))) = Р Я К Х)). (44) Из теоремы существования (георема 14) следует, что точка х(1,Х) описывает все пространство Х, когда пробегает отрицательные значения, а вектор Х меняется произвольно. Таким образом, соотношение (44) определяет значение функции о(х) для произвольной точки х пространства Х. Заметим, что условие устойчивости оператора А использовалось в предшествующих рассуждениях лишь один раз, а именно в конце предыдущего параграфа, когда показывалось, что из любой точки пространства Х 160 линяпныв оптимхльныв выстгодвиствия 1гл.
з можно подойти как угодно близко к началу координат. Поэтому все выводы настоящего параграфа сохраняют свою силу и в том случае, когда оператор Л не является устойчивым, но за счет выбора надлежащего управления и(1) можно из любой точки х,~Х подойти как угодно близко к началу координат (см. пример 1 в 5 5). Если, однако, и это условие пе выполняется, то синтез все равно возможен, но не для всего пространства Х, а лишь для некогорой его области. Именно, обозначим через У множество тех точек пространства Х, из которых можно (с помощью надлежащего управления) как угодно близко подойги к началу координат. Тогда функцию п(х) можно построить (предполагая, что начало координат пространства ń— в н у т р е н п я я точка многогранникаа У и что выполнено условие общности положения) на множестве У, что и дает в этом случае решение задачи синтеза. При этом совсем не нужно заранее проверять, из любой или не из любой точки можно попасть в начало координат: если решать задачу синтеза, как указано выше (т.
е. пользуясь «попятными движениями» из начала координат), то множество всех тех точек пространства Х, в которые мы сможем попасть (на основании формул (38), (39), (41), (42)), исходя из начала координат, и будет представлять собой область У, для которой задача синтеза допускает решение. Множество У является о т к р ы т ы м, т. е. вместе с каждой точкой содержит и некоторую ее окрестность.
В самом деле, пусть ха~ У и иЯ, 1ч 1(1ь — оптимальное управление, переводящее фазовую точку из положения ха в начало координат. Пусть, далее, Р— такая окрестность начала координат, из каждой точки которой можно (с помощью надлежащего управления) попасть в начало координат. В силу теоремы о непрерывной зависимости решений дифференциальных уравнений от начальных значений существует в Х такая окрестность Ж точки хм что фазовая траектория, соответствующая тому же управлению и(1), 1« я- 1 ~ 1ь и исходящая в момент (е из любой точки уа е=" %', оканчивается в момент 1~ в некоторой точке множества 1~. Следовательно, любая точка уо ~ йг может быть при помощи надлежащего управления переведена в начало координат, т.
е. ПРИМЕРЫ 2 2!] ]12~ У. Таким образом, множество У открыто. Далее, так как из любой точки хе а= У можно за конечное время попасть в начало координат, то (см. следствие иэ теоремы 14) 1'- 13 Е'т. т-! т. е. У представляется в виде объединения возрастающей последовательности выпуклых множеств и потому само является в ы и у к л ы м множеством Итак, множество У всех тех точек пространства Х, из которых можно попасть в начало координат, представляет собой открытое выпуклое множество пространства Х. Внутри этого множества У задача синтеза оптимальных управлений допускает решение. ф 21.
Примеры Пример 1 !]х! =а'х'+а!х'+ Ь'и'+Ь!и2, 2]! ! 2 ! 2 1х1 — = азх' + а'х2 + Ь2и! + Ьзич (45) в предположении, что собственные значения матрицы (а') комплексны, т. е. (а', — а2) + 4аза,' ( О. Область управления 0 пусть определяется неравенствами ]и'1~1, 1 из!~1. (46) Если ранг матрицы (Ь]) меньше двух, то столбцы этой матрицы пропорциональны, т. е. Ь2 АЬ! (1= 1, 2), и потому система (45) записывается в виде !]х! =- а1х'+ а]хз + Ь~ (и'+,л! ], лт 2 азх2+ атх2+ Ь2(и! + Ьиз) Ж ! а л а и Р 2 ]ь (Система второго порядка с двумя управляющими параметрами и комплекспымн собственными значениями.) Рассмотрим систему уравнений 1б2 липгииыв о/и//млльные гыстгодниствия !гл.
з Здесь и' + //и' есть величина, которая может принимать произвольные значения, подчиненные неравенству !а'+ /гит )~ (1+ ! /г !. Таким образом, система (45) представляет собой в этом случае систему с о д и и м управлшощим параметром и = и'+ й//2. Мы исключаем этот случай из рассмотрения, т. е. будем предполагать, что определитель матрицы (Ь,') отличен от нуля. Собственные значения матрицы(а') обозначим через l Л-+ /и, где и Ф О; можно считать, что и ) О. Все дальнейшие рассуждения не зависят от знака Л, ио для определенности мы будем рассматривать случай Л ( О. Линейным преобразованием переменных у'=з,'х'+ з'х', у у~= зтх/+ зах" / '2 (47) систему (45) можно привести к виду — = Лу — ру'- + с,'и + с,'и, а//' ~ т // ~т 1 с//~ (48) где коэффициенты с! очевидным образом выражаются / через элементы матриц (Ь',.) и (з').
Так как независимое переменное ! (время) ие подвергается преобразованию, а формулы (47) однородны, то оптимальные траектории системы (45), ведущие в начало координат, переходят при преобразовании (47) в оптимальные траектории системы (48), ведущие в начало координат. Ввиду этого мы можем рассмотреть лишь синтез оптимальных траекторий системы (48), откладывая псременнь'е у' и уз по осям координат. Получив этот синтез, мы с помощью аффиниого преобразования (47) найдем и синтез оптимальных управлений для системы (45).