Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 24
Текст из файла (страница 24)
Кроме того, имеет место соотношение (34). Иэ этого, в силу теоремы о неявных функциях, вытекает разрешимость уравнения х, (х„$', $г, ..., $") = О ' относительно Ег, $г, ..., $" для всех эначвний хь, принадлежащих некоторой окрестности У начала координатО~Х. Иначе говоря, для любой точки хг ~У существует такое кусочно-постоянное управление и (а именно, управление и (г, $', ..., $'), О ( 8 ( г, при надлежащим образом выбранных ег, ..., $"), которое переводит фаэовую точку иэ положения хг в начало координат (эа время г,). Пусть теперь хг — произвольная точка пространства Х.
Заставим фаэовую точку сначала двигаться иэ положения хг при управлении и (1) = О. Так как все собственные эначения оператора А имеют отрицательные действительные части, то по истечении некоторого времени движущаяся точка придет в окрестность г", после чего ее, по доказанному, можно перевести в начало координат.
Отсюда в силу теоремы 13 вытекает существование о и т и— м а л ь н о г о управления, переводящего фаэовую точку иэ положения хг в начало координат. Итак, теорема 14 доказана. С л е д с т в и е. Предположим, что начало координат пространства Е„является внутренней точкой многогранника У. Обозначим через Ут множество тех точекхгг-Х, которые могут быть (при помощи надлежаще выбранного управления) переведены в начало координат О(:Х га время, не превосходящее Т (где Т вЂ” некоторое положительное число).
Тогда гт еапь замкнутое выпуклое множество пространства Х, имеющее внутренние точки (т. е. выпуклое тело). Дока э а тельство. Обратимся к докаэательству теоремы 14, взяв в нем 1г = Т. Тогда мы получим такую окрестность г' начала координатО~Х, что для любой точки хгЯУсуществует кусочно-постоянное управление, которое переводит фаэовую точку иэ положения х, в на- 151 ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 9 191 чало координат (за время Т). Иначе говоря, У! Хт, т. е. начало кооРдинат является в н у т р е н н е й точкой множества Хт. Замкнутость множества Хт легко следует из теоремы существования.
Остается доказать, что множество Хт выпукло, Пусть х, = (х'„хэ, ..., х",) и х, = (х,', хэ, ..., х,") — две точки множества хт, а и1 (1) и ив (1) — управления, переводящие фазовую точку из положений х„хо в начало кооР- динат за время,не превосходящее Т.
Будем предполагать оба управления и1 (1), ив (1) заданными на всем отрезке О ( 8 ( Т, считая их равными нулю от момента попадания фазовой точки в начало координат и до момента Т. Тогда и1 (о) и ив (1) — управления, заданные на отрезке О = 1( Т и переводящие за время Т фазовую точку из положений х1 и х, в начало координат, т. е.
в силу (22) в т ~ т.!то(Ч~-$!О Р1, В.,И!а) О, т=! 9 з т т т,1трво1(о р1,в,,оо!а) =о. т= 1 9 (36) (37) Пусть теперь а1 и а,— произвольные положительные числа, УДОВЛЕТВОРЯЮЩИЕ УСЛОВИЮ а1 + а, =1; ПОЛОЖИМ Хра а1Х1+ + аохо, ио (1) = ави1 (1) + авив (1). Тогда точка хо расположена на отрезке, соединяющем точки х, и х„а точка ио (1) — на отрезке, соединяю1цем точки и, (1) и ив (1) (при любом 1, О =. 1( Т), так что ио (1)т — П при любом 1 (ибо П вЂ” в ы п у к л ы й многогранник). Таким образом, ио (1)— допустимое управление, заданное на отрезке О ~ 1 в-.
Т. Умножая соотношения (36), (37) соответственно на а„ав и складывая, получаем то т т. т,!тО(Ч-о!!1,1рв~ос!а)=о. 1 9 Таким образом, управление ие (1) переводит фазовую точку из положения хо в начало координат эа время Т, т. е. хо1=ХТ. Итак, любая точка отрезка, соединяющего точки х, и х„принадлежит множеству Хт, и потому множество Хт выпукло. $52 ЛИНЕЙНЫЕ ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ ~ГЛ й 20. Синтез оптимального управления В главе 1 мы рассмотрели на конкретных примерах задачу синтезирования оптимальных управлений. Эта задача имеет смысл для проиэвольного управляемого процесса (см.
формулу (4) в $2). Однако адесь мы будем рассматривать лишь линейные системы вида (1), удовлетворяющие условиям, указанным в формулировке теоремы 14 (по поводу условия устойчивости оператора А см. замечание в конце этого параграфа). Для таких систем имеют место теоремы существования и единственности (теоремы 14 и 12), благодаря чему эадача синтеза является в принципе решенной. Приводимые здесь соображения дают конструктивный метод решения этой задачи. Осуществление этого метода в каждом конкретном случае требует, однако, ряда построений. Синтезирование оптимального управления линейной системы (1) было осуществлено ранее (совершенно другими методами, т. е.
беэ использования принципа максимума) лишь для случая одного управляющего параметра (т. е. при г = 1) — А. А. Фельдбаумом при действительных собственных аначениях оператора А и Д. Вушоу в случае, когда я=2, а собственные эначения оператора А комплексны. Испольэование принципа максимума дает воаможность эначительно проще получить укаэанные результаты (см. примеры, наложенные в 5 5). Ниже мы покажем, каким обраэом с помощью принципа максимума можно при и = 2 построить синтез линейных систем оптимального управления с д в у и я управляющими параметрами.
В атом параграфе мы изложим общие соображения о эадаче синтеэа оптимальных управлений. Мы будем считать, что выполнены условия, сформулированные в теореме 14. Тогда для каждой точки хо~Х существует и притом только одно оптимальное (кусочно-постоянное) управление и„, (8), переводящее фаэовую точку иэ точки х, в начало координат О~Х. Единственность имеет место, конечно, только с точностью до сдвига времени и до значений управления и (8) в его точках раарыва. Так как в каждый момент времени нас, естественно, интересует, каким будет оптимальное управление и о с л е этого момента времени, то (в отличие от ранее принимавшихся согла- СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 153 е ео] шений — см.
стр. 15 и сноску на стр. 130) целесообразнее всего считать в каждой точке разрыва 1 управления и„, (С) его значение равным и„(с + О). При этом соглашении во все моменты времени (кроме конечного, когда значение управления не играет роли) выполняется соотношение и„,(г) = и„,(г + О), благодаря чему устраняется неоднозначность управления й«,(с) в начальный момент и в точках разрыва. Величина и,(8е) зависит, таким образом, только от точки хю а не от случайно выбранного начала отсчета времени ~о, и потому можно положить " (хо) = и«е ('о). Пусть х (г) — решение уравнения (2), соответствующее управлению и (8), а г ( 8 ( сг — промежуток времени, в течение которого точка, двигаясь при этом управлении, переходит из положения х, в начало координат.
Так как для любой точки т, взятой из этого промежутка времени, управление и, (1), рассматриваемое на отрезке т ( ~ ( г„о и т и м а л ь н ы м образом переводит фаэовую точку из положения х (т) в начало координат (иначе все управление в целом не было бы оптимальным), то имеет место соотношение и, (т) = о (х (т)) . Таким образом, — „, х(г) = Ах(г)+ Во (х(с)), и мы видим, что решение уравнения —, =Ах+Во(х) с произвольным начальным условием х (1е) = хе дает закон оптимальнозо движения фозовой точки из положения хе в начало координат.
В атом смысле функция э (х) с и н т ее и р у е т оптимальное управление, переводящее фазовую точку из любой точки хо в начало (ср. 3 5). В нахождении функции о (х) и заключается решение задачи синтеза оптимального управления (для линейной системы (2)). $54 линеЙные оптимальные выстгоденствия [гл, о Дадим метод построения функции Р (х). Пусть $ (~)— то (нетривиальное) решение уравнения (5), которое в силу теоремы 2 соответствует управлению и~, (г), так что ( „() = — Аоф(~), ш (38) а функция и„, (г) определяется из уравнения (39) (Ф(г), Ви„,(~))=Р(ф(~)).
Пусть, далее, х (а) — решение уравнения (2) с управлением и = ио, (1), удовлетворяющее начальному условию (40) х(~о) =хо н конечному условию (41) х(С,) =О, = Ах(~)+Вв,,(Е). так что (42) Тогда функция э (х) удовлетворяет условию (ор (Го) ВР (х (Го))) = Р ('р (Го)). (43) Из теоремы существования и единственности следует, что существует, и притом только одна (с точностью до сдвига времени), пара функций и„(г), х (г), заданных на отрезке го ( о -' гг и удовлетворяющих условиям(38) — (42).
Ввиду возможности сдвига времени числа ~о и ~, этими условиями не определены одноаначно, но число определено. Совершенно не ясно, как искать функции и„, (~), х (г), удовлетворяющие всем условиям (38) — (42), но легко найти все функции и„,(Г), х(1), удовлетворяющие лишь условиям (38), (39), (41), (42). Для этого поступим следующим образом. Ввиду возможности произвольного сдвига времени аафиксируем число ~н положив ~г = О.
Пусть теперь т, = (~ы у„..., у„) — произвольный вектор, 2 2Ю СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 155 отличный от нуля, и 2р (г, у) — решение уравнения (38), удовлетворяющее начальному условию "р (О~ Х) = Х и определенное при 2 ( О. Определим, далее, функцию и (2, т) из условия И(2,)(),В (2,Н))=Р(~(2,Х)), 2~О, и функцию х (2, у), удовлетворяющую начальному условию х (О, ~) = О, — из уравнения А Ах(~ у)+Ви(2 )() согласно скааанному выше, функция О (х) определится соотношением (2Р(Ц Х), Ви(х(8,)()))=Р(2Р(2,)()).
(44) Из теоремы существования (теорема 14) следует, что точка х (1, у) описывает в с е пространство Х, когда г пробегает отрицательные значения, а вектор т меняется проиавольно. Таким обрааом, соотношение (44) определяет значение функции ю (х) для произвольной точки х пространства Х. Заметим, что условие устойчивости оператора А использовалось в предшествующих рассуждениях лишь один раз, а именно в конце предыдущего параграфа, когда показывалось, что иэ любой точки пространства Х можно подойти как угодно близко к началу координат. Поэтому все выводы настоящего параграфа сохраняют свою силу и в том случае, когда оператор А не является устойчивым, но за счет выбора надлежащего управления и (2) можно из любой точки хе2-.Х подойти как угодно близко к началу координат (см.
пример 1 в З 5). Если, однако, и это условие не выполняется, то синтез все равно возможен, но не для всего пространства Х, а лишь для некоторой его области. Именно, обоаначнм через 2' множество тех точек пространства Х, из которых можно (с помощью надлежащего управления) как угодно близко подойти к началу координат. Тогда функцию Р (х) можно построить (предполагая, что начало координат пространства Е, — в н у т р е н н я я точка многогранника П и что 156 линейнЫЕ ОПТИМАЛЬНЫе ЕЫСтРОДЕНСТВИЯ ~ГЛ выполнено условие общности положения) на множестве У, что и дает в атом случае решение задачи синтеза. При этом совсем не нужно заранее проверять, из любой или не из любой точки можно попасть в начало координат.
если решать аадачу синтеза, как указано выше (т. е. пользуясь «попятными движениями» из начала координат), то множество всех тех точек пространства Х, в которые мы сможем попасть (на основании формул (38), (39), (44), (42))„ исходя из начала координат, и будет представлять собой область У, для которой аадача синтеза допускает решение. Множество Уявляется открытым, т. е. вместескаждой точкой содержит и некоторую ее окрестность.