Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 29
Текст из файла (страница 29)
Иначе говоря, задача заключается в быстрейшем попадании объекта, управляемого уравнениями (61), (62), нз начальной точки ха ~Х в какую-либо точку многообразия 5], определяемого в Х уравнениями (63). Многообразие 5! представляет собой, очевидно, и-нерпу]о плоскость. Функция О имеет в рассматриваемом случае следующий вид: Н =2Р]хл+! + ..
+ 2Рлххл+ 2Р и]+ + 2Р2ли". (64) 192 линейные Оптимхльиые выстгодейстеия ~гл. 3 с помощью этой функции находим систему уравнений для вспомогательных переменных 29;: — -о, лфг и Йоги (И ю Из этой системы вытекает, что в течение всего оптимального движения величины 29г, ганг, ..., ф, сохраняют постоянные значения, и потому величины ф„+ь г)г„+2, ... ..., грг„являются линейными функциями времени. Напишем теперь условие трансверсальпости в правом конце оптимальной траектории.
Для того чтобы вектор гр = (чггг .. ° г)г Ф+ь, г)гг ) был ортогонален к многообразию Яь определяемому уравнениями (63), очсвидно, необходимо и достагочно выполнение условий Фгг+! Чггг+2 ° . ° г)ггл Таким образом, условие трапсверсальности в правом конце оптимальной траектории имеет вид г)ге ы (1,)= ф„гг(1г) = ... Чгг„(1,) = О, (65) 1„г.а= (И, — ~), ..., грг„= ( — ~), (66) где 1г — момент попадания фазовой точки на многообра- зие Зг.
ВспомипаЯ тепеРь, что фУнкции г(ъ+ь 4ъ+2, ..., грг„линейны, мы находим из (65), что имеют место формулы Ф, 2=а И~ — Г). Ф т!1 прнмрры где аь ам -, а„— постоянные величины. Так как величины трс определены лишь с точностью до общего положительного множителя пропорциональности, то мы можем при этом предполагагь, что вектор а = (аь аги ...
..., а ) является единичным, т. е. (а,)" + (аэ)Р + ... + (а„)' = 1. Подставляя найденные значения (66) в формулу (64), мы получаем Н= ... +(1, — с)(асис+аси~+ ... +а„и"), где многоточием обозначены члены, не зависящие от и', ..., и . Так как 1,— С)0 (нбо 1,— последний момент движения), то условие максимума функции сс' означает, чго в течение всего движения величина а,и' + ааи'+ ... + а„и" (а, и) должна быть максимальной, а это, в силу (62), означаег, что и(1) == а, т. е.
что величины и', и', ., и" в течение всего движения сохраняют постоянные значения ис = аь с = 1, ..., п. Итак, в рассматриваемом случае оптимальность движения означает, что ускорение и постоянно и величина его равна единице. Это позволяет однозначно определить искомое ускорение (т. е.
найти направление вектора ускорения и). В самом деле, траектория движения точки в рассматриваемом евклндовом пространстве представляет собой параболу сг х'=х'+х" сс(+и' —, 1=1, ... и, а а 2 ' где и = (и', ..., и") — постоянный вектор ускоренна, равный по величине единице, т. е. удовлетворяющий ус. ловию (ис)а + (и5'+ ...
+ (и")' = 1. (67) Для того чтобы эта траектория прошла через начало координат, должны выполняться условия х'+ таитс(+ссс —,=О, 1=1, ..., и. (68) 7 л. с. Понтрягин и нр. 1В4 линвнпыв оптнмлльные выстгодвиствни (гл о Соотношения (67), (68) представляют собой систему из а + 1 уравнений относительно неизвестных и', и', ... ..., и", 1, причем для 1 мы должны получить положительное значение.
В случае, если таких решений окажется несколько, мы лолжйы взять решение с и а и м е н ьш и м положительным значением 1 (ибо речь идет о б ыстрейшем попадании в начало координаг). Из (68) мы получаем 2 (хо+ х"+ () и'= — ',, 1 =1, ..., и, (69) и подстановка в соотношение (67) дает уравнение л 4 ~ (хо+ хл+Ч)о — 14 0 (70) о о относительно неизвестного й При ( = 0 левая часть этого уравнения принимает значение 4 2',(х')' ) 0 (разуо 1 меется, мы считаем, что точка (х', х~~, ..., х") не совпадает с началом координат, так как в противном случае решение оптимальной задачи очевиднш 1 = 0).
При 1 †- со левая часть уравнения (70) отрицательна. Следовательно, уравнение (70) имеет хотя бы один положительный корень. Обозначим через т(х )~(х', х', ..., х, х"+', ..., х'') на именьш и й положительный корень этого уравнения. Тогда из (69) мы находим искомыс значения компонент ускорения 2 (хо + хо о'т (хо)) (т (хо))' Это и дает синтез оптимальных управлений в рассматриваемом случае. (Функция т(х,), а следовательно, и функции и* кусочно-непрерывны.) 9 22.
Моделирование линейных оптимальных быстродействий при помощи релейных схем Возвратимся снова к задаче о линейных оптимальных быстродействиях, рассмотренной в 5 17. В силу теоремы 9 каждая экстремальная траектория (см. стр. 144), исхо- молвлиговлнив !95 дящая в момент г, из точки хм определяется начальными значениями ф(1а) решения ф(1) уравнения (5). Именно, если задан произвольный отличный от нуля вектор ф«, то однозначно определено решение ф(1) уравнения (5) с начальным условием ф(!») = ~ъ. После этого, в силу теоремы 9, соотношение (6) однозначно определяет соответствующее экстремальное управление и(1).
Наконец, зная управление и(1), мы из уравнения (2) находим и соответствующую траекторию х(1), исходящую из точки хм Таким образом, в конечном счете экстремальная траектория х(1) однозначно определяется выбором начального значения ф„. Если бы пам удалось найти именно такое началшюе значение фа, что траектория х(!) и р о х о д и т ч е р е з н а ч а л о к о о р д и н а т О, то управление и(1) и траектория х(1), полученные указанным выше способом, будут оптимальными. В самом деле, полученная траектория х(1) будет идти в этом случае из точки х» в требуемую точку О, и потому оптимальное управление сушествует (теорема 13).
Это оптимальное управление единственно (теорема 11) и удовлетворяет принципу максимума, т. е, является экстремальным (стр. 144). По экстремальное управление, псрсводяшее фазовую точку из положения х0 в начало координат, также единственно (теорема 12), Таким образом, экстремальное управление, переводящее фазовую точку в па« чало координат, как раз и является оптимальным управлением. Следует отметить, что в ы ч и с л е н и е траектории х(1), соответствующей начальному значению ф,, является довольно трудоемким. Действительно, эта задача включает в себя решение уравнения (5), нахождение функции и(1) по формуле (6) и, наконец, решение уравнения (2), что сводится к решению н е с к о л ь к и х систем дифференцнальпых уравнений с последовательным «прппасовыванием» начальных значений (ибо функция и(1) получается, вообще говоря, не постоянной, а лишь кусочно- постоянной).
Если предположить, что нахождение траектории х(Г) по начальному значению фа осуществляется некоторым прибором, то остается задача поиска начального зпа. чения ф„, при котором траектория х(1) проходит через О, 196 лппгппыт оптпмлльпыг. выстяодгнствпя [гл. з В этом параграфе, не касаясь второй задачи (задачи поиска начальных значений фг), мы укажем способ построения моделирующего устройства, позволяющего по начальному зпаченшо ф, находить соответствующую экстремальную траекторию х(1). Это моделирующее устройство состоит нз двух линейных объектов с уравнениями (2) и (5) и некоторого числа р е л е й н ы х э л ем е и т о в, колнчестпо и схема соединения которых определяются многогранником (l и оператором В. Переходим к математическому описанию указанного моделирующего устройства.
Рассмотрим линейный объект, фазовые состояния которого описываются перемепнымп фь ..., ф», изменяющимися по закону (5). Этот объект мы будем условно изображать так, как показано на рпс. 67. Задание начальных значений для величин фь,... 1); (т. е. задание вектора ф») однозначно Рнс. 68. Ряс. 67. определяет дальнейшее изменение величин фь ..., ф, во времени. Псходный объект (описываемый уравнением (2)) мы будем изображать так, как показано на рис.
68. Для того чтобы однозначно было определено изменение (во времени) выходных величин (т. е. фазовых координат) х', ..., х", нужно задать начальное фазовое состояние ха объекта н изменение (во времени) входных величин и', ..., и" (т. е. управляющих параметров), Требуемое моделирующее устройство имеет вид, указанный на рис. 69; средний «ящик», помещенный между объектами, изображенными на рис.
67 и 68, содержит некоторое количество релейных элементов. Описанию этого модалиговлнць 9 г! 197 среднего «ящика» и посвящена остальная часть параграфа. Прежде всего отметим частные случаи, в которых устройство среднего «ящика» особенно просто. Рассмотрим сначала случай, когда в уравнение (2) входит только один управляющий параметр и, изменяющийся в пределах — 1 ( и =- 1 (т.
е, случай, когда многогранник (7 и .в9. представляет собой отрезок 1 — 1, !!). В этом случае матрица (Ь';) превращается в столбец (Ь', Ь', ..., Ь"), а функция (7) имеет вид л ~ ф,Р)Ь"и. а=~ Поэтому уравненис (6) имеет следующее решение: (71) Иначе говоря, если мы введем в рассмотрение вспомогательн)чо величину ~= ~ Ь"ф., (72) то решение уравнспия (6) будет определяться формулой (73) и = з!дп =. Переход от величин фь ..., ф„к величине 9, определяемой формулой (72), осуществляется некоторым сульки- 198 ЛИ!!РИНЫЕ ОПТИМАЛЬНЫЕ БЫСТРОЛРИСТБТ!Я !ГЛ. 3 руюи)им устройством, условно изображенным на рис.
70. На рис. 71 показано условное изображение релейного элемента, т. е. объекта, выходная и входная величины которого связаны соотношением т) = з)ип 5, Соединим теперь объекты, изображенные на рис. 67, 66, 70, 7!, в одну схему (рис. 72). Ясно, что, каков бы пи был начальный вектор фы на выходе псрвого звена (в нзобра7кенной на рис. 72 схеме) мы Рис. 7! Ряс. 70. получаем величины ф!(1), ..., !)!„(1), составляющие решение уравнения (5).
Эти величины в следующем звене (обведенном пунктиром) преобразуются по формулам (72), (73), тзк что на выходе этого звена мы получаем Рис. 72. величну (71), являю!цуюся решением уравнения (6). Иначе говоря, на выходе второго звена мы получаем э к с т р е м а л ь н о е у п р а в л е н и е и (1), и потому выходные величины х'(1), ..., х (1) последнего звена будут давать соответствующую экстремальную траекторию. Иначе говоря, схема, изображенная на рис. 72, при любых начальных значениях фм хь осуществляет движение объекта (2) с фазовыми координатами х', ..., х" по соответствующей экстремальной траектории. Если схема, изображенная на рис.
72, осуществлена в виде прибора (моделирующего устройства), то при использовании та- 199 мопелнРОВлние кого прибора остается нерешенной лишь задача поиска начального значения фм для которого (при заданном начальном значении ха) получаемая траектория приходит в начало координат. 11роведенныс рассуждения легко обобщаются также на тот случай, когда область управления У является г-мерным кубом, т. е. определяется неравенствами ~и'~(1, 1=1...„г. (74) В этом случае функция (7) имеет вид х "т' (г) Ь~и~. (75) Так как, в силу (74), область изменения каждого из управляющих параметров и', ..., и" не зависит от того, какие значения приняли остальные управляющие параметры, то для того, чтобы функция (75) принимала максимальное значенис, необходимо, чтобы к а ж д о е ее отдельное слагаемое л ф„(1) Ь„и Иначе говоря, еслн мы введем в рассмотрение вспомога- тельные величины ~,= Х Ь,"ф., (76) то решение уравнения (6) будет определяться форму- лами: ив = з!дп $в, р = 1, ..., г, Переход от величин фь ..., ф„к величинам Вь ..., $, осуществляется суммирующим устройством, условно изо.