Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 29
Текст из файла (страница 29)
е. является экстремальным (стр. 140). Но экстремальное управление, переводящее фазовую точку иэ положения х» в начало координат, также единственно (теорема 12). Таким образом, экстремальное управление, переводящее фазовую точку в начало координат, как раэ и является оптимальным управлением. Следует отметить, что в ы ч и с л е н и е траектории х(с), соответствующей начальному значению ф„, является довольно трудоемким. Действительно, эта аадача включает в себя решение уравнения (5), нахождение функции и(») по формуле (6) и, наконец, решение уравнения (2), что сводится к решению н е с к о л ь к и х систем дифференциальных уравнений с последовательным вприпасовыванием» начальных значений (ибо функция и(») получается, вообще говоря, не постоянной, а лишь кусочно- постоянной) . Если предположить, что нахождение траектории х(1) по начальному аначению»р» осуществляется некоторым и р и б о р о м, то остается задача поиска начального значения»р», при котором траектория х(~) проходит череа О.
В этом параграфе, не касаясь второй задачи (задачи поиска начальных значений»р»), мы укажем способ построения модвлирующезо устройства, позволяющего по начальному значению»р» находить соответствующую экстремальную траекторию х(г). Это моделирующее устрои- МОДЕЛИРОВАНИЙ ство состоит из двух линейных объектов с уравнениями (2)и(5) и некоторого числа релейных элемент о в, количество и схема соединения которых определяются многогранником У и оператором В.
Переходим к математическому описанию указанного моделирующего устройства. Рассмотрим линейный объект, фазовые состояния которого описываются переменными ..., ф„изменяющимися по закону (5). Этот объект мы будем условно изображать так, как показано на рис. 67. г'л ал Рис. 67. Рис. 68. Задание начальных значений для величин ф„, ..., ф, (т. е. задание вектора $а) однозначно определяет дальнейшее иамвнение величин ар„ ..., ар„ во времени.
Исходный объект (описывавмын уравненном (2)) мы будем аг'а ха Рис. 69. изображать так, как покааано на рис. 68. Для того чтобы однозначно было определено иаменение (во времени) выходных величин (т. е. фазовых координат) х', ..., х", нужно задать начальное фазовов состояние ха объекта и изменение (во времени) входных величин и', ..., й (т. е. управляющих параметров). Требуемое моделирующее устройство имеет вид, укааанный на рис.
69; 192 линейные ОптимАльные Быстгодеиствия (гл, » средний «ящик», помещенный между объектами, изображенными на рис. 67 и 68, содержит некоторое количество релейных злементов. Описанию этого среднего «ящика» и посвящена остальная часть параграфа. Прежде всего отметим частные случаи, в которых устройство среднего «ящика» особенно просто. Рассмотрим сначала случай, когда в уравнение (2) входит только один управляющий параметр и, Г ' Рис.
71. Рис. 70 изменяющийся в пределах — 1 ( и(1 (т. е. случай, когда многогранник Ь7 представляет собой отреаок [ — 1, 1)). В этом случае матрица (Ь1) превращается в с т о л б е ц (Ь1, Ь', ..., Ь"), а функция (7) имеет вид п Х ф.«) Ь'и «=1 Поэтому уравнение (6) имеет следующее решение: и = з16 (~ Ьаф, «)). (71) а=1 Иначе говоря, если мы введем в рассмотрение вспомогательную величину »и ~,' Ьа««ь„ (72) «=1 то решение уравнения (6) будет определяться формулой и = а1йп5.
(73) Переход от величин 19„..., «ри к величине $, определяемой формулой (72), осуществляется некоторым еул«- мирующим устройством, условно иаображенным на рис. 70. На рис. 71 показано условное иаображение релейного элел(ента, т. е. объекта, выходная и входная величины которого связаны соотношением») = а1яп $. 193 МОДЕЛИРОВАНИЕ Соединим теперь объекты, изображенные на рис. 67, 66, 70, 71, в одну схему (рис. 72). Ясно, что, каков бы ни был начальный вектор ~>р, на выходе первого звена (в изображенной на рис.
72 схеме) мы получаем величины т(тг (1), ..., тры (Г), составляющие решение уравнения (5). Эти величины в следующем звене (обведенном пунктиром) преобразуются по формулам (72), (73), так что на выходе этого звена мы получаем величину (71), являющуюся решением уравнения (6). Иначе говоря, на выходе второго звена мы получаем э к с т р е м а л ь н о е у и р а в л е н и е и(с), и потому выходные величины Ркс. 72.
х'(~), ..., х"(~) последнего звена будут давать соответствующую экстремальную траекторию. Иначе говоря, схема, изображенная на рис. 72, при любых начальных значениях тро, хв осуществляет движение объекта (2) с фазовыми координатами хт, ..., х" по соответствующей экстремальной траектории. Если схема, изображенная на рис. 72, осуществлена в виде прибора (моделирующего устройства), то при использовании такого прибора остается нерешенной лишь аадача поиека начального значения тр„для которого (при заданном начальном значении хо) получаемая траектория приходит в начало координат.
Проведенные рассуждения легко обобщаются также на тот случай, когда область управления У является т'-мерным кубом, т. е. определяется неравенствами (74) 7 Л С. Поытрытыы ы Ыр. 194 ЛИНЕЙНЫЕ ОПТИМАЛЬНЫЕ ВЫСТРОДЕйСТВИЯ 1ГЛ. э В этом случае функция (7) имеет вид Х Х фа(1) о$ис. (75) Так как, в силу (74), область изменения каждого иэ управляющих параметров и1, ..., й не эависит от того, какие эначения приняли остальные управляющие параметры, то для того, чтобы функция (75) принимала максимальное эначение, необходимо, чтобы к а ж д о е ее отдельное слагаемое и Х ф,(1) 5"иэ а.
1 при р = 1, ..., г принимало максимальное значение. Отсюда получим и па = эМН(Х ф.(1) 5;) а=1 Иначе говоря, если мы введем в рассмотрение вспомога- тельные величины и = ~Ч', б фа, Р=1,...,г, (76) а=1 то решение уравнения (6) будет определяться формулами: иэ = э1дп$в, )) = 1,..., г. Переход от величин 191, ..., 19 к величинам $„..., чг осуществляется суммирующим устройством, условно изображенным на рис. 73.
Иа сказанного ясно, что схема, изображенная на рис. 74, вырабатывает на выходе релейных элементов э к с т р ем а л ь н о е у и р а вл е н и е и1(1), ..., й(1), а на выходе последнего звена— соответствующую экстремальную траекторию х(~). Отметим, что число релейных элементов в этой схеме равно числу управляющих параметров. Наконец, перейдем к рассмотрению общего случая, когда многогранник У проиэволен. Пусть (77) ю» юз ~т 196 ЛИНЕЙНЫЕ ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ [ГЛ. 3 Пусть теперь е„..., е — все вершины многогранника У. Рассмотрим какую-либо одну вершину е, и пусть у — одно из чисел 1, 2, ..., у.
Если исходящий из вершины е, вектор, равный ю,, идет по одному из ребер многогранника У, примыкающих к атой вершине, то мы положим е, = + 1. Если исходящий из вершины е~ вектор, равныи — и, идет по одному из ребер многогранни- О ка У, примыкающих к атой вершине, то мы положим згт = — 1. Если же ни один из зтих двух случаев места не имеет, то символ е,; не определяется. Фиксируем некоторйй индекс 1( = 1, 2, ..., д) и будем рассматривать только такие индексы 1, для которых символ е,, определен.
Тогда векторы з,,и~, (рассматриваемые для указанных индексов у) направлены по ребрам многогранника У, исходящим из вершины ег Пусть теперь ф = ($м фю ..., ~р„) — произвольный отличный от нуля вектор. Обозначим через Веф вектор пространства Е„, имеющий 1-ю координату ~ч', о"фе, 1 = 1, ..., г.
Тогда для любого вектора и пространства Е„, как легко видеть, имеет место соотношение (В*ф, и) = (ф, Ви). (80) Проведем теперь в пространстве Е, гиперплоскость Л, проходящую через точку е, и ортогональную вектору В*ф а вектор Ве~Р будем считать исходящим из точки е;. Для того чтобы величина (ф Ви), рассматриваемая как функция точки и ~ У, достигала своего наибольшего значения только в одной вершине е,, необходимо и достаточно (в силу (80)), чтобы весь многогранник У находился в том полупространстве, определяемом гиперплоскостью Л, которое не содержит вектора Веф, а для етого, в свозо очередь, необходимо и достаточно, чтобы каждый вектор, исходящий из точки е, и направленный по ребру многогранника У, составлял с вектором В*~р тупой угол.
Иначе говоря, для того чтобы уравнение (81) (ф, Ви) = Р (ф) имело единственное решение и = е,, необходимо и 197 модклиговлние ф 221 достаточно, чтобы все скалярные проиаведения (Ва~(~, е,.ют) (соответствующие индексам 7', для которых символ е,; определен) были отрицательными, или, иначе, чтобй были выполнены неравенства еы(~р, Вш7)(0.
В силу (78) последнее неравенство принимает вид е;Я7(0. (82) Итак, для того чтобы уравнение (81) имело единственное решение и = ап необходимо и достаточно, чтобы для всех у (для которых символ е2 определен) выполнялось неравенство (82), или, что то же самое, равенство е,,Ч7 = — 1 (83) (см. (79)) Положим теперь Ь2 =1; — 1+ '~ е;,217, 1=1, 2,..., д, (84) 7 где 12 — число ребер многогранника У, примыкающих к вершине е2, а суммирование распространено на все значения 7', для которых символ е1; определен (так что в втой сумме имеется 1; слагаемых).