Пупков К.В. Методы классической и современной теории автоматического управления. Том 2 (2000) (1095389), страница 93
Текст из файла (страница 93)
Таким образом, переключения оптимального управления происходят' на линии )Гэя(зм,ОМ,М,М, ,составленной из полуокружностей единичного радиуса Глава 2. П иицип максим а ПО ягииа 499 Рпе.2.23. Оптимальное управление Введем функцию 1 выше линииГ.. ШзДГг)У!ОМ,МзМз...и г(хокз) = -1 ниже линииГ.. УзлгзУ10М,МзМз...н Из рис. 222 следует, что оптимальное управление к=с(хох,) в = е(хи хе), то решениями системы (2 94) будут идущие в начало сгнию траектории Пример 2.5. Рассмотрим систему уравнений х, =и, ехз, иа линии М(), на линии Дг(7 Если в уравнениях (294) положить координат оптимальные по быстродей- (2 100) хз =из, Чг,(г) = О, Шд(г) = Ш,(0), которое приводит к тому, что управление и, не определяется однозначно из условия максимума функции Гамильтона, т.е условию максимума удовлетворяет любое значение параметра и,, лежащего в диапазоне — 1<к! <! Уравнения (2.101) имеют решение Ч >(г)=Ш (О), Ч гф)=-Ш!(О) !+Шз(0) (2 103) Если начальное условие Ш,(0) и О, то а соответствии с (2.101) управление к, на всем интервале движения остается неизменной величиной, равной ! либо -1.
Функция Ш,(г) может изменять свой знак только эдип раз. Поэтому управление пз(г) является кусочно-постоянной функцией, принимающей значения е! ели -1, и допускжтся только одно изменение знака управления. Далее отметим, что если в оптимальном шижении управление из(г) изменяет свой знак, то, как слелует из (2.103), иа начальном участке движения управления и,(г) и и,(г) имеютодинакоаые знаки. щ' полагая, что на управления и, и ит наложены ограничения ) к!151 !пз! — 1 По-прежнему решается задача о наибыстрейшем переводе фазовой точки системы из заданного начально- го положения а начало координат.
С помощью матриц (2.75) легко убедиться, что система уравнений (2.100) ие является нормальной. Это означжт, что из условия максимума функции Гамильтона управление определяется неоднозначным образом. Рассмотрим, как это сказывасгся на определении оптимальнопг управления и оптимальных тра- екторий. Запишем функцию Гамильтона Н(чг,к,в) Ш~(к|+хе)ежзоз Вспомогательные пеРемеиные ш,(г) и шз(г) опРеделкюгсЯ УРавнениЯми -"Шь=о ~Шь=-„ 41 п) Из условия максимума функции Гамияьтона находим, что оптимальное управление в!(1) = з!ап ш,(г), (2 102) кз(г) = ыап ш,(г), здесь предполагается, что функция з(бп у не определена в точке у = О. Функция Ш,(г) не может тождественно равняться нулю, т.к. тогда, как следует из второго уравнения (2 1О!), Ш,(г) ч О, что противоречит пункгу 2 теоремы 2.2.
Однако уравнения (2 101) дапускмот нетриви- альное решение 500 Методы тео ии оптимального авлений. Часть Ш Необходимо рассмотреть два варианта ч! !(!) т О, Ч11(!) = 0 Рассмотрим сначала первый вариант, когда Ч11(!) Н О В этом случае справедлива теорема 2 4, и, следовательно, управление н траектория, удовлетворяющие теореме 2 2, являются оптимальными, а теорема 2 5 исключает возможность существования других оптимальных траекторий. Найдем фазовые траектории системы (2 100), соответствующие различным сочетаниям управлений н, и и, Для этого решим уравнения (2!00), полагая н! и из постоянными величинами ИЧЕЕЛ! Хз = Нз!.1.<1, 1 Х, =-Нз! 1-Н!+С!!1-ез, 2 здесь г, и с, — произвольные числа Определим из первого уравнения время ! и подставим его во второе уравнение В результате получим равенство !хз и, 1 х,= — + — х,+х, 2 из нз где г = сз — — — — с, — произвольная константа.
Равенство (2.104) задает параболу, вершина которой с; н, 2из из 1н, лежит в точке с координатаии г- — ', — и, Задаваясь различными значениями г, параболы (2 104) 2 из можно произвольным образом сдвигать вдоль прямой .11 = — Н! Рассмотрим оптимшгьные траектории, на которых управление нгф) имеет переключение В этом случае возможны следующие сочетания начальных условий лля вспомогательного вектора чг(!) чгз(0) > О, Чг 1(0] > О, 1Гз(0) < О, Ч11(0) < 0 Для первого сочетания управление и, =1, управление н, на начальном участке равно 1, а на заключителыюм участке равно -1 На начальном учжтке фазоаая точка системы движется по параболе семейства 1 1 Х1 — Хз 4Х11 3 2 вершина которой лежит на прямой «1 =1, а заканчивается движение по параболе семейства 1 .т! = — '.Хз Хз+1, 2 причем нотой из парабол, которая проходит через наив!о коорлинат Для второго сочетания начальных условий управление н, = -1, управление и, до переключения рав- но -1, а после переключения равно 1 Оптимальная фазовая траектория состоит из примыкающих друг к другу кусков парабол соответственно семейства 1 Х! = — Хз + Хз+Г 2 и семейства 2 х = — х — хз+з 1 1 2 Вершины этих парабол лежат на прямой х, =1 На рис 2 24 изобрюкены две рассмотренные выше оптимальные траектории.
Остальные оптимальные траектории, соответствующие варианту Ч11(!) И О, аналогичны изображенным иа рис 2.24. Оказывается, что не все точки фазового пространства, рассматриваемые как начальные для оптимальных траекторий, могут бьггь переведены в начало координат с помощью оптимальных траекторий, соответствующих первому варианту ( Ч11(!) ч 0 ) Предельной оптимальной траекторией типа А'В'О ( Ез(0) < О, Ч11(0) < 0 ) является траектория, у которой участок В'О равен нулю Очевидно, на этой траектории управление н,[1) не имеет переключения (траектория ЛО на рис.
2 25) Предельной траекторией типа АВО является траектория ВО, на которой и, =1, и, =1 Фазовые точки, расположенные между Глава 2. П иицип максим ма Пои ягииа линиями МВОВ'М' и ВОО, как следует из рис. 2 25, не могут быть переведены в начало координат с помощью оптимальных фазовых траекторий, соответствующих первому варианту Рпс. 2.24. Графики оптимальных траекторий Рне, 2.25. Графики оптимальных траекторий г, = х,(0), (г, = 0) Анализ уравнений (2.100) показывает, что фазовая переменная к, выбором управления и, (! и,! <! ) Рассмотрим второй вариант, когда и!(г) = О.
В этом случае, как следует из (2 10!) и (2 102), управле ние и,(!) не имеет переключений Соответствующие оптимальные траектории лежат в области, ограни ченной линиями ВОО и МОМ' также может быть переведена в нуль за время г,, при этом управление и,(!) определяется неоднозначным образом Очевидно, каждая нз этих траекторий является оптимальной, т к.
обращение в нуль фазовой переменной х, выполняется за минимально возможное время Для того чтобы упростить окончательный результщ", будем выбирать управление и,(г) постоянной величиной, но так, чтобы фазовая переменная к, обращалась в нуль за время г, = к,(0) Тогда фазовые траектории являются параболами вида 1 з ° к! = — кз -и! хз 2 (2 105) здесь символом и, обозначено соответствующее постоянное значение управления и, Разным точкам х соответствуют различные значения управления и, .
Так как фазовая точка движется по параболам (2 !05), то, очевилно, управление и, можно запать равенством Положим для определенности, что начальная точка х лежит в области, ограниченной линиями ВО и МО . Как следует из уравнений (2 100) и рис. 2 25, фазовая переменная х, может быть переведена в нуль только с управлением и,(!) = — 1, те. необходима выбрать чгз(0) <О Переменная хз обращается в нуль за время 502 Методы тео ни оптимального п авления. Часть ГН ! т, и, = — хг 2 «г Зто управление можно рассматривать как оптимальное таким образом, в области фшового пространствь ограниченной линиями ЕО и МО, оптимальное по быстродействию управление задается равенствами 1 х, и хг ! 2 хг* яг Линии ЕО и МО представляют собой куски параболы (2 104) соответственно при н, =-1, и, =-1 и и, = 1, и, = -1 и определяются уравнениями.
1 х! — — — хг.!.хг,хг >О; 2 1 х~ = — хг хг, хг д 0. 2 Соответствующая оптимальная траектория на рис 2 25 изображена лунд«иром Аныгогичным образом можно установки оптимальные траектории, лежашие в области, ограниченной линиями Е'О и МО Линия Е'О определяется уравнением 1 х, = — хг +хг,х <О, 2 а линия МΠ— уравнением 1 х!=-хг хг хг>0. 2 Оптимальное управление в этой области задается равенствами 1 х, 2 хг "г =1.
Пунктиром на рис 2.25 обозначена соответствующая оптимальная траектория. Обозначим х, = у!(хг) — уравнение линии ЕОЕ', а х, =уз(хг) — уравнение линии МОМ' Пусть, далее, х, = Уг(хг) — уравнение линии ЕОМ', х, =А(хг) — уравнение линии МОЕ' Из рис. 225 следует, что оптимальное управление задаекя равенствами -1, если х, — гг(хг)>0, 1 если «1 Аг(хг) < 0 1 х! — — если х, — А(хг) < О, х, — зг(ха) > О, хг > О, хг 1 х, — хг+ —, если хг- б(хг)>0, х,— гг(хг)<0, «э<0, 2 хг и,= -1, если «,-Уг(хг)>0, "г = 1, если хг-Уг(хг)<0 2.4. СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Принцип максимума ориентирован на определение оптимального управления в виде функции времени, т.е.
на определение управления в виде оптимальной программы. Если управление ищется в виде оптимальной программы, то решение задачи с помощью принципа максимума может быть сведено к определению начального значения для вектора Чг . Начальный вектор Чг должен быть выбран таким образом, чтобы исходящая из начальной точки х оптимальная фазовая траектория проходила через заданную конечную точку хг . Так как часть условий задается в начальный момент времени !о, а часть условий — в конечный момент г,, то получаем типичную двухточечную краевую задачу для системы дифференциальных уравнений. Определение оптимального управления в виде оптимальной программы рассматривается в ! ! 7].
Глава 2. П инцип максим ма Пои ягина 503 Однако возможен другой способ задания оптимального управления. Во всех рассмотренных выше примерах оптимальное управление задавалось в виде функции вектора состояния. Такой способ задания оптимального управления не ограничивается рассмотренными выше примерамц а справедлив для любого объекта управления, движение которого задается уравнениями (2.1).