Пупков К.В. Методы классической и современной теории автоматического управления. Том 2 (2000) (1095389), страница 89
Текст из файла (страница 89)
Проинтегрируем уравнения (2.29); Чгг(Г) = Чгг(0), Чгз(Г) = -гу!(0)Г + Чгз(0). Строго юворя, уравнения (2.29) допускают решение Чгз(г) = О '! 2(г) =-! (2.38) (2 37) В этом случае соотношение (2 33) не определяет управление и (г) однозначным образом. Однако решение (2 Зб), как легко убедиться, противоречгп условию М(чг(г), х(!)) = 0 и поэтому его следует исключить из дальнейшего рассмотрения В соответствии с (2.37) график функции Ргф) является прямой линией Вид этой прямой определяется начальными условиями гу,(0) и Чгз(О) . Далее, если Ч'з(г) = Ч'з (О) то в соответствии с неравенствами(2 34) / Чгз(0) !>! .
Рассмотрим оптимааьное управление и оптимальную траекюрию, свлветствуюшие функции Рз(г), представленной на рис 2 8. Управление и (г) в этом случае имеет вид, изображенный на рис. 2.9. Как следует из (2 24) и (2 25), при и =1 фазовая точка движется по параболе семейства 1 з ° «! хз 2 (2 39) а при и = -! — по параболе семейства 1 х! = — ха +я 2 (2 40) здесь з и з — произвольные констшпы.
При и(г) = 0 480 Методы тео ни оптимального п авленид. Часть!П «г(г) = «г(0), «,(г) = «,(О)г + ,(О), те, при и=О фазоваяточкадвижется по прямой линии «г(г) = «г(0) (2 41) Рнс. 2.О. ГРафик фУнкиин де(г) Рмс. 2.9. График оптимального унравлення На рис 2 1О изображено семейство прямых (2 41) Рис. 2ЛО. Графики прямых, определяемых уравнением (2.41) Таким образом, траектория, соответствующая изображенному на рис 2 9 управлению и (г), состоит из парабол соответственно семейств (2 39) и (2 40), соединенных между собой отрезком прямой (2 4!) (рис. 2 11). На заключительном участке фиовая точка движется по параболе семейства (2.40), причвм по той из парабол семейства (2 40), которая проходит через начало координат Эта парабола задаатся уравнением 1 «, = —.т,, 2 а участок параболы, по которому фазовая точка переводится в начало координат, — уравнением г « = — «г, «гаО Глава 2.
П иицип максим ма Пои агина 481 Рис. 2.1!. График оптимальной траектории Переключение управления с и (!)=О на и (!)=-! происходит именно в точках участка параболы (242) Таким обриом, можно записать г И('г) = хг(гг) . 2 Линию, которая зыается уравнением (2 42), обозначим у, Найлом линию, в точках которой происхоютт переключение уравнения с и (!) = ! ка и (!) = О Воспользуемся равенством М(иг(!) х(!)) =0 Для мог!сита времени гг имеем -А -)и(гг "0)~ь и!(тг)хг(гг)+ гуг(гг )и(б +0) = О Всоответствии с рис 28 и 29 (2 43) и(гг г О) = — ! Рг(гП = Из (2.43) следует в Ч'г(тг ) = Чг!— хг(гг) (2 44) Найдем время движения с управлением и (!)=О Так как г!гг(г!)=), чг,(г,) =-), го из равенства жг(гг)' ж!(гг гг)+жгИ) следует гг — г! †.ь-, чг! или, принимая во внниание (2 44), 2х,(г,) — ! =— г ! (2 45) В интервале г, < ! < г, фазовая точка движется под возлейсгвием управления и (!) = 0 Позтому хЗпг) хг(!1) (!г г! ) + х! Н ) нли х,(г,) =«,(г,) — г — ьх,(г,) 2хг(! ) 7! Поскольку х,(г,) = хг(г, ), то можно записать 2 х (гг) = — хг (гг) + х (г!) .
(2 46] Точка т(г,) пел!их полинин у, н, следовательно. ! х!(гг) = — х,(г,) 2 (2 47) Подставив (2 47) в (2 46), получим Палее, учитывая, что хг(г,) = х,(г!), можно записать Методы тео ии оптимального п ааления. Часть 111 432 2'! х (г,) = — ~ —.«-~ззз(г,) . 1,2 Яз Итак, переключение управления с л (!) =1 на и (г) = 0 происходит в точках кривой (1 2) з х, =- -ь- хз, «з йО (2 48) Линию, задаваемую уравнением (2.48), обозначим у,' Рассмотрев управление к (г), представленное на рис.
2.12, аналогичным обрюом ма кно показать, что переключение управления с и (г) =-1 на и (г) =0 происходит на линии (1 21з х! —— — + — ~ хз, хз <О, (2 49] а переключение управления с н (г) = 0 на и (г) = 1 происходит на линии 2 х! = — хз, хз ьО. 2 (2.50) Линии, залаваемые уравнениями (2.49) и (2.50), обозначим соответственно у, и у,'. Пусть, далее, у, =у, Оу,', а у, =уз()уз Рис. 2.12.
График управления и (г) Таким образом, на фазовой плоскости сушествуют две линии переключения у, и у, (см. рис 2.13) Выше линии у, и у, управление и (г) = -1, ниже линии у, и уз управление и (г) =+1 В промежутке Рне. 2.!3. Графпки фазовых траекторий между линиями у, и у, л = 0 На рис. 2.13 жирными линиями выделены две фазовые траектории, которые удовлепюряют теореме 2.1.
Только управления и траектории, задаваемые рис 2.13, могут быть оптимальными. Глава 2. П инцип максим ма Пон ягина 483 Далее, поскольку для каждой начальной точки сушествует только одна траектория, удовлетворяюшая необходимым условиям оптимальности (условиям теоремы 2.1), а по физическим соображениям сушествование оптимальных траекторий представляется вполне очевидным фактам, то зто позволяет заключить, что полученные выше управления н траектории являются оптимальными.
Пусть = у[(хз) -уравнениелинии т,,а х! -— -)з(хз) — уравнение линии у, . Тогда оптимальное управление можно задать равенстваы и 1 если х( б(хз) ( О н х! Гз(хз) ( О, -1, если х,- г!(хз) >О и х!-/з(хз) >О, (2.51) О, если Иап = [»! - /;(хз)] = -з!ап[х! - уз(хз)] Строго говоря, равенство (2.51) не задает значение оптимального управленца на линии т,, хотя линия у, образована двумя оптимальными фазовыми траекториями системы (2!9). Как будет показано ниже (см гл. 5), задание управления на линии переключения ие требуется. На рис.
2.14 изобршкена структурная схема оптимальной системы Рис. 2.14. Структурнва схема оптимальной системы Если функции х, — У!(хз ) и х, — Уз(хз ) имеют ршные знаки, то о(г) = О и управление л(г) = О . Если указанные функции имеют одинаковые знаки, то о(!) = -2ийп[», -Х(хз)] и сигнал управления «(!) = -з!йп[», -Х(хз)]. 2.2. ЗАДАЧА С ПОДВИЖНЫМИ КОНЦАМИ. ПРИНЦИП МАКСИМУМА Д]"гЯ НЕАВТОНОМНЫХ СИСТЕМ 2.2.1. ЗАДАЧА С ЗАКРЕПЛЕННЫМ ВРЕМЕНЕМ В 92.! была сформулирована задача оптимального управления.
При этом предполагалось, что время движения не задано. Поскольку уравнения (2.!) являются автономными, то можно положить начальный момент времени г фиксированным, а конечный момент времени г, свободным. 484 Методы тео ии оптимального п авления. Часть Ш Будем теперь считать, что моменты времени го и б фиксированы.
Обратимся к рассмотренной в в1.5 задаче оптимального управления методом классического вариациоиного исчисления. При фиксированных моментах времени го и 11 вариация функционала будет по-прежнему задаваться равенством (1.74), в котором следует положить Ьг, = О . Это, в свою очередь, приведдт к тому, что нз необходимых условий минимума выпадут условия (1.87) и, следовательно, равенство (1.88), доказательство которого основывается на соотношениях (1.87).
Если теперь совершить обратный переход от приведенных в 81.5 необходимых условий оптимальности к принципу максимума (теореме 2.1), то получим все условия теоремы 2.1, кроме соотношения М((О),х(г,)) = О. (2.52) Таким образом, необходимые условия оптимальности для задачи с фиксированным временем движения задаются теоремой 2.1, из формулировки которой следует исключить условие (2.52). Отметим, что соотношение М(ер(г), х(г)) = сопзг по-прежнему сохраняет свою силу. Однако функция М(ер(г),х(г)) теперь не обяза- тельно должна равняться нулю.
2,2.2. ЗАДАЧА С ПОДВИЖНЫМИ КОНЦАМИ В 82.1 предполагалось, что начальное и конечное состояние системы строго определены, т.е, в фазовом пространстве заданы начальная х и конечная х точки, ко- о 1 торые следует соединить оптимальной траекторией. Рассмотрим более обший случай.
Предположим, что вместо начальной и конечной точек заданы начальное ао н конечное з, многообразия. Пусть многообразие ао задается уравнениями <р~(х,, хы ..., х„) = О, 1 = 1, р, р < л, (2.53) а многообразие А — уравнениями ~3„(хп хы ..., х„) = О, ч = 1,)е, й В и. Если л = 3, а р = )е = 1, то многообразия ло и з~ представляют собой поверхности в трехмерном фазовом пространстве.
При л =3, и = 2, )е =! многообразие ао задается как множество, образованное пересечением двух поверхностей (рис. 2.15), т.е. является линией в трехмерном фазовом пространстве, а многообразие з1 по-прежнему представляет собой поверхность. Рне. ЗЛ5. Начальное ао н конечное А многообразна Глава 2. П инцип максим ма Пон агина Функции <р(х!,хз,...,х„)=0 и В„(х!, хз,...,х„),1=1,р,т=),к, будем полагать непрерывно дифференцируемыми по всем своим аргументам. Введем вектор 1 ду~х) ду(х) дух) ) ч<р(х!,...,х2) = —, —,..., —, дх, дх2 дх„ ! называемый градиентом функции !р (х) . Многообразие хе называется гладким, если в каждой точке хиле следующие векторы Чс!2!(х), У!1!2(х),..., У!р (х) (2.55) линейно независимы.
Условие линейной независимости векторов (2.55) эквивалентно требованию, чтобы ранг матрицы дан ар, дя, дх! дх2 д'1'2 ~2 д!1'2 дх! дх2 ~Ь ~ь, дх! дх2 дхл у,(ге) = Л.р! —, д<р! (х) х = х(ге) (2.56) был равен р. Аналогичным образом определяется гладкость многообразия л!. В дальнейшем многообразия лс и л! полагаются гладкими.
Рассмотрим следуюшую задачу: требуется среди допустимых управлений ц(2), переводящих фазовую точку х с многообразия хс на многообразие л,, найти такое, которое доставляет минимум функционалу (2.2). Так как в поставленной задаче концы траектории х(!) могут скользить по многообразиям ле и л!, соответствующую задачу оптимального управления будем называть задачей с нодеижныл!и копнами. Пусть п(2) и х(2), ге < 2 < г! — управление и траектория, решаюшие поставленную выше задачу оптимального управления с подвижными концами.