Пупков К.В. Методы классической и современной теории автоматического управления. Том 2 (2000) (1095389), страница 88
Текст из файла (страница 88)
Если, например, Глава 2. П лицин максим ма Пон ягина максимум функции Н(гр(!),х(!),ц(!)) достигается во внутренней точке области (7. (2 20) зо* то должны выполняться соотношения дН(гр(!), х(!), ц) =О, 7'=!,гп. ди, Далее, 2п+1 из указанных уравнений являются дифференциальными. Общее ре- шение этих уравнений будет содержать 2п+1 произвольных констант. Неизвестно также время движения (, -го, т.е.
общее число неизвестных чисел равно 2п+ 2. Для нахождения указанных чисел можно использовать 2п условий прохождения опти- мальной траектории через заданные точки х и х, условие М(Чг(г!),х(г,)) = О. Выше уже отмечалось, что теоремой 2.1 вектор зр(!) определяется с точностью до постоянного положительного множителя. Поэтому всегда, например, можно положить !Ч ((0)1= ! Таким образом, общее число условий совпадает с общим числом неизвестных. Поэтому можно ожидать, что условия теоремы 2.! позволят выделить одну или не- сколько траекторий, проходящих через заданные точки х и х' . Так как теорема 2.1 задаат необходимые условия оптимальности, то оптимальная траектория будет нахо- диться среди выделенных траекторий.
К настоящему времени накоплен достаточно богатый опыт по применению прин- ципа максимума для определения оптимального управления и оптимальной траекто- рии. Зтот опыт показывает, что задаваемые теоремой 2.1 (теорема 2.2 является част- ным случаем теоремы 2.1) необходимые условия оптимальности являются сильными в том смысле, что выделяемые ими управление и траектория, как правило, являются оптимальными. Далее, известно, что принцип максимума, как необходимое условие сильного минимума, не может быть усилен. Рассмотрим несколько примеров. Пример 2Л. рассмотрим объект, движение которого заявятся уравнением Азх — =и, (2 )7) ей 2 здесь и — управляюший параметр, который должен удовлетворять условию !н)5 А, (2.
)8) где А — заданное положительное число. В соответствии с формализмом принципа максимума представим уравнение (2. ! 7) в виде системы лифференциальных уравнений первого порядка = хт Ах Ах (2 )9) ,! — т Будем решать задачу о наибыстрейшем переводе фазовой точки системы (2 !9) из заданного начально- го положения в начало координат (точку х' = 0 ) В качеспе начальной тачки будем рассматривать любую точку фазового пространства Это позволит выделить всю совокупность оптимальных траекторий Воспользуемся теоремой 2.2 Составим функцию Гамильтона Й(йг,х,н) = |у,хз ь Чзи. Принимая во внимание неравенство (2. ! 8), из условия максимума функции Гамильтона найдем в=А (а Чз(Г) Вспомогательные переменные ч!(г) и чт(г) находятся из системы уравнений Аг =,й'=- ~ Выпишем решение системы уравнений (2.2 1): ч,(!)=Со дзр)=-С>гьСз, где С, и С, — произвольные константы тогдаусловие(2.20) принимает вид 476 Методы тео ии оптимального и веления.
Часть !П и= Аз!бп(-С!!+С!) (2.22) Графиком функции Чгз(!) является прямая линия, и поэтому функция Чгз(!) может изменять знак не более одного раза Из (2 22), таким абрисы, следует, что оптимальное управление и(!) являещв кусочно- постоянной функцией, принимающей значения А и -А н имеющей не более двух интервалов постоянства управления Обратно, любая такая функция и(!) может быть получена из (2 22) при соответствующем выборе постоянных С, и С, .
Найдем фвзовую траекторию системы (2 19) при и = А. Имеем к!=А!+к,, Х,=-А! +зрак! 2 Выразив из первого уравнения (2 23) время ! и подставив его во второе уравнение, получим з К,= — К!ах, 2А (2 23) (2 24) где к =кз — — к, — произвольная постоянная Аналогичным образом легко показать, что при 2 2А фазовые траектории системы (2 19) являются параболами вида 1 г х =- — к +я 2А (2 25) здесь з — произвольная постоянная На рис.
2 3 и 2 4 представлены параболы семейсзи (2.24) и (2.25) соответственно. Рнс. 2.3. Параболы семейства (2.24) По параболам семейства (2 24) фазовая точка движется снизу вверх, а по параболам семейства (2 25)— сверху вниз, т к в соответствии со вторым уравнением (2 19) при и = А координата х, возрастает и при н=-А убывает Рнс. 2.4. Параболы семейства (2.25) 477 Глава 2. П иннин максим ма Пон агина Рассмотрим фюовую траекторию, на начальном учаспсе которой фазовая точка ввижется под возлепствием управления и = А по параболе семейства (2.24), а заканчиваекя движение под воздействием управления и = -А по параболе семейства (2.25).
При этом заканчимцтся двихзение по той из парабол семейства (2.25), которая прохолзтт через начало координат, т к конечной целью управления является перевод фазовой точки в начало координат. Указанная траектория изображена на рисунке 2 5 (лпния МЯО ). Если на начальном участке фазовая точка движется под воздействием управления и = -А, а заканчивается движение под воздействием управления и = А, то движение происходит по траектории МН'О, которая симметрична относительно начала координат траектории 6ГЯО Рис. 2.5. График фазовой траектории На рис 2 6 изображена совокупность всевозможных оптимальных траекторий Эти траектории действительно являются оптимальными, т к для каждой начальной точки х' сушествует единственная траексория, удовлетворяющая необходимым условиям оптимальности (теареь~е 2 2], а по условию залачи ясно.
что оптимальное управление сушествует Рис. 2.6. Графики оптималы<ых траекторий Из рис 2 6 видно, что переключение управления происходит на линии ЯОЯ' Выше линии ЯОЯ' оптимальное управление и=-А, а ниже линии ЯОЯ' оптимальное управление и=А. Линия ЯО является частью параболы семейства (2 25) и задается уравнением х,= — хз, хз>О, з 2А а линия Я'Π— частью параболы семейства (2 24) и задается уравнением ) х= — т,х <О. 3 2— 478 Методы тео ии оптимального п веления.
Часть!И Введем функцию -А выше линии йОЯ' и на линии ЯО, о(х) = А ниже линии РО//' и на линии и'О. Тогда в каждый момент времени / оптимальное управление и = о(к(/)) . Если в уравнениях (2 19) положить и = о(х), то при кажцом начальном условии решением системы урав- нений (2 19) будет идущая в начало координат оптимальная по быстродействию траектория Пример 2.2. По-прежнему рассматривается объект, движение которого задается уравнен!жми (2.19) Будем предпояагать, что на управляющий параметр и наложено ограничение [и[< ! (2.26) В качестве критерия оптимизации рассмотрим функционал г ./ =/(к+!и!)А/, а здесь я — некоторое положительное число Функционал (2 27) является линейной комбинацией двух функционалов г г з! =) А/ н ./, =)[и[А/, о с олин из которых задает вреия движения, а второй — расхолуемые на управление ресурсы Число /г являешя весовым коэффициентом, с помощью которого устанавливается компромисс межлу двумя этими критериями Требуется найти управление и траекторию, переводящие фазовую точку из >тданного начального со- стояния в начало координат и иинимизируюшие функционал (2.27).
В качестве начальных предполагается рассмотреть все точки фазовой плоскости В соответствии с теоремой 2.1 функция Гамильтона Н(чг хи) = же(/с+[и[)+ чг хз ьчгги . (2 28) (2 27) Вектор чг(/) определяется уравнениями — =О, — =О, — =-%. Ьс Ащ Ажз (2 29) ьв ' са ' ну Выше уже отмечалось, что теоремой 2,1 вектор ч/(/) определяется с точностью до постоянного положительно~ о множгпеля. Далее, поскольку чгс(/) = сопя! < О, положим цс(/) = -1.
Тогда функция (2.28) примет вид Н(тг, х, в) = — /с - 1 и[ ь М >хз + Чгт и (2 30) Для определения оптимального управления необходимо максимизировать функцию Гамильтона как ф>нкцию управления, и, в соответствии с(2 30), максимизация функции Гамильтона выливается в максимизацию функции ДН = -[и[ - Г и Представим ЛН в виде (чг, — 1)и при и>0, ДН = (чгз ь()и при и<0 Из условия максимума функции (2 31), принимая во внимание ограничение (2 26), найдем (2 3!) 1, если чгз(г)>1, -1, если чгт(/) <-1, О, если [ чгт(/) [< 1, к[О,Ц, если жт(/)=1, н[-1,0[, если чгз(г) =-1, и (/)= (2 32) О, если [>~<1, сйп х, если )т(>1, в[О,Ц, если к=!, н[-1,0], если к= — 1 здесь символом и (/) обозначено управление, максимизируюшее функцию Гамильтона.
Введем в рассмотрение функцию «зоны нечувствительности» у = Оса(х), которая определяется соот- ношениями Глава 2. П иннин максим ма Пои ягина на рис 2 7 приведен график функции у = бех(х) Равенство (2.32) можно записать в виде и (г) = мех(чг,(г)) (2 33) В конечный момент времени Т х(Т) = О, т к. конечной целью управления является перевод фазовой точки в начало координат Покажем, что )рз(Т~> 1. Рне. 2.7. График функции Мех(х) Запишем равенство Н(чг(Т),х(Т),и (Т))=-)г — )и (Т)!2чг,(Т) хз(Т)эчгз(Т) и (Т) (2 35) Если )Чгз(Т)/ <1, то в соответствии с (233) и(Т) = О и нз (2 35] следУет Н(чг(Т), х(Т). и'(Т)) = -х и 0 (2 Зб) Соотношение (23б) противоречит второму условию (2! 0) При Чгз(Т) =1 и(Т) в (01], а при рз(Т) = -! и(Т) е [-1, 0) . Равен сио (2 34) в этом случае также приводит к соотношению (2 Зб). Из неравенства (2.34) следует, что в начало координат фазовая точка может попасть либо с управлением и(г) = 1, либо с управлением и(г) = -1 .