Громов Ю.Ю. и др. - Специальные разделы теории управления, оптимальное управление динамическими системами, страница 11
Описание файла
PDF-файл из архива "Громов Ю.Ю. и др. - Специальные разделы теории управления, оптимальное управление динамическими системами", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "оптимальное управление" в общих файлах.
Просмотр PDF-файла онлайн
Текст 11 страницы из PDF
Такоеназвание объясняется тем, что поскольку гамильтониан H от u j не зависит, оптимальное управление не может быть найденонепосредственно с помощью принципа максимума. Более того, в случае выполнения условия (61) ни необходимые условияклассического вариационного исчисления, ни необходимые условия динамического программирования (см. п. 5.2) не могутслужить для непосредственного вычисления компоненты u *j , хотя все эти условия формально не выполняются.Рис.
9. Поведение гамильтонианов H1 (u j ) = α + Φ j u j и H 2 (u j ) = Φ j u j + u j + α в зависимости от Φ j :а, б, г, д – строгий минимум (регулярное управление);в, е – нестрогий минимум (особое управление)Так, например, если гамильтониан H от управления u j не зависит, то H достигает максимума при любом u j .Условия (61) не могут установить различие между управлениями u j , дающими минимум или максимум функционалуJ[u]. На участке особого управления выполняется соотношение ∂ 2 H det ≡ 0 (i, j = 1, m) на [τ1 , τ 2 ] , ∂ui ∂u j (62)показывающее, что условие Гильберта невырожденности вариационной задачи нарушено. Задачи, для которых имеет местоусловие, в классическом вариационном исчислении называются вырожденными.
Если множество U m – замкнуто и ограничено, то в вырожденных задачах может наблюдаться два режима оптимального управления: регулярный, когда u определяется из принципа максимума [как, например, (60)], и особый, когда u не может быть найдено из принципа максимума [как, например, при выполнении (61)] и когда требуется особая процедура для его отыскания.6.2. Процедура нахождения особого управленияОбщая теория вырожденных вариационных задач разработана недостаточно. Наиболее полно исследован случай особого управления по одной компоненте u j .
В этом случае решение можно получить следующим образом.Условие (62) показывает, что режим особого управления на участке [τ1 , τ 2 ] (участке особого управления) имеет место,еслиn∂H= λ i rij (t , x) ≡ 0 .∂u j i = 0∑Последовательное дифференцирование этого соотношения по t приводит к соотношениямdkdt k ∂H ∂u j ≡ 0 на [τ1 , τ 2 ] (k = 0, 1, 2, ...).(64)Можно показать, что первое ненулевое значение величины∂∂u j dk k dt ∂H ∂u jвозможно лишь при четном k. Обозначим его k = k min = 2 p . Число p называется порядком вырожденности (сингулярности)вариационной задачи (оптимального управления).d ∂H явным образом.
Теперь величину особого оптимального управления u *jПри k = 2p управление u j войдет в k u∂dt j можно найти из условия ∂H = 0 на [τ1 , τ 2 ] ,(65) ∂u j которое линейно по u j (в силу линейности по u системы (56)). Уравнения сопряженной системы в данном случае имеют видd2pdt 2 pndλ s∂γ= − λi i +dt∂x si =0∑∂r n λ i ij∂x sj =1 i = 0m∑∑u j .(66)Считая, что все остальные компоненты вектора u регулярны, т.е. определяются соотношениями типа (60), условие (65)можно записать в видеd 2 p ∂Hdt 2 p ∂u j = M 1 (x, λ, t ) + u j M 2 (x, λ, t ) = 0 ,(67)откуда и может быть найдено особое управление для компонентuj = −M 1 ( x, λ , t ).M 2 (x, λ, t )6.3. Необходимое условие оптимальности особого управленияДля минимума критерия качества J[u] на особом управлении u *j в задаче (56)–(57) должно выполняться следующее необходимое условие:(−1) p∂∂u j d 2p 2p dt ∂H ∂u j ≥ 0,p = 0, 1, 2, ...
.(68)При максимизации критерия качества знак в неравенстве (68) следует заменить на обратный.Отметим, что при p = 0, т.е. для невырожденных задач, это условие переходит в условие ∂ 2 H ∂u 2j ≥ 0 (при m = 1) и, таким образом, (68) является аналогом условия Лежандра–Клебша для особых (вырожденных) экстремалей (для одномерногоуправления u j ). При p = 1 условие (68) имеет вид ∂H ≤ 0 . ∂u j 6.4. Необходимые условия в точках сопряженияособого и регулярного управлений∂∂u j d2 2 dtРезультаты, полученные в пп. 6.2 и 6.3, применимы, если значения оптимального особого управления u *j (t ) являютсявнутренними точками множества U m на отрезке [τ1 , τ 2 ] . Необходимые условия для перехода с регулярного оптимальногоуправления на особое оптимальное в случае, когда U m – m-мерный прямоугольник a j (t ) ≤ u j (t ) ≤ b j (t ) , а τ1 – момент времени начала перехода, определяются следующими неравенствами:[ M 1 (x, λ , t ) + b j (t ) M 2 (x, λ , t )]τ1 < 0(69)(необходимое условие для возможности перехода регулярного управления с верхней границы u j (t ) = b j (t ) на особое оптимальное управление) и[ M1 (x, λ , t ) + a j (t ) M 2 (x, λ , t )]τ1 > 0(70)(необходимое условие для возможности перехода регулярного управления с верхней границы u j (t ) = b j (t ) на особое оптимальноеуправление).Требование совместного выполнения условий (69) и (70) может быть представлено в виде неравенства∂ d 2p∂u j dt 2 p ∂H ∂u j ≤ 0 . τ1(71)Это условие является необходимым для возможности перехода с обеих границ регулярного управления на особое.
Необходимое условие (71) легче проверить, так как оно не связано с вычислением M 1 (x, λ , t ) . Однако следует иметь в виду, чтооно является более слабым, чем условия (69) и (70), поскольку последние из него не вытекают.Контрольные вопросы1.2.3.4.Что такое особое управление, и когда оно возникает?Процедура нахождения особого управления.Необходимое условие оптимальности особого управления.Необходимые условия в точках сопряжения особого и регулярного управлений.Глава 7НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИУПРАВЛЕНИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ ТИПАНЕРАВЕНСТВ, СОДЕРЖАЩИМИ ТОЛЬКО ФАЗОВЫЕКООРДИНАТЫ xВ технических приложениях имеется ряд задач, когда при формировании оптимальной траектории необходимо учитывать ограничения на область допустимых значений фазовых координат. Например, при наборе самолетом высоты или прирассмотрении траекторий спускаq=ρ(h(t ))v 2 (t )≤ qзад ,2т.е.q(h(t ), v(t ), t ) − q зад ≤ 0 .При движении ЛА типичными также являются ограничения на допустимые значения высоты полета h и массы m ЛА:h(t) ≥ 0;m(t) ≥ m.В общем случае ограничения указанного типа можно записать в видеφ(t , x) ≥ 0 ,(72)гдеφ = (φ1 , φ 2 , ..., φ µ1 )T ;x = ( x1 , x2 , ..., xn )T .7.1.
Краткая формулировка задачиПусть эволюция рассматриваемой системы S описывается векторным дифференциальным уравнениемdx= f (t , x, u) ,dt(73)гдеf = ( f1 , f 2 , ..., xn )T ; x = ( x1 , x2 , ..., xn )T ; u = (u1 , u 2 , ..., u m )T ;u ∈ U m ; U m – некоторая замкнутая и ограниченная область в пространстве R m .Заданы:• начальное значениеx(t 0 ) = x 0 ,• интервал времени [t0 , t1 ] ,• критерий качества(74)J [u] = Φ (t1 , x(t1 )) +t1∫ f 0 (t, x, u)dt .(75)t0Необходимо найти такое кусочно-непрерывное управление u(t ) ∈ U m , которое переводит начальное условие (t 0 , x 0 ) внекоторую конечную точку (t1 , x(t1 )) , удовлетворяющую условиямq(t1 , x(t1 )) = 0, q = (q1 , q 2 , ..., ql )T ,(76)l < n + 1,и минимизирует функционал J[u] на траекториях, удовлетворяющих условиямφ(t , x) ≥ 0, φ = (φ1 , φ 2 , ..., φ µ1 )T .(76')Здесь значения функции φi не зависят явно от управления u. Предполагается, что t , f 0 , φ обладают непрерывными производными до второго порядка.7.2.
Необходимые условия оптимальностиВ постановке п. 7.1 вся оптимальная траектория полета в общем случае может состоять из двух типов участков: участков, целиком лежащих внутри допустимой области, и участков, лежащих на границе допустимой области (рис.
10). Количество таких участков и их чередование зависит от конкретной задачи и граничных условий. На участках, целиком расположенных внутри допустимой области, условия (72) выполняются в виде строгих неравенствφ(t , x) > 0 .Для этих участков справедлив принцип максимума, сформулированный в п. 4.3.На участках, лежащих на границе допустимой области, одно или несколько условий типа (72) выполняются в виде равенств. Эти участки называются граничными, для них принцип максимума п.
4.3 уже не справедлив. Наличием этих участков данная задача и отличается от задач п. 4.1.Известно несколько эквивалентных подходов к получению необходимых условий оптимальности для участков, расположенных на границе φ(t , x) = 0 . Будучи эквивалентными, эти подходы ведут к различным вычислительным процедурамполучения решения.Рис. 10. Типы возможных оптимальных траекторий в задачахс ограничениями на фазовые координаты:а – г – случаи, когда допустимые траектории располагаются внутри некоторой области (не обязательно замкнутой); а – траектория, целиком лежащая внутри допустимой области; б – траектория, имеющая с границей области одну общую точку (типа отражения от границы); в– траектория, целиком лежащая награнице; г – траектория, частично расположенная на границе;д – з – случаи, когда допустимые траектории располагаются вне некоторой области; д – случай двух траекторий, доставляющих относительный минимум в задаче о кратчайшем пути на плоскости; е – случай невыпуклой запрещенной области, траектории с несколькими участками входа и схода;ж – 1–2 – траектория, не имеющая общих точек с границей; 1–3 – траектория,имеющая одну общую точку (касание) с границей; з – случай негладкойграницы допустимой области; 1 – начальная точка траектории; 2 – конечнаяточка траектории; 1' – точка входа на границу; 2' – точка схода с границыРассмотрим случай одного скалярного ограничения видаφ i (t , x) ≥ 0 .7.3.