Громов Ю.Ю. и др. - Специальные разделы теории управления, оптимальное управление динамическими системами (955108), страница 5
Текст из файла (страница 5)
При этом J[u(t)] зависит от совокупности всех значений, принимаемых функцией u(t) на отрезке [t 0 , t1 ] , и может рассматриваться как функция бесконечного числа независимых переменных.Для каждого фиксированного конечного момента времени t1 = t1′ состояние x(t1′ ) системы S, движущейся из начальногосостояния (t 0 , x 0 ) в соответствии с уравнением (1), является одновременно векторным функционалом (т.е. вектором, компонентами которого являются функционалы) от управления u(t) и вектор-функцией от вектора a и вектора начальных условий x 0 (t0 ) . Критерии качества процессов управления являются функционалами.Достаточно общая форма критерия качества в ТОП имеет видt1J [u(t ), a] = Φ (t 0 , t1 , x 0 , x1 , a) + ∫ f 0 (t , x(t ), u(t ), a)dt ,(4)t0где x(t) удовлетворяет системе (1); u(t) – некоторое выбранное управление; а – управляющий параметр.В частности, каждую из координат xi (t ) системы (1) можно записать в формеxi (t ) =t1∫ f i (t, xi (t ), u(t ), a) + xi (t0 ),i = 1, n .t02.5.
Автономные системыЕсли правые части (1) и функции Φ и f0 в (4) от времени явно не зависят, то соответствующая задача называется автономной:dx= f (x, u, a) ;dtJ [u(t ), a] = Φ (x0 , x1 , a) +t1∫ f0 (x, u, a)dt .t0Автономные системы инвариантны относительно сдвига вдоль оси t, поэтому для автономных систем важна толькодлительность процесса t1 − t0 и можно положить t0 = 0 .2.6. Допустимое программное управлениеВектор-функция u(t) называется допустимым программным управлением в задаче, если:а) u(t) принадлежит к выбранному классу в большинстве практических приложений кусочно-непрерывных по t на интервале [t 0 , t1 ] функций, т.е.
может иметь лишь конечное число точек разрыва первого рода;б) значения u(t) принадлежат заданному множеству U m для всех t ∈ [t 0 , t1 ] .Кусочно-непрерывные управления соответствуют предположению о «безынерционности».Если желательно учесть «инерцию», то следует искать управление в классе непрерывных кусочно-гладких функцийu(t). Такой класс допустимых управлений иногда сводится к предыдущему путем введения нового безынерционного управления u (t ) , связанного со «старым» управлением u(t) соотношениемdu= u, u ∈U m ,dtгде u = (u1, u2 ,..., um )T ;u = (u1, u2 ,..., um )T .(5)mЕсли U – замкнутая и ограниченная область, то это означает, что введены ограничения на значения первых производных от вектор-функции u(t).Кусочно-непрерывным функциям u (t ) отвечают кусочно-гладкие функции u(t) в силу (5). Таким образом, в новой задачеu(t) становится переменной состояния, управляемой посредством u (t ) через систему (5).Если условие u ∈ U m в новой задаче можно снять, то задача сводится к предыдущей для кусочно-непрерывного управления u ∈ U m .
В противном случае следует обратиться к задаче оптимизации с ограничениями на фазовые координаты. Нарис. 3 приведены примеры управлений, принадлежащих как к классу кусочно-непрерывных функций, так и к другим классам.Рассмотрение допустимых управлений в классе кусочно-непрерывных функций объясняется тем, что для оптимизациифункционалов на этом классе функций разработан соответствующий математический аппарат – принцип максимума.Рис. 3.
Примеры управлений uj (t), принадлежащих различным классам функций:а – гладкое управление; б – кусочно-гладкое непрерывное управление; в – непрерывное управление (в окрестности uj (t), t недифференцируема); г – кусочно-непрерывное управление; д – управление, не являющееся кусочно-непрерывным (u'j содержит бесконечное числопереключений в окрестности t1; u 2j (t ) – элемент последовательности, сходящейся к функции, разрывной в каждой точке [t0, t1]); е – управление, содержащее δ-функции Дирака; u 0 , u1 , u 2 – константыДля каждого допустимого управления u(t) в силу сделанных предположений относительно f(t, x, u) существует единственное абсолютно-непрерывное решение системы x(t ) = x(t , x0 , t0 ) , которое удовлетворяет системе (1) почти всюду на[t 0 , t1 ] [т.е.
за исключением конечного числа или счетного множества точек разрыва функции u(t)] и при t = t0 принимаетзаданное значение x0 = x(t0 ) .2.7. Допустимый закон управленияЗакон управления v(x, t) является допустимым на x ∈ X n , t ∈ [t 0 , t1 ] , если1) v(x, t ) ∈ U m , ∀t ∈ T = [t 0 , t1 ], x ∈ X n ;2) v (x(t ), t ) = u(t ) ,где x(t) – траектория системы S; u(t) – допустимое программное управление при законе управления v(x, t).Вектор а управляющих параметров называется допустимым, если его значение принадлежит заданному множествуrA ⊂ Rr .2.8.
Допустимые траектории и процессыФазовая траектория x(t) системы S называется допустимой, если:а) она получена из решения системы ДУ при допустимом управлении u(t) или при допустимом законе управления v(x,t);б) значения x(t) принадлежат заданной области X n пространства состояний X n .Управляемый процесс (x, u) называется допустимым, если в нем под действием допустимого управления u(t) или допустимого закона управления v(x, t) реализуется допустимая траектория.2.9.
Граничные условия. Краевая задачаЦель управляемого процесса (x, u) состоит в переходе системы S из некоторого заданного при t = t0 начального состояния x0 = x(t0 ) в заданное конечное состояние x1 = x(t1 ) за время T = t1 − t 0 .При этом все компоненты векторов x 0 , x1 и моменты времени t 0 , t1 обязательно должны быть фиксированными, некоторые могут оставаться незаданными (свободными). В общем случае система S в начальный и конечный моменты времениможет находиться в состояниях, описываемых уравнениями видаа)в)б)г)д)е)Рис. 4. Примеры граничных условий:a – левый и правый концы фазовой траектории закреплены;б – левый конец закреплен, правый – свободен; в – левый и правый концыподвижные; г – левый конец закреплен, правый – свободен, за исключениемкоординаты x1; д – общий случай подвижных граничных условий;е – граничные условия в задаче встречи движений;– оптимальная траектория; - - - - - - – произвольная траекторияh(t0 , x0 , a) = (h1, h2 ,..., hl1 )T = 0 ;(6)g (t1, x1, a) = (h1, h2 ,..., hl1 )T = 0(7)g (t 0 , t1 , x 0 , x1 , a) = ( g1 , g 2 , ..., g l )T = 0 ,(8)или более общими уравнениями видагде l1 + l 2 ≤ 2n + 2 + r ; l ≤ 2n + 2 + r .Уравнения (6) и (7) описывают (при фиксированном управляющем параметре а) обычно поверхность размерности(n + 1 − l2 ) и (n + 1 − l1 ) , и (u − l2 ) в пространстве (t, x) называются раздельными граничными условиями для концов фазовойтраектории.
Примеры граничных условий приведены на рис. 4. Уравнения (8) называются смешанными граничными условиями. Если значения фазовых координат в момент t0 (или t1) не фиксируются, то граничные условия для левого (или правого) конца траектории называются свободными. Раздельные условия вида (6) и (7) часто называют подвижными граничнымиусловиями.Определение уравнений u(t), при которых решение системы (1) удовлетворяет условиям (6) и (7), называется двухточечной краевой задачей.Перевод начального состояния x0 в конечное состояние x1 на заданном отрезке [t0, t1] не всегда возможен.
Однако, еслинайдется хотя бы одна пара векторов {u(t), a} или {v(x, t), a}, осуществляющая указанный переход, то обычно существуют идругие пары векторов, реализующие этот же самый переход. В этом случае каждой паре {u(t), a} соответствует определенное значение критерия качества J[u, a]. Можно ставить задачу об отыскании таких {u(t), a}, которые минимизируют илимаксимизируют этот критерий.Контрольные вопросы1.2.3.4.5.6.7.Что такое фазовые координаты?Расскажите об эволюции системы и ее описании при помощи дифференциальных уравнений движения.Функционал.
Критерий качества управления.Какие системы называются автономными?Расскажите о допустимых программных управлениях.Расскажите о допустимом законе управления.Допустимые траектории и процессы. Граничные условия. Краевая задача. Виды краевых условий.Глава 3ПОСТАНОВКА ОСНОВНЫХ ЗАДАЧОПТИМАЛЬНОГО УПРАВЛЕНИЯОсновная задача оптимального программного управления в форме временной программы (2) для системы (1) с критерием (4) и краевыми условиями (8) формулируется следующим образом.Среди всех допустимых на отрезке [t 0 , t1 ] программных управлений u = u(t ) ∈ U m и управляющих параметров a ∈ Ar ,переводящих точку (t 0 , x 0 ) в точку (t1 , x1 ) , найти такие, для которых функционал (4) на решениях системы (1) примет наименьшее (наибольшее) значение с выполнением условий (8).Управление u(t), решающее эту задачу, называется оптимальным (программным) управлением, а вектор а – оптимальным параметром.Если пара {u*(t), a*} доставляет абсолютный минимум функционалу J[u(t), a] на решениях системы (1), то выполняетсясоотношениеJ min = J * = J [u * (t ), a * ] ≤ J [u(t ), t ](9)для ∀u ∈ U m , a ∈ A r , являющихся допустимыми и осуществляющих заданный переход с выполнением условия (8).