Синтез управлений при двойных и разнотипных ограничениях (1104822), страница 2
Текст из файла (страница 2)
Величина класса допустимых программных управлений зависит от начального резерва k, поэтому используется обозначениеUOL (k).В данной главе преследуются следующие цели: вычислить функцию цены и построить с ее помощью синтез управлений, гарантирующий попадание на заданное целевоемножество; получить необходимые и достаточные условия для программных управлений,приводящих на границу множества достижимости; указать способ вычисления множествадостижимости.5В разделе 1.2 рассматривается случай µ ≡ 1. От управления требуется соблюдать фазовое ограничение k(t) > 0, эквивалентного интегральному ограничению для программныхуправленийZt1t0ku(t)k2R(t) dt 6 k(t0 ).(3)Для соблюдения этого требования в определение позиционных стратегий добавляетсяусловие U (t, x, k) = {0} при k < 0.Пункт 1.2.2 посвящен исследованию множества достижимости. Основной задачейздесь является следующая:Задача 1.1.
Найти область достижимости XGI [t1 ] ⊆ Rn , то есть множество точек x, достижимых системой в конечный момент времени при данном резерве k 0 изначала координат или произвольного множества M0 ⊆ Rn , а также для произвольногонаправления ` ∈ Rn указать управление u(·) ∈ UOL (k0 ), обеспечивающее вывод системы вконечный момент времени на границу множества достижимости в этом направлении,то есть выполнение равенстваh`, x(t1 )i = ρ (` | XGI [t1 ]) .(4)Множество достижимости при двойном ограничении является выпуклым компактоми содержится в пересечении множеств достижимости при геометрическом ограниченииXG и при интегральном ограничении XI , свойства которых приведены в теореме 1.1. Приэтом указанное вложение может быть строгим (примеры 1.1 и 1.3 в пункте 1.2.6).Теорема 1.3 дает необходимое и достаточное условие в форме принципа максимума дляуправлений, приводящих на границу множества достижимости в фиксированном опорномнаправлении.
Поскольку множество достижимости является выпуклым компактом, тоэтого достаточно, чтобы найти все его точки. Важно отметить, что в отличие от задачис чисто геометрическим ограничением управление здесь может принимать произвольныезначения из P(t).В пункте 1.2.3 рассматривается задача 11 в обратном времени, то есть задача разрешимости:Задача 1.2. Найти область разрешимости WGI [t0 ] ⊆ Rn , то есть множество точекx ∈ Rn , стартуя из которых система может достигнуть в конечный момент заданное целевое множество M1 ⊆ Rn при данном резерве k0 , а также указать управление,обеспечивающее включение x(t1 ) ∈ M1 .Решение задачи 1.2 дается теоремой 1.5 в виде необходимого и достаточного условияоптимальности управления.
При этом множество разрешимости может быть найдено поформулеWGI (t0 , k0 ; t1 , M1 ) = M1 − XGI (t0 , k0 ; t1 ).(5)Применению к рассматриваемым задачам метода динамического программированияпосвящен пункт 1.2.4. Для этого задачи 1.1 и 1.2 переформулируются в терминах оптимизации расстояния до начального или целевого множества и вводится соответствующаяфункция цены, которая является решением уравнения Гамильтона–Якоби–Беллмана (теоремы 1.8 для задачи достижимости и 1.9 для разрешимости).
Для задачи разрешимостионо имеет вид1∂V∂V∂V2+ min, B(t)u −kukR(t) = 0u∈P(t)∂t∂x∂k1Уравнение не содержит матрицы A(t): линейным преобразованием специального вида можно привести исходную систему к такому виду, что A(t) ≡ 0 (см. пункт 1.1.1). То же самое относится и к другимрассматриваемым задачам.6с начальным условием V (t1 , x, k) = d2 (x, M1 ). Вследствие того, что имеется фазовое ограничение k(t) > 0, помимо начального условия у этого уравнения есть также и краевоеусловие вида∂V = 0,∂t k=0означающее, что при нулевом резерве управление уже не может влиять на траекториюсистемы.Множество разрешимости легко найти, зная функцию цены: это ее множество уровня[29]. Если же множество разрешимости найдено, например из (5), то можно не решаяуравнение Гамильтона–Якоби–Беллмана вычислить функцию цены: она равна квадратурасстояния до множества разрешимости (теорема 1.9).
То же самое относится и ко множеству достижимости и соответствующей функции цены (теорема 1.6).В пункте 1.2.5 описывается способ вычисления множества достижимости при двойномограничении, основанный на методах эллипсоидальной аппроксимации [29]. Построенопараметризованное семейство эллипсоидов, дающее в пересечении в точности множестводостижимости.В разделе 1.3 рассматривается задача, в которой управление стеснено геометрическимограничением, нелинейно зависящим от текущего резерва:u ∈ µ(k(t))P(t).(6)Интегральное ограничение при этом задается неявно.
А именно, если существует конечная точка k ∗ = sup {k | µ(k) 6 0, k < k(t0 )}, то автоматически выполнено фазовое ограничение k(t) > k ∗ , эквивалентное, в свою очередь, интегральному. (Добавление явногоинтегрального ограничения ничего существенно не изменяет, приводя лишь к появлениюдополнительного условия трансверсальности).При ограничении (6) система (1) фактически становится нелинейной, поскольку послезамены u → µ(k)u принимает вид(ẋ(t) = A(t)x(t) + µ(k(t))B(t)u,(7)t ∈ T = [t0 , t1 ].k̇(t) = −µ2 (k(t))kuk2R(t) ,В связи с возможностью такой замены удобно кроме классов управлений U OL и UCL с00ограничением (6) использовать классы управлений UOLи UCL, заданные с геометрическимограничением вида u ∈ P(t).Задача 1.7 о нахождении множества достижимости XG(I) [t1 ] дословно повторяет задачу1.1 (с той лишь разницей, что множество допустимых программных управлений UOL (k)теперь определено с учетом ограничения (6)).
Впрочем, более удобным оказывается вместо нее рассматривать задачу о максимизации произвольного линейного непрерывногофункционала:Задача 1.8. Найти допустимое управление u(·) ∈ UOL , доставляющее максимум интегральному функционалуZ t1J(u(·)) = hh(·), u(·)i =hh(t), u(t)i dt.(8)t0Для решения этой задачи вначале применяется принцип максимума Л.
С. Понтрягина(теорема 1.15). Далее в теореме 1.17 полученные соотношения конкретизируются дляслучая эллипсоидального множества P(t).7В пункте 1.3.3 доказывается существование решения задачи 1.8 (теорема 1.23). Доказательство основывается на трех леммах, в которых утверждается соответственно выпуклость, ограниченность и замкнутость множества допустимых управлений U OL (k).Если в случае выполнения теоремы о существовании решения принципу максимумаудовлетворяет только одно управление, то это управление очевидно является оптимальным.
Таким образом, в условиях этой теоремы принцип максимума в совокупности с единственностью решения прямой и двойственной системы является достаточным условиемоптимальности. Если существует несколько пар {u(t), ψ(t)}, удовлетворяющих принципу максимума, то в силу существования решения и необходимости принципа максимумасреди этих пар будет оптимальное управление. Следовательно, при выполнении условийтеоремы о существовании решения для нахождения оптимального управления достаточноперебрать все решения системы из принципа максимума.В пункте 1.3.4 доказана теорема о единственности решения задачи 1.8 при некоторых предположениях на функцию µ(·) и при выполнении условия общности положения,заключающегося в том, что для всех чисел δ > 0 выполненоZ t1kh(t)k2 dt > 0.t1 −δПункт 1.3.5 посвящен отысканию оптимального управления.
Для этого отрезок времени T = [t0 , t1 ] разделяется на два подмножества: в первом геометрическое ограничениенеактивно, и соответствующий множитель Лагранжа λ = 0; во втором, напротив, геометрическое ограничение активно, и λ > 0.В случае автономной управляемой системы с монотонной функцией µ(k) в началетраектории λ = 0, а затем, начиная с некоторого момента θ и до конечного моментаλ > 0. Для эллипсоидального геометрического ограничения P можно аналитически найтимомент θ, и, следовательно, оптимальную траекторию управления.В общем случае таких моментов переключения может быть сколь угодно много, инайти их аналитически не представляется возможным, однако задачу нахождения оптимальной траектории можно свести к решению одномерного нелинейного уравнения дляначального значения сопряженной переменной ψ.
После решения этого уравнения какимлибо численным методом мы получаем полные начальные условия задачи Коши для прямой и двойственной системы, и, следовательно, можем найти оптимальную траекторию.В пункте 1.3.6 решается задача 1.9 о синтезе управлений, в которой требуется указать0, при которой решения дифференциального включенияпозиционную стратегию U ∈ UCL µ(k)B(t)uẋ(t) u ∈ U (t, x, k) ,∈ conv−µ2 (k)kuk2R(t) k̇(t)выпущенные из произвольной точки (x(t0 ), k(t0 )) = (x0 , k0 ), оказываются в конечный момент на минимально возможном расстоянии от целевого множества M(k(t1 )), а такженайти это расстояние V (t, x, k) для каждой точки (t, x, k) ∈ T × Rn × R.Функция цены V (t, x, k) является вязкостным решением уравнения Гамильтона–Якоби–Беллмана∂V∂V∂V22+ min, µ(k)B(t)u − µ (k)kukR(t) = 0u∈P(t)∂t∂x∂kс начальным условием V (t1 , x, k) = d(x, M(k)) и равна расстоянию от текущей позициидо множества разрешимости.8Во второй главе диссертации рассматривается задача синтеза гарантирующих управлений при двойном ограничении в случае наличия в системе неопределенности, стесненной геометрическим ограничением.Рассматривается линейная управляемая система(ẋ(t) = A(t)x(t) + B(t)u + C(t)v,t ∈ T = [t0 , t1 ].(9)k̇(t) = −kuk2R(t) ,В отличие от (1), здесь присутствует заранее неизвестная помеха v, на которую наложено геометрическое ограничение v ∈ Q(t).
Управление, как и раньше, стеснено двойнымограничением: геометрическим (2) и интегральным (3). Здесь матрицу A(t) также можносчитать нулевой, а матрицу C(t) — единичной (заменив множество Q(t) на C(t)Q(t)).Как и в первой главе, рассматриваются два класса управлений: программные управления UOL (k) и позиционные стратегии UCL . Поскольку в системе есть неизвестная помеха,то использование позиционных стратегий дает существенно больше возможностей, чемприменение программных управлений.Состояние системы (9) описывается парой (x, k) ∈ Rn+1 , что позволяет сформулировать принцип оптимальности [2] для данной задачи. Следовательно, целевое множествои множество разрешимости должны рассматриваться как подмножества Rn+1 ; однако поряду причин удобнее работать со множествами в пространстве Rn , для чего вводитсяпонятие сечения.Пусть в пространстве Rn+1 переменных (x, k) задано множество N .
Будем называтьсечениями множества N значения следующего многозначного отображения: N (k) ={x ∈ Rn | (x, k) ∈ N }. Само множество N однозначно восстанавливается по своим сечениям, поскольку является графиком многозначного отображения N (k). При этом выпуклость всех множеств N (k) не означает выпуклости множества N . Этот факт позволяетв некоторых случаях ослабить требование выпуклости целевого множества (и, следовательно, множества разрешимости) до требования выпуклости всех его сечений.Пусть задано такое непустое целевое множество M ⊆ Rn , что 1) M(k1 ) ⊆ M(k2 ),если k1 6 k2 ; 2) M(k) = ∅ при k < 0; 3) M(k) непрерывно при тех k, где M(k) 6= ∅;4) множества M(k) являются выпуклыми компактами.












