Диссертация (1102398), страница 14
Текст из файла (страница 14)
Для этих иллюстраций были выбраныследующие параметры системы:t0 = 0,t1 = 0.5,r0 = ri = 1/16, i = 1, m.На рисунках 3.3-3.6 изображены проекции аппроксимации информационногомножества на координатные оси q1 , q2 , q3 и q4 соответственно при m = 10.Аналогичные проекции для случая m = 100 приведены на рисунках 3.7-3.10.9910.80.60.4q10.20−0.2−0.4−0.6−0.8−100.10.20.30.40.5tРис.
3.3: Динамика проекции аппроксимации информационного множества наось q1 . Случай m = 10.10.80.60.4q30.20−0.2−0.4−0.6−0.8−100.10.20.30.40.5tРис. 3.4: Динамика проекции аппроксимации информационного множества наось q2 . Случай m = 10.10010.80.60.4q30.20−0.2−0.4−0.6−0.8−100.10.20.30.40.5tРис. 3.5: Динамика проекции аппроксимации информационного множества наось q3 .
Случай m = 10.10.80.60.4q40.20−0.2−0.4−0.6−0.8−100.10.20.30.40.5tРис. 3.6: Динамика проекции аппроксимации информационного множества наось q4 . Случай m = 10.10110.80.60.4q10.20−0.2−0.4−0.6−0.8−100.10.20.30.40.5tРис. 3.7: Динамика проекции аппроксимации информационного множества наось q1 . Случай m = 100.10.80.60.4q20.20−0.2−0.4−0.6−0.8−100.10.20.30.40.5tРис. 3.8: Динамика проекции аппроксимации информационного множества наось q2 .
Случай m = 100.10210.80.60.4q30.20−0.2−0.4−0.6−0.8−100.10.20.30.40.5tРис. 3.9: Динамика проекции аппроксимации информационного множества наось q3 . Случай m = 100.10.80.60.4q40.20−0.2−0.4−0.6−0.8−100.10.20.30.40.5tРис. 3.10: Динамика проекции аппроксимации информационного множества наось q4 . Случай m = 100.1033.6Задача синтеза управленийВ этом разделе рассмотрим задачу управления билинейной системой принеопределенности:ẋ = Ax + Bx,A(t) ∈ A (t),t ∈ [t0 , t1 ],(3.49)B(t) ∈ B(t).Здесь x(t) ∈ Rn — состояние системы, A ∈ Rn×n — помеха, а B ∈ Rn×n —управление. Множества A (t) и B(t), представляющие собой “жесткие” или “геометрические” ограничения на помеху и управление соответственно, являютсяэллипсоидами или параллепипедами в пространстве матриц. Задано целевоемножество в виде эллипсоида:x(t0 ) ∈ M = E (0, M ).Управление B рассматривается в классе позиционных стратегий U (t, x), которые принимают значения в множестве B(t).
Символом ∆ обозначим некоторое разбиение}{∆ = τi , i = 0, l + 1 ,t0 = τ0 < τ1 < · · · < τl+1 = t1 .Пусть функция B(t) определена по следующему правилу с помощью стратегииU (t, x):B(t) = U (τi , x(τi )), τi ≤ t < τi+1 , i = 0, l.Решение уравнения замкнутой системыẋ = Ax + B(t)x(3.50)существует, единственно и продолжимо при любой реализации неопределенности A(·) ∈ V(t) = L∞ ([t, t1 ], A (·)).Определим функцию цены V (t, x) по следующей формулеV (t, x) = infsupU,∆ A(·)∈V(t){⟨⟩}(x(t0 ), M x(t0 ) x(t) = x .104Данная функция является решением уравнения Гамильтона-Якоби-БеллманаАйзекса [14, 30]⟨⟩⟨⟩Vt + max Vx , Ax + min Vx , Bx = 0A∈A (t)с краевым условием(3.51)B∈B(t)⟨⟩V (t1 , x) = x, M x .(3.52)Далее мы приведем способ построения внутренних оценок W − [t] множества разрешимости, которые затем используем для построения позиционных стратегийU (t, x), гарантирующих в указанном ниже смысле, что из любого состояниясистемы x(τ ) ∈ W − [τ ] и любой допустимой реализации помехи A(t) можноперевести систему в момент t1 в состояние x(t1 ) ∈ M.Справедливо следующее утверждение (см., например [30]).Теорема 22 Предположим, что функция w ∈ C([t0 , t1 ] × Rn ) удовлетворяетусловиямq + H(t, x, p) ≤ 0 ∀(q, p) ∈ D+ w(t, x),⟨⟩w(t1 , x) = x, M x .(3.53)(3.54)Тогда w(t, x) ≥ V (t, x), t ∈ [t0 , t1 ], и множествоW − [t] = {x | w(t, x) ≤ 1}является внутренней оценкой множества разрешимости W[t].Для определенности будем рассматривать A (t) в виде параллелепипеда, аB(t) — в виде эллипсоида E (0, P (t)).
В этом случае уравнение (3.51) приобретает видd1∑⟩⟨⟩ √⟨Vx ⊗ x, P (Vx ⊗ x) = 0(3.55)Vt +| Vx , A k x | −k=1Внутреннюю оценку W − [t] построим в виде объединений эллипсоидов:m∪{ ⟨⟩}W [t] =x x, Ks (t)x ≤ 1 ,−Ks (t) > 0.(3.56)s=1⟨⟩В соответствии с теоремой 22, функцию w(t, x) = mins x, Ks x будем искать105в виде суперрешения уравнения (3.55). Чтобы получитьуравнения для набора⟩ √⟨⟩∑d1 ⟨матриц Ks (·) оценим слагаемые k=1 wx , Ak x иwx ⊗ x, P (wx ⊗ x) по аналогии с тем, как это было сделано соответственно в пунктах 2.2.1 и 2.3.2 главы 2.Используя формулы (2.20) и (2.37)-(2.40), приходим к следующим уравнениям:K̇s +d∑QTj (t)Abs(Λj (t))Qj (t) − γs−1 Rs = 0,Ks (t1 ) = M.j=1Для полноты изложения приведем далее формулы так называемых экстремальных стратегий для множества W − [t].
Будем использовать следующие обозначенияW0− (t, x) = Arg min ∥x − y∥,y∈W[t]{}S 0 (t, x) = p = y 0 − x : y 0 ∈ W0− (t, x) .Выберем произвольный вектор s0 (t, x) ∈ S 0 (t, x). Тогда позиционную стратегиюU (t, x) можно определить следующим образом⟨⟩U (t, x) ∈ Arg max s0 (t, x), Bx .(3.57)B∈B(t)Символом X(τ, y, U, ∆) обозначим множество абсолютно непрерывных функций x(·), которые удовлетворяют начальному условию x(τ ) = y и дифференциальному включениюẋ ∈ {(A + B(t))x : A ∈ A (t)}для почти всех t ∈ [τ, t1 ], в которомB(t) = U (τi , x(τi )),τi ≤ t < τi+1 ,i = 0, l.Кроме того, введем множество X(τ, y, U ) = lim supdiam∆→0 X(τ, y, U, ∆). С использованием этих обозначений можно сформулировать следующую теорему[30].Теорема 23 Пусть множество W − [t] вычислено по формулам (3.56), а позиционная стратегия U выбрана в соответствии с условием (3.57).
Пусть,106кроме того, xτ ∈ W − [τ ]. Тогдаx(t) ∈ W − [t],∀x(·) ∈ X(τ, xτ , U ),∀t ∈ [τ, t1 ],и, в частности, x(t1 ) ∈ M.3.7Пример: задача синтеза для линейной системы с неопределенностью в матрицеВ этом пункте приведем пример синтеза управления для линейной системыс неопределенностью в коэффициентах матрицы. Рассмотрим системуẋ = Ax + B(t)u,A(t) ∈ A (t),t ∈ [t0 , t1 ],(3.58)u(t) ∈ E (pu (t), P (t)),в которой о матрице A известно лишь то, что она содержится в множествеA = {A | A(t) = A0 (t) + u1 A1 (t) + · · · + ud Ad (t)} ,(3.59)а u представляет собой управление, ограниченное эллипсоидом E (pu (t), P (t)).Предположим, что целевое множество имеет видM = E (0, M ).(3.60)Задача 15 Построить внутреннюю оценку W − [t] множества разрешимости W[t] и предъявить позиционную стратегию U (t, x), которая для любогосостояния системы x(τ ) ∈ W − [τ ] и любой допустимой реализации неопределенности в коэффициентах (t) приводит замкнутую систему в состояниеx(t1 ) ∈ M.Уравнение Гамильтона-Якоби-Беллмана-Айзекса в данном случае имеет видd1∑⟨⟩ √⟨⟩Vt +| Vx , A k x | −Vx , B(t)P (t)B(t)T Vx = 0.k=1107Будем искать внутреннюю оценку W − [t] в виде эллипсоида:{ ⟨⟩}W − [t] = x w(t, x) = x, K(t)x ≤ 1 .Применяя формулы пункта 2.2.1 и примера 3 из раздела 2.5, получаем дифференциальное уравнение для матрицы K(t)K̇ +d∑QTj (t)Abs(Λj (t))Qj (t)−j=1[]−1T 12 TTT 12−γ (t) K(t)(B(t)P (t)B(t) ) S (t) + S (t)(B(t)P (t)B(t) ) K(t) = 0с краевым условием K(t1 ) = M .
ЗдесьQTj (t)Abs(Λj (t))Qj (t) = K(t)Aj (t) + ATj (t)K(t),S(t)S T (t) = I.Ниже приведены иллюстрации для следующих значений параметров системы:[]0 −1d = 1, A1 (t) = 0.3, B(t) = 5I,1 0[]4 0P (t) = I, pu (t) = 0, M =, t0 = 0, t1 = 1.0 1На основе построенной эллипсоидальной оценки W − [t] был проведен синтезуправления для траектории, выпущенной из точки x0 = [4.81, 0.67]T при кусочно постоянной реализации помехи v(t). На рисунке 3.11 изображено соответствующее синтезированное управление (красным цветом компонента u1 исиним цветом компонента u2 ).10864u20−2u−41u2−600.20.40.60.81tРис.
3.11: Синтезированное управление. Компонента u1 изображена краснымцветом, а компонента u2 — синим.ЗаключениеВ заключение кратко сформулируем основные результаты, полученные вдиссертации.1. Построены семейства внешних и внутренних численных аппроксимациймножеств достижимости для билинейных систем.2. Предложен алгоритм решения задач аппроксимации множеств достижимости, информационных множеств и задачи синтеза управлений для класса нелинейных глобально билинеаризуемых систем.3.
Построено семейство внешних численных аппроксимаций множества достижимости для системы уравнений динамического уницикла.Изложенные в настоящей работе методы оценивания множеств достижимости и информационных множеств для билинейных и билинеаризуемых системмогут быть использованы при конструировании конкретных алгоритмов численного решения задач достижимости, гарантированного оценивания и синтезауправлений для указанного класса систем. Эти результаты могут быть также использованы в качестве составной части решения более сложных задачуправления таких, как задача синтеза управлений при неполных измерениях.Дальнейшие исследования могут быть нацелены на уточнение построенных внастоящей работе аппроксимаций.109Литература[1] Р. Беллман. Динамическое программирование.
М.: ИЛ, 1960.[2] Ф. П. Васильев. Методы оптимизации. М.: МЦНМО, 2011.[3] Ф. Р. Гантмахер. Теория матриц. 5-е изд., М.: ФИЗМАТЛИТ, 2004.[4] Ю. Ф. Голубев. Основы теоретической механики. 2-e изд., М.: Изд-во МГУ, 2000.[5] М. И. Гусев. Оценки множеств достижимости многомерных управляемых систем с нелинейными перекрестными связями // Труды ИММ УрО РАН.















