Диссертация (1102398), страница 10
Текст из файла (страница 10)
Выберем матрицуS(t) следующим образом:[]−11nS(t) = x̄ (t) . . . x̄ (t),(2.48)предполагая при этом, что[]det x̄ (t) . . . x̄ (t) ̸= 0,1nt ∈ [t0 , t1 ].Введем следующее обозначение:}{ K(x1 , . . . , xm ) = x ∃j ∈ 1, m, α ≥ 0 : x = αxj .Предположим, что функция ψ(x) удовлетворяет соотношениям0 ≤ c1 d (x, K (e1 , . .
. , en )) ≤ ψ(x) ≤ c2 d (x, K (e1 , . . . , en )) ,(2.49)в которых d(x, A) = miny∈A ∥x − y∥2 — расстояние от точки x до множества A.Справедлива следующая теорема.Теорема 17 Пусть функция S(·) определена равенством (2.48), а функция ψудовлетворяет условию (2.49). Тогда при некотором выборе γ(·) функция w,определенная равенством (2.47), является суперрешением уравнения (2.45), исправедливы включенияX − [t] = {x ∈ Rn | w(t, x) ≤ 1} ⊆ X [t],x̄k (t) ∈ X − [t],k = 1, n.65Доказательство.
Сначала проверим второе включение, воспользовавшись свойством функции ψ:w(t, x̄k (t)) = σ(S −1 (t0 )S(t)x̄k (t)) + γ(t)ψ(S(t)x̄k (t)) == σ(S −1 (t0 )ek ) + γ(t)ψ(ek ) = σ(x̄k (t0 )) ≤ 1.Для краткости введем обозначение p = (S −1 (t0 ))T pσ + γ(t)pψ , в которомpσ ∈ D− σ(S −1 (t0 )S(t)x),pψ ∈ D− ψ(S(t)x).Запишем условие того, что функция w является суперрешением уравнения(2.45):⟨⟩[]γ̇ψ(S(t)x) + max p, S(t) A0 (t) + u1 (t)A1 (t) + · · · + ud (t)Ad (t) x + Ṡ(t)x ≥ 0u()Справедливость этого неравенства при x ∈ K x̄1 (t), . . . , x̄n (t) следует из того,что⟨ []⟩max l, A0 (t) + u1 (t)A1 (t) + · · · + ud (t)Ad (t) S −1 (t)ek + Ṡ(t)S −1 (t)ek =u⟨[]= max l, S(t) A0 (t) + u1 (t)A1 (t) + · · · + ud (t)Ad (t) x̄k (t)−u[]⟩−S(t) A0 (t) + ūk1 (t)A1 (t) + · · · + ūkd (t)Ad (t) x̄k (t) ≥ 0 ∀l ∈ Rn .При сделанных предположениях множества D− σ(x) и D− ψ(x) ограничены налюбом компакте, откуда для произвольного x ∈ Rn выполняется неравенство⟨⟩[] −1−1max p, S(t) A0 (t) + u1 (t)A1 (t) + · · · + ud (t)Ad (t) S (t)x + Ṡ(t)S (t)x ≥u≥ −L1 (1 + γ(t))d (x, K (e1 , .
. . , en )) .Из условия на функцию ψ следует, чтоψ(S(t)x) ≥ c1 d (S(t)x, K (e1 , . . . , en )) =(())= c1 d S(t)x, K S(t)x̄1 (t), . . . , S(t)x̄n (t) =(())(())= c1 d S(t)x, S(t)K x̄1 (t), . . . , x̄n (t) ≥ L2 d x, K x̄1 (t), . . . , x̄n (t) .66Таким образом, неравенство для суперрешения выполняется, еслиγ̇ ≥L1(1 + γ) = L(1 + γ).L2Остается положить γ(t) = eLt − 1.В качестве примера функции ψ, удовлетворяющей условиям теоремы, можно предложить функциюψ(x) = ∥x∥∞ − ∥x∥1 ,в которой символы ∥ · ∥1 и ∥ · ∥∞ обозначают соответствующие нормы Гельдера.Функция γ(·) вычисляется для данной системы и заданных функций σ(x), ψ(x)и S(t) так, как это делается в доказательстве теоремы.Таким образом, мы получили семейство внутренних оценок, параметризо{}ванных набором из n траекторий ūk (t) , точки которых линейно независимы вкаждый момент времени t, и функцией ψ(x).
Ясно, что объединение всех такихоценок совпадает с точным множеством достижимости. Для этого достаточно перебирать наборы траекторий, зафиксировав функцию ψ. Однако, средитаких оценок, вообще говоря, имеются в том числе и нетривиальные оценки,отличные от эволюционных множеств при фиксированном управлении.В заключение этого раздела отметим возможность дальнейших обобщенийпостроенных здесь оценок, которые могут быть применены для аппроксимациимножеств достижимости других классов нелинейных систем. А именно, линейное отображение x → S(t)x может быть заменено на нелинейное отображениеx → S(t, x), а конус K(x1 , .
. . , xm ) на другое такое множество, для которого изусловий xi ∈ X [t], i = 1, m, x ∈ K(x1 , . . . , xm ) следует включение x ∈ X [t].672.5ПримерыПример 1. Применим алгоритм построения внешних квадратичных оценокмножества достижимости к следующей двумерной системе при t ∈ [0, 1]:([][])0 20 −1ẋ =+ux,−4 21 0[]10x(0) ∈ E (0, (X 0 )−1 ), X 0 =.0 50(2.50)Представленные иллюстрации (рис. 2.1) отвечают параметру L(t) = 1 и оптимальным траекториям x̄(·) этой системы, проходящим при t = 0 через точки[−1, 0]T и [0.7515, −0.0933]T соответственно.Заметим, что, с практической точки зрения, может быть полезно останавливать вычисление конкретной оценки в некоторый момент ϑ и считать далееоценку вырожденной, если нормы векторов cj (ϑ) в представленном алгоритмепревосходят некоторую положительную постоянную Cmax .Рис.
2.1: Множество достижимости системы (2.50) и ее внешние оценки в видемножеств уровня квадратичных форм.Пример 2. Рассмотрим простейшую билинейную системуẋ1 = ux1 ,ẋ2 = −ux2(2.51)с управлением u ∈ [−1, 1]. Для данного примера матрица P (t) из гамильтониана68H(t, x, p) имеет вид10P (t) = 0−100000000−10.01Для построения внешней оценки множества достижимости этой системы из{}единичного круга X 0 = x| x21 + x22 ≤ 1 в виде объединения двух эллипсоидов,будем искать матрицы квадратичных форм в следующем виде:[K1 =]k11 0,0 k22[K2 =]k22 0,0 k110 < k11 ≤ k22 .(2.52)Подобрав матрицы P11 (t), P12 (t), P21 (t) и P22 (t), которые удовлетворяют неравенствам (2.35), получаем следующие уравнения для матриц квадратичныхформ:[[k̇110k̇220][][]0k11 0k11 0++= 0,k̇220 00 0] [] []00 00 0++= 0.k̇110 k110 k11Решая эти уравнения с начальными условиями k11 (0) = k22 (0) = 1, получаемk11 (t) = e−2t ,k22 (t) = 1.Таким образом, функция{}w− (t, x) = min e−2t x21 + x22 , x21 + e−2t x22является оценкой снизу для функции цены и определяет внешнюю оценку длямножества достижимости данной системы из единичного круга.Для построения внутренних оценок множества достижимости возьмем матрицы Ks также в виде (2.52).
Соотношения (2.41) будут справедливы, если по-69ложить[][][]1 01 01 0H11 =, H21 =, R1 = 2,0 00 00 −1[][][]0 00 01 0H12 =, H22 =, R2 = −2,0 10 10 −11 0 0 −100001 , γ1 = γ2 = 1,Q1 = QT2 = √ 000021 0 0 1что приводит к следующим уравнениям для k11 , k22 :k̇11 = −2k11 ,k̇22 = 2k22 .Следовательно, функция{}w− (t, x) = min e−2t x21 + e2t x22 , e2t x21 + e−2t x22является оценкой сверху для функции цены и определяет внутреннюю оценку для множества достижимости данной системы из единичного круга.
Нижеприведены иллюстрации построенных оценок в момент t = 1 (рис. 2.2).Рис. 2.2: Внутренняя и внешняя оценки множества достижимости системы(2.51) в виде объединений двух эллипсоидов.70Пример 3. Результаты раздела 1.5 позволяют использовать теоремы 13 и15 для построения аппроксимаций множеств достижимости линейных систем.Покажем, что это приводит к известным формулам эллипсоидального исчисления [62, 22]. Действительно, для линейной системыẋ = u,u ∈ E (0, R(t))соответствующая билинейная система имеет видẏ = Ay,A ∈ E (0, P (t)),[] []R(t) 0n×10n×n 0n×1P (t) =⊗.01×n 001×n 1Для получения внешних оценок можно взять[]K(t) 0.K1 (t) ≡ K(t) =0 k(t)Теоремы 13 и 14 приводит к следующему уравнению для матрицы K(t):[][−1][]K̇ 0µ (t)K(t)R(t)K(t) 00 0++= 0,0 k̇000 µ(t)√√⟩1 ⟨¯l, Q(t)¯l .µ(t) = ⟨x̄, KQ(t)K x̄⟩ =2Заметим, что случайẋ = Ax + Bu,u ∈ E (0, Q(t))может быть легко приведен к уже рассмотренному.2Учитывая, что функция yn+1является суперрешением соответствующегоуравнения ГЯБ, для получения внутренних оценок можно взять[]K(t) 0K1 (t) =,0 k(t)[]0n×n 0n×1K2 (t) =.01×n 171При s = 1 положим[H1s ≡]In×n 0n×1,01×n 0H2s = en+1 eTn+1 ,[]Q(t) 0n×1Qs (t) =⊗ I(n+1)×(n+1) .01×n 1Теорема 15 приводит к следующему уравнению для матрицы K1 (t):[][[]1T2K(t)R (t)Q (t) 0Q (t)R (t)K(t) 0K̇ 0+ γ −1 (t)+ γ −1 (t)= 0.0 0000012T]Таким образом, для множества достижимости исходной линейной системы получаем включения}{ { }E − [t] = x lim w+ (t, x, 1 + ε) ≤ 1 ⊆ X [t] ⊆ x w− (t, x, 1) ≤ 1 = E + [t],ε→+0причем множества E − [t] и E + [t] (при соответствующем выборе параметров)совпадают с эллипсоидальными оценками, построенными в [62].Пример 4.
Применим подход, представленный в разделе 1.5, к построениювнешних оценок множества достижимости системы уравнений динамическогоунициклаẋ1 = x3 ,ẋ2 = x4 ,(2.53)ẋ3 = v cos x5 ,ẋ4 = v sin x5 ,ẋ5 = αu.Как и в разделе 1.3 первой главы, здесь v и α — положительные константы,управление u принимает значения из отрезка [−1, 1].Пусть начальное множество X 0 представляет собой эллипсоид E (x0 , (X 0 )−1 ).72Применяя алгоритм билинеаризации, получаем системуẋ1ẋ2ẋ3ẋ4ẋ5ẋ6ẋ7ẋ8= x3 ,= x4 ,= vx6 ,= vx7 ,= αux8 ,= −αux7 ,= αux6 ,= 0,которая является билинейной реализацией системы (2.53). При этомL = [I5×5 , 05×3 ],φ(x) = [x1 , x2 , x3 , x4 , x5 , cos x5 , sin x5 , 1]T .В качестве нового начального множества X̃ 0 можно выбрать эллипсоидE (0, (X̃ 0 )−1 ) с матрицейX05×1 05×1−X x010011×5.X̃ 0 = 300101×5⟨ 0 0 0 ⟩0 0 T−(X x )00 1 + x ,X x00 0Легко заметить, что⟨⟩ 2⟩ 1⟨φ(x), X̃ 0 φ(x) = x − x0 , X 0 (x − x0 ) + .33Следовательно, φ(X 0 ) ⊆ X̃ 0 , и, более того, φ(∂X 0 ) ⊆ ∂ X̃ 0 .
Запишем гамильтониан этой новой системы:H(t, x, p) = p1 x3 +p2 x4 +vp3 x6 +vp4 x7 +α|p5 x8 −p6 x7 +p7 x6 | = ⟨p, Ax⟩+|⟨p, Bx⟩| .Субрешение соответствующего уравнения ГЯБ будем искать в виде w− (t, x) =⟨x, K(t)x⟩. Используя схему из раздела 2.2.1, получаем оценку сверху для вели-73чины H(t, x, wx− ):⟨⟩H(t, x, wx− (t, x)) ≤ x, (KA + AT K + QT Abs(Λ)Q)x ,гдеKB + B T K = QT ΛQ.Получаем для матрицы K уравнениеK̇ + KA + AT K + QT Abs(Λ)Q = 0.Таким образом, для множества достижимости X [t] = X (t; t0 , X 0 ) исходнойнелинейной системы (2.53) справедливо включение{ }X [t] ⊆ X + [t] = x w− (t, φ(x)) ≤ 1 .Пример 5. Рассмотрим двумерную билинейную систему со скалярным управлением:ẋ = uAx, u ∈ [−1, 1], x ∈ R2 .Пусть начальное множество задается следующим образом:X 0 = {x | |x1 | + |x2 | ≤ 1} .Применим алгоритм построения внутренних оценок из раздела 2.4 при трехразличных матрицах A.
Полученные далее вязкостные суперрешения w(t, x)соответствующих уравнений Гамильтона-Якоби-Беллмана задают внутреннююоценку следующим образом:X − [t] = {x | w(t, x) ≤ 1} .Пусть[]0 1A = A1 =.0 0Тогда функция11w(t, x) = |x1 + (1 + t)x2 | + |x1 − (1 + t)x2 | − t|x2 |2274является вязкостным решением уравнения ГЯБ и удовлетворяет начальномуусловиюw(0, x) = |x1 | + |x2 |.Множество достижимости данной системы приведено на рис. 2.3.Рис. 2.3: Множество достижимости при t = 1 в двумерном примере с матрицейA1 .Пусть[A = A2 =]1 0.0 −1Тогда функция11w(t, x) = (e−t + 2e2t )|x1 | + (e−t + 2e2t )|x2 |−3311− e−t (e3t − 1)|x1 − x2 | − e−t (e3t − 1)|x1 + x2 |33является суперрешением уравнения ГЯБ.
Соответствующие оценки множествадостижимости изображены на рис. 2.4.75Рис. 2.4: Внутренняя оценка множества достижимости при t = 1/2 и t = 1 вдвумерном примере с матрицей A2 .Пусть[]0 −1A = A3 =.1 0Определим величиныαk =2 cos2 t − 12 cos2 t − 1,β=− cos t.kcos t + (−1)k+1 sin tcos2 t − sin2 tТогда функцияw(t, x) = α1 |x1 cos t − x2 sin t| + α2 |x1 sin t − x2 cos t|−−β1 |x1 + x2 | − β2 |x1 − x2 |является суперрешением уравнения ГЯБ. Соответствующие оценки множествадостижимости изображены на рис. 2.5.76Рис. 2.5: Внутренние оценки множества достижимости при t = π/9 и t = π/4 вдвумерном примере с матрицей A3 .Глава 3Задачи гарантированногооценивания и синтезауправлений для билинейныхсистем3.1Постановка задач гарантированного оцениванияРассматривается билинейная системаẋ = Ax,A ∈ A (t),t ∈ [t0 , t1 ],(3.1)x(t0 ) ∈ X 0 = {x | σ(x) ≤ 1} ,в которой x ∈ Rn — состояние системы, множество A (t) представляет собойнеопределенность в динамике системы, а X 0 — неопределенность в начальномсостоянии.














