Диссертация (1102398), страница 8
Текст из файла (страница 8)
При этих предположениях для частных производных функции w справедливы формулы:⟨⟩wt− (t, x) = x, K̇(t)x ,2.2.1wx− (t, x) = 2K(t)x.Внешние аппроксимацииДля того, чтобы построить целое семейство оценок такого вида, рассмотримхарактеристическую систему для уравнения (2.12):[ẋ = A0 (t) +d∑]uj (t)Aj (t) x,(2.15)j=1d∑[ T]ṗ = − A0 (t) +uj (t)ATj (t) p,uj (t) ∈ signЗдесь(⟨(2.16)j=1⟩)p(t), Aj (t)x(t) .a > 0, {1} ,sign(a) ={−1} , a < 0,[−1, 1] , a = 0.(2.17)50В качестве параметра оценки будем использовать решение (x̄(t), p̄(t)) этой системы, такое что p̄(t0 ) = 2X 0 x̄(t0 ).Гамильтониан H(t, x, wx ) имеет вид⟩⟨H(t, x, wx (t, x)) = x, (AT0 (t)K(t) + K(t)A0 (t))x +(2.18)d∑⟩⟨+| x, (ATj (t)K(t) + K(t)Aj (t))x |.j=1В соответствии с определением 6, функция w представляет собой вязкостноесубрешение уравнения (2.12), если справедливо неравенствоwt + H(t, x, wx ) ≤ 0.(2.19)Чтобы получить условие на матрицу K(t), при котором это неравенство выполняется, оценим сверху функцию H(t, x, wx (t, x)) с помощью квадратичнойформы по переменной x.
Для этого рассмотрим разложениеMj (t) = ATj (t)K(t) + K(t)Aj (t) = QTj (t)Λj (t)Qj (t),Λj (t) = diag(λj1 (t), . . . , λjn (t)).Матрица Qj (t) имеет следующую структуру:Qj (t) = Q3j (t)Q2j (t)Q1j (t).Здесь матрица Q1j (t) ортогональна и удовлетворяет условиюQ1j (t)x̄(t) = ∥x̄(t)∥[1, 0, . . . , 0]T .Невырожденная матрица Q2j (t) имеет вид[Q2j (t) =10(n−1)×1]−cj (t),Lj (t)cj (t) = (mj11 (t))−1 [mj12 (t) . .
. mj1n (t)],M1j (t) = Q1j (t)Mj (t)QT1j (t) = (mis )ni,s=1 .Здесь Lj (t) является произвольной невырожденной матрицей, такой что функ-51ция Lj (·) непрерывна. Ортогональная матрица Q3j (t) диагонализует матрицуM2j (t) = (Q2j (t))−1 M1j (t)(QT2j (t))−1 ,так чтоM2j (t) = QT3j (t)Λj (t)Q3j (t).После преобразования x̃ = Qj (t)x получаем неравенства⟨⟩⟨⟩⟨⟩ ⟨⟩| x, Mj (t)x | = | x̃, Λj (t)x̃ | ≤ x̃, Abs(Λj (t))x̃ = x, QTj Abs(Λj (t))Qj x ,в которыхAbs(Λj (t)) = diag(|λj1 (t)|, .
. . , |λjn (t)|).Ясно, что неравенство (2.19) будет выполняться, еслиK̇ +d∑QTj (t)Abs(Λj (t))Qj (t) = 0.(2.20)j=1Это уравнение, взятое вместе с начальным условием K(τ ) = X 0 , гарантируетвыполнение соотношения w− (t, x) ≤ V (t, x). Вообще говоря, решение уравнения(2.20), а значит и субрешение w− (t, x), определено на некотором максимальномполуинтервале [t0 , ϑ), который может быть конечным или бесконечным. В частности, если величина ∥cj (t)∥, ограничена на [t0 , ϑ1 ] для всех j, то ϑ1 < ϑ. Такимобразом, мы приходим к следующему утверждению.Теорема 10 Пусть функция K(t) является решением уравнения (2.20) с начальным условием K(τ ) = X 0 . Тогда для множества достижимостиX (t; t0 , X 0 ) справедливо включениев которомX [t] ⊆ X + [t],(2.21){ ⟨⟩}X + [t] = x x, K(t)x ≤ 1 .(2.22)Замечание 3 Если в уравнении (2.20) все слагаемые QTj (t)Abs(Λj (t))Qj (t) оказались непрерывными, то в соответствии с теоремой 2 выполняется включение x̄(t) ∈ ∂X [t] ∩ ∂X + [t].52Пересечения элементарных оценок (2.22), отвечающих различным траекториям системы (2.15)-(2.17), могут быть использованы в качестве более точныхаппроксимаций множеств достижимости:X [t] ⊆∩Xξ+ [t],(2.23)ξгде ξ представляет собой совокупность параметров (x̄(·), p̄(·)), Lj (·), j = 1, n.При этом, отдельные оценки в таких пересечениях строятся независимо, чтопозволяет эффективно использовать параллельные вычисления.Пересечение всех оценок, которые можно построить в соответствии с теоремой 10, является, вообще говоря, лишь внешней аппроксимацией множествадостижимости и может с ним не совпадать.
Рассмотрим, например, систему(ẋ =u1[][])0 −11 0+ u2x,1 00 −1[x(t0 ) ∈ E (0, X0 ),]1 0X0 =.0 4У этой системы существуют траектории, которые лежат на границе множества достижимости до некоторого фиксированного момента θ. При этом любаяоценка H(t, x, wx ) гамильтониана H(t, x, wx ), построенная по приведенным выше формулам, может удовлетворять равенству H(t, x, wx ) = H(t, x, wx ) только вдоль одной траектории x̄(·). Таким образом, траектория x̃(·), такая чтоx̄(θ) = x̃(θ), будет лежать во множестве intX + [t] при t > t0 .
Откуда следует,что x̄(θ) ∈ intX + [θ].2.2.2Внутренние аппроксимацииВ качестве параметров внутренней квадратичной оценки будем использовать допустимые управления ū(·) ∈ U(t1 ). В соответствии с определением 7,функция w представляет собой вязкостное суперрешение уравнения (2.12), если справедливо неравенствоwt + H(t, x, wx ) ≥ 0,(2.24)в котором величина H(t, x, wx ) определяется формулой (2.18). Чтобы получитьусловие на матрицу K(t), при котором это неравенство выполняется, необхо-53димо оценить сверху функцию H(t, x, wx ) с помощью квадратичной формы попеременной x. Оценивая, получаем следующее уравнениеK̇ +d∑ūj (t)(ATj (t)K(t) + K(t)Aj (t)) = 0,K(t0 ) = X 0 .(2.25)j=1В результате мы приходим к утверждению.Теорема 11 Пусть функция K(t) является решением уравнения (2.24) с начальным условием K(τ ) = X 0 .
Тогда для множества достижимостиX (t; t0 , X 0 ) справедливо включениев которомX [t] ⊆ X + [t],(2.26){ ⟨⟩}X + [t] = x x, K(t)x ≤ 1 .(2.27)Легко заметить, что такие внутренние оценки представляют собой эволюционные множества из начального множества X 0 в силу системы (2.1) при некоторомфиксированном управлении ū(·).Далее рассмотрим понятие внутренней тугой оценки, введенное в работе[64].Определение 14 Внутреннюю оценку X − [t] будем называть тугой в классеA˜, если для любой оценки X̃ − [t] ∈ A˜ из включения X − [t] ⊆ X̃ − [t] ⊆ X [t]следует, что X̃ − [t] = X − [t].⟨⟩Ясно, что для любой квадратичной формы x, Qx , которая оценивает гамильтониан H(t, x, wx+ (t, x)) снизу, для некоторых функций uj (t) ∈ [−1, 1] справедливо неравенствоQ≤d∑uj (t)(ATj (t)K(t) + K(t)Aj (t)).j=1Это приводит нас к следующему утверждению.Теорема 12 Семейство всех оценок, которые могут быть построены с помощью теоремы 11 содержит все тугие оценки в классе оценок видаX̃ + [t] = {x | w(t, x) ≤ 1} ,54⟨⟩где w(t, x) = x, K(t)x , функция K(·) непрерывно дифференцируема, а функция w является вязкостным суперрешением уравнения (1.9).Таким образом, внутренние оценки в этом классе оказываются тривиальными.В следующих разделах этой главы будут приведены примеры других внутренних оценок, не являющихся эволюционными множествами для рассматриваемой системы или их объединениями.2.3Кусочно-квадратичные аппроксимации множеств достижимостиВ этом параграфе производится построение решения задачи 8.
Рассматривается билинейная система видаẋ = A(t)x,t ∈ [t0 , t1 ],(2.28)A(t) ∈ A (t) = E (0, P (t)),где A(t) ∈ Rn×n — это управление (или помеха), значения которого лежат вэллипсоиде⟨⟩}{⟩⟨E (0, P (t)) = A ∈ Rn×n A, P −1 (t) ◦ A F = A, P −1 (t)A ≤ 1(2.29)с непрерывной матрицей формы P (t) ∈ Rn ×n , P (t) = P T (t) ≥ 0.Квадрат функции Минковского множества достижимости из начальногомножества X 0{ }µ2 (x|X [t]) = inf λ2 λ−1 x ∈ X [t], λ > 0(2.30)22совпадает с функцией цены в задаче оптимального управленияV (t, x) = minminA(·)∈U(t) 1≤k≤m⟨⟩x(t0 ; t, x, A(·)), Xk0 x(t0 ; t, x, A(·)) ,которая удовлетворяет уравнению Гамильтона-Якоби-БеллманаVt + max ⟨Vx , Ax⟩ = Vt + H(t, x, Vx ) = 0A∈A(2.31)⟨⟩с начальным условием V (t0 , x) = x, X 0 x .
Вычисляя максимум в гамильтони-55ане H(t, x, p), получаем⟨⟩H(t, x, p) = max ⟨p, Ax⟩ = max pxT , A F =A∈A (t)A∈A (t)√√= ⟨pxT , P (t) ◦ pxT ⟩ = ⟨p ⊗ x, P (t)(p ⊗ x)⟩.В соответствии со схемой применения принципа сравнения, приведеннойв параграфе 1.2, для решения указанных задач необходимо построить вязкостные суб- и суперрешения w± (t, x) уравнения (2.31) с начальным услови⟨⟩ем w± (t0 , x) = min1≤k≤m x, Xk0 x . Такие суб- и суперрешения будут являтьсянижними и, соответственно, верхними оценками функции цены V (t, x).
Оценкам множества достижимости (2.9) соответствуют оценки функции цены в видеw± (t, x) = min ⟨x, Ks (t)x⟩ .(2.32)1≤s≤mВезде далее считаем выполненным следующееПредположение 2 Функции Ks (·) удовлетворяют условиямKs (·) ∈ C 1 ([t0 , t1 ]),Ks (t0 ) = Xs0 > 0.Введем в рассмотрение набор открытых множеств Ws (t) (s = 1, m), удовлетворяющих условиям}{ x ⟨x, Ks (t)x⟩ < ⟨x, Kj (t)x⟩ , j = 1, m, j ̸= s ⊆ Ws (t),Ws1 (t) ∩ Ws2 (t) = ∅ при s1 ̸= s2 ,∪(2.33)s Ws (t)= Rn .Заметим, что при t ∈ [t0 , t1 ], x ∈ Ws (t) функции w± (t, x) дифференцируемы, и⟨⟩wt± (t, x) = x, K̇s (t)x , wx± (t, x) = 2Ks (t)x.В дальнейшем, для краткости, мы иногда будем опускать зависимость некоторых функций от t и писать, к примеру, Ks вместо Ks (t).Заметим также, что все результаты этого параграфа могут быть очевиднымобразом обобщены на случай A (t) = E (0, P 1 (t)) + · · · + E (0, P k (t)).
В частности, при rankP j (t) = 1 множество A (t) представляет собой параллелепипедв пространстве матриц. Однако, в этом параграфе мы ограничимся случаемk = 1.562.3.1Внешние аппроксимацииДля вычисления субрешений уравнения (2.31) построим оценку сверху длягамильтониана H(t, x, p) при x ∈ Ws (t), p = wx− (t, x) с помощью квадратичнойформы по x:√√H(t, x, wx− ) = ⟨Ks x ⊗ x, P (Ks x ⊗ x)⟩ ≤ ⟨x ⊗ x, (P1s ⊗ P2s )(x ⊗ x)⟩ =√= ⟨x, P1s x⟩ ⟨x, P2s x⟩ ≤ (4µs )−1 ⟨x, P1s x⟩ + µs ⟨x, P2s x⟩ = H(t, x, wx− ).Здесь неотрицательно определенные матрицы P1s и P2s выбраны так, что справедливо первое из неравенств. Вопрос вычисления таких матриц рассмотрен да{}лее.















