Диссертация (1102398), страница 9
Текст из файла (страница 9)
Заметим, что P1s и P2s суть функции от t и от набора матриц Kj , j = 1, m .Второе неравенство справедливо для любых матриц P1s , P2s и любого µs > 0.Если µs определено по формуле√µs =12⟨x̄s , P1s x̄s ⟩,⟨x̄s , P2s x̄s ⟩то неравенство обращается в равенство в точке x = x̄s ∈ Ws (t).Таким образом, для справедливости неравенства (1.13) при x ∈ ∪s Ws (t)достаточно, чтобыwt− + H(t, x, wx− ) ≤ 0.Записывая это условие более подробно, получаем⟨⟩x, K̇s x + (4µs )−1 ⟨x, P1s x⟩ + µs ⟨x, P2s x⟩ ≤ 0,x ∈ Ws ,s = 1, m.Эти неравенства квадратичны по x, поэтому достаточным условием их выполнения будет равенство нулю матриц соответствующих квадратичных форм:K̇s + (4µs )−1 P1s + µs P2s = 0,s = 1, m.(2.34)Эти соотношения следует рассматривать как уравнения относительно Ks .Далее необходимо рассмотреть неравенство (1.13) при x ̸∈ ∪s Ws (t). ФункцияH(t, x, p) выпукла по p и непрерывна по совокупности переменных, а множествоD+ w− (t, x) компактно.
Поэтому существует пара, (qmax , pmax ) ∈ ∂D+ w− (t, x)57такая, что(qmax , pmax ) ∈ Argmax[q + H(t, x, p)].(q,p)∈D+ w− (t,x)По известной теореме (см., например, [45]) для этой точки (t, x) и для(qmax , pmax ) ∈ ∂D+ w− (t, x) существует последовательность точек (tk , xk ) →(t, x) такая, что xk ∈ ∪s Ws (tk ) и (qk , pk ) = (wt− (tk , xk ), wx− (tk , xk )) → (q, p).Используя непрерывность гамильтониана H(t, x, p) по совокупности переменных, получаем0 ≥ qk + H(tk , xk , pk ) ≥ qk + H(tk , xk , pk ) → qmax + H(t, x, pmax ).Таким образом, доказанаТеорема 13 Пусть функции Ks (t) удовлетворяют предположению 2, а открытые множества Ws (t) удовлетворяют условиям (2.33).
Кроме того, пустьпри t ∈ [t0 , t1 ], x ∈ Ws (t) для некоторых непрерывных функций P1s (t) ≥ 0,P2s (t) ≥ 0 справедливы неравенства (s = 1, m)⟨x ⊗ x, (Ks (t) ⊗ I)P (t)(Ks (t) ⊗ I)(x ⊗ x)⟩ ≤ ⟨x ⊗ x, (P1s (t) ⊗ P2s (t))(x ⊗ x)⟩ ,(2.35)а матрицы Ks (t) являются решениями уравненийK̇s + µ−1s (t)P1s (t) + µs (t)P2s (t) = 0,s = 1, mпри некоторых µs = µs (t) > 0. Тогда имеет место включение{ }X [t] ⊆ X + [t] = x w− (t, x) ≤ 1 =}{ ⟩⟨x min x, Ks (t)x ≤ 1 .1≤s≤mДалее рассмотрим вопрос касания множества достижимости X [t] и оценки X + [t].Будем говорить, что множества A и B, A ⊆ B ⊂ Rn касаются, если∂A ∩ ∂B ̸= ∅. Множества X [t] и X + [t] касаются тогда и только тогда, когдасуществует точка z ∈ Rn такая, что w− (t, z) = V (t, z).
Используя результатыраздела 1.2, получаем следующее утверждение.Теорема 14 Пусть для некоторого j и некоторой траектории x̄(·) системы(2.28), (2.29) выполняется включение x̄(t) ∈ Wj (t) при t ∈ [t0 , t1 ]. Пусть далеев условиях теоремы 13 неравенство (2.35) для s = j обращается в равенство58при x = x̄(t), а функция µj (t) выбрана следующим образом:√µj (t) =⟨x̄j (t), P1j (t)x̄j (t)⟩.⟨x̄j (t), P2j (t)x̄j (t)⟩Тогда w− (t, x̄(t)) = V (t, x̄(t)), то есть множества X [t] и X + [t] касаются. Вчастности, из условия x̄(t) ∈ ∂X [t] следует условие x̄(t) ∈ ∂X + [t].Алгоритм решения основного неравенстваДля построения оценок множества достижимости в соответствии с теоремой 13необходимо иметь алгоритм решения неравенств вида 2.3.1. Заметим, что, вообще говоря, недоминируемое решение этого неравенства неединственно. Нижеприведен лишь один пример алгоритма решения неравенства 2.3.1 для случаевn = 2 и n = 3.Рассмотрение аппроксимаций множества достижимости в виде (2.9) приm ≥ 2 имеет смысл, если оказывается возможным получить такие оценки X + [t]и X − [t], что не все отдельные множества {x |⟨x, Ks (t)x⟩ ≤ 1} определяют соответственно сильно и слабо инвариантные относительно рассматриваемой системы многозначные отображения.
Другими словами, это имеет смысл в случае,когда не все функции ⟨x, Ks (t)x⟩ являются вязкостными суб- и суперрешениямиуравнения (2.31). Приводимый далее алгоритм решения неравенств вида (2.3.1)позволяет в некоторых случаях получать такие оценки. Это иллюстрируется вконце главы на нескольких примерах.Пусть задана симметричная матрица P размера n2 × n2 . Требуется оценитьсверху функциюF (x) = ⟨x ⊗ x, P (x ⊗ x)⟩с помощью функции видаG(x) = ⟨x ⊗ x, (P1 ⊗ P2 )(x ⊗ x)⟩ = ⟨x, P1 x⟩ ⟨x, P2 x⟩ ,P1 ≥ 0, P2 ≥ 0при всех x ∈ W так, чтобы в точке x̄ ∈ W выполнялось равенство F (x̄) = G(x̄).Можно выделить два случая:1. Множество W совпадает со всем пространством Rn ;⟨{⟩}2.
Множество W = x ∈ Rn x, W x ≥ 0 , где W — симметричная матри-59ца размера n × n, которая имеет n − 1 отрицательных и одно положительное собственное значение.Далее будет рассматриваться второй случай. Для первого случая схема остается справедливой, но некоторые шаги необходимо опустить. Предлагаемый алгоритм может быть использован для решения неравенств (2.3.1) в том случае, когда множества Ws (t) могут быть вложены в множества вида W приt0 ≤ t ≤ t1 .Существует невырожденная матрица U ∈ Rn такая, чтоU −1 x̄ = ȳ ≡ [1, 0, .
. . , 0],U T W U = diag(µ1 , . . . , µn ), µ1 > 0, µj < 0 при j = 2, n.После замены переменных y = U −1 x неравенство F (x) ≤ G(x) принимает вид⟨⟩ ⟨⟩y ⊗ y, (U T ⊗ U T )P (U ⊗ U )(y ⊗ y) ≤ y ⊗ y, (U T P1 U ⊗ U T P2 U )(y ⊗ y) .(2.36)Определим матрицы: P̃ = (U T ⊗ U T )P (U ⊗ U ), P̃i = U T Pi U , W̃ = U T W U .Таким образом, теперь требуется решить поставленную задачу для вектора ȳи диагональной матрицы W̃ . Далее, не вводя дополнительных обозначений,проведем последовательность преобразований над матрицей P̃ , при которых⟨⟩величина y ⊗ y, P̃ (y ⊗ y) не изменяется при каждом y ∈ U −1 W .Вводя обозначение z = y ⊗ y, получаем, чтоz1z2 zn+1zn+2Z= ......zn2 −n+1 zn2 −n+2.
. . zn. . . z2n . . . . . .. . . z n2является симметричной положительно определенной матрицей ранга 1. Свойство rankZ = 1 означает, что любой минор этой матрицы порядка 2 равен нулю.Таким образом, z принадлежит множеству нулей определенного набора квадратичных форм, что позволяет прибавлять к P̃ матрицы этих квадратичных⟨⟩форм, не изменяя величины y ⊗ y, P̃ (y ⊗ y) . В частности, в этот набор входят60квадратичные формы[det]zn(j−1)+j zn(j−1)+k= 0,zn(k−1)+j zn(k−1)+kj ̸= k,что позволяет обнулить элементы P̃(n(j−1)+j)(n(k−1)+k) при j ̸= k. Условие симметричности также можно записать в виде равенства нулю определенного набора квадратичных форм:⟨z, Mi z⟩ = zl (zn(j−1)+k − zn(k−1)+j ) = 0,j, k, l = 1, n,j ̸= k.Используя эти квадратичные формы при l = n(j − 1) + k или l = n(k − 1) + j,можно привести матрицу P̃ к блочно-диагональному виду с блоками размера n.Ограничение x ∈ W с учетом соотношения x = U y эквивалентно неравенству⟨⟩ ⟨⟩y, U T W U y = y, W̃ y ≥ 0.
Следовательно, при λj ≥ 0 справедлива оценка⟨()⟨⟩y ⊗ y, P̃ (y ⊗ y) ≤ y ⊗ y, P̃ + diag(0, λ1 , . . . , λn−1 ) ⊗ W̃ (y ⊗ y) =⟨⟩= y ⊗ y, R(y ⊗ y) .⟩При выборе соответствующем выборе неотрицательных чисел λj , можно получить матрицы с одним положительным собственным значением во всех блокахматрицы R, кроме первого. Далее используем следующие из условий симметричности:22zn(j−1)+k− zn(k−1)+j= 0.Эти условия позволяют получить отрицательно определенные матрицы во всехблоках матрицы R, кроме первого. Выберем матрицы P̃1 и P̃2 из соотношенийP̃1 ≥ R1 ,P̃1 ≥ 0,(P̃1 )11 = (R1 )11 ,P̃2 = [1, 0, .
. . , 0]T [1, 0, . . . , 0],где через R1 обозначен первый блок матрицы R. При таком выборе матриц P̃1 иP̃2 неравенство (2.36) будет справедливо. Остается только вернуться к исходнымкоординатам:P1 = (U T )−1 P̃1 U −1 , P2 = (U T )−1 P̃2 U −1 .612.3.2Внутренние аппроксимацииПерейдем к вычислению суперрешений уравнения (2.31). Оценим гамильтониан H(t, x, p) снизу при всех (t, x, p):⟨⟩1Hs (p ⊗ x), Qs P 2 (p ⊗ x)H(t, x, p) ≥ √⟨⟩ =Hs (p ⊗ x), Hs (p ⊗ x)⟨⟩1H1s Ks−1 p ⊗ H2s x, Qs P 2 (p ⊗ x)= √⟨⟩=−1−1H1s Ks p ⊗ H2s x, H1s Ks p ⊗ H2s x⟨⟩1H1s Ks−1 p ⊗ H2s x, Qs P 2 (p ⊗ x)= √⟨⟩⟨⟩ = Hs (t, x, p), s = 1, m.T−1−1H1s Ks p, H1s Ks p x, H2s H2s xЗдесь функции Hs (·) определяются равенствамиHs (t) = H1s (t)Ks−1 (t) ⊗ H2s (t),(2.37)функции H1s (·), H2s (·) и Qs (·) непрерывны при t ∈ [t0 , t1 ], а матрицы Qs (t)ортогональны. Равенство в оценке H(t, x, p) ≥ Hs (t, x, p) достигается в точке(t, x̄(t), p̄(t)), если для некоторого λ = λ(t) > 0 справедливо соотношениеQs P 2 (p̄ ⊗ x̄) = λHs (p̄ ⊗ x̄) = λH1s Ks−1 p̄ ⊗ H2s x̄.1(2.38)Таким образом, для справедливости неравенства (1.14) при x ∈ ∪s Ws (t)достаточно, чтобы⟨⟩1H1s Ks−1 wx ⊗ H2s x, Qs P 2 (wx ⊗ x)wt + √⟨⟩⟨⟩ = wt + Hs (t, x, wx ) ≥ 0.T−1−1H1s Ks wx , H1s Ks wx x, H2s H2s x(2.39)Пусть матрицы Rs удовлетворяют неравенствам⟩ ⟨⟩⟨⟩⟨1TH2s x .x ⊗ x, (H1s ⊗ H2s )Qs P 2 (Ks ⊗ I)(x ⊗ x) ≥ x, Rs x x, H2sТогда, подставляя выражение для функции w+ (t, x) в соотношение (2.39), по-62лучаем систему неравенств⟨⟨⟩1H1s x ⊗ H2s x, Qs P 2 (Ks x ⊗ x)x, K̇s x + 2 √⟨⟩⟨⟩ ≥TTx, H1s H1s x x, H2s H2s x√⟨⟩TH x⟨⟩ ⟨⟩x, H2s2s⟨⟩ ≥0≥ x, K̇s x + x, Rs xTH xx, H1s1s⟩при x ∈ Ws (t), s = 1, m.
Пусть числа γs > 0 и матрицы H1s , H2s выбраны так,что⟨⟩⟨⟩TT0 ≤ x, H1sH1s x ≤ γs2 x, H2sH2s xпри x ∈ Ws (t). Неравенство (2.39), таким образом, будет справедливо, если⟩⟩⟨⟨x, K̇s x + γs−1 x, Rs x ≥ 0.Последнее соотношение заведомо выполняется, еслиK̇s + γs−1 Rs = 0.(2.40)Заметим, что из условия Ks (t0 ) = X 0 > 0 и неравенства (2.39) следует условие Ks (t) > 0, t ∈ [t0 , t1 ]. Если же последнее справедливо для всехs = 1, m, то либо функция w+ (t, x) дифференцируема в произвольной точке(t, x), t ∈ [t0 , t1 ], либо D− w+ (t, x) = ∅. Поэтому в точках недифференцируемости этой функции условие (1.14) выполняется тривиальным образом.Теорема 15 Пусть функции Ks (t) удовлетворяют предположению 2, а открытые множества Ws (t) удовлетворяют условиям (2.33). Кроме того, пустьпри t ∈ [t0 , t1 ], x ∈ Ws (t) для некоторых непрерывных функций Rs (t), Qs (t),H1s (t), H2s (t) справедливы неравенства (s = 1, m)⟨⟩1TT2 x ⊗ x, (Ks (t) ⊗ I)P 2 (t)QTs (t)(H1s(t) ⊗ H2s(t))(x ⊗ x) ≥⟨⟩T≥ x ⊗ x, (Rs (t) ⊗ H2s(t)H2s (t))(x ⊗ x) , Qs (t)QTs (t) = I,⟨⟩⟨⟩TTx, H1s(t)H1s (t)x ≤ γs2 (t) x, H2s(t)H2s (t)x ,а матрицы Ks (t) являются решениями уравненийK̇s + γs−1 (t)Rs (t) = 0,s = 1, m.(2.41)63Тогда имеет место включение{ }⟨⟩{ }x min x, Ks (t)x ≤ 1 = x w+ (t, x) ≤ 1 = X − [t] ⊆ X [t].1≤s≤mТеорема 16 Пусть для некоторого j и некоторой траектории x̄(·) системы (2.28), (2.29) выполняется включение x̄(t) ∈ Wj (t) при t ∈ [t0 , t1 ].
Пустьдалее в условиях теоремы 15 неравенство (2.41) для s = j обращается в равенство при x = x̄(t), и для некоторой непрерывной функции λ(·) и пары(x̄(t), 2Kj (t)x̄(t)) выполняется условие (2.38). Тогда из условия x̄(t) ∈ ∂X [t]следует, что множества X [t] и X − [t] касаются, и x̄(t) ∈ ∂X − [t].Заметим, что для множества всех оценок, которые можно построить в соответствии с теоремой 15, справедливо тождество∪Xξ− [t] = X [t].ξ2.4Внутренние аппроксимации с помощью положительно однородных функцийВ этом параграфе рассматривается билинейная система вида[]ẋ = A0 (t) + u1 (t)A1 (t) + · · · + ud (t)Ad (t) x,t ∈ [t0 , t1 ],x(t0 ) ∈ X 0 = {x ∈ Rn | σ(x) ≤ 1} .(2.42)(2.43)Считается выполненным следующееПредположение 3 Функция σ(x) удовлетворяет условию Липшица, положительно однородна и симметрична относительно нуля.Функция цены в данном случае имеет видV (t, x) = inf σ (x(t0 ; t, x, u)) .(2.44)u∈U(t)Она является вязкостным решением уравнения Гамильтона-Якоби-БеллманаVt + ⟨Vx , A0 (t)x⟩ +d∑j=1|⟨Vx , Aj (t)x⟩| = 0(2.45)64с начальным условием(2.46)V (t0 , x) = σ(x).В этом разделе будем искать вязкостные суперрешения w уравнения (2.45)в виде [26]w(t, x) = σ(S −1 (t0 )S(t)x) + γ(t)ψ(S(t)x).(2.47){}Пусть ūk (t) — набор из n допустимых управлений, а x̄k (t) — соответствующиеим траектории, выпущенные из начального множества X 0 .














