Диссертация (1102398), страница 5
Текст из файла (страница 5)
Будем обозначать это множество символом W[t].Задача 5 Построить внутреннюю оценку (стабильный мост) W − [t] для множества разрешимости и предъявить позиционную стратегию U (t, x), которая для любого состояния системы x(τ ) ∈ W − [τ ] и любой допустимой реализации помехи v(t) приводит замкнутую систему в состояние x(t1 ) ∈ M.Как и в случае с оценками множества достижимости, решения данной задачи, полученные в настоящей работе, представляют собой алгоритмы построения оценок W − [t], основанные на численном решении задач Коши для некоторых специально сконструированных систем обыкновенных дифференциальныхуравнений.1.2Метод аппроксимации множеств достижимости.
Принцип сравненияВ этом параграфе приводятся основные теоремы для решения задач 1 и 2.Множество достижимости X (t; t0 , X 0 ) в этих задачах может быть представленов виде множества уровня функции цены для определенной задачи динамической оптимизации. А именно, справедливо соотношение [63]X (t; t0 , X 0 ) = {x | V (t, x) ≤ 1} ,26в которомV (t, x) =infu(·)∈U(t){σ(x(t0 )) | x(t) = x} .Введем множество Ω = [t0 , t1 ) × Rn .
В продолжении этого раздела считаемвыполненным следующее предположение.Предположение 1 Функция цены V (t, x) является непрерывной в Ω.В условиях предположения 1 функция V (t, x) является обобщенным решением уравнения Гамильтона-Якоби-Беллмана [40, 47, 51, 30]Vt + H(t, x, Vx ) = 0,(1.9)V (t0 , x) = σ(x).(1.10)с начальным условиемДля дальнейшего изложения нам потребуются определения вязкостных суби суперрешений (см., например, [40, 47]) уравнения (1.9).Определение 6 Функция w ∈ C(Ω) называется вязкостным субрешениемуравнения (1.9) на множестве Ω, если для всех (t, x) ∈ Ωq + H(t, x, p) ≤ 0 ∀(q, p) ∈ D+ w(t, x).(1.11)Определение 7 Функция w ∈ C(Ω) называется вязкостным суперрешениемуравнения (1.9) на множестве Ω, если для всех (t, x) ∈ Ωq + H(t, x, p) ≥ 0 ∀(q, p) ∈ D− w(t, x).(1.12)Определение 8 Функция w ∈ C(Ω) называется вязкостным решением уравнения (1.9), если она одновременно является вязкостным субрешением и вязкостным суперрешением.Здесь D− w(t, x) и D+ w(t, x) — соответственно суб- и супердифференциалыфункции w (см., например, [45]), черта над множеством обозначает его замыкание.Определение 9 Субдифференциалом функции w ∈ C(Ω) в точке (t, x) ∈ Ωназывается множество D− w(t, x) всех пар (q, p) ∈ R × Rn , удовлетворяющих27условиям(q, p) = (ϕt (t, x), ϕx (t, x)),(t, x) ∈ Arg min [w(s, y) − ϕ(s, y)](s,y)∈Ωдля некоторой функции ϕ ∈ C ∞ (Ω).Определение 10 Супердифференциалом функции w ∈ C(Ω) в точке (t, x) ∈Ω называется множество D+ w(t, x) всех пар (q, p) ∈ R × Rn , удовлетворяющих условиям(q, p) = (ϕt (t, x), ϕx (t, x)),(t, x) ∈ Arg max [w(s, y) − ϕ(s, y)](s,y)∈Ωдля некоторой функции ϕ ∈ C ∞ (Ω).Таким образом, функция цены V (t, x) оказывается решением уравнения (1.9) ввязкостном смысле.
Заметим также, что она является решением и в минимаксном смысле [30].Сформулированные далее теоремы 1 и 3 имеют название теорем сравнения.Использование утверждений такого вида для получения вычислительных алгоритмов аппроксимации множеств достижимости было впервые предложено вработах [22, 63]. Прежде чем сформулировать эти теоремы, приведем известнуюлемму о вязкостных решениях [40, 47, 51, 53].Лемма 1 Пусть w− и w+ соответственно вязкостное субрешение и вязкостное суперрешение уравнения (1.9).
Тогдаsup(t,x)∈Ω[][]w− (t, x) − w+ (t, x) ≤ sup w− (t0 , x) − w+ (t0 , x) .x∈RnТеорема 1 Предположим, что функция w ∈ C(Ω) является вязкостнымсубрешением уравнения (1.9) и удовлетворяет начальному условию (1.10).Тогда w(t, x) ≤ V (t, x), t ∈ [t0 , t1 ], и, следовательно, справедливо включениеX (t; t0 , X 0 ) ⊆ X + [t] = {x | w(t, x) ≤ 1} .28Доказательство.
Утверждение теоремы следует непосредственно из леммы онеравенстве между вязкостным суб- и суперрешением.Далее приведем уточняющее утверждение, аналогичное известной теоремео верификации [51].Теорема 2 Пусть в условиях теоремы 1 функция w является непрерывнодифференцируемой в окрестности некоторой траектории x̄(·) системы (1.1),отвечающей управлению ū(·) такому, что⟨⟩ū(t) ∈ Arg max wx (t, x̄(t)), f (t, x̄(t), u) .u∈UКроме того, пусть выполняется равенствоwt (t, x̄(t)) + H(t, x̄(t), wx (t, x̄(t))) = 0, t ∈ (t0 , t1 ).Тогда w(t, x̄(t)) = V (t, x̄(t)) при t ∈ [t0 , t1 ].
В частности, из условияx̄(t) ∈ ∂X (t; t0 , X 0 ) следует условие x̄(t) ∈ ∂X + [t].Доказательство. Имеем следующее тождество⟨⟩dw(t, x̄(t)) = wt (t, x̄(t)) + wx (t, x̄(t)), f (t, x̄(t), ū(t)) =dt= wt (t, x̄(t)) + H(t, x̄(t), wx (t, x̄(t))) = 0.Откуда следует, чтоw(t, x̄(t)) = w(t0 , x̄(t0 )) = σ(x̄(t0 )).Учитывая неравенствоw(t, x̄(t)) ≤ V (t, x̄(t)) =infu(·)∈U(t){σ(x(t0 ))| x(t) = x̄(t)} ,получаем, чтоw(t, x̄(t)) = V (t, x̄(t)).Второе утверждение теоремы следует из того, что ∂X (t; t0 , X 0 ) = {x |V (t, x) = 1}и ∂X + (t; t0 , X 0 ) = {x | w(t, x) = 1}.Важно подчеркнуть, что оценка трубки достижимости X + [·] множества достижимости, построенная в соответствии с теоремами 1 и 2, оказывается сильно29инвариантным многозначным отображением относительно дифференциального включения ẋ ∈ cof (t, x, U ).Определение 11 Многозначное отображение X (t) называется сильно инвариантным (в обратном времени) относительно дифференциального включения ẋ ∈ F (t, x), если для любых (τ, y) ∈ graphX каждая траекторияx(·) : [t0 , τ ] → Rn этого дифференциального включения с концевым условием x(τ ) = y удовлетворяет условию выживаемости x(t) ∈ X (t) для всехt ∈ [t0 , τ ].Аналогом теоремы 1 для внутренних оценок является следующее утверждение [40, 47, 51, 53].Теорема 3 Предположим, что функция w ∈ C(Ω) является вязкостнымсуперрешением уравнения (1.9) и удовлетворяет начальному условию (1.10).Тогда w(t, x) ≥ V (t, x), t ∈ [t0 , t1 ], и, следовательно, справедливо включениеX − [t] = {x | w(t, x) ≤ 1} ⊆ X (t; t0 , X 0 ).Доказательство.
Утверждение теоремы следует непосредственно из леммы онеравенстве между вязкостным суб- и суперрешением.Теорема 4 Пусть в условиях теоремы 3 функция w является непрерывнодифференцируемой в окрестности некоторой траектории x̄(·) системы (1.1).Кроме того, пусть выполняется равенствоwt (t, x̄(t)) + H(t, x̄(t), wx (t, x̄(t))) = 0, t ∈ (t0 , t1 ),в котором x̄(·) — траектория системы (1.1). Тогда из условияx̄(t) ∈ ∂X (t; t0 , X 0 ) следует условие x̄(t) ∈ ∂X − [t].Доказательство.
Имеем следующее неравенство⟨⟩dw(t, x̄(t)) = wt (t, x̄(t)) + wx (t, x̄(t)), f (t, x̄(t), ū(t)) ≤dt≤ wt (t, x̄(t)) + H(t, x̄(t), wx (t, x̄(t))) = 0.Откуда следует, чтоw(t, x̄(t)) ≤ w(t0 , x̄(t0 )) = σ(x̄(t0 )).30С другой стороны, из условия x̄(t) ∈ ∂X (t; t0 , X 0 ) и теоремы 3 следует, чтоσ(x̄(t0 )) = V (t, x̄(t)) ≤ w(t, x̄(t)).Таким образом, w(t, x̄(t)) = V (t, x̄(t)). Остается заметить, что ∂X (t; t0 , X 0 ) ={x | V (t, x) = 1} и ∂X − (t; t0 , X 0 ) = {x | w(t, x) = 1}.Решения задач 1 и 2 могут быть получены путем нахождения функций w,удовлетворяющих теореме 3 или 4 соответственно при различном выборе траекторий x̄(·).Оценка трубки достижимости X + [·] множества достижимости, построеннаяв соответствии с теоремами 3 и 4, оказывается слабо инвариантным многозначным отображением относительно дифференциального включенияẋ ∈ cof (t, x, U ).Определение 12 Многозначное отображение X (·) называется слабо инвариантным (в обратном времени) относительно дифференциального включения ẋ ∈ F (t, x), если для любых (τ, y) ∈ graphX существует траекторияx(·) : [t0 , τ ] → Rn , которая удовлетворяет этому дифференциальному включению, концевому условию x(τ ) = y и следующему условию выживаемости:x(t) ∈ X (t) для всех t ∈ [t0 , τ ].Необходимо отметить важность начального условия (1.10) для возможностиполучения точных представлений множества достижимости нелинейной системы в виде пересечения внешних оценок:X [t] =∩Xξ+ [t].(1.13)ξК примеру, рассмотрим систему[ẋ = u]0 −1x,1 0u ∈ [−1, 1],x(t0 ) ∈ X 0 = E (0, I).(1.14)(1.15)31Если условие (1.15) заменить на включениеx(t0 ) ∈ X 0 = {x | |x1 | ≤ 1, |x2 | ≤ 1} ,то любая внешняя оценка X + [·], которая представляет собой сильно инвариантное отображение, будет удовлетворять включению E (0, 2I) ⊆ X + [t] приt ≥ t0 + π/4.
При этом в исходной постановке X [t] = X 0 = E (0, I). Это отличает задачу достижимости для нелинейных систем от задачи достижимостидля линейных систем, в которой возможно получить представление (1.13), дажеесли для каждой из оценок Xξ+ [t] выполняется строгое включение X 0 ⊂ Xξ+ [t0 ].В частности, для конкретной нелинейной системы классы эллипсоидальных ипараллелотопных оценок могут оказаться слишком узкими для получения представлений выпуклой оболочки множества достижимости, а вводимые далее вовторой главе классы квадратичных и кусочно квадратичных оценок — недостаточными для получения представления (1.13).1.3Пример аппроксимации множества достижимости: динамический унициклВ этом параграфе рассматривается пример применения сформулированныхвыше теорем сравнения к одной конкретной нелинейной системе, так называемому динамическому унициклу [48, 71, 75, 78]:ẋ1ẋ2ẋ3ẋ4ẋ5= x2 ,= v cos x5 ,= x4 ,= v sin x5 ,= αu.(1.16)Здесь u — управление, принимающая значения из отрезка [−1, 1], а v и α — положительные константы.
Начальное множество представляет собой эллипсоид()x(t0 ) ∈ X 0 = E x0 , (X 0 )−1 ,X 0 = (X 0 )T > 0.(1.17)32Множество допустимых управленийU(t) = L∞ ([t0 , t]; U ),U = [−1, 1].Эта система имеет отношение к динамической модели машиноподобного робота.А именно, x1 и x3 представляют собой декартовы координаты заднего колеса,x2 и x4 — соответствующие скорости, v — модуль скорости, x5 — угол поворота,а α — максимальное значение угловой скорости.Задача 6 Построить семейство внешних эллипсоидальных аппроксимациймножества достижимости X [t] системы (1.16) из начального множестваX 0.Функцию цены в данной задаче можно определить следующим образом:V (t, x) = infu(·){⟨⟩}x − x0 , X 0 (x − x0 ) x[t] = x .Тогда будет справедливо равенствоX [t] = {x | V (t, x) ≤ 1} .Рассмотрим уравнение Гамильтона-Якоби-Беллмана для функции V (t, x):Vt +max {Vx1 x2 + Vx3 x4 + vVx2 cos x5 + vVx4 sin x5 + αuVx5 } = Vt +H(t, x, Vx ) = 0,|u|≤1(1.18)в которомH(t, x, p) = p1 x2 + p3 x4 + vp2 cos x5 + vp4 sin x5 + α|p5 |.(1.19)Для нахождения внешней аппроксимации множества достижимости X [t] воспользуемся теоремами 1 и 2 из предыдущего параграфа.















