Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения (1155776), страница 18
Текст из файла (страница 18)
рисунок 16.6).Область I−+− отвечает управлениям вида⎧⎪⎨−1, 0 t < τ1 ,u2 (t) = +1, τ1 < t < τ2 = τ1 + π,⎪⎩−1, τ2 < t t1 ,0 < τ1 < π,0 < t1 − τ2 < π;160P1x0O−3N1−2=−1I−+0t11O1τ−4x2u2 = −1u2N23O−1−τM12 x1−1Рисунок 16.5u2=−11 x2N1t1−O1τO−1 0−1M1τI+−u2 = +1x0−3Рисунок 16.61613M3x1область I+−+ отвечает управлениям вида⎧⎪⎨+1, 0 t < τ1 ,u2 (t) = −1, τ1 < t < τ2 = τ1 + π,⎪⎩+1, τ2 < t t1 ,0 < τ1 < π,0 < t1 − τ2 < π;(см. рисунок 16.7).x2I−+−x03I−+N3−4N2−3N1−1 0 O11O−1M1M235M3x1I+−−3I+−+Рисунок 16.7Для описания окончательного результата на фазовой плоскостивыделяется линия.
. . N3 N2 N1 OM1 M2 M3 . . . ,162называемая линией переключения. Определим функцию⎧⎪−1, если точка (x1 , x2 ) лежит выше⎪⎪⎪⎨линии переключения . . . N2 N1 OM1 M2 . . .v(x1 , x2 ) =или на кривой N1 O;⎪⎪⎪⎪⎩+1, если точка (x1 , x2 ) лежит нижелинии переключения или на кривой M1 O.Любая оптимальная траектория состоит из дуг окружностей с центром в точке O−1 , лежащих выше линии переключения, где u2 = −1,и из дуг окружностей с центром в точке O1 , лежащих ниже линиипереключения, где u2 = +1. Функция v(x1 , x2 ) реализует синтез оптимального управления (см. рисунок 16.8).x2M1O−1N3N3N20N1u2 = −1O1M2M3M4x1u2 = +1Рисунок 16.8 aПереход в начало координат возможен из любой точки x =bфазовой плоскости.
Построенные траектории, удовлетворяющие прин0163ципу максимума, оптимальны по быстродействию, см. раздел 3.15,пример 15.1. Пример 16.1 подробно рассмотрен в книге [1].Упражнение 16.1. Построить семейство изохрон в примере 16.1.Пример 16.2. Построить синтез в начало координат для объектаẋ1 = x2 ,(5)ẋ2 = x1 + u2 , |u2 | 1.Особенность рассматриваемой задачи заключается в том, что попадание в начало координат возможно не из любых начальных состояний x0 фазовой плоскости, а лишь из начальных состояний, лежащихв полосе|x1 + x2 | < 1.Рассматриваемая система (5) при u2 = 0 принимает видẋ1 = x2 ,ẋ2 = x1 .(6)Система (6) имеет единственное положение равновесия (0, 0) типаседло (неустойчиво по Ляпунову). Фазовые траектории этой системыизображены на рисунке 16.9.На основании принципа максимума приходим к выводу, что управление u2 (t), удовлетворяющее принципу максимума, принимает лишьзначения ±1 и имеет не более одной точки переключения.
Оптимальные траектории рассматриваемой системы склеиваются из траекторийсистемы (5) при u2 = +1 и u2 = −1. Последние получаются из траекторий системы (5), изображённых на рисунке 16.9, путём переноса положения равновесия в точки (−1, 0) и (+1, 0) соответственно.Окончательный вид оптимальных траекторий в примере 16.2 показанна рисунке 16.10.Синтезирующая функция⎧⎪⎪−1, если точка (x1 , x2 ) лежит выше линии переклю⎨чения AOB в полосе |x1 + x2 | < 1 и на BO,v(x1 , x2 ) =⎪+1,еслиточка (x1 , x2 ) лежит ниже линии переклю⎪⎩чения AOB в полосе |x1 + x2 | < 1 и на AO,определена в полосе |x1 + x2 | < 1.Упражнение 16.2. Провести полное обоснование решения примера 16.2.
Показать, что из любой точки x0 фазовой плоскости, не164x2x10Рисунок 16.9принадлежащей полосе |x1 + x2 | < 1, невозможно попасть в началокоординат при помощи допустимого управления.Упражнение 16.3. Построить семейство изохрон в примере 16.2.Пример 16.3. Решить линейную задачу быстродействияẋ = u,x, u ∈ E n ,M0 = {x0 }, M1 = {0},t1 → min .U = S1 (0),t0 = 0,Показать, что оптимальное времяt1 опт = x0 ,оптимальное управлениеuопт (t) = −а оптимальная траекторияxопт (t) = 1 −x0,x0 tx0 0 t x0 ,x0 ,0 t x0 .Найти сопряжённую переменную, участвующую в формулировкепринципа максимума.165Bx21u2=+11−10x1−1u2=1−AРисунок 16.10При n = 2 на рисунке 16.11 показаны оптимальные траектории,ведущие в начало координат.Упражнение 16.4.
Установить единственность оптимального управления в примере 16.3. Показать, что синтезирующая функция v(x)определяется формулойx.v(x) = −xУпражнение 16.5. Построить синтез в примерах22 |x1 | 1a) ẋ = u; x, u ∈ E ; M1 = S1 (0), U = K ≡ x ∈ E ;|x2 | 1б)в)г)ẋ = u; x, u ∈ E 2 ; M1 = K,2ẋ = u; x, u ∈ E ; M1 = K,2ẋ = u; x, u ∈ E ; M1 = S1 (0),U = S1 (0);U = K;U = S1 (0).Исследовать вопрос о единственности решения, провести обоснова166x2x00Рисунок 16.11ние оптимальности.167x14 Линейная задача быстродействия с “гладкой” областью управления. Численныеметоды решения линейной задачи быстродействия4.17Теорема об опорной точке строго выпуклогокомпакта и градиенте его опорной функции.Теоремы единственностиРассмотрим в пространстве E n непустой выпуклый компактU ∈ conv Ω(E n ).Этот компакт однозначно определяется своей опорной функцией3c(ψ) = max (u, ψ),u∈Uψ ∈ En .(1)Возьмём любой отличный от нуля вектор ψ 0 ∈ E n .
Гиперплоскость%&Γψ0 = x ∈ E n : (x, ψ 0 ) = c(ψ 0 )называется опорной гиперплоскостью компакта U в направлениивектора ψ 0 . Множество"Hψ 0 = U Γ ψ 0называется опорным множеством компакта U в направлении вектора ψ 0 , см. рисунок 17.1.Ясно, что%&(2)Hψ0 = u ∈ U : (u, ψ 0 ) = c(ψ 0 ) = ∅,т.е. опорное множество Hψ0 состоит из тех точек u ∈ U , на которых в соотношении (1) при ψ = ψ 0 достигается максимум. Опорноемножество Hψ0 может состоять из одной точки, см.
рисунок 17.1 а);множество Hψ0 , изображённое на рисунке 17.1 б), состоит более чемиз одной точки.3 Опорная функция (1), естественно, зависит от множества U ; аргумент U в обозначении опорной функции здесь и ниже, для сокращения записи, будем опускать, еслииз контекста понятно, об опорной функции какого множестве идёт речь.168Uψ0ψ0Hψ 0Hψ 0UΓψ 0Γψ 0а)б)Рисунок 17.1Определение 17.1. Выпуклый компакт U ∈ conv Ω(E n ) называетсястрого выпуклым в направлении ненулевого вектора ψ 0 ∈ E n , еслиопорное множество Hψ0 компакта U состоит из единственной точки.Определение 17.2.
Выпуклый компакт U ∈ conv Ω(E n ) называетсястрого выпуклым, если он является строго выпуклым в направлениилюбого ненулевого вектора ψ 0 ∈ E n .Упражнение 17.1. Выяснить, какие из выпуклых компактов U являются строго выпуклыми:а) U = {u ∈ E n : u 1} ≡ S1 (0) – единичный шар;б) U = {u ∈ E 2 : |u1 | 1, |u2 | 1} – квадрат;в) U = {u ∈ E n : u∗ Qu 1} – компакт, ограниченный эллипсоидом,Q = Q∗ > 0 – симметричная положительно определённая матрица;г) U = conv{a, b} – отрезок, соединяющий точки a и b; a, b ∈ E n .Задача нахождения опорного множества возникает, например, прииспользовании принципа максимума, и является некоторым элементом решения задачи оптимального управления.
Во многих примерах спростым множеством U (отрезок, параллелепипед, шар и т.п.) задачанахождения опорного множества решается, исходя из наглядных геометрических соображений. Рассмотрим сейчас вопрос об аналитическом описании опорного множества Hψ0 для любого строго выпуклогокомпакта. Следующая теорема содержит аналитическое условие строгой выпуклости в терминах опорной функции c(ψ) и конструктивноеописание опорной точки при помощи градиента опорной функции.Теорема 17.1.
Пусть U ∈ conv Ω(E n ), c(ψ) – опорная функция169выпуклого компакта U , Hψ0 – опорное множество компакта U в направлении ненулевого вектора ψ 0 ∈ E n .A) Если в точке ψ 0 существует градиент c (ψ 0 ) опорной функции c(ψ), то опорное множество Hψ0 состоит из единственнойточки h0 , причём h0 = c (ψ 0 ), т.е. опорная точка h0 совпадает сградиентом опорной функции в точке ψ 0 .B) Если опорное множество Hψ0 выпуклого компакта U состоитиз единственной точки h0 , то опорная функция c(ψ) имеет вточке ψ 0 градиент c (ψ 0 ), причём c (ψ 0 ) = h0 .2 Проверим сначала утверждение A). Возьмём произвольную точку u0 ∈ Hψ0 и докажем, чтоu0 = c (ψ 0 ).(3)Этим будет закончено доказательство утверждения A).
Чтобы установить (3), рассмотрим вспомогательную функциюG(ψ) = c(ψ) − (ψ, u0 ).Она удовлетворяет условиямG(ψ 0 ) = 0,(4)G(ψ) 0 ∀ ψ ∈ E .n(5)Равенство (4) вытекает из определения множества Hψ0 , см. (2). Неравенство (5) следует из определения опорной функции, см.
(1), так какu0 ∈ Hψ0 ⊂ U . Условия (4), (5) влекут неравенствоG(ψ) G(ψ 0 )∀ ψ ∈ En,это означает, что функция G(ψ) имеет минимум в точке ψ 0 . Крометого, в точке ψ 0 функция G(ψ) имеет градиентG (ψ 0 ) = c (ψ 0 ) − u0 .(6)Необходимое условие минимума G (ψ 0 ) = 0, в силу (6), приводит кравенству (3). Утверждение A) доказано.Докажем теперь утверждение B) теоремы 17.1.
Для этого сначалаустановим существование такого вектора g ∈ E n , чтоc(ψ 0 + λχ) − c(ψ 0 )= (χ, g)λ→+0λlim170(7)для любого вектора χ ∈ E n , причём(8)g = h0(предел (7) есть производная опорной функции c(ψ) в точке ψ = ψ 0 внаправлении вектора χ).Возьмём любой вектор χ ∈ E n ; так как ψ 0 = 0, то при достаточномалых λ > 0 вектор ψ 0 + λχ отличен от нуля и определено опорноемножество Hψ0 +λχ = ∅. Выберем в последнем множестве произвольную точку(9)uλ ∈ Hψ0 +λχ .По условию утверждения B) теоремы 17.1 Hψ0 = {h0 } и потомуuλ |λ=0 = h0 .
Используя определение опорной функции (1), опорного множества (2) и учитывая выбор точек uλ , см. (9), запишем двасоотношения(ψ 0 , uλ ) c(ψ 0 ) = (ψ 0 , h0 ),000(ψ + λχ, h0 ) c(ψ + λχ) = (ψ + λχ, uλ ).(10)(11)Умножив (10) на минус единицу, перепишем его в форме−(ψ 0 , h0 ) = −c(ψ 0 ) −(ψ 0 , uλ ).Почленное сложение двух последних соотношений приводит к двойному неравенствуλ(χ, h0 ) c(ψ 0 + λχ) − c(ψ 0 ) λ(χ, uλ ),из которого получаем при λ > 00c(ψ 0 + λχ) − c(ψ 0 )− (χ, h0 ) (χ, uλ − h0 ) .λ(12)Докажем теперь, что при λ → +0uλ − h0 → 0.(13)Если допустить, что (13) неверно, то существуют число δ > 0 и по∞следовательность чисел {λk }k=1 , λk > 0, λk → +0 (k → ∞), такие,что(14)uλk − h0 δ > 0 ∀k = 1, 2, .
. .171Последовательность uλk ограничена, так как все uλ ∈ Hψ0 +λχ ⊂ U ,а U – компакт; поэтому из неё можно выделить сходящуюся к некоторой точке v ∈ U подпоследовательность. Не меняя обозначений, будемсчитать, что сама последовательность uλk сходится к точке v. Тогда,записав равенстваc(ψ 0 + λk χ) = (ψ 0 + λk χ, uλk )и переходя в них к пределу при k → ∞ (λk → +0, uλk → v), в силунепрерывности опорной функции, приходим к равенствуc(ψ 0 ) = (ψ 0 , v).Следовательно, v ∈ Hψ0 = {h0 }, и потому(15)v = h0 .Условия (14), (15) и предельное соотношение uλk → v при k → ∞противоречивы, что доказывает (13).
Из (12), (13) следует (7), (8).Остаётся показать, что существует градиент c (ψ 0 ) и c (ψ 0 ) = h0 .Ниже будет установлено, что приращение опорной функции можнозаписать в виде:c(ψ 0 + ∆ψ) − c(ψ 0 ) = (c (ψ 0 ), ∆ψ) + ō¯(∆ψ),∆ψ → 0.Для этого достаточно показать, чтоΦ(∆ψ) → 0 при∆ψ → 0,(16)гдеc(ψ 0 + ∆ψ) − c(ψ 0 )∆ψΦ(∆ψ) =− h0 ,,∆ψ∆ψ∆ψ > 0.Предположим& противное. Тогда найдутся: число ε > 0, последователь%ность ∆ψk (∆ψk = 0, ∆ψk → 0 при k → ∞), номер K такие, чтодля ∀k K выполняется неравенство|Φ(∆ψk )| ε > 0.Введём обозначения:λk = ∆ψk ,χk =172∆ψk∆ψk≡.∆ψk λk(17)Тогда λk > 0, λk → 0 при k → ∞; χk ∈ S.
В силу компактности единичной сферы S из последовательности {χk } можно выбратьсходящуюся к некоторой точке χ̄ ∈ S подпоследовательность. Безограничения общности будем считать, что сама последовательностьχk → χ̄, k → ∞. Тогда, вводя дополнительные обозначенияc(ψ 0 + λk χk ) − c(ψ 0 )− (h0 , χk ) ,λkc(ψ 0 + λk χ̄) − c(ψ 0 )− (h0 , χ̄) ,rk =λkπk ≡ Φ(∆ψk ) =имеем rk → 0 при k → ∞, в силу (7), (8).