В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем (1158263), страница 27
Текст из файла (страница 27)
Полагать, чтоприближенно разрыв происходит в узле сетки нельзя, так как решение задачи может быть чувствительно к моменту разрыва управления.195Пусть для простоты H = H0 + H1 u. В каждом узле сетки надо отслеживать знак величины H1 и ее производной, чтобы исключить случай, когда на отрезке интегрирования дважды происходит смена знакаH1 . Далее точка разрыва уточняется методом хорд (см. рис.27.1). Какправило, хватает 1-2 итераций.Вторая сложность, с которой можно столкнуться при использовании метода Ньютона при решении двухточечной задачи, заключается втом, что в некоторых случаях при вариации z матрица F (z) становитсявырожденной.
Но численное построение не улавливает вырожденности матрицы Z, так как на практике она плохо обусловлена и в методеНьютона вычисляется неправильное, случайное направление спуска.Здесь помогает следующий прием. Необходимо провести регуляризацию и вместо (27.5) решать так называемую нормальную задачу(F F + εE)Δz = −F X(z 0 ),(27.7)где величина ε мала по сравнению с элементами матрицы F .Кроме того полезна нормировка системы, при которой одни и те жевариации z приводят к примерно равным вариациям компонент невязки X.Для этого решается нормированная задача минимизацииmin X SX = s1 X12 + s2 X22 + s3 X32 ,где выбор si осуществляется по формуламs2i ≈ 1/n ∂Xi 2 .∂zjj=1Это существенно улучшает сходимость метода Ньютона.Ниже рассмотрим пример [20], в котором принципиально нельзярешить двухточечную краевую задачу методом стрельбы.Пример 27.1.
Задача о плоте.Рассмотрим задачу движения плота через речку с известным профилем течения. Пусть требуется в фиксированныймомент времени максимально удалиться вдоль реки от точкистарта.Профиль течения зададим в виде V (y) = 1 − y 2 . Управление плотом осуществляется перпендикулярно течению ẏ = u, где ускорениеплота ограничено |u| ≤ 1.
Сделаем замену x1 = x, x2 = y, x3 = t.196Уравнения управляемой системы следующие:⎧2x1 (0) = 0,⎪⎨ ẋ1 = 1 − x2 ,x2 (0) = −1,ẋ2 = u,|u(t)| ≤ 1⎪⎩x3 (0) = 0.ẋ3 = 1,(27.8)Терминальное множество M = {x3 (tk ) = T }.Минимизируемыйфункционалݽϕ0 = −x1 (tk ) → min .u0ܽРис. 27.2.
Профиль скоростиФункцияПонтрягинаимеетвидH = ψ1 (1 − x22 ) + ψ2 u + ψ3 .Сопряженная система⎧⎪ψ̇ = 0,⎪⎨ 1(27.9)ψ̇2 = 2ψ1 x2 ,⎪⎪⎩ ψ̇ = 0.3Из условия трансверсальностиψ(tk ) + λ0 (−1, 0, 0) ⊥ M = (γ1 , γ2 , 0)следует ψ1 (tk ) = λ0 и ψ2 (tk ) = 0.Докажем, что λ0 == 0. Пусть λ0 = 0, тогда ψ1 ≡ 0 =⇒ ψ2 ≡ 0.Тогда из условия H(t) ≡ 0 =⇒ ψ3 ≡ 0 и получаем нулевую пару, чтопротиворечит ПМП. Следовательно, ψ1 > 0 и можно нормироватьψ1 = 12 .Получили двухточечную задачу++ẋ2 = ux2 (0) = −1(27.10)ψ2 (T ) = 0ψ̇2 = x2Вектор z (в данной задаче скаляр) зададим как z1 = ψ2 (0).При T ≤ 1 решение краевой задачи следующее1ψ2 (t) = t2 /2 − t + z1 = [(t − 1)2 − (T − 1)2 ]x2 (t) = −1 + t,2Если 1 ≤ T , то в этой задаче существует особый режим на участке[t∗ , T ], где ψ2 (t) ≡ 0 и, cледовательно, x2 (t) ≡ 0, а uoc = 0.Проверьте, что условие Келли выполнено и особый участок является оптимальным.197¾¾ 10.41.0 ¾¾1.401¼½Рис.
27.3. Поведение решения при изменении начальных условийИз предыдущей формулы следует, что начало особого режима естьточка t∗ = 1 и оптимальное решение имеет вид:++x2 (t) = −1 + t при t ≤ 1ψ2 (t) = 12 (t − 1)2 при t ≤ 10при t ≥ 10при t ≥ 1Решение получается с начальным условием z1 = 12 . Наличие особогорежима приводит к тому, что невозможно методом стрельбы получитьрешение задачи. Действительно, если мы получим решение с любойточностью z1 = 12 ± ε, то соответствующая экстремаль (при ошибке−ε) будет такой+√ψ2 (t) = 12 (t − 1)2 − ε при t ≤ t∗√t∗ = 1 − 2ε,1∗ 2∗∗ψ2 (t) = − 2 (t − t ) − 2ε(t − t ) при t ≥ t+x2 (t) = −1 + t при t ≤ t∗√x2 (t) = − 2ε − (t − t∗ ) при t ≥ t∗Вид решений изображен на рис.27.3.Видно накопление ошибки (невязки) (ψ2 (T ) − 0) к концу интервала [0, T ], вследствие чего невозможно численно решить задачу пристрелки.
Как видно из рис. 27.3, в решении по x2 тоже накапливаетсяошибка.Выход здесь состоит в том, что нужно перейти к модифицированному методу пристрелки, вводя промежуточную точку z2 = t∗ и соответствующую невязку X2 (z1 , z2 ) = x2 (t∗ ). По такой схеме удаетсячисленно найти решение.198Лекция 28Задача Булгакова о накоплениивозмущений и максиминное тестированиекачества стабилизации1. Задача Булгакова о накоплении возмущенийРассмотрим задачу оптимального управления с фиксированнымвременем, где для простоты применяется скалярное управлениеẋ = Ax + Bu,x(0) = 0,u(·) ∈ U,t ∈ [0, tk ],(28.1)а функционал представляет квадрат нормы вектора состояния в концепроцессаJ(u) = ϕ0 (x(tk )) = x(tk )2 → max .u(·)≤μВпервые на возможность применения вариационного метода для решения такого рода задач обратил внимание профессор МГУ Б.В.
Булгаков. В 1939 г. он поставил и решил задачу о влиянии северной составляющей скорости корабля на отклонение гирокомпаса. Относительно скорости предполагалось известным только то, что она является кусочно-непрерывной функцией, ограниченной по модулю. Былопоказано, что наихудшая ситуация осуществляется тогда, когда корабль идет с максимальной скоростью вперед и назад по меридиану,меняя курс на обратный через каждый полупериод собственных колебаний гирокомпаса, и найдено максимальное отклонение гирокомпасаот направления на север.
В 1946 г. Б.В. Булгаков дал полное решениезадачи о максимальном отклонении линейной системы по одной координате [15].Рассматриваемая экстремальная задача представляет собойобобщение задачи Б.В. Булгакова о накоплении возмущений.Как было сказано выше, Б.В. Булгаковым была решена задача омаксимальном отклонении по одной координате, т.е. для линейногофункционала J(u) = cT x(tk ), где c — заданный вектор.Решение этой задачи легко получить из принципа максимума. Налекции 18 мы получили с помощью ПМП решение задачи оптимального управления с фиксированным временем, терминальным функционалом и свободным концом траектории.199Рассматриваемая нами задача Б.В. Булгакова полностью укладывается в постановку задачи лекции 18, где функционал качества — линейный вида ϕ0 (x(tk ) = −c x(tk ).Выпишем функцию Понтрягина H = ψ (Ax+Bu) и сопряженнуюсистему⎧ψ̇ = − A ψ⎨(28.2)⎩ ψ(tk ) = − ∂ϕ0 = c.∂xОптимальное возмущение, доставляющее максимум функционалу,следующее:+u0 (t) =μ−μпри ψ T (t)B(t) ≥ 0,при ψ T (t)B(t) < 0.¾ª¼ ´ µ0½Рис.
28.1. Решение линейной задачи о максимальном отклоненииψ(tk ) = −(28.3)Это решение имеет простой геометрический смысл(см. рис.28.1) — достигается максимальная проекция множества достижимости Ω(tk ) на направление,заданное вектором c.Вернемся теперь к исходной задаче — с нелинейным функционалом вида ϕ0 = x (tk )x(tk ).Тогда из ПМП следуеткраевое условие для сопряженной системы∂ϕ0= 2x0 (tk ).∂yПроблема решения двухточечной задачи в том, что мы не знаем x0 (tk ).Трудности решения двухточечной задачи методом стрельбы обсуждались на прошлой лекции.Применим для решения задачи оптимизации прямой метод — метод условного градиента.Метод условного градиента. Опишем метод условного градиента для решения следующей конечномерной задачи:J(u) → min ,u(·)∈U200где U — замкнутое ограниченное множество в евклидовом пространстве Rs , причем функционал J (функция) непрерывно дифференцируем J(u) ∈ C 1 (U ).Обозначим u0 ∈ U — некоторое начальное приближение.
Пустьi-ое приближение известно ui ∈ U . Рассмотрим главную линейнуючасть gi (u) приращения ΔJ: gi (u) = ∇J(ui ) (u − ui ), где вектор∇J(u) = ∂J∂u ) . Найдем вспомогательное приближение ũi из условия∇J(ui ) (ũi − ui ) = min ∇J(ui ) (u − ui ))uили, что то же, из условия∇J(ui ) ũi = min ∇J(ui ) u.u∈U(28.4)Можно показать, что минимум в (28.4) достигается хотя бы на одномũi ∈ U .Затем полагаемui+1 = ui + αi (ũi − ui ),αi ∈ [0, 1],(28.5)где параметр αi может быть выбран одним из способов:• αi определяется условиемϕi (αi ) = min ϕi (α),0≤α≤1(28.6)где ϕi (α) = J(ui + α(ũi − ui ))• если градиент удовлетворяет условию Липшица∇J(u) − ∇J(w) ≤ Lv − w,то можно положить!"γi |gi (ũi )|αi = min 1;,ũi − ui 20 < ε 1 γi 2,L + 2εгде ε1 , ε > 0 — параметры метода• задать αi = 1, проверить условие монотонности J(ui+1 ) <J(ui ) и при необходимости положить αi = 12 αi , пока не выполнится условие монотонности.Доказана сходимость метода условного градиента к стационарнойточке функционала J для последовательности {ui }, определяемой методом при любом выборе начального приближения u0 ∈ U .Для бесконечномерной задачи шаг алгоритма условного градиентапредставляет собой решение задачи Булгакова для линейного функiционала Jk (u) = ci x(tk ), где ci = 2x (tk ).201¾¼ ´ µª0½¼½Рис.
28.2. Алгоритм решения задачи БулгаковаТогда при каждом t решение линейной одномерной задачи приводит к формуле (28.3).Отсюда следует, что шаг метода условного градиента (при αi = 1)полностью совпадает с решением соответствующей задачи Булгакова(совпадает с решением ПМП) и имеет тот же геометрический смысл:найдена максимальная проекция множества достижимости системыΩtk на направление c (см. рис.28.2).Для случаев n = 2, 3 доказана сходимость этого метода [12] в задаче Булгакова.Действительно (при n = 2), на текущем шаге решается задачаiJ i+1 = max xi x(tk ) = xi xi+1 > xi xi = J ,x(tk )∈Ωесли xi+1 = xi .
Вычисления прерываются, когда выполнено равенство и, следовательно, xi = xi+1 .Метод Крылова-Черноусько. Рассмотрим теперь нелинейныйвариант задачи (28.1), т.е. управляемую систему с фиксированнымвременем и свободным правым концом траекторииẏ = f (y, u),y(t0 ) = y ∗ ,u(·) ∈ U,t ∈ [t0 , tk ],(28.7)и терминальным функционаломJ(u) = ϕ0 (y(tk )) → min .u(·)∈UИсходя из ПМП оптимальное управление находится из решениякраевой Б.В Булгакова задачи относительно переменных ψ(t), y(t):+y(t0 ) = y ∗ ,ẏ 0 = f (y 0 , u0 ),(28.8)∂ϕ0,ψ̇(t) = −Hy (y 0 , u0 )ψ(t), ψ(tk ) = −∂y202H(ψ(t), y 0 (t), u0 (t)) = max H(ψ(t), y 0 (t), u(t)).u(t)∈Ω(28.9)В работе [28] был предложен следующий алгоритм поиска оптимального управления:Пусть задано некоторое начальное приближение u(t) = ui (t).1) При известном ui можно проинтегрировать систему (28.7) и вы0числить y i (t).