Деменков Н.П. Вычислительные аспекты решения задач оптимального управления (2007) (1253737), страница 18
Текст из файла (страница 18)
е. от t0 до tk ).Подстановка вариаций δp (t ) из соотношения (4.52) в выражение для вариации управления⎛ ∂2 H ⎞δu (t ) = − ⎜ 2 ⎟⎝ ∂u ⎠−1т⎛ ∂2 H⎞⎛ ∂f ⎞δu + ⎜ ⎟ δp ⎟ ,⎜⎜⎝ ∂u ∂x⎟⎠⎝ ∂u ⎠полученного из (4.48),дает⎛ ∂2 H ⎞δu (t ) = − ⎜ 2 ⎟⎝ ∂u ⎠−1 ⎡т⎤⎛ ∂ 2 H ⎛ ∂f ⎞ т ⎞⎛ ∂f ⎞⎢⎜+ ⎜ ⎟ S ⎟ δx + ⎜ ⎟ Rd ν ⎥ . ( 4.69)⎝ ∂u ⎠⎢⎜⎝ ∂u ∂x ⎝ ∂u ⎠ ⎟⎠⎥⎣⎦GВеличина dν вычислена в (4.68) в точке t = t0 .Рассматривая (4.69) как закон управления с обратной связью,Gвидим, что величину dν необходимо вычислять либо в несколькихпромежуточных точках по времени, либо непрерывно. Для непрерывного случая выражение (4.69) примет вид−1т⎛ ∂ 2 H ⎞ ⎡⎛ ∂ 2 H ⎛ ∂f ⎞δu (t ) = −⎜ 2 ⎟ ⎢⎜+ ⎜ ⎟ S − RQ −1RT⎝ ∂u ⎠ ⎢⎝⎜ ∂u ∂x ⎝ ∂u ⎠⎣(≡ Λ1 (t )δx −Λ 2 (t )δφ.т⎤⎞⎛ ∂f ⎞−1 ⎥xRQδ+δφ≡⎟⎜⎝ ∂u ⎟⎠⎟⎠⎥⎦)(4.70)Это непрерывный линейный закон управления с обратнойсвязью, при котором терминальные условия имеют требуемыемалые отклонения δφ, а критерий качества J достигает минимума.
Поэтому полученный закон управления целесообразно назвать оптимальным законом управления в окрестности номинальной траектории (или оптимальным законом управления пососедним траекториям).Такой тип управления совпадает с линейным законом управления с обратной связью u = K x .137В этом случае весовыми коэффициентами в квадратичном критерии качества являются частные производные второго порядка отгамильтониана исходной вариационной задачи, а линейными уравнениями объекта – линейные уравнения возмущенного движенияотносительно оптимальной номинальной траектории.Блок-схема оптимального управления для соседних траекторий, основанного на уравнении (4.70), приведена на рис. 4.2.Если состояние системы описывается тремя и более переменными, то объем вычислительной работы, а также объем памяти,которые необходимы для определения нелинейного оптимальногозакона управления с обратной связью методом динамическогопрограммирования, катастрофически возрастают из-за большогоколичества числового материала, с которым приходится иметь дело.
Для практических целей следует рассматривать управление собратной связью для возмущенного движения, т. е. управление вокрестности номинальной траектории.Если номинальная траектория оптимальна, то использованиекоэффициентов усиления, определенных методом обратной прогонки, приводит к соседним оптимальным траекториям. Этот типуправления совпадает с линейным законом управления с обратнойсвязью. При этом весовыми коэффициентами в квадратичном критерии качества являются частные производные второго порядка отгамильтониана исходной вариационной задачи (см. формулу(4.52)), а линейными уравнениями объекта – линейные уравнениявозмущенного движения относительно номинальной оптимальнойтраектории (см.
уравнение (4.46)).4.3.2. Достаточные условия локального минимумаДля существования соседних экстремальных траекторий (экстремальных в слабом смысле, т. е. при малых отклонениях δx иδu ) достаточно выполнения следующих условий.Условие выпуклости Лежандра–Клебша:∂2 H> 0,∂u 2т. е. матрица138∂2 Hположительно определена при t0 ≤ t ≤ tk .∂u 2(4.71)139Рис. 4.2. Блок-схема оптимального управления по соседним траекториямУсловие нормальности:Q(t) < 0,(4.72)т. е.
матрица Q отрицательно определена при t0 ≤ t ≤ tk .Условие Якоби – условие отсутствия сопряженных точек натраектории.Матрица[ S (t ) − R (t )Q −1 (t ) R т (t )](4.73)ограничена при t0 ≤ t ≤ tk .Условия (4.71) – (4.73) совместно с необходимыми условиями(4.39) – (4.44) образуют систему достаточных условий локальногоминимума критерия качества J на рассматриваемой траектории.Смысл условий выпуклости заключается в том, что управлениеu (t ) определяется минимизацией гамильтониана H по u прификсированных значениях x , p и t. Если H – гладкая функция иограничения на управление отсутствуют, то должны выполнятьсяусловия∂H= 0,∂u∂2 H≥ 0.∂u 2Условие нормальности позволяет интерпретировать уравнение(4.68) следующим образом.
Малые изменения отклонения δφ могут быть получены при малых изменениях отклонения δν только вслучае невырожденности матрицы Q(t ) на t0 ≤ t ≤ tk . Если∂2 HG > 0, то из условия∂u 2⎛ ∂2 H ⎞Q = R ⎜ 2 ⎟⎝ ∂u ⎠т−1т⎛ ∂2 f ⎞⎜ ∂u ⎟ R ,⎝⎠Q(tk ) = 0,вытекает, что Q ≥ 0. Поскольку Q(tk ) = 0, то, следовательно, Q(t ) ≤ 0.140Если S − RQ −1R т → ∞ в точке t = t ′, где t0 ≤ t ′ ≤ tk , то необходимо, чтобы некоторая линейная комбинация δ x (t ′) была равнанулю. Это означает, что система допустимых возмущений имеетразмерность меньше чем n, где n – число переменных состояния.
Следовательно, поверхность постоянных значений J 0 в окрестности точки t = t ′ имеет излом (разрыв в частных производ∂2 J 0ных), поскольку→ ∞ при t = t ′. Если траектории продол∂x 2жить от t = t ′ в сторону t < t ′, то они уже не будут минимизирующими. Заметим, что если S → ∞, то это еще не обязательноозначает, что S − RQ −1R т → ∞.Рассмотрим в качестве примера выбор кратчайшей траекториина сфере между точкой О и большим кругом λ1 (рис. 4.3).Северный полюсМеридиан λ = λ1ϕО λРис. 4.3.
К задаче о кратчайшей траектории на сфереВыберем систему координат с началом в этой точке. Пусть окружность большого круга соответствует меридиану λ = λ1 , ϕ – широтаточки, λ – ее долгота.Элемент расстояния dS на поверхности сферы радиусом r определяется равенствомdS = r 2 (d ϕ) 2 + r 2 cos 2 ϕ(d λ ) 2 .141Задача стоит в отыскании управления u (λ ), минимизирующегокритерий качестваJ=λ1∫u 2 + cos 2 ϕd λ,0dϕ= u , ϕ(0) = 0.dλЛегко показать, что траектория u = 0, ϕ = 0 удовлетворяет необходимым условиям первого порядка, при этом J = λ1.Рассмотрим теперь траектории, лежащие в окрестности найденной экстремали, т.
е. соседние траектории.Обозначим u = δu , ϕ = δϕ и λ = δλ. Разложение критерия качества с точностью до членов второго порядка даетгдеλ1 1δJ = J − λ1 ≅ ∫ (u 2 − ϕ2 )d λ.20Для полученной присоединенной задачи на минимум гамильтониан имеет вид1H = (u 2 − ϕ2 ) + pu ,2а уравнения Эйлера–Лагранжа – видdp∂H=−= ϕ;dλ∂ϕp (λ1 ) = 0;∂H= u + p = 0.∂uИсключая переменные p и u с помощью соотношенияполучаемd 2ϕdλ1422+ ϕ = 0;ϕ (0) = 0;⎛ dϕ ⎞= 0.⎜⎟⎝ d λ ⎠λ=λ1dϕ= u,dλПри ϕ = A sin λ удовлетворяется дифференциальное уравнениеи начальное условие ϕ(0) = 0, но еще необходимо, чтобы⎛ dϕ ⎞= A cos λ = 0.⎜⎟⎝ d λ ⎠λ=λ1π,2ππи при любом A, если λ1 = . Заметим, что в том случае, когда λ1 = ,22Последнее равенство справедливо только при A = 0, если λ1 <δJ =12π2∫ (A2cos 2 λ + A2 sin 2 λ )d λ = 0.0Точка О называется фокальной, или сопряженной, точкой дляπλ = в данной задаче.2Другой способ решения задачи основан на использованииуравнения Риккати.
Принимая во внимание, что в рассматриваемом примереA = 0; B = 1;∂2 H∂2 H∂2 H=−1;=0;= 0 = 1,∂ϕ∂u∂ϕ2∂u 2получаем уравнение РиккатиdS= S 2 + 1; S (λ1 ) = 0.dϕОно легко решается:S = – tg(λ1 – λ).πВидно, что S → ∞ при λ1 = λ → . Таким образом, сопряжен2πная точка существует, когда λ1 − λ = .2143Оптимальный закон управления с обратной связью для соседних траекторий имеет видδu (t ) = [tg (λ1 − λ )]δϕ.Заметим, что коэффициент усиления k = tg (λ1 − λ ) > 0 дляπ0 ≤ λ1 − λ ≤ .2Рассмотрим управление возмущенным движением для выведения КА на орбиту с максимальной горизонтальной скоростью вyaVxKϑhg0 t0tkxРис.
4.4. Выведение КА на орбитуконце участка выведения (рис. 4.4). При допущениях y = const;a = const; время tk задано; V y = 0; Vxk = Vmax имеемtg(v) = tg( ν0 ) + (tg( νk ) − tg( ν0 ))t;t k − t0 = TV = a sin(ν) − y; V (0) = 0;144y = V ; y (0) = 0;tky = a ∫ cos(ν)dt.0Соседние экстремали описываются уравнениями (4.65) – (4.67)с граничными условиями (4.58) – (4.60).В рассматриваемом случаеQ(tk) = 0; Φ1 = V y ; Φ 2 = y − h;H = a cos(ν) + p1 (a sin(ν) − y ) + p2V ;p1 = V1 + V2 (T − t ) = tg( ν);p2 = V2 ;∂2 H∂2 H=0;G = − a cos(ν) − p1a sin(ν) ≡ − a sec(ν);G∂x 2∂ν 2⎡0 0⎤A=⎢⎥ , fν =⎣1 0 ⎦⎡ a cos(ν) ⎤⎡1 0 ⎤3⎢ 0 ⎥ ; C = 0; B = − a cos (ν) ⎢0 0 ⎥ ; S = 0.⎣⎦⎣⎦Выражение для оптимального закона управления имеет следующий вид:δυ =cos 2 υ[Q22 − (T − t )Q12 ,2Q11 − Q22 − Q12⎛ δυk − δυ⎞⎟.(T − t )Q11 − Q12 ] ⎜⎜⎟⎝ δyk − [(T − t )δυ + δy ] ⎠Для реализации такого закона управления необходимо знаниеноминальной траектории.145ГЛАВА 5. ПРОГРАММНЫЙ КОМПЛЕКСДЛЯ РЕШЕНИЯ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯДля решения задач оптимального управления на кафедре «Системы автоматического управления» МГТУ им.
Н.Э. Баумана разработан программный комплекс «Методы оптимизации», в основе которого лежит использование пакетаMatlab [17].Рис. 5.1. Программный комплексКомплекс «Методы оп«Методы оптимизации»тимизации» предназначендля нахождения оптимального управления с помощью косвенныхметодов оптимизации: классического вариационного исчисления,Рис. 5.2. Методы оптимизацииРис. 5.3. Задачи оптимизациипринципа максимума и динамического программирования для решения различных задач (рис. 5.1–5.4).146Рис.