В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем (1158263), страница 20
Текст из файла (страница 20)
в расширенном пространстве она параллельна (γ1 , γ2 , . . . , γn , 0) = (γ , 0).136Рассмотрим условие ортогональности ∂ϕ0 γ + ψn+1 · 0 = 0ψ(tk ) + λ0∂y 0 Поскольку γ произвольное, то ψ(tk ) = −λ0 ∂ϕ. Если λ0 = 0, то∂yψ(tk ) = 0. Из условия H̃(tk ) = 0 следует ψn+1 (tk ) = 0, откуда (всилу однородности сопряженной системы) ψ̃ ≡ 0, что противоречитпринципу максимума.Следовательно, λ0 > 0 и можно нормировать λ0 = 1. Тогда изусловия 1 теоремы ПМП следует (18.7) как необходимое условие слабого локального минимума.137Лекция 19Лагранжева форма необходимых условийоптимальности1. Задача Больца в вариационном исчисленииПусть кривая y(t), t ∈ [t0 , tk ], y(t0 ) = y ∗ минимизирует функционалtktkJ = f0 (y, ẏ)dt + l(y(tk )) = L(y, ẏ)dt + l(y(tk )),t0t0где лагранжиан L(y, ẏ) и терминант l(y(tk )) — гладкие функции.Представим исходную задачу как задачу оптимального управления с фиксированным временем и применим принцип максимума изпредыдущей лекции.+y0 (t0 ) = 0ẏ0 = f0 (y, u)y(t0 ) = y ∗ .
В расширенном пространстве состояний ỹ = yy0 функционал можнопредставить как терминальный J = ϕ0 (ỹ(tk )) = y0 (tk ) + l(y(tk )).Ограничения на область значений управления отсутствуют, т.е.Ω = Rn .Рассмотрим функцию Понтрягина H̃ = ψ̃ f˜ = ψ0 f0 + ψ u. Учитывая, что∂ f˜0 ∂f0 /∂y=,00∂ ỹвыпишем сопряженную систему⎧⎨ ψ̇0 = 0(19.1)⎩ ψ̇ = − ∂f0 ψ0 .∂y∂ϕ0=Поскольку из условия трансверсальности следует ψ̃ (tk ) = −∂ ỹ ∂l ∂l(y(tk ))= − 1,., то получим ψ0 = −1, а ψ (tk ) = −∂y∂yТогда H̃ = −f0 (y, u) + ψ u.ẏ = u138Согласно условию оптимальности (18.7) на оптимальном решениивыполнено равенство∂ H̃(ψ(t), y 0 (t), u0 (t))= 0.∂uСледовательно∂ H̃∂f0=−+ ψ = 0,∂u∂u ∂f 0откуда ψ =.
Подставим полученное выражение для ψ в∂u(19.1), заменим f0 = L и транспонируем. В результате получим уравнение ЭйлераdLẏ = Ly .(19.2)dtИз условий трансверсальности получим краевое условие для уравнения Эйлера∂l(y 0(tk )(19.3)Lẏ (tk ) = −∂yИз условия станционарности гамильтониана на оптимальном решении H̃ = const следует интеграл энергии: функция E(t) = Lẏ ẏ −L ≡ const — постоянна на оптимальном решении системы. Действительно, поскольку f0 = L, а u = ẏ, получим на оптимальной траекторииH̃ = ψ u − f0 (y, u) = Lẏ ẏ − L = E(t) ≡ const .2. Лагранжева форма условий оптимальностиЛагранжеву форму принципа максимума Понтрягина получим напримере задачи управления при фиксированных начальных и конечных условиях: t0 , tk , y(t0 ), y(tk ).ẏ = f (y, u)u(·) ∈ U = {u(·) ∈ KC[t0 , tk ] u(t) ∈ Ω ⊂ Rs }(19.4)(19.5)tkf0 (y(t), u(t)) dt → minJ(u) =u(·)∈U(19.6)t0В соответствии с принципом Лагранжа [?] составим функционалttЛагранжа L(y, u, ψ, λ0 ) = λ0 t0k f0 dt + t0k ψ (ẏ − f )dt, где λ0 ≥0, ψ(t) — множители Лагранжа, поскольку математическая модель139(19.4) можно рассматривать как ограничение типа равенства ẏ −f (y, u) = 0.Пусть {y 0 (t), u0 (t)} — оптимальный процесс на [t0 , tk ].Рассмотрим Лагранжиан L = λ0 f0 +ψ (ẏ −f (y, u)).
Ему соответствует расширенная функция Понтрягина H̃ = ψ f −λ0 f0 = ψ ẏ−L.Для функционала L при фиксированном u0 (t) выпишем условиестационарности по траектории y(·):tkλ0∂f (y 0 (t), u0 (t))∂f0 (y 0 (t), u0 (t))x(t)+ψ (t) ẋ(t)−x(t) dt = 0.∂y∂yt0(19.7)Здесь x(t) = y(t) − y 0 (t) — вариация траектории y 0 (t).Произведем замену линейного оператора (ẋ(t) − A(t)x(t)), где00(t))на сопряженный ему оператор − ψ̇(t)−A (t)ψ(t) .A = ∂f (y (t),u∂yВ соответствии с определением сопряженного оператора (g, P x) =(P ∗ g, x) (здесь скалярное произведение (,) означает линейный функционал, а P ∗ — сопряженный оператор) покажем, что выполнено равенствоtkψ (t) ẋ(t) − Ax(t) dt =t0tk− ψ̇(t) − A (t)ψ(t) x(t)dt.t0Действительно,tk ψ ẋ − ψ Ax + ψ̇ x + ψ Ax dt =t0tk=−d(ψ x) = ψ (tk )x(tk ) − ψ (t0 )x(t0 ) = 0.t0Тогда условие стационарности (19.7) перепишем в видеtk ∂f0 (y 0 (t), u0 (t)) − ψ̇(t) + A ψ(t)λ0x(t) dt = 0.∂y(19.8)t0Оно выполнено при любых x(·) ∈ C[t0 , tk ] с конечными условиямиx(t0 ) = x(tk ) = 0.
Учитывая, что ψ(t) = Lẏ , из (19.8) получим в140лагранжевой форме ∂f (y 0 (t), u0 (t)) ∂f (y 0 (t), u0 (t)) d 0Lẏ = Ly ⇔ ψ̇ = −ψ+λ0,dt∂y∂y(19.9)что соответствует гамильтоновой формеψ̇ = −∂ H̃(y 0 (t), u0 (t), ψ(t))∂y(19.10)Поэтому в литературе по оптимальному управлению динамическимисистемами употребляются два названия для системы (19.9), (19.10):– сопряженная система дифференциальных уравнений, что соответствует сопряженному оператору;– уравнения Эйлера, что является расширением известных в теоретической механике уравнений Лагранжа второго рода для голономных консервативных систем.Перейдем теперь к формулировке принципа максимума в лагранжевой форме для задачи оптимального управления, сформулированной в 16-ой лекции, т.е. оптимального прихода на гладкое многообра= m} в смыслезие M = {ϕi (y(tk )) = 0, i = 1, .
. . , m rank ∂ϕ∂yi (y)jтерминального функционала (Маера) J = ϕ0 (y(tk )).Здесь лагранжиан.mзадачи имеет вид L = ψ (ẏ − f (y, u)), терминант — l(y(tk )) = i=0 λi ϕi , а функция Лагранжа —tkL(λ0 , . . . , λm , tk , ψ, y, u) =Ldt + l(y(tk )).t0Без доказательства сформулируем необходимые условия оптимальности в форме Лагранжа (доказательство можно найти в [?] ).Теорема 23.
Если {y 0 (·), u0 (·), [t0 , t0k ]} — оптимальный процесс, то существуют множители Лагранжа λ0 , λ1 , . . . , λm иψ1 , . . . , ψn не все равные нулю такие, что выполняются условия:а) стационарности по y(·):d∂f (y 0 , u0 )− Lẏ + Ly = 0, ⇔ ψ̇ = −ψ;dt∂yб)Lẏ (t0k ) = −ly (t0k ) ⇒ ψ (t0k )+λ0m∂ϕ0 (y(t0k ))∂ϕi (y(t0k ))=−λi∂y∂yi=1— условия трансверсальности;141в) стационарности по tk :Ltk = 0 ⇒ ly ẏ 0 (t0k ) = 0 ⇒ ψ (t0k )f (y 0 (t0k ), u0 (t0k )) = H(t0k ) = 0.Поскольку лагранжиан L не зависит явно от времени, существует интеграл для решений уравнения Эйлера, т.е. на оптимальной траектории выполнено условие E(t) = Lẏ ẏ − L = const.Поскольку на оптимальном решении L(t) ≡ 0, потому E(t) =Lẏ ẏ = ψ f = H(t) ≡ const .
Следовательно H(t) ≡ 0;г) минимума по u лагранжиана L = ψ ẏ − H:min L(ẏ 0 (t), y 0 (t), u) = L(ẏ 0 (t), y 0 (t), u0 (t)) ⇔u∈Ω⇔ max H(ψ(t), y 0 (t), u) = H(ψ(t), y 0 (t), u0 (t));u∈Ωд) неотрицательности множителя: λ0 ≥ 0.3. О связи вариационных принципов механики спринципом максимумаПусть дана система материальных точек с массами mi и коордиiiнатами ri = (y1i , y.2 , y3 ), i = 1, . .
. , n. Кинетическая энергия систеn1мы равна T = 2 i=1 mi ṙi2 , а потенциальная — задана функциейU (r1 , . . . , rn ). Из принципа Гамильтона–Остроградского следует, чтодвижение системы происходит по экстремалям функционала действияпо ГамильтонуtkS = L(r, ṙ)dt,(19.11)t0где лагранжиан имеет вид L(r, ṙ) = T − U , а моменты времени t0 , tk , атакже начальные и конечные условия фиксированы.Следовательно, выполнено уравнение Эйлера (19.2) для функционала действия (19.11):dLṙ = Lr ,dtкоторое представляет собой уравнения Лагранжа второго рода длясистемы материальных точек.Таким образом здесь уравнения движения получены из принципамаксимума как необходимого условия слабого локального минимумадля функционала действия по Гамильтону.Получим теперь уравнения Гамильтона.
Обозначим ψi = Lṙi =mi ṙi — импульсы материальных точек системы.142.Функция Понтрягина H =ψi ṙi − T + U = T + U представляет полную энергию системы и связана преобразованием Лежандра сфункцией L.Уравнения Эйлера в канонической (гамильтоновой) форме принимают вид∂Hψi∂H∂U=,ψ̇i = −=−.ṙi =∂ψimi∂ri∂riПервая группа уравнений представляет определение импульса, а вторая — второй закон Ньютона для системы материальных точек.Таким образом в случае потенциальных сил, уравнения Лагранжавторого рода (их гамильтонову форму) можно получить из принципамаксимума Понтрягина.143Лекция 20Оптимальная стабилизация принеограниченных ресурсах1. Управление линейной системой с квадратичнымфункционалом качества на конечном интервалевремениРассмотрим уравнения в отклонениях от программного движенияẋ = Ax + BΔu,x(t0 ) = 0,u = up + Δu∂f где x = y − y p , A = ∂f∂y y=y p , B = ∂u u=up .
В дальнейшем для простоты будем считать up = 0.Функционал качества имеет видtkJ(u) = (x Gx + u N u)dt → minu(·)t0Здесь G = G > 0, N = N > 0 — симметричные матрицы, т.е.поставлена задача минимизации отклонений и ресурсов управления наотрезке времени t ∈ [t0 , tk ], t0 < tk ≤ ∞.Обозначим оптимальное решение задачи u0 (·) ∈ KC 1 [t0 , tk ].Перепишем задачу в в виде+ẋ0 = x Gx + u N u,x0 (t0 ) = 0,x(t0 ) = x∗ . Введем расширенный вектор состояния x̃ = xx0 и запишем функционал в виде J = ϕ0 (x̃(tk )) = x0 (tk ).Рассмотрим функцию Понтрягина H̃ = ψ0 (x Gx + u N u) +ψ (Ax + Bu) и сопряженную систему+ψ̇0 = 0ẋ = Ax + Bu,ψ̇ = −A ψ − 2(Gx)ψ0 .Краевые условия (трансверсальности) для сопряженной системы ∂ϕ0 (x̃(tk )) ∂ϕ0 (x̃)имеют вид ψ̃(tk ) = −λ0= (1, 0, .
. . , 0).. Но∂ x̃∂ x̃14411, тогда ψ0 ≡ − , а ψ(tk ) = 0. Следовательно,22сопряженную систему можно записать как ψ̇ = −A ψ + Gx.Необходимое условие оптимальности имеет видНормируем λ0 =∂ H̃=0∂u∀t ∈ [t0 , tk ].Из условия оптимальности следует −u N + ψ B = 0. Так как N > 0,тоu0 = N −1 B ψ.Будем искать решение сопряженной системы в виде ψ(t) =−L(t)x, где симметричная матрица L ∈ Mn×n (R) > 0. Тогда u0 =−N −1 B Lx иψ̇ = −L̇x − Lẋ = −L̇x − L(Ax + Bu) = −L̇x − L(Ax − BN −1 B Lx).С другой стороны, согласно сопряженной системе ψ̇ = A Lx + Gx,поэтому(A L + G)x = (−L̇ − LA + LBN −1 B L)x.Поскольку x — произвольное решение системы, получим матричное уравнение — уравнение Риккати для управляемой системыL̇ + LA + A L + G − LBN −1 B L = 0,L(tk ) = 0.Заметим, что краевое условие этого уравнения задано на правом концеt = tk .2.