В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем, страница 25
Описание файла
PDF-файл из архива "В.В. Александров, С.С. Лемак, Н.А. Парусников - Лекции по механике управляемых систем", который расположен в категории "". Всё это находится в предмете "механика управляемых систем" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 25 страницы из PDF
Пусть {y 0 (·), u0 (·),[t0 , t0k ]} — оптимальный процесс, т.е.1) выполнен ПМП;˜ ⊂ [t , t0 ] H (t) ≡ 0 выполнено2) на особом участке ∀t ∈ (t̃, t̃)0 k10|u (t)| < μ;Тогда для оптимальности u0 необходимо выполнение неравенства 2d∂H1 (t) ≥ 0∂u dt21802. Скобки ПуассонаПокажем, что условие Келли можно записать в форме{H1 (t), {H1 (t), H0 (t)}} ≤ 0.Рассмотрим скобки Пуассона: пусть α(y, ψ) и β(y, ψ) — гладкиескалярные функции векторных аргументов.
Оператор∂α ∂β ∂α ∂β −{α, β} =∂y ∂ψ∂ψ ∂yназывается скобками Пуассона.Перечислим основные свойства скобки Пуассона:1) {α, β} = −{β, α};2) {α, α} = 0;3) {α, β + γ} = {α, β} + {α, γ};4) {α, cβ} = c{α, β},c ∈ R.Заметим, что скобки Пуассона широко используются в аналитической механике.Как было показано в лекции 23 оптимальное решение задачи может быть записано в гамильтоновой форме⎧ ∂H ⎪⎪,⎨ ẏ =∂ψ ∂H ⎪⎪⎩ ψ̇ = −.∂yРассмотрим произвольную гладкую функцию S(y, ψ). Тогда производная в силу системыdS∂S ∂H ∂S ∂H =−= {S, H}.dt∂y ∂ψ∂ψ ∂yВ нашем случае H = H0 + H1 u и в качестве функции S выберем˜ где H (t) ≡ 0. Вычислим производную вH1 на особом участке (t̃, t̃),1силу системыdH1= {H1 , H} = {H1 , H0 + H1 u} =dt= {H1 , H0 } + u1 {H1 , H1 } = {H1 , H0 } ≡ 0.d2 H1d= {H1 , H0 } = {{H1 , H0 }, H} = {{H1 , H0 }, H0 + H1 u} =dt2dt= {{H1 , H0 }, H0 } + {{H1 , H0 }, H1 }u ≡ 0Условие Келли приводит к неравенству∂ d2 H1= {{H1 , H0 }, H1 } ≥ 0∂u dt2˜∀t ∈ (t̃, t̃),181откуда следует неравенство{H1 , {H1 , H0 }} ≤ 0.Если неравенство строгое, тоu0 ={{H1 , H0 }, H0 }{H1 , {H1 , H0 }}.Если же {H1 , {H1 , H0 }} = 0, то не можем определить u01 .
Этоозначает, что особая траектория имеет более высокий порядок и надо продолжить дифференцирование H1 .˜ ⊂Определение 22. Порядком особой траектории на t ∈ (t̃, t̃)[t0 , t0k ] называется целое число q ∈ N такое, что ∀s0, 1, 2, . . . , 2q − 1 выполнено s⎧∂∂H(ψ, y)d⎪⎪≡ 0, s = 0, 1, ..., 2q − 1,⎨ ∂u dts∂u 2q ⎪∂H(ψ, y)d∂⎪⎩= 0,∂u dt2q∂u=где (ψ, y) принадлежит некоторой открытой окрестности(ψ, y 0 ).Таким образом, приходим к следующей формулировке.Теорема31(ОбобщенноеусловиеКелли).Пусть{y 0 (·), u0 (·), [t0 , t0k ]} оптимальный процесс, т.е.1) выполнен ПМП;2) особый участок имеет порядок q.Тогда для оптимальности особого участка необходимо выполнение неравенства 2q ∂H(ψ, y)d∂(−1)q≤ 0.(25.2)∂u dt2q∂uУсловие (25.2) для случая q = 2 называют условием КоппаМойера [16].3.
Структура оптимального управленияРассмотрим вопрос о сопряжении регулярного и особого участковоптимальной траектории. Возможны следующие случаи, изображенные на рис. 25.2.1) Разрыв управления в точке сопряжения t̃. Регулярный случай,управление слева и справа от t̃ принимает значения на концах отрезкаΩ.182¼¼ ªª¼1)2)Рис. 25.2. Сопряжение особого и регулярного участков:случай 1,22) Особый случай.
В точке сопряжения регулярной и особой траектории управление терпит разрыв u(t̃ − 0) = u(t̃ + 0). В этом случаепорядок особой траектории q должен быть нечетным, что следует изсформулированной ниже теоремы.¼ ª¼ ª3)4)Рис. 25.3. Сопряжение особого и регулярного участков:случай 3,4Теорема 32 ( Келли, Копп, Мойер,1967). Пусть оптимальная тра˜ имеет второй (илиектория y 0 (t) на особом участке t ∈ (t̃, t̃)любой четный) порядок q и выполнено условие Келли в строгойформе 2q ∂H(ψ, y)dq ∂(−1)< 0.∂u dt2q∂uТогда особый участок траектории y 0 не может сопрягатьсяс регулярной (не особой) кусочно-гладкой траекторией y 0 , если управление u0 в точке сопряжения особого и регулярногоучастков терпит разрыв.3) Особый случай: управление в точке склейки непрерывно u(t̃ −0) = u(t̃ + 0), а производная терпит разрыв u (t̃ − 0) = u (t̃ + 0). Здесь183порядок особой траектории q должен быть четным.4) Особый случай:управление в точке склейки¼ гладкое u(t̃ − 0) = u(t̃ + 0),u (t̃ − 0) = u (t̃ + 0).
Здесь ªпорядок особой траекторииq должен быть нечетным.Как видим, при четном qразрыва быть не может. Нов 1961 г. на первом конгрессе ИФАК, проходившим в г. Москве, ФуллеромРис. 25.4. Чаттеринг режимпредложен пример задачи,в которой сопряжение регулярного и особого участков происходитс бесконечным числом переключений на конечном отрезке времени(chattering-режим).5) Разрывы управления (точки переключения) сгущаются к точке сопряжения с особым участком и оптимальное управление оказывается измеримой по Лебегу функцией со счетным множеством точекразрыва.Таким образом, оптимальное управление u0 (t) может содержатьследующие участки:а) регулярный участок.
В этом случае оптимальное управлениеu0 (t) можно найти из ПМП и u(·) ∈ KC[t0 , tk ], т.е. может иметь конечное число точек разрыва 1-го рода;б) особый участок;в) участок с учащающимися переключениями (только если расширим U до u(·) ∈ L∞ [t0 , tk ] (chattering-режим).184Лекция 26Задача ГоддардаНа лекции 17 были получены уравнения движения ЛА в вертикальной плоскости. При выводе уравнений предполагали, что ЛАимеет плоскость симметрии, изменение высоты полета мало по сравнению с радиусом Земли, в следствии чего пренебрегалось кривизнойземной поверхности, а поле тяготения однородно, кроме того атмосфера имеет постоянную плотность .
Как и в предыдущих примерахна лекциях 15 и 17 считаем, что Земля не вращается.Тогда вырожденная по Тихонову система уравнений (при θ(t) =ϕ(t) = π/2) описывает строго вертикальный полет ЛА (метеорологической ракеты):⎧⎪⎨ ḣ = v,mv̇ = −mg − Q + P,⎪⎩ṁ = −u,0 ≤ u ≤ μ,где P = γu — реактивная тяга ракеты, γ = const — относительная2скорость истечения частиц топлива, Q = v2 Sc0x = kv 2 — сопротивление воздуха.Обозначим y1 = h, y2 = v, y3 = m и перепишем систему в виде⎧ẏ1 = y2 ,⎪⎪y1 (0) = 0,⎪⎨Qγuy2 (0) = 0,ẏ2 = −g −+,⎪y3y3⎪⎪y3 (0) = m0 .⎩ẏ3 = −u,Ограничения на управление следующие: 0 ≤ u ≤ μ.Рассмотрим две задачи:1) Задача подъема на максимальную высоту в момент выгораниявсего топлива.
Пусть m1 — масса собственно ракеты. Тогда терминальное многообразие имеет вид M = {y3 (tk ) = m1 < m0 }, а экстремальная задачаy1 (tk ) → max ,0≤u≤μϕ0 = −y1 (tk ).Это классическая задача Годдарда, поставленная в 1919г., впервыебыла решена профессором А.А.Космодемянским в 1956г.1852) Полет беспилотного (автоматического) самолета на заданнуювысоту с минимальным расходом топлива.Тогда терминальное многообразие имеет вид M = {y1 (tk ) = h1 },а функционал(m0 − y3 (tk )) → min ,0≤u≤μϕ0 = m0 − y3 (tk ).Рассмотрим первую задачу.
Выпишем функцию ПонтрягинаQγu + ψ3 (−u),H = ψ1 y2 + ψ2 − g −+y3y3и сопряженную систему ψ̇ = − ∂H∂y :⎧⎪ψ̇1 = 0⎪⎪⎪⎪1 ∂Q⎨ψ2ψ̇2 = −ψ1 +y3 ∂y2⎪⎪⎪ Qγu ⎪⎪⎩ ψ̇3 = ψ2 − 2 + 2y3y3Многообразие M можно представить в виде M = {y3 (tk )−m1 = 0} ={γ1 , γ2 , 0}, где γ1 , γ2 — произвольные числа.Из условий трансверсальности следует(ψ1 (t0k ) − λ0 )γ1 + ψ2 (t0k )γ2 = 0,откуда ψ1 = λ0 = const ≥ 0, а ψ2 (t0k ) = 0.Докажем, что λ0 = 0. Допустим противное, т.е. λ0 = 0. Тогдаψ1 (t0k ) = ψ2 (t0k ) = 0.Из условия равенства нулю гамильтониана следует H(t0k ) =ψ3 (t0k )u0 (t0k ) = 0.Поскольку условие остановки определяет первый момент, когдаy3 (tk ) = m1 , то в левой окрестности t0k функция y3 (t) должна убывать,следовательно u0 (t) > 0 и в этой окрестности выполнено u0 (t0k ) > 0.Но тогда ψ3 (t0k ) = 0 и (λ0 , ψ) составляют нулевую пару, что противоречит ПМП. Поэтому λ0 = 0 и нормируя ψ, получим ψ1 ≡ 1.Поскольку стартуем с нулевой скоростью, то из физических соображений (тяга больше веса) следует неравенство γμ > gm0 .Представим функцию Понтрягина в видеQ(y2 ) ψ2 γH = y2 − ψ2 g +− ψ3 u = H0 + H1 u.+y3y3˜ ⊂ [t , t ], где H (t) ≡ 0.Допустим, что есть интервал Δ = (t̃, t̃)0 k1186Сопряженная система (при ψ1 ≡ 1) примет вид⎧ψ2 ∂Q⎪⎪ψ2 (t0k ) = 0,⎨ ψ̇2 = −1 + y ∂y ,32ψ ⎪⎪⎩ ψ̇3 = 22 γu − Qy3Из условия максимума функции Понтрягина следует вид оптимального управления+μ при H1 (ψ, y) > 0˜0u (t) =,t ∈ (t̃, t̃).0 при H1 (ψ, y) < 0На особом участке определить оптимальное управление из ПМПнельзя.Найдем производную в силу системы ψ̇2 γdH1ẏ3 ψ2 γ=−− ψ̇3 =2dty3y3 Q − γu Qψ2γ ∂Q ψ2ψ2 ∂Q γ uψ2 γ== −1++ 2 +ψ2−1 + 2 =2y3 ∂y2 y3y3y3y3 ∂y2 y3y3 ∂Qψ2 − y3 + Qψ2 ≡ 0= y3−2 γ∂y2(26.1)Поскольку y3 (t) > 0 на особом участке, то квадратная скобка в последнем выражении равна нулю.Найдем теперь вторую производную в силу системы, учитываятождество (26.1):ψ2 ∂Q ∂Q ψ2 ∂Q d2 H121 +γ u+−1++= − 3 [ .
. . ] + 2 Q −1+2dty3 3 45 6 y3y3 ∂y2∂y2y3 ∂y2=0+ψ2+ ψ2∂ 2 Q 1∂Q ∂Q ψ2 ẏ2 = 2 γu + Q + γ−1++2∂y2y3∂y2∂y2 y3 ∂Q γu Q∂ 2 Q ∂ 2 Q γψ2 ∂Q− −g+γ 2 = 2 1++ γ 2 u+y3 y3∂y2∂y2y3y3 ∂y2∂y2∂Q ∂Q ψ2 1 −1+−+ 2 Q+γy3∂y2∂y2 y3 ∂QQ∂ 2 Q +g ·+ γ 2 ≡ 0 (26.2)− ψ2y3∂y2∂y2187Из тождества (26.2) можно определить особое управления.Для его оптимальности необходимо выполнение условия Келли∂ d2H1 (t) ≥ 0,(26.3)∂u dt2откуда следует необходимость выполнения неравенстваγ∂ 2 Q ψ2 ∂Q+γ1+≥ 0.y32y3 ∂y2∂y22(26.4)Покажем, что оно выполнено.
Для этого надо выяснить знак ψ2 , таккак в нашем случае Q = ky22 , где k > 0 и, следовательно, круглаяскобка в левой части неравенства положительна.На оптимальной траектории гамильтониан H(t) ≡ 0, откуда наособом участке выполняетсятождество H0 (t) ≡ 0 (так как H1 (t) ≡ 0).Но тогда y2 ≡ ψ2 yQ3 + g , откуда следует неравенствоy2> 0.ψ2 = Qy3 + g∂Q, откуда получимИз условия (26.1) следует γy3 ≡ ψ2 Q + γ ∂y2γy3Q∂Q + g = y2 Q + γy3∂y2(26.5)уравнение особой поверхности.Подставляя в (26.5) выражение Q = ky22 , получим уравнение особого участкаkgy3 = (y23 + γy22 ).(26.6)γВ свою очередь уравнение (26.2) можно переписать в видеγ gy3 + 3ky22 + 2kγy2 u − ky2 ky23 + gy3 (3y2 + 4γ) ≡ 0.(26.7)Поскольку y2 ≥ 0, то в (26.7) квадратная скобка при u больше нуля,откуда следует строгое неравенство Келли и оптимальность полученной особой траектории.Из уравнения (26.7) вычислим особое управление1 ky2 ky23 + gy3 (3y2 + 4γ)oc(26.8)u =γ (gy3 + 3ky22 + 2kγy2 )В исходных переменных уравнение особого участка (26.6) имеетвидm=k188v 3 + γv 2.γgγμgm0mA = {u = μ, v̇ = 0}m = kvu0 = μu0 = μm1 u = 03+γv 2γguoctk*vγμgРис.