Численное решение терминальных задач управления для обратимых систем, страница 12
Описание файла
PDF-файл из архива "Численное решение терминальных задач управления для обратимых систем", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "диссертации и авторефераты" в общих файлах, а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 12 страницы из PDF
3.3 — графики зависимости управления от времени. НаРис. 3.4 приведен график зависимости боковой дальности от продольной. Навсех рисунках также приведены соответствующие графики из базы маневровв [32]. При изменении диапазона V ∈ [50, 100] на ограничение V ∈ [10, 140]было получено следующее оптимизированное время маневра tmin = 7.19 c.Полученные графики зависимости переменных состояния и управлений отвремени, а так же их аналоги из базы маневров, приведены на Рис. 3.5–3.681Рис. 3.3.
Разворота ЛА на 175 градусов. Графики управленийРис. 3.4. Разворота ЛА на 175 градусов. Зависимость бокового смещения отдальностисоответственно. Из представленных графиков видно, что характер измененияпеременных состояния и управлений существенно не поменялся, однако воз-82Рис. 3.5. Разворота ЛА на 175 градусов, ограничение V ∈ [10, 140]. Графикипеременных состоянияРис. 3.6. Разворота ЛА на 175 градусов, ограничение V ∈ [10, 140].
Графикиуправленийросло максимально потребное значение перегрузки ny , а также увеличиласьмаксимальная скорость во время маневра.Пример 3.2.Рассмотрим задачу планирования траектории движенияв вертикальной плоскости. Без ограничения общности, будем считать, что83движение происходит в плоскости Z = 0. В качестве исходных значенийпримем данные из [32]:начальное состояние:V = 100 км/ч, H = 100 м, L = 0 м, Z = 0 м,ϑ = 0◦ , ψ = 0◦ , nx = 0, ny = 1.0, γ = 0◦ ,конечное состояние, t∗ = 30 c:V = 105 км/ч, H = 400 м, L = 800 м, Z = 0 м,ϑ = 0◦ , ψ = 0◦ , nx = 0, ny = 1.0, γ = 0◦ .В качестве ограничений примем:V ∈ [20, 140], H ∈ [10, 3000], L ∈ [0, 3000], Z = 0,ϑ ∈ [−89, 89], ψ = 0◦ , nx ∈ [−3, 3], ny ∈ [0.2, 6.0], γ = 0◦ .В результате численного решения задачи (3.18) было найдено время маневра tmin = 26.17 c.
На Рис. 3.7 приведены графики зависимости переменныхсостояния от времени, на Рис. 3.8 — графики зависимости управления от вре-Рис. 3.7. Движение в вертикальной плоскости. Графики переменных состояния84Рис. 3.8. Движение в вертикальной плоскости. Графики управленийРис. 3.9. Движение в вертикальной плоскости. Зависимость высоты от дальностимени, на Рис. 3.9 — график зависимости высоты от дальности. На указанныхрисунках так же приведены соответствующие графики из базы маневров [32].853.6. Другие методы построения траекторииРассмотрим альтернативный способ построения программной траектории, удовлетворяющей наложенным на состояния ограничениям.
Основнымотличием предлагаемого далее способа является работа на фазовой плоскости, а не в пространстве состояний. Представленные ниже результатыбазируются на работе [46], и позволяют строить фазовую траекторию удовлетворяющую наложенным ограничениям на фазовые переменные в некоторомклассе функций.
Предложены варианты расширения множества, в которомищутся фазовые траектории.3.6.1. Построение фазовой траекторииДля динамической системыÿ + f (y, ẏ) = g(y, ẏ)u,(3.20)рассмотрим задачу терминального управления при наличии ограничений напеременные состоянияY = (y, ẏ) ∈ R2 : y ∈ [y0 , y∗ ], 0 < ψ− (y) < ẏ < ψ+ (y), ψ± (y) ∈ C 1 [y0 , y∗ ](3.21)и граничных условийy(0) = y0 , ẏ(0) = ẏ0 ,y(t∗ ) = y∗ , ẏ(t∗ ) = ẏ∗ ,(3.22)считая, что g(y, ẏ) 6= 0 при (y, ẏ) ∈ Y и управление является непрерывнойфункцией времени.Решению задачи (3.20)–(3.22) на фазовой плоскости (y, ẏ) соответствуетt-параметрическая кривая y = y(t), ẏ = ẏ(t), t ∈ [0, t∗ ].
Так как ẏ(t) > 0, тоуравнение этой кривой можно записать в виде ẏ = ψ(y), где ψ(y) ∈ C 1 [y0 , y∗ ].Рассматривая равенство ẏ = ψ(y) как дифференциальное уравнение первого порядка и интегрируя его на [0, t∗ ] находим, что для функции ψ выполнены86следующие условия:Zy∗y0dy= t∗ ,ψ(y)0 < ψ− (y) < ψ(y) < ψ+ (y),ψ(y0 ) = ψ0 = ẏ0 ,(3.23)y ∈ [y0 , y∗ ],ψ(y∗ ) = ψ∗ = ẏ∗ .(3.24)(3.25)Если для функции ψ выполнены условия (3.23)–(3.25), то ей соответствуетрешение задачи (3.20)–(3.22). Действительно, полагая ẏ = ψ(y), находимÿ = ψ 0 (y)ẏ = ψ 0 (y)ψ(y)и в результате имеем решение задачи (3.20)–(3.22) в видеu(y) = [ψ 0 (y)ψ(y) + f (y, ψ(y))]/g(y, ψ(y)).(3.26)Поскольку y(t) есть решение задачи Кошиẏ = ψ(y), y(0) = y0 ,то управление (3.26) можно записать в видеu(y(t)) = [ψ 0 (y(t))ψ(y(t)) + f (y(t), ψ(y(t)))]/g(y(t), ψ(y(t))).(3.27)Соответствующее стабилизирующее управление может быть найдено поформулеu(y, t) = [ÿ(t) + f (y, ẏ) − k1 (ẏ − ẏ(t)) − k2 (y − y(t))]/g(y, ẏ),где k1 , k2 > 0 – некоторые константы, задающие динамику убывания ошибкиe = y − y(t).Таким образом, для решения задачи (3.20)–(3.22) необходимо и достаточнонайти функцию ψ(y) ∈ C 1 [y0 , y∗ ], удовлетворяющую условиям (3.23)–(3.25).Несложно заметить, что для существования решения задачи (3.23)–(3.25) ееисходные данные должны удовлетворять условиямψ− (y0 ) < ψ0 < ψ+ (y0 ),ψ− (y∗ ) < ψ∗ < ψ+ (y∗ ),tinf < t∗ < tsup ,(3.28)87гдеZy∗tinf =y0dy,ψ+ (y)Zy∗tsup =y0dy.ψ− (y)Построение функции ψ будем проводить согласно [46].Для этого введем следующие обозначенияm− = min ψ− (y),m+ = min ψ+ (y),M− = max ψ− (y),M+ = max ψ+ (y),y∈[y0 , y∗ ]y∈[y0 , y∗ ]y∈[y0 , y∗ ]y∈[y0 , y∗ ]m+− = min (ψ+ (y) − ψ− (y)),y∈[y0 , y∗ ]Для ε+ = t∗ − tinf и ε− = tsup − t∗ фиксируем любые шесть параметров ε̃ =−+−= (ε+ , ε− , ε+0 , ε∗ , ε0 , ε∗ ) > 0, удовлетворяющих неравенствамε+ m2+ε+ < min m+− /3, ψ+ (y0 ) − ψ0 , ψ+ (y∗ ) − ψ∗ ,,+m3(y−y)+ε∗0+ε− m2−ε− < min m+− /3, ψ0 − ψ− (y0 ), ψ∗ − ψ− (y∗ ),,3(y∗ − y0 )ε− m− M+,ε−<min(y−y)/3,∗003(M−m)+−ε− m− M+−ε∗ < min (y∗ − y0 )/3,,3(M+ − m− ) ε+ m− M+ε+<min(y−y)/3,,∗003(M−m)+−+εmM−+.ε+∗ < min (y∗ − y0 )/3,3(M+ − m− )(3.29)Сначала построим ψ−ε̂ (y) и ψ+ε (y) — специальные аппроксимации дляфункций ψ− (y) и ψ+ (y), которые выбираются в классе C 1 [y0 , y∗ ] так, чтобыбыли выполнены граничные условия (3.25), ограничения (3.24) иZ y∗Z y∗dydyt− (ε̂) =< t∗ < t+ (ε) =.y0 ψ−ε̂ (y)y0 ψ+ε (y)В качестве таких функций можно взять+ (ψ+ (y) − ε+ )λ1 (y) + ψ− (y)(1 − λ1 (y)), y ∈ [y0 , y0 + ε0 ]ψ+ε (y) =ψ+ (y) − ε+ ,+y ∈ [y0 + ε+0 , y∗ − ε∗ ] (ψ+ (y) − ε+ )λ2 (y) + ψ− (y)(1 − λ2 (y)), y ∈ [y∗ − ε+ , y∗ ],∗88+где ε = (ε+ , ε+0 , ε∗ ),y − y0,ε+0y − y∗ + ε +∗ ,ν=+ε∗λ1 (y) = 1 − (1 − ξ+ )(1 − τ )2 ,λ2 (y) = 1 − (1 − η+ )τ 2 ,ψ−ε̂ (y) =τ=ψ0 − ψ− (y0 ),ψ+ (y0 ) − ψ− (y0 ) − ε+ψ∗ − ψ− (y∗ )η+ =.ψ+ (y∗ ) − ψ− (y∗ ) − ε+ξ+ =− (ψ− (y) + ε− )λ3 (y) + ψ+ (y)(1 − λ3 (y)), y ∈ [y0 , y0 + ε0 ]−y ∈ [y0 + ε−0 , y∗ − ε∗ ]ψ− (y) + ε− , (ψ− (y) + ε− )λ4 (y) + ψ+ (y)(1 − λ4 (y)), y ∈ [y∗ − ε− , y∗ ],∗−где ε̂ = (ε− , ε−0 , ε∗ ),y − y0,ε−0y − y∗ + ε −∗ ,ν=−ε∗λ3 (y) = 1 − (1 − ξ− )(1 − τ )2 ,λ4 (y) = 1 − (1 − η− )τ 2 ,τ=ψ0 − ψ+ (y0 ),ψ− (y0 ) − ψ+ (y0 ) + ε−ψ∗ − ψ+ (y∗ ).η− =ψ− (y∗ ) − ψ+ (y∗ ) + ε−ξ− =Искомую функцию ψ(y), а точнее 1/ψ(y), будем искать как линейную комбинацию функций 1/ψ+ε (y) и 1/ψ−ε̂ (y).
Для этого рассмотрим функциюZ y∗ c1−c α(c) =+dy = ct+ (ε) + (1 − c)t− (ε̂),ψ+ε (y) ψ−ε̂ (y)y0гдеZy∗t− (ε̂) =y0dy,ψ−ε̂ (y)Приc = c∗ =Zy∗t+ (ε) =y0dy.ψ+ε (y)t∗ − t− (ε̂)∈ (0, 1)t+ (ε) − t− (ε̂)выполнено равенство α(c) = t∗ и функцияψ(y) =1c∗1 − c∗+ψ+ε (y) ψ−ε̂ (y)=ψ+ε (y)ψ−ε̂ (y)c∗ ψ−ε̂ (y) + (1 − c∗ )ψ+ε (y)(3.30)является решением задачи (3.23)–(3.25). Действительно, выполнение (3.23)обеспечивается приведённым выше выбором c∗ в (3.30). Выполнение (3.24)и (3.25) обеспечивается автоматически выбором вспомогательных функцийψ+ε (y) и ψ−ε̂ (y) [46].89Замечание. Отметим, что подобный подход применим и в случае, когдафазовая траектория находится в нижней полуплоскости. Соответствующаятерминальная задача имеет видÿ + f (y, ẏ) = g(y, ẏ)uY = (y, ẏ) ∈ R2 : y ∈ [y∗ , y0 ], 0 > ψ− (y) > ẏ > ψ+ (y), ψ± (y) ∈ C 1 [y∗ , y0 ]y(0) = y0 , ẏ(0) = ẏ0 ,y(t∗ ) = y∗ , ẏ(t∗ ) = ẏ∗ ,g(y, ẏ) 6= 0 при (y, ẏ) ∈ Y.(3.31)Для нахождения фазовой траектории ψ(y) получаем задачу, аналогичную(3.23)–(3.25)Zy∗y0dy= t∗ ,ψ(y)0 > ψ− (y) > ψ(y) > ψ+ (y),ψ(y0 ) = ψ0 = ẏ0 ,y ∈ [y∗ , y0 ],(3.32)ψ(y∗ ) = ψ∗ = ẏ∗ .Вводя следующие обозначенияm− = min (−ψ− (y)),m+ = min (−ψ+ (y)),M− = max (−ψ− (y)),M+ = max (−ψ+ (y)),y∈[y∗ , y0 ]y∈[y∗ , y0 ]y∈[y∗ , y0 ]y∈[y∗ , y0 ]m+− = min (ψ− (y) − ψ+ (y)),y∈[y∗ , y0 ]получим условия, аналогичные (3.29), для выбора шести параметров ε̃ =−+−= (ε+ , ε− , ε+0 , ε∗ , ε0 , ε∗ ) > 0ε+ m2+,ε+ < min m+− /3, ψ0 − ψ+ (y0 ), ψ∗ − ψ+ (y∗ ),3(y−y)+εm0∗+ε− m2−ε− < min m+− /3, ψ− (y0 ) − ψ0 , ψ− (y∗ ) − ψ∗ ,,3(y−y)0∗ε− m− M+−ε0 < min (y0 − y∗ )/3,,3(M+ − m− ) ε− m− M+−ε∗ < min (y0 − y∗ )/3,,3(M+ − m− ) ε+ m− M++ε0 < min (y0 − y∗ )/3,,3(M−m)+−ε+ m− M++,ε∗ < min (y0 − y∗ )/3,3(M+ − m− )(3.33)90где ε+ = t∗ − tinf и ε− = tsup − t∗ .− −+Выбор ε = (ε+ , ε+0 , ε∗ ) > 0 и ε̂ = (ε− , ε0 , ε∗ ) > 0 осуществляется анало-гично рассмотренному выше случаю, когда фазовая траектория находится вверхней полуплоскости.Функции ψ−ε̂ (y) и ψ+ε (y) зададим следующим образом+ (ψ+ (y) + ε+ )λ1 (y) + ψ− (y)(1 − λ1 (y)), y ∈ [y∗ , y∗ + ε0 ]ψ+ε (y) =ψ+ (y) + ε+ ,y ∈ [y∗ + ε+, y0 − ε+∗]0 (ψ+ (y) + ε+ )λ2 (y) + ψ− (y)(1 − λ2 (y)), y ∈ [y0 − ε+ , y0 ],∗+где ε = (ε+ , ε+0 , ε∗ ) > 0 и−(ψ− (y) − ε− )λ3 (y) + ψ+ (y)(1 − λ3 (y)), y ∈ [y∗ , y∗ + ε0 ]−ψ−ε̂ (y) =ψ− (y) − ε− ,y ∈ [y∗ + ε−0 , y0 − ε∗ ] (ψ− (y) − ε− )λ4 (y) + ψ+ (y)(1 − λ4 (y)), y ∈ [y0 − ε− , y0 ],∗−где ε̂ = (ε− , ε−0 , ε∗ ).
Вспомогательные функции λ1 (y) – λ4 (y), определяютсяследующим образомy − y∗,ε+0y − y0 + ε +∗ ,ν=ε+∗ψ∗ − ψ− (y∗ ),ψ+ (y∗ ) − ψ− (y∗ ) + ε+ψ0 − ψ− (y0 ).η+ =ψ+ (y0 ) − ψ− (y0 ) + ε+y − y∗,ε−0y − y0 + ε −∗ ,ν=ε−∗ψ∗ − ψ+ (y∗ ),ψ− (y∗ ) − ψ+ (y∗ ) − ε−ψ0 − ψ+ (y0 ).η− =ψ− (y0 ) − ψ+ (y0 ) − ε−λ1 (y) = 1 − (1 − ξ+ )(1 − τ )2 ,λ2 (y) = 1 − (1 − η+ )τ 2 ,λ3 (y) = 1 − (1 − ξ− )(1 − τ )2 ,λ4 (y) = 1 − (1 − η− )τ 2 ,τ=τ=ξ+ =ξ− =Искомая функция ψ(y) вычисляется согласно (3.30).3.6.2. Оптимизационный подход к выбору фазовой траекторииПостроенная в предыдущем разделе функция ψ(y) зависит, в общем случае, от шести параметров. При фиксировании всех шести параметров ε̃ =−+−= (ε+ , ε− , ε+0 , ε∗ , ε0 , ε∗ ), удовлетворяющих (3.29), мы получаем единствен-ную фазовую траекторию ψ(y) вида (3.30), которая является решением задачи (3.23)–(3.25).
Изменяя указанные параметры получим, в общем случае,91другую фазовую траекторию, являющуюся решением задачи (3.23)–(3.25).Таким образом, мы имеем параметрическое семейство функций ψε̃ (y), являющееся решением терминальной задачи (3.20)–(3.22). Наличие подобногомножества решений позволяет строить искомую фазовую траекторию какрешение некоторой оптимизационной задачи, в которой в качестве оптимизи−+−руемых параметров выступают значения ε̃ = (ε+ , ε− , ε+0 , ε∗ , ε0 , ε∗ )J(ε̃)|ε̃∈Ω → min,(3.34)−+−где Ω – множество допустимых значений ε̃ = (ε+ , ε− , ε+0 , ε∗ , ε0 , ε∗ ). В част-ности, множество Ω может задаваться условиями вида (3.29) или (3.33), чтосоответствует оптимизационной задачи при наличии ограничений в виде линейных неравенств.