Численное решение терминальных задач управления для обратимых систем (1024983), страница 11
Текст из файла (страница 11)
Обратная к (3.4) замена переменныхимеет видH = y1 ,L = y2 ,Z = y3 ,py4 V = y42 + y52 + y62 , sin ϑ = q,222y4 + y5 + y6yysin ψ = − q 6, cos ψ = q 5.2222y5 + y6y5 + y6(3.5)74В новых переменных система (3.3) примет канонический видẏ1 = y4 ,ẏ4 = −g + v1 g sin ϑ + v2 g cos ϑ, ẏ = y ,25ẏ5 = v1 g cos ϑ cos ψ − v2 g sin ϑ cos ψ + v3 g sin ψ,ẏ3 = y6 ,ẏ6 = −v1 g cos ϑ sin ψ + v2 g sin ϑ sin ψ + v3 g cos ψ,(3.6)где ϑ и ψ выражаются согласно (3.5).3.3.
Построение траектории на базеполиномов при известном времени маневраРассмотрим задачу построения траектории ЛА, а так же реализующегоее программного управления, приводящей ЛА из некоторого начального состояния(H0 , L0 , Z0 , V0 , ϑ0 , ψ0 ), (nx0 , ny0 , γ0 )(3.7)при t = 0 в заданное конечное состояние(H∗ , L∗ , Z∗ , V∗ , ϑ∗ , ψ∗ ), (nx∗ , ny∗ , γ∗ )(3.8)за заданное время t∗ .Исключив из системы (3.6) переменные y4 , y5 , y6 , получим следующую систему трех дифференциальных уравнений второго порядка ÿ1 = −g + v1 g sin ϑ + v2 g cos ϑ,ÿ2 = v1 g cos ϑ cos ψ − v2 g sin ϑ cos ψ + v3 g sin ψ, ÿ3 = −v1 g cos ϑ sin ψ + v2 g sin ϑ sin ψ + v3 g cos ψ,(3.9)75Система (3.9) разрешима в области Ω относительно управлений(ÿ + g) sin ϑ + ÿ2 cos ϑ cos ψ − ÿ3 cos ϑ sin ψv1 = 1,g(ÿ1 + g) cos ϑ − ÿ2 sin ϑ cos ψ + ÿ3 sin ϑ sin ψv=,2g v = ÿ2 sin ψ + ÿ3 cos ψ .3g(3.10)Таким образом, для любой траектории движения, заданной в видеyi = yi (t) ∈ C 2 [0, t∗ ], t ∈ [0, t∗ ], i = 1, 3(3.11)уравнения (3.10) позволяют найти управления vi = vi (t), реализующие данную траекторию.Получим условия при которых траектория (3.11) обеспечивает выполнениеграничных условий (3.7)–(3.8).
Граничные условия на yi , ẏi , ÿi , i = 1, 3,могут быть получены из (3.7)–(3.8) с использованием (3.2), (3.4), (3.6) и (3.9).Действительно, при t = t0 имеемv10y10 ẏ10ÿ10ÿ20ÿ30= nx0 , v20 = ny0 cos γ0 , v30 = ny0 sin γ0 ,= H0 , y20 = L0 , y30 = Z0 ,= V0 sin ϑ0 , ẏ20 = V0 cos ϑ0 cos ψ0 , ẏ30 = −V0 cos ϑ0 sin ψ0 ,(3.12)= −g + v10 g sin ϑ0 + v20 g cos ϑ0 ,= v10 g cos ϑ0 cos ψ0 − v20 g sin ϑ0 cos ψ0 + v30 g sin ψ0 ,= −v10 g cos ϑ0 sin ψ0 + v20 g sin ϑ0 sin ψ0 + v3 g cos ψ0 ,и, аналогично при t = t∗ , имеемv1∗y1∗ ẏ1∗ÿ1∗ÿ2∗ÿ3∗= nx∗ , v2∗ = ny∗ cos γ∗ , v3∗ = ny∗ sin γ∗ ,= H∗ , y2∗ = L∗ , y3∗ = Z∗ ,= V∗ sin ϑ∗ , ẏ2∗ = V∗ cos ϑ∗ cos ψ∗ , ẏ3∗ = −V∗ cos ϑ∗ sin ψ∗ ,= −g + v1∗ g sin ϑ∗ + v2∗ g cos ϑ∗ ,= v1∗ g cos ϑ∗ cos ψ∗ − v2∗ g sin ϑ∗ cos ψ∗ + v3∗ g sin ψ∗ ,= −v1∗ g cos ϑ∗ sin ψ∗ + v2∗ g sin ϑ∗ sin ψ∗ + v3 g cos ψ∗ .(3.13)76Таким образом, любые гладкие функции yi = yi (t) i = 1, 3, удовлетворяющие граничным условиям (3.12)–(3.13), обеспечивают выполнение (3.7)–(3.8).В качестве функций yi (t) удобно использовать многочлены пятой степени следующего видаyi (t) =2(j)Xyi0j=0j!jt +3Xcij t2+j , i = 1, 3.(3.14)j=1Введенные таким образом функции yi (t), при любых значениях коэффициентов cij i, j = 1, 3, при t = 0 обеспечивают требуемые равенства yi (0) = yi0 ,ẏi (0) = ẏi0 и ÿi (0) = ÿi0 , i = 1, 3.
Для выполнения аналогичных условий приt = t∗ неизвестные коэффициенты cij должны удовлетворять следующим тремсистемам уравнений3452 ∆ ci0 + ∆ ci1 + ∆ ci2 = yi∗ − yi0 − ẏi0 ∆ − 0.5ÿi0 ∆ ,3∆2 ci0 + 4∆3 ci1 + 5∆4 ci2 = ẏi∗ − ẏi0 − ÿi0 ∆, 6∆ci0 + 12∆2 ci1 + 20∆3 ci2 = ÿi∗ − ÿi0 ,(3.15)i = 1, 3,где ∆ = t∗ 6= 0, что гарантирует существование и единственность решенийданных систем уравнений, поскольку определитель каждой системы равен2∆9 6= 0.3.4.
Численная минимизация времениперелета в классе полиномов 5-й степениКак показывают результаты моделирования [32], выбор времени маневраоказывает влияние как на вид программной траектории, так и на реализующее ее программное управление. Кроме того, как правило заданы ограничения на переменные состояния и управления. Так как граничные условияполностью определяют вид полинома (3.14) и получаемых программных траектории (3.11) и управлений (3.10), то возникает задача выбора времениманевра таким образом, чтобы удовлетворялись наложенные на переменныесостояния и управления ограничения.77Обозначим через T множество, допустимых значений времени маневраt∗ , при которых построенные в (3.3) программные траектория и управленияудовлетворяют ограничениямH ∈ [Hmin , Hmax ],L ∈ [Lmin , Lmax ],Z ∈ [Zmin , Zmax ],(3.16)V ∈ [Vmin , Vmax ],|ϑ| 6 π2 , ϑ ∈ [ϑmin , ϑmax ],ψ ∈ [ψmin , ψmax ],γ ∈ [γmin , γmax ],nx ∈ [nx min , nx max ],(3.17)ny ∈ [ny min , ny max ].Будем предполагать, что множество T есть отрезок.
Для этих решений рассмотрим задачу нахождения маневра ЛА с минимальным временем t∗ .Пусть множества S и U задаются неравенствами (3.16) и (3.17) соответственно. Таким образом получаем следующую задачу одномерной минимизации при наличии ограниченийt∗ |u∈U,s∈(Ω∩S), t∗ ∈T→ min,(3.18)где u = (nx , ny , γ) вектор управлений, s = (H, L, Z, V, ϑ, ψ) вектор переменных состояния.Поскольку в действительности множество T неизвестно, необходимо получить оценку T̂ , которая будет использоваться при численном решении задачиминимизации (3.18).
Положим T̂ = [t̂0 , t̂∗ ].В качестве нижней границы отрезка T̂ предлагается использовать время,затрачиваемое ЛА при движении с максимально допустимой скоростью попрямой из начального в конечное положение:t̂0 =p(L∗ − L0 )2 + (H∗ − H0 )2 + (Z∗ − Z0 )2 /Vmax .78При этом граничные условия по углам курса и наклона траектории ЛА иуправлениям не используются. Подобная оценка гарантирует, что t̂0 не будетпревышать минимально допустимое время маневра.Определение верхней границы t̂∗ является более сложной задачей, предполагающей учет множества различных факторов, таких как граничные условия (3.7)–(3.8), ограничения на переменные состояния и управления (3.16)–(3.17).
В зависимости от вида маневра можно использовать различные способы определения t̂∗ . Наиболее просто это время можно оценить для маневрасмены эшелона и для прямолинейного движения:– смена эшелона: t̂∗ = |(H∗ − H0 )|/Vmin ;p– прямолинейное движение t̂∗ = (L∗ − L0 )2 + (Z∗ − Z0 )2 /Vmin .Для других видов маневров наиболее общим способом нахождения t̂∗ является метод поразрядного поиска [60].
В этом случае рассматривается последовательность моментов времени t̂i = t̂0 + ∆t · i, i > 1, для каждого моментавремени рассчитывается траектория и проверяется выполнение ограничений (3.16)–(3.17). Поиск заканчивается, когда найдена допустимая траектория. Это следует из того, что для решения задачи (3.18) множество T̂ необязательно включает в себя все множество допустимых значений времениманевра.
Достаточно лишь, чтобы T̂ включало в себя любое подмножество,содержащее искомое минимальное время маневра. Поэтому, если известнокакое-либо допустимое время требуемого маневра, то оно может быть взятов качестве t̂∗ . Допустимое время маневра может быть известно, например,если для построения требуемой траектории используется подход, основанныйна базе типовых маневров, когда компоновка траектории осуществляется изопределенного набора заранее рассчитанных маневров, база которых формируются при помощи сочетания аналитических методов расчета траекторий,методов математического моделирования и различных эвристических алгоритмов [31, 32].
В этом случае, предлагаемый в данной работе алгоритм79может быть использован для минимизации времени выполнения типовых маневров, входящих в базу маневров.Заметим, что задача (3.18) есть задача нелинейного программирования [60]с девятью ограничениями в виде неравенств. Поскольку решение задачи нелинейного программирования связано со значительно большими трудностями,чем решение задачи безусловной минимизации, заменим задачу (3.18) задачейбезусловной минимизации, для чего сформируем новый критерий t , если u(t) ∈ U, s(t) ∈ (Ω ∩ S), ∀t ∈ [0, t ],mmJ(tm ) =PP t̂∗ + 6 ai ∆si + 3 bi ∆ui , иначе,i=1(3.19)i=1где u(t) и s(t) — решения граничной задачи (3.7)–(3.8) при t∗ = tm , ∆si —величина максимального по абсолютной величине отклонения i-й переменнойсостояния от допустимого диапазона (3.16), ∆ui — величина максимальногопо абсолютной величине отклонения i-ого управления от допустимого диапазона (3.17), ai , bi — весовые множители.
Решение данной задачи проводилосьфункцией «fminbnd», включенной в библиотеку оптимизации пакета Matlab,и представляющей собой комбинацию методов золотого сечения и параболической интерполяции [80].3.5. МоделированиеПример 3.1. Рассмотрим задачу минимизации времени разворота ЛА на175 градусов со следующими начальными и конечными значениями переменных состояния и управления [32]:начальное состояние:V = 80 км/ч, H = 1000 м, L = 0 м, Z = 0 м,ϑ = 0◦ , ψ = 0◦ nx = 0, ny = 1.0, γ = 0◦ .конечное состояние:V = 80 км/ч, H = 1010 м, L = 0 м, Z = −150 м,ϑ = 0◦ , ψ = 150◦ , nx = 0, ny = 1.0, γ = 0◦ .80В качестве ограничений примем:V ∈ [50, 100], H ∈ [10, 3000], L ∈ [0, 3000], Z ∈ [−2000, 2000],ϑ ∈ [−89, 89], ψ ∈ [−179, 179], nx ∈ [−3, 3], ny ∈ [0.2, 6.0], γ = 0◦ .В качестве верхней границы времени маневра t̂∗ примем 11.5 с — времяданного маневра из базы маневров в [32].
В результате численного решениязадачи (3.18) было найдено следующее оптимизированное по критерию (3.19)значение времени маневра tmin = 9.85 c.Рис. 3.2. Разворота ЛА на 175 градусов. Графики переменных состоянияНа Рис. 3.2 приведены графики зависимости переменных состояния отвремени, на Рис.