Численное решение терминальных задач управления для обратимых систем, страница 13
Описание файла
PDF-файл из архива "Численное решение терминальных задач управления для обратимых систем", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "диссертации и авторефераты" в общих файлах, а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 13 страницы из PDF
В качестве критерия оптимизации может выступать абсолютная величина максимального значения программного управления, среднее значение программного управления и т.д. Если в дополнение к ограничениям (3.21) имеются ограничения, например, на значение программногоуправления, то оптимизационную задачу (3.34) следует дополнить соответствующим ограничениемJ(ε̃)|ε̃∈Ω,u∈U→ min,(3.35)где U – множество допустимых значений программного управления. К сожалению, зависимость программного управления от параметров ε̃ достаточносложная, это приводит к оптимизационной задачи при наличии ограниченийв виде нелинейных неравенств.Выполнение условий (3.29) ((3.33) для нижней полуплоскости) гарантирует, что построенная траектория является решением задачи (3.23)–(3.25),однако эти условия достаточно грубы.Численное моделирование показа-ло, что в большинстве случаев предложенный алгоритм находит решениетерминальной задачи (3.20)–(3.22) даже если параметры ε0 и ε∗ не удовлетворяют условиям (3.29) (или (3.33) в случае нижней полуплоскости).
При этом92увеличение значения параметров ε0 и ε∗ зачастую приводит к значительному уменьшению, к примеру, абсолютной величины максимального значенияпрограммного управления. Отказ от выполнения условий (3.29) ((3.33) длянижней полуплоскости) для указанных параметров, ведет к добавлению дополнительной проверки на принадлежность полученного решения множествудопустимых решений. В работе предлагается расширить множество Ω, задаваемое неравенствами (3.29), и использовать следующее множество допустимых значенийεm2+ε+ < min m+− /3, ψ+ (y0 ) − ψ0 , ψ+ (y∗ ) − ψ∗ ,,3(y−y)+εm∗0+εm2−ε− < min m+− /3, ψ0 − ψ− (y0 ), ψ∗ − ψ− (y∗ ),,3(y∗ − y0 )0 < ε+0 < ε+∗ < γ(y∗ − y0),0 < γ(y∗ − y0),0 < ε−0 < γ(y∗ − y0),+ε+0 + ε∗ < y∗ − y0,(3.36)0 < ε−∗ < γ(y∗ − y0),−ε−0 + ε∗ < y∗ − y0,(t∗ − tinf (ε̃))(t∗ − tsup (ε̃)) 6 0,Z y∗dydyгде tinf (ε̃) =, tsup (ε̃) =, γ ∈ (0, 1).
Последнее услоy0 ψ+ε (y)y0 ψ−ε̂ (y)вие в (3.36) осуществляет проверку принадлежности получаемой траекторииZy∗множеству допустимых решений.При нахождении фазовой траектории в нижней полуплоскости множество Ω,задаваемое неравенствами (3.33), расширяется до следующего множества допустимых значенийεm2+ε+ < min m+− /3, ψ+ (y0 ) − ψ0 , ψ+ (y∗ ) − ψ∗ ,,3(y−y)+εm0∗+εm2−ε− < min m+− /3, ψ0 − ψ− (y0 ), ψ∗ − ψ− (y∗ ),,3(y0 − y∗ )0 < ε+0 < ε+∗ < γ(y0 − y∗),0 < γ(y0 − y∗),0 < ε−0 < γ(y0 − y∗),+ε+0 + ε∗ < y0 − y∗,0 < ε−∗ < γ(y0 − y∗),−ε−0 + ε∗ < y0 − y∗,(t∗ − tinf (ε̃))(t∗ − tsup (ε̃)) 6 0,(3.37)93Z y∗dydyгде tinf (ε̃) =, tsup (ε̃) =, γ ∈ (0, 1). Последнее услоy0 ψ+ε (y)y0 ψ−ε̂ (y)вие в (3.37) осуществляет проверку принадлежности получаемой траекторииZy∗множеству допустимых решений.3.6.3.
МоделированиеМоделирование осуществлялось в среде Matlab. В качестве оптимизационного критерия рассматривалась абсолютная величина максимального значения программного управленияJ(ε̃) = max(|u(t)|)|ε̃∈Ω, t∈[0, t∗ ] → min,(3.38)где множество Ω, задается неравенствами (3.36) или (3.37) в случае нижнейполуплоскости. Как показало моделирование, изменение параметров ε+ и ε−слабо влияло на значение оптимизационного критерия. Поэтому, а так жедля уменьшения размерности оптимизационной задачи, из шести параметров−−+ε̃ = (ε+ , ε− , ε+0 , ε∗ , ε0 , ε∗ ) в качестве оптимизируемых параметров рассма−−+тривались только 4: ε+0 , ε∗ , ε0 и ε∗ .
Параметры ε+ и ε− фиксировалисьудовлетворяющими условиям (3.29) ((3.33) для нижней полуплоскости). Длярешения оптимизационной задачи при наличии ограничений использоваласьфункция среды fmincon. В качестве алгоритма численного решения задачииспользовался «Interior Point» алгоритм [76, 77, 92].Приведенный ниже пример 3.3 демонстрирует возможность изложенногов п. 3.6 метода построения программной траектории в случае сложных ограничений на переменные состояния, допускающих лишь небольшой диапазонизменения переменных состояния.Далее, в примере 3.4 рассматривается та же терминальная задача, что и впримере 3.3, но в случае когда ограничения на переменные состояния являются постоянными функциями. В таких случаях, использование предложенногов п.
3.6.2 расширения множества Ω, позволяет значительно улучшить решение оптимизационной задачи (3.38).94В конце данного раздела пример 3.5 демонстрирует возможность применения предлагаемого метода в случае нахождения фазовой траектории в нижнейполуплоскости.Пример 3.3.
Рассмотрим следующую терминальную задачуÿ + y cos ẏ = (0.5y + 0.1ẏ)u,y(0) = 0, ẏ(0) = 3.5, y(t∗ ) = 10, ẏ(t∗ ) = 2.5, t∗ = 6,при наличии ограничений на переменные состоянияy ∈ [0, 10], cos y + 1.5 < ẏ < 2 sin y + 4.5.На Рис. 3.10-3.11 представлены графики ограничений ψ− (y) и ψ+ (y) и аппроксимации ограничений ψ+ε (y) и ψ−ε̂ (y), а так же график искомой функцииψ(y), вычисленный согласно (3.30), до и после оптимизации соответственно.На Рис.
3.12 представлены графики программного управления u(y(t)) до ипосле оптимизации.Рис. 3.10. Пример 3.3. Графики ограничений, их оценки и построенная фазовая траектория95Рис. 3.11. Пример 3.3. Графики ограничений, их оценки и построенная фазовая траектория (оптимизация)Рис. 3.12. Пример 3.3. Программное управление до и после оптимизацииВ качестве параметров ε̃ взяты следующие значения, удовлетворяющиеусловиям (3.29)+−−ε+0 = ε∗ = ε0 = ε∗ = 0.565, ε+ = 0.242, ε− = 0.026.Значение критерия (3.38) без оптимизации составило J = 7.81.96После численного решения оптимизационной задачи были получены следующие значения оптимизируемых параметров+−−ε+0 = 3.853, ε∗ = 1.129, ε0 = 1.303, ε∗ = 0.743.Значение критерия составило J = 6.5, что соответствует уменьшению значения критерия на 17%.Пример 3.4. Рассмотрим ту же терминальную задачу, что и в примере 3.3 со следующими ограничениями на переменные состоянияy ∈ [0, 10], 0.5 < ẏ < 5.На Рис.
3.13-3.14 представлены графики ограничений ψ− (y) и ψ+ (y), графики аппроксимации ограничений ψ+ε (y) и ψ−ε̂ (y), а так же график искомойфункции ψ(y), вычисленный согласно (3.30), до и после оптимизации соответственно. На Рис. 3.15 представлены графики программного управленияu(y(t)) до и после оптимизации.Рис. 3.13. Пример 3.4. Графики ограничений, их оценки и построенная фазовая траектория97Рис. 3.14. Пример 3.4. Графики ограничений, их оценки и построенная фазовая траектория (оптимизация)Рис. 3.15.
Пример 3.4. Программное управление до и после оптимизацииВ качестве параметров ε̃ взяты следующие значения, удовлетворяющиеусловиям (3.29)+−−ε+0 = 0.667, ε∗ = 0.667, ε0 = 2.333, ε∗ = 2.333, ε+ = 0.030, ε− = 0.105.Значение критерия (3.38) без оптимизации составило J = 19.6.98Численное решение оптимизационной задачи дало следующие значенияоптимизируемых параметров+−−ε+0 = 5.191, ε∗ = 1.981, ε0 = 8.278, ε∗ = 0.245.Значение критерия составило J = 2.41, что соответствует уменьшению значения критерия более чем в 8 раз.Пример 3.5. Рассмотрим следующую терминальную задачуÿ − y cos ẏ = u,y(0) = 10, ẏ(0) = 3.5, y(t∗ ) = 0, ẏ(t∗ ) = 2.5, t∗ = 6,при наличии ограничений на переменные состоянияy ∈ [0, 10], − cos y − 1.5 > ẏ > −2 sin(y + π/4) − 4.5.На фазовой плоскости данные условия соответствуют нижней полуплоскости.Рис. 3.16.
Пример 3.5. Графики ограничений, их оценки и построенная фазовая траекторияНа Рис. 3.16-3.17 представлены графики ограничений ψ− (y) и ψ+ (y),их аппроксимации ψ+ε (y) и ψ−ε̂ (y), а так же график искомой функции99ψ(y), вычисленной согласно (3.30), до и после оптимизации соответственно.На Рис.
3.18 представлены графики программного управления u(y(t)) до ипосле оптимизации.Рис. 3.17. Пример 3.5. Графики ограничений, их оценки и построенная фазовая траектория (оптимизация)Рис. 3.18. Пример 3.5. Программное управление до и после оптимизацииВ качестве параметров ε̃ взяты следующие значения, удовлетворяющиеусловиям (3.33)100+−−ε+0 = 0.565, ε∗ = 0.565, ε0 = 0.565, ε∗ = 0.565, ε+ = 0.042, ε− = 0.026.Значение критерия (3.38) без оптимизации составило J = 16.05.После численного решения оптимизационной задачи были получены следующие значения оптимизируемых параметров+−−ε+0 = 2.932, ε∗ = 2.940, ε0 = 2.731, ε∗ = 5.815.Значение критерия составило J = 8.36, что соответствует почти 2-х кратномууменьшению значения критерия.Данный пример иллюстрирует применимость, как уже отмечалось ранее,используемого подхода в случае, когда фазовая траектория находится в нижней полуплоскости, т.е.
отвечает условию ẏ = ψ(y) < 0.3.6.4. Векторный случайДля аффинной системы (см. п. 1.1.2)ẋ = A(x) + B(x)u,x ∈ R2n , u ∈ Rnприводимой к каноническому видуnPÿ=f(y,ẏ)+g1j (y, ẏ)uj ,11j=1...nPÿ=f(y,ẏ)+gnj (y, ẏ)uj ,n n(3.39)(3.40)y = (y1 , . . . , yn )T ,j=1рассмотрим задачу терминального управления при наличии ограничений напеременные состоянияY = (y, ẏ) ∈ R2n : yi ∈ [yi0 , yi∗ ], 0 6 ψi− (yi ) 6 ẏi 6 ψi+ (yi ),oψi± ∈ C[yi0 , yi∗ ], i = 1, n(3.41)101и граничных условийyi (0) = yi0 , ẏi (0) = ẏi0 ,yi (t∗ ) = yi∗ , ẏi (t∗ ) = ẏi∗ ,i = 1, n,(3.42)предполагая, что матрица G(y, ẏ) = ||gij (y, ẏ)||, i, j = 1, n является невырожденной при (y, ẏ) ∈ Y и управления ui ищутся в классе непрерывныхфункций времени.Решение данной задачи может быть получено, согласно п.
3.6.1. Имеетместо следующая лемма.Лемма 3.1. Для существования решения задачи (3.40)–(3.42) необходимои достаточно, чтобы ограничения удовлетворяли следующим соотношениямψi− (yi− (yi∗ ) < ẏi∗ < ψi+ (yi∗ ),Zi0y)i∗< ẏi0 < ψi+ (yi0 ),Z ψyi∗dydy6 t∗ 6, i = 1, n.y0i ψi− (y)yi0 ψi+ (y)(3.43)J Действительно, решению задачи (3.40)–(3.42) на фазовых плоскостях (yi , ẏi )соответствуют n t-параметрических кривых yi = yi (t), ẏi = ẏi (t), t ∈ [0, t∗ ].Для каждой фазовой плоскости (yi , ẏi ) мы имеем задачу по построению функции ψi (yi ), удовлетворяющую условиям (3.23)–(3.25).Для существованиятакой функции, согласно [46], необходимо и достаточно выполнение условий (3.28).
Условия (3.43) являются обобщением условий (3.28) на случайn фазовых плоскостей (yi , ẏi ). Таким образом, построив согласно п. 3.6.1 nфункций ψi (yi ), мы получим решение искомой терминальной задачи−1u(y(t)) = G (y(t), ψ(y(t))) ψ10 (y1 (t))ψ1 (y1 (t))− f1 (y(t), ψ(y(t))) ,.........0ψn (yn (t))ψn (yn (t)) − fn (y(t), ψ(y(t)))ψ(y) = (ψ1 (y1 ), . . . , ψn (yn ))T .I1023.6.5. Движение летательного аппарата в вертикальнойплоскости при наличии ограничений на состоянияВ качестве примера рассмотрим задачу автоматической прокладки траектории ЛА в вертикальной плоскости при наличии ограничений на переменныесостояния.Поскольку при движении в вертикальной плоскости углы курса и кренаравны нулю, а боковая дальность постоянна, то система (3.1) примет следующий видV̇ = (nx − sin ϑ)g, ϑ̇ = (ny − cos ϑ)g ,VḢ = V sin ϑ, L̇ = V cos ϑ.(3.44)Рассмотрим задачу снижения и набора высоты ЛА в вертикальной плоскости при наличии ограничений на переменные состояния, а именно на вертикальную скорость Ḣ и продольную скорость L̇ летательного аппарата.