Лазарев Ю.Н. Управление траекториями аэрокосмических аппаратов (2007) (1246773), страница 14
Текст из файла (страница 14)
Ведущим подходом является эквивалентностьсформулированной задачи задаче на минимакс: найти67Лазарев Ю.Н. «Управление траекториями аэрокосмических аппаратов»_____________________________________________________________________________________________________________max min ( f , g )gf ∈Pгде g − вектор, определяемый условием нормировки ( g , e) = 1, который является опорным к (m + 1) -мерной грани множества P.
Решение такой задачи определяет значение λ , после чего определение прообраза λe в σ сводится к решению системы m линейныхалгебраических уравнений.Итерационный метод дает приближённое решение в том смысле, что вместо соотношенияNf = F + ∑ si hi = λeполучаетсяi =1Nf − λe = F + ∑ si hi − λe ≤ δ ,i =1где δ − малый параметр. Кроме того, величина λ не будет точнымминимумом, поэтому для нее требуется выполнение оценкиλ − λmin≤ η∗,η=λminгде η ∗ − заданное число. Число η ∗ и параметр δ определяюттребуемую точность решения.Подробно алгоритм итерационного метода решения задачи линейного программирования описан в [139].2.3.3.
Модификация итерационного метода. Рассмотренныйитерационный метод решения задачи линейного программированиясоответствует условиям формирования номинального управления.При формировании командного управления в реальном времени онможет использоваться после модификации, которая должна обеспечить выполнение заранее определённого числа вычислительныхопераций.Однако это приводит к тому, что за заранее определённое количество итераций приближённого метода решения задачи (2.30) −(2.32) может не выполниться условие для оценки η , в связи с чемснижается точность решения задачи линейного программирования.68Глава 2.
Теоретические основы формирования управления_____________________________________________________________________________________________________________Как следствие этого уменьшается эффективность алгоритма формирования командного управления в целом.Вопрос о целесообразности использования рассмотренногоитерационного метода решения задачи линейного программирования в алгоритме формирования командного управления долженрешаться отдельно в каждом конкретном случае. Для этого необходимо провести дополнительные исследования, подтверждающиеобеспечение необходимой точности решения задачи.Во многих задачах управления траекториями аэрокосмическихаппаратов вследствие достаточно хорошего знания уровня неучтённых при формировании номинального управления возмущающихфакторов командное управление будет находиться в окрестностиноминального.
В связи с этим формулировка задачи формированиякомандного управления обычно содержит меньше ограничений,чем задача формирования номинального управления.Это позволяет использовать рассмотренный итерационный метод решения задачи линейного программирования при следующихусловиях. Назначается меньшая по сравнению с процессом формирования номинального управления величина малой окрестностиопорного управления δU метода последовательной линеаризации.Выполняется небольшое, заранее определённое число итераций поиска вариаций управления δu и небольшое заранее определённоечисло итераций метода последовательной линеаризации.
В этомслучае дополнительные исследования сводятся к уточнению численных значений упомянутых параметров, удовлетворяющих целевой задаче управления аэрокосмическим аппаратом.2.3.4. Использование метода штрафных функций. При формировании командного управления можно использовать более простые алгоритмы решения задачи линейного программирования.
В[30, 112, 113, 141] описаны различные подходы, которые могут использоваться при решении задачи линейного программирования.Рассмотрим метод штрафных функций, сводящийся в используемых обозначениях к минимизации по s квадратичной формывида2⎧ ( j) N( j) ⎫∑ ⎨F + ∑ si hi ⎬ .⎭j =0 ⎩i =1m69Лазарев Ю.Н. «Управление траекториями аэрокосмических аппаратов»_____________________________________________________________________________________________________________Метод штрафных функций обеспечивает решение задачи условной минимизации как последовательности решений задач безусловной минимизации.
Алгоритм решения задачи линейного программирования (2.30) − (2.32) на основе метода штрафных функцийсводится к выполнению следующих операций.1. Осуществляется нормировка задачи.Нормировка обеспечивает условия, при которых одинаковымвариациям управления соответствуют равные приращения функционалов в исходной задаче оптимального управления. При нормировке каждая строка (2.31) ( j = 0,1,..., m) делится наN2( ).( j)∑ hii =12.
Задается начальное приближение вариаций управления −компоненты вектора s : si = si− (i = 1,2,..., N ) .3. Задаются целые числа − пределы изменения значенийштрафного коэффициента k (k o , k n ) и счётчика в методе условногоградиента l (1, ln ) .4. Задаются значения точности ε ( j ) , с которыми должны выполняться j -е ограничения.5. Для всех значений k = k 0 ,..., k n выполняется цикл действий,соответствующий l n -кратному выполнению пунктов 6 − 12.6. Вычисляются невязкиf( j)(s) = F( j)N+ ∑ si hi( j )i =1( j = 1,2,..., m) .7. Определяется функция()δ ( j ) ( f ( j ) (s)) = 1 ,δ ( j ) f ( j ) ( s ) = 0 , еслиf ( j ) (s) ≤ ε ( j ) ,еслиf ( j ) (s) > ε ( j ) .8.
Вычисляется и запоминается значение обобщённой функцииΦ k (s) =Nmi =1j =1()2∑ si hi0 + k ∑ δ ( j ) f ( j ) ( s) f ( j ) ( s) .9. Вычисляются компоненты градиента обобщённой функции70Глава 2. Теоретические основы формирования управления_____________________________________________________________________________________________________________()mΦ ′i ( s ) = hi(0) + 2k ∑ δ ( j ) f ( j ) ( s ) f ( j ) ( s )hi( j ) (i = 1,2,..., N ) .j =110. Определяется вспомогательное приближениеsi = si− при Φ ′i ( s ) > 0 ,si = si+ при Φ ′i ( s ) < 0 ,si = ( si+ + si− ) / 2 при Φ ′i ( s ) = 0 .11. Находится параметр Δ , определяющий длину шага изменения вариации управления s из условияmin Φ k (s + α ( s − s ) ) .0 ≤ Δ ≤1Минимизация обобщённой функции Φ k осуществляется методом золотого сечения.12. Определяется новое приближение градиентного спускаsi = si + Δ( si − si ) (i = 1,2,..., N ) .13. Среди чисел Φ k [s ] выбирается наименьшее. Соответствующие ему значения si (i = 1,2,..., N ) принимаются за решение задачи линейного программирования (2.30) − (2.31).Приведённый алгоритм позволяет за определённое количествовычислительных операций приближённо решить задачу линейногопрограммирования.
Заранее подобранные значения свободных параметров алгоритма обеспечивают приемлемую точность решениязадачи (2.30) − (2.31) и, как следствие этого, не ухудшают эффективность функционирования алгоритма формирования командногоуправления в целом.2.4.
Учёт ограничений на управление2.4.1. Ограничения в виде неравенств. Для аэрокосмическогоаппарата ограничения (1.11) являются ограничениями на величинуи скорость изменения угла атаки и скоростного угла крена (1.1), атакже расхода топлива (1.2). В общем случае рассматриваемые ограничения на управление u зависят от вектора параметров траектории p и записываются следующим образом:71Лазарев Ю.Н.
«Управление траекториями аэрокосмических аппаратов»_____________________________________________________________________________________________________________u min ( p ) ≤ u ≤ u max ( p ) ,(2.33)u& min ( p ) ≤ u& ≤ u& max ( p ) .(2.34)Поиск в пространстве управлений позволяет относительнопросто учитывать ограничения на управление любой степени сложности, включая ограничения на величину управляющего воздействия, скорость его изменения и другие характеристики управляющейзависимости по каждому из каналов управления.
Причём, виды ограничений могут быть заданы как зависимости любых параметровтраектории, которые можно измерить или вычислить в процессеформирования управления.Рассмотрим в общем виде способы учёта ограничений науправление вида (2.33), (2.34) при формировании управляющеговоздействия по k -ому каналу u (t ) (k = 1,2,..., r ) .Учёт ограничений на управление (2.33) осуществляется на каждой итерации улучшения управления следующим образом [77].1. В узлах аппроксимации задачи вычисляются улучшенныезначения управляющей зависимости ui (i = 1,2,..., N ) без учёта ограничений (2.33).2.
Последовательно проверяется, начиная с первого узла, выполнение неравенствui min ≤ ui ≤ ui max(i = 1,2,..., N ) ,где u i min и u i max − значения заданных функций u min ( p) и u max ( p )в узлах аппроксимации. В узлах, в которых эти ограничения не выполняются, значения управляющих зависимостей заменяются наu i min или u i max .3. В качестве нового улучшенного опорного управления принимается зависимость, удовлетворяющая ограничениям (2.33).Учёт ограничений на управление (2.34) осуществляется на каждой итерации улучшения управления следующим образом [77].1. В узлах аппроксимации задачи вычисляются улучшенныезначения управляющих зависимостей ui (i = 1,2,..., N ) без учёта ограничений (2.34).2.
Последовательно проверяется, начиная с интервала междупервым и вторым узлом, выполнение неравенств:72Глава 2. Теоретические основы формирования управления_____________________________________________________________________________________________________________u&i min <u i +1 − u it i +1 − t i< u&i max(i = 1,2,..., N − 1) .Здесь u& i min и u&i max − значения заданных функций u& min ( p) иu& max ( p ) в узлах аппроксимации.На интервалах, на которых эти ограничения не выполняются,производится перерасчёт значений управляющих зависимостей вконце интервала.
Если ui +1 − ui > 0 , то перерасчёт производится поодной из следующих формул:ui +1 = ui + u&i max (ti +1 − ti ) ,ui +1 = ui + u&i min (ti +1 − ti ) (i = 1,2,..., N − 1) .Если ui +1 − ui < 0 , то перерасчёт производится по одной из следующих формул:ui +1 = ui − u&i max (ti +1 − ti ) ,ui +1 = ui − u&i min (ti +1 − ti )(i = 1,2,..., N − 1) .3. В качестве нового улучшенного управления принимается зависимость, удовлетворяющая ограничениям (2.34).Поскольку рассчитанное на итерации неисправленное улучшенное управление принадлежит малой окрестности δU опорногоуправления, а учёт рассматриваемых ограничений не расширяетобласть δU , то предлагаемые способы учёта ограничений науправление не вносят дополнительные погрешности в процесс поиска управления, удовлетворяющего всем условиям задачи.
Выполнение ограничений обеспечивается на каждой итерации улучшения управления одновременно по всем каналам, что позволяетпрерывать поиск на любой итерации при полной гарантии нахождения управляющих зависимостей внутри области допустимыхуправлений U .2.4.2. Ограничения в виде равенств. Рассмотрим, как учитываются ограничения на управление в виде равенств:u = u треб ( p ) ,(2.35)u& = u& треб ( p ) .(2.36)73Лазарев Ю.Н. «Управление траекториями аэрокосмических аппаратов»_____________________________________________________________________________________________________________Учёт ограничений на управление (2.35) осуществляется на каждой итерации улучшения управления следующим образом [77].1.