Лазарев Ю.Н. Управление траекториями аэрокосмических аппаратов (2007) (1246773), страница 18
Текст из файла (страница 18)
2.1) так, чтобы выполнялось условие′ξ C i −1 − min ξ kAi < Δξ i < Δξ i −1 ,k ∈Kза счёт чего вершина аппроксимирующей гиперповерхности оказывается на каждой итерации между точками аппроксимации Ai′ и Ai′′ .Шаг на i -й итерации вычисляется по формулеA′Δξ i =Δξ i −1 + ξ C i −1 − min ξ k ik ∈K2.2.6.6. Алгоритм решения двухкритериальной задачи. В случае K =2 аппроксимирующая кривая является гиперболой.
С учётом нормализации (2.46) центр гиперболы принадлежит началу координат, так как асимптотами являются координатные оси. Линияϑ (Π ) π -оптимальных сочетаний критериев имеет вид, показанныйна рис. 2.1.Предложен следующий алгоритм формирования минимакснооптимального управления [86].1. Решаются задачи скалярной минимизации критериев Rk [u ] ,k ∈ K .
Определяются управления u kmin и соответствующие им ми89Лазарев Ю.Н. «Управление траекториями аэрокосмических аппаратов»_____________________________________________________________________________________________________________нимальные значения каждого критерия Rkmin , k ∈ K без учёта остальных критериев.2. Определяются максимальные значения каждого критерияRkmax =max Rk [u nmin ] , k ∈ K .n∈K , n ≠ k~3.
Выбирается начальный закон управления u н ∈ U средиu kmin , k ∈ K .4. Задаётся начальное значение шага Δξ н < 1 .5. Определяется опорное управление, тождественное начальному управлению ui = u н при i = 0 (i − номер итерации), или полученному на предыдущей итерации ui = uiC−1 при i > 0.6. Определяется критерий с наибольшим нормализованнымзначениемξ ki ′ = max ξ ki [ui ] ,k ∈Kи фиксируется значение другого критерия R k = R k [ui ] , k ≠ k ′ ; об~ласть U дополняется ограничением~~U ′ = u ∈ U , R k [u ] = R k , k ≠ k ′ .{}7. Формируется управление uik ′ , удовлетворяющее условиюминимальностиi′ξ ki ′ [u ki ′ ] = min~ ξ k ′ [u ] , k ∈ K ,u∈U ′и вычисляются координаты точки Ai′ (ξ1′i ,ξ 2′ i ) , принадлежащеймножеству ϑ (Π ) .8.
Определяется значение шага итерации Δξ i = Δξ н при i = 0илиA′Δξ i =Δξ i −1 + ξ C i −1 − min ξ k ik ∈K2при i > 0. Вычисляется значение критерия с номером k ′ , соответствующее этому приращению90Глава 2. Теоретические основы формирования управления_____________________________________________________________________________________________________________( [ ])()Rk ′ = ξ k u ki ′ + Δξ i Rkmax − Rkmin + Rkmin .~Область U дополняется ограничением~~U ′′ = u ∈ U , Rk ′ [u ] = Rk ′ .{}9. Формируется управление uik ′′ , удовлетворяющее условиюминимальностиiξ ki ′′ [u ki ′′ ] = min~ ξ k ′′ [u ] , k ′′ ∈ K ,u∈U ′′и вычисляются координаты точки Ai′′(ξ1′′i ,ξ 2′′i ) .10.
Вычисляются координаты вершины гиперболыξ1Ci= ξ 2Ci= (a )1b +1 .11. Формируется управление uiC , соответствующее точкеCi (ξ1Ci , ξ 2Ci ) или ближайшей к ней точке, если Ci ∉ Ф ; для этого покоординатам Ci определяются значения исходных критериевRkC = ξ kiC ( Rkmax − Rkmin ) + Rkmin , k ∈ K ,и находится управление u из условия принадлежности области~~U С = u ∈ U , R k [u ] = RkC , k ∈ K ,{}если Ci ∈ Ф , или, если Ci ∉ Ф , из условияkCmin~ max R [u] − Rk .u∈U k∈K12.
Проверяется условие окончания поиска ξ iC−1 − ξ iC ≤ ε . Приего выполнении точка Ci считается приближённым минимакснооптимальным сочетанием критериев, а её прообраз uiC − минимаксно-оптимальным управлением u 0 ; в противном случае вычисленияповторяются, начиная с пункта 5.2.6.7. Алгоритм решения многокритериальной задачи вобщем случае. В общем случае K критериев алгоритм сводится квыполнению следующих действий [86].91Лазарев Ю.Н.
«Управление траекториями аэрокосмических аппаратов»_____________________________________________________________________________________________________________~1. Выбирается начальный закон управления u н ∈ U ; задаетсяначальное значение шага Δξ н < 1 .2. Определяется опорное управление по правилу:ui = u н при i = 0 , ui = uiC−1 при i > 0 .3. Формируется K управляющих зависимостей uik , k ∈ K путем последовательного решения K задач минимизацииiξ ki [u ki ] = min~ max ξ k [u ], k = 1,...K ,u∈U ki k ∈K~~U ki = {u ∈ U , R k [u ] = R0k , k ≠ arg max ξ ki [u ki −1 ], k ∈ K } ,k∈Kв каждой из которыхR k = ξ ki ( Rkmax − Rkmin ) + Rkmin , ξ ki = ξ ki −1 + Δξ i ,где ξ ki−1 - значение k -го критерия, полученное в результате решения предыдущей задачи.
В каждой из K задач начальным приближением служит управление ui при k = 1, и u ki −1 при k = 2,3,..., K ;при этом шаг итерации равенA′Δξ i =Δξ i −1 + ξ C i −1 − min ξ k ik ∈K2.k4. Вычисляются координаты точек Aik (ξ1ki , ξ 2ki ,...,ξ Ki), k ∈ K ,принадлежащих множеству ϑ (Π ) .5. Вычисляются координаты вершины гиперповерхностиCCi = (ξ1Ci ,ξ 2Ci ,...,ξ Ki),ξ1Ci= ξ 2CiC= ... = ξ Ki= ξ iC= (a )1b1 + b2 + ... + b K −1 +1 ,где коэффициенты b1 , b2 ,..., bK −1 определяются из системы( )−b (ξ 2k )−b ...(ξ Kk −1 )−bξ Kk = a ξ1k9212K −1, k = 1,2,..., K .Глава 2. Теоретические основы формирования управления_____________________________________________________________________________________________________________6.
Формируется управление uiC , соответствующее точке Ci илиближайшей к ней точке, если Ci ∉ Ф ; для этого по координатамточки Ci определяются значения исходных критериевRkC = ξ kiC ( Rkmax − Rkmin ) + Rkmin , k ∈ K ,и находится управление u из условия принадлежности области~~U C = u ∈ U , R k [u ] = RkC , k ∈ K ,{}если Ci ∈ Ф , или, если Ci ∉ Ф , из условияkCmin~ max R [u] − Rk .u∈U k∈K7. Проверяется условие окончания итераций ξ iC−1 − ξ iC ≤ ε .
Если оно выполнено, то точка Ci считается приближённым минимаксно-оптимальным сочетанием критериев, а её прообраз uiC −минимаксно-оптимальным управлением u 0 ; в противном случаевычисления повторяются, начиная с пункта 2.2.6.8. Условия сходимости алгоритма. Алгоритм позволяетопределить минимаксно-оптимальное сочетание критериев ξ 0 законечное число итераций, то есть для заданной точности ε > 0 найдётся такой номер i , чтоξ 0 − ξ iC ≤ ε .(2.48)Для случая K =2 гиперболы, соответствующие смежнымитерациям, определяются уравнениями (рис. 2.1) [86]Г i −1 : ξ 2 = f i −1 (ξ1 ) , Г i : ξ 2 = f i (ξ1 ) .Пусть приращение Δξ i подбирается так, что на каждой итерации точки Ai′ и Ai′′ лежат на гиперболе по разные стороны от Ci . Вэтом случае можно подобрать такое δ ∈ [0,1] , чтоξ kC = δξ k′ + (1 − δ )ξ k′′ , 0 ≤ δ ≤ 1, k = 1,2 .Поскольку гипербола является выпуклой кривой, то из условиявыпуклости93Лазарев Ю.Н.
«Управление траекториями аэрокосмических аппаратов»_____________________________________________________________________________________________________________f (δξ k′ + (1 − δ )ξ k′′ ) ≤ δf (δξ k′ ) + (1 − δ ) f (ξ k′′ )для любого δ ∈ [0,1] вытекает, чтоξ 2Ci = f i (ξ1Ci ) = f i (δξ k′ + (1 − δ )ξ1′′) ≤ δf (δξ1′ ) + (1 − δ ) f (ξ1′′) == δξ 2Ci −1 + (1 − δ ) f (ξ1′′) .(2.49)Так как по построению точки Ai′′ верно неравенствоf (ξ1′′) = f i (ξ1Ci−1 ) ≤ ξ 2Ci −1 ,то при подстановке ξ 2Ci −1 вместо f (ξ1′′) неравенство (2.49) не изменит знакξ 2Ci = δξ 2Ci −1 + (1 − δ )ξ 2Ci −1 = ξ 2Ci −1 .(2.50)С учётом того, что по свойству симметричностиξ1С = ξ 2С = ξ 3С ,(2.51){ }из (2.50) следует невозрастание последовательности точек ξ iCξ iC ≤ ξ iC−1 .С другой стороны, по свойству симметричности (2.51) и свойству минимальностиξ ki [u ki ] = min~ ξ ki [u ] , k ∈ Ku∈Uсочетание критериев ξ 0 при минимаксно-оптимальном управлении{ }u 0 ограничивает последовательность точек ξ iC снизу:ξ 0 = min~ ξ k , k = arg max ξ k .k ∈Ku ∈UТаким образом, существует lim ξ iC = ξ 0 , а это означает, что,i →∞начиная с некоторого номера i , выполнится условие (2.48).Решение многокритериальной задачи на основе предложенногоалгоритма сводится к последовательности скалярных оптимизационных задач и предусматривает следующее [86].1.
Формирование K Парето-оптимальных управлений;94Глава 2. Теоретические основы формирования управления_____________________________________________________________________________________________________________2. Построение в соответствии со значениями критериев приэтих управлениях гиперболических поверхностей (кривые Г i , Г i −1на рис. 2.1), аппроксимирующих поверхность Парето в пределахмалой окрестности опорного управления;3. Нахождение точки сочетания критериев, принадлежащей аппроксимирующей поверхности и имеющей равные нормализованные значения критериев, и формирование соответствующегоуправления.Предложенный алгоритм позволяет определять минимакснооптимальное сочетание критериев ξ 0 как в случае выпуклого к началу координат множества ϑ (Π ) , так и в невыпуклом случае, поскольку на предпоследнем шаге в невыпуклом случае ищется точка,ближайшая к C в смыслеu = arg min~ max ξ ik [u ] − ξ iC .u =U k ∈KАлгоритм, кроме того, позволяет учесть приоритеты критериев,задаваемые коэффициентами важности β k :K∑ β k = 1, β k > 0 , k ∈ K .k =1В этом случае алгоритм применяется в неизменном виде, нонормализованные критерии подвергаются преобразованию:ξ k = β kξ k , k ∈ K .Таким образом, предложенный алгоритм, формируя минимизирующую последовательность управлений, сводит решение многокритериальной задачи управления к последовательности решенияскалярных задач оптимизации.2.7.