Лазарев Ю.Н. Управление траекториями аэрокосмических аппаратов (2007) (1246773), страница 17
Текст из файла (страница 17)
Методы, основанные на свертывании критериев.Задача сводится к однокритериальной, если удаётся обосноватьвведение весовых коэффициентов сk (k = 1,2,...K ) , характеризующих относительную важность критериев. Весовые коэффициентыобычно нормируются, составляя в сумме единицу.Однокритериальная задача формирования управления в этомслучае формулируется следующим образом. Определить управление u (t ) для системы (2.40) с начальным условием (2.41), удовлетворяющее ограничениям (2.42) и минимизирующее функционалF0 [u (t )] =m∑ ck Fk , (k = 1,2,...K ) .44)k =1Основным достоинством методов, основанных на свёртываниикритериев в соответствии с (2.44), является выполнение условийоптимальности по Парето. К недостаткам рассматриваемого подхода относится то, что обычно известна лишь сопоставимая важностькритериев, но трудно априори найти численные значения весовыхкоэффициентов, удовлетворяющие всем возможным ситуациям.Кроме того, в ряде случаев малым приращениям весовых коэффициентов соответствуют большие приращения целевых функций, иполученное решение является неустойчивым [25].2.
Методы, использующие ограничения на критерии.Автоматизировать поиск единственного решения многокритериальной задачи позволяет метод последовательных уступок [115].В этом случае критерии располагаются и нумеруются в порядкеубывания важности. Затем производится последовательная оптимизация критериев, начиная с первого, при условии наличия возможности некоторого ухудшения предыдущих критериев (допустимойуступки). После оптимизации последнего по важности критерияпри условии выполнения заданных ограничений на все критериирешение задачи считается найденным.К недостаткам методов, построенных на последовательных уступках, относится то, что, во-первых, полученное решение в общем83Лазарев Ю.Н.
«Управление траекториями аэрокосмических аппаратов»_____________________________________________________________________________________________________________случае не оптимально по Парето, а, во-вторых, затруднительно априорное на все возможные случаи назначение величин уступок, которые, как правило, несоизмеримы между собой.3. Методы целевого программирования.Эти методы предполагают наличие определённой цели по каждому из критериев. Величины целей используются при преобразовании исходной задачи в задачу целевого программирования, которая в соответствии с [168] представляется как минимизация некоторой суммы отклонений с нормированными весами.Основными недостатками методов целевого программированияявляются несоизмеримость разностей критериев и величин соответствующих целей, а также трудности с выбором весов.4.
Методы, основанные на отыскании компромиссного решения.Методы обеспечивают гарантированный результат решения задачи управления из условия поиска максимума минимального (максимин) или минимума максимального (минимакс) критерия.Принцип гарантированного результата для решения многокритериальных задач предложен в работе [70] и развит в работах [29,34, 40, 41, 59-61, 98].Распространённым подходом, позволяющим выбрать единственное решение задачи управления, является сведение рассматриваемой задачи к минимаксной: найти управление u (t ) для системы(2.40) с начальным условием (2.41), удовлетворяющее ограничениям (2.42) и доставляющее минимум функционалуF0 [u (t )] = max F0k [u (t )] (k = 1,2...K ) ,kто есть найтиu (t ) = arg min max F0k [u (t )] (k = 1,2...K )uk(2.45)при условии выполнения ограничений (2.42).При решении минимаксной задачи функционалы F0k сравниваются по величине, и поэтому численному решению этой задачипредшествует операция нормализации функционалов.Существование решения минимаксной задачи (2.45), удовлетворяющего ограничениям (2.42), гарантирует существование ре84Глава 2.
Теоретические основы формирования управления_____________________________________________________________________________________________________________шения поставленной задачи управления и притом единственного.Управление, являющееся решением минимаксной задачи, сформулированной соответствующим образом, по сравнению с другимиуправлениями гарантирует, в частности, наибольшее удаление наихудшего из функционалов от границы области допустимых значений.2.6.3. Итерационная процедура решения.
Рассмотрим подход, основанный на отыскании компромиссного решения (гарантированного результата) в виде (2.45).Пусть известны диапазоны изменения K критериев задачиF0kmin ≤ F0k (u ) ≤ F0kmax(k = 1,2,..., K ) ,где F0kmin − минимальное значение k -го критерия, полученное врезультате решения однокритериальной задачи оптимизации безkучёта остальных критериев и достигаемое при управлении u min,F0kmax − максимальное значение k -го критерия среди значений, соk(k = 1,2,..., K ) . В этом случаеответствующих управлениям u minобоснована нормализацияkξ (u ) =при которойF0k (u ) − F0kminF0kmax − F0kmin(k = 1,2,..., K ) ,(2.46)lim ξ k (u ) = 0 , 0 ≤ ξ k (u ) ≤ 1. Значения F0k (u ) вы-u →u kminчисляются для текущего приближения искомого управления u (t ) .Будем считать, что для нормализованных критериев решениемногокритериальной задачи определяется в соответствии с принципом минимакса (гарантированного результата).
Рассмотрим итерационную процедуру решения многокритериальной задачи формирования номинального управления, которая сводится к выполнению следующих действий [39].1. Решение K задач однокритериальной оптимизации с цельюkнахождения управлений u minи соответствующих им значений критериев F0kmin и F0kmax (k = 1,2,..., K ) .85Лазарев Ю.Н. «Управление траекториями аэрокосмических аппаратов»_____________________________________________________________________________________________________________2.
Выбор начального приближения искомого управления u (t )kиз управлений u minи формирование множества значений F0k (u ) .3. Нормализация критериев при текущем приближении искомого управления.4. Выбор наихудшего критерия ξ * = max β k ξ k (u ) , где β k > 0 −kKкоэффициенты важности критериев, ∑ β k = 1 .k =15. Минимизация наихудшего критерия с целью нахожденияследующего приближения текущего управления:u (t ) = arg min ξ * (u ) .u∈UУправление u (t ) принимается в качестве решения многокритериальной задачи, если на двух смежных итерациях значения наихудших критериев отличаются на значение, меньшее заданной точности, в противном случае выполняется следующая итерация, начиная с пункта 3.
Поиск приближённо-оптимального управления сучётом всех ограничений при выполнении пунктов 1 и 5 выполняется с помощью алгоритмов на основе метода последовательнойлинеаризации.На каждой итерации решения многокритериальной задачи минимизируется наихудший критерий, в качестве которого может выступать любой критерий. В процессе поиска формируется приближение множества Парето, из которого в соответствии с коэффициентами важности критериев автоматически выбирается единственное решение.Приведённая процедура может использоваться при формировании командного многокритериального управления. Для этого необходимо обеспечить выполнение требований к алгоритмам реального времени, в частности, априорную определённость числа выполняемых вычислительных операций.В этом случае пункты 1 и 2 не выполняются, соответствующиеим операции выполняются заранее: значения критериев F0k ∗ ,(k = 1,2...K ) не рассчитываются, а принимаются равными значениям, полученным при решении задачи формирования номинального86Глава 2.
Теоретические основы формирования управления_____________________________________________________________________________________________________________управления, начальное приближение управления u 0 принимаетсяравным полученному при этом номинальному управлению. Количество итераций поиска задаётся заранее.2.6.4. Аппроксимация множества Парето. Приближённооптимальное управление можно получить с использованием аппроксимации в K -мерном пространстве критериев поверхностиϑ (Π ) , образованной сочетаниями критериев при π -оптимальныхуправлениях [86]. В соответствии со свойствами множества Парето[54] поверхность ϑ (Π ) строго монотонна и представляет собой левую нижнюю границу множества Φ . Поверхность ϑ (Π ) являетсявыпуклой, если множество Φ выпукло.
В этом случае поверхностьϑ (Π ) может быть аппроксимирована гиперповерхностью.В двухкритериальной задаче гиперболическая кривая (рис.2.1),проходящая через точки аппроксимации A′(ξ ′,ξ ′′) и A′′(ξ ′,ξ ′′) , сцентром в начале координат и асимптотами − координатными осями (в результате нормализации критериев) определяется уравнениемξ 2 = a(ξ1 ) − bс коэффициентамиbln ξ 2″ − ln ξ 2′b=, a = ξ 2′ ξ1′ .ln ξ ′ − ln ξ ″1( )1В общем случае K критериев уравнение аппроксимирующейгиперповерхности, проходящей через K точек аппроксимацииA k ξ1k , ξ 2k ,..., ξ Kk ( k = 1,2,..., K ) имеет вид()ξ K = a(ξ1 )− b1 (ξ 2 )− b2 ...(ξ K −1 )− b K −1с коэффициентами a , b1 , b2 ,…, bK −1 , получаемыми в результатерешения системы уравнений( )−b (ξ 2k )−b ...(ξ Kk −1 )−bξ Kk = a ξ1k12K −1k = 1,2,..., K .(2.47)87Лазарев Ю.Н. «Управление траекториями аэрокосмических аппаратов»_____________________________________________________________________________________________________________Рис.
2.1. Формирование аппроксимирующих гипербол2.6.5. Методика использования аппроксимирующих гиперповерхностей. С учетом свойства, сформулированного в [148],нормализованные критерии при минимаксно-оптимальном управлении равны между собой. В двумерном случае точка, образованная сочетанием критериев при этом управлении, принадлежит биссектрисе первого квадранта. Вследствие этого координаты вершинаппроксимирующих гипербол (точки Ci , Ci −1 на рис.
2.1) соответствуют приближённым решениям двухкритериальной задачи.Для формирования управления, являющегося приближённымрешением многокритериальной задачи, необходимо выполнитьследующее[86].1. Определить K векторов управления, обеспечивающих сочетания критериев, при которых значения ( K − 1 ) критериев фиксированы, а один критерий достигает минимума.2.
Определить коэффициенты аппроксимирующей поверхностипутём решения системы (2.46).88Глава 2. Теоретические основы формирования управления_____________________________________________________________________________________________________________3. Вычислить координаты вершины аппроксимирующей поверхности по формулеξ1С = ξ 2С = ... = ξ kС = ξ C = (a )1b1 +b2 +...+bK −1 +1.Сочетание критериев в вершине аппроксимирующей поверхности и соответствующий вектор управления представляют собойприближённое решение многокритериальной задачи.Уточнение приближённого решения может быть выполнено спомощью итерационной процедуры минимизации максимальногодля данного приближения критерия при фиксированных значенияхдругих критериев. Управление, полученное в результате скалярнойминимизации, позволяет сформировать соответствующую аппроксимирующую гиперповерхность, координаты вершины которой являются опорным управлением на следующей итерации.Сходимость итерационной процедуры обеспечивается выборомшага Δξ i i -й итерации (рис.