Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 66
Текст из файла (страница 66)
При любом уровне ограничения сложности2)2(S ( t ) , 0 < S ( ) ( t ) < ∞ и при любом x ( t ) ∈ X ( t ) в частном случаеkkqq358Задачи управления двухкоалиционными ММС. Часть II(см. пункт 8.2.2) оценкой сверху множителя Лагранжа ρ* , обеспечивающего этот уровень сложности, является величина ρ*max – решение уравне2ния nρ*− 2 b1 ( tk ) ρ*− 2 + b2 ( tk ) ρ*−1 + b3 ( tk ) =S ( ) ( tk ) , где bi – известныефункции.Замечание 8.2.• Для решения нелинейных уравнений (8.93), (8.96) удобно использование простейших итерационных методов – метода секущих, методаНьютона и их комбинаций [262].• При вычислении МИПФ K ∆* ( t2 , t1 ) в рамках программной системы, вкоторой производится исследование всей задачи, более удобными, чемформулы (8.92), (8.95) являются исходные формулы (8.90), (8.16).• Если требуемая точность достижения функционалом сложностизаданного значения невысока, то, вследствие известного характеразависимости значений функционала сложности от множителя Лагранжаρ [240], этот множитель может оказаться экономичнее находить (всмысле расхода машинного времени) не из (8.93), (8.96), а назначатьаприори и уточнять затем с помощью нескольких проб [240].• При расширении постановки задачи пункта 8.1.3 путем отказа отфиксации момента времени tk задача поиска момента tk = tk* сводитсяк одномерной задаче нелинейного программирования.
Если матрицыфункции уровней спектральной плотности аддитивных и мульти2пликативных помех N 2n ( ττ1 ) , N Г ( 2 ) непрерывны, то для этой задачинелинейногопрограммированияможнодоказатьтеоремысуществования решения. Аналитическое решение задачи поиска tk = tk*даже в простейшем «плоском» случае не удается. Это заставляеториентироваться на применение известных методов минимизации, накаждой итерации которых требуется решать уравнения (8.93), (8.96).Анализ результатов 8.3. На основе результатов 8.2 получены нелинейные уравнения (8.93), (8.96) для определения множителей Лагранжаρ* , обеспечивающих заданные значения функционалов сложности, и доказаны утверждения 8.3, 8.4 существования решений этих уравнений.Аналитическое решение уравнений (8.93), (8.96) не удается даже в простейших случаях, вследствие чего принята ориентация на использованиеизвестных численных методов.
В этой связи для обоих функционалов( 2)сложности (для E2 в частном случае (см. 8.3.2)) получены выражения дляоценок сверху ρ* (предложения 8.1, 8.2).Глава 8. Стохастическая интегро-дифференц. модель конфликта3598.4. О МЕТОДЕ ОПРЕДЕЛЕНИЯ ОПТИМАЛЬНОЙ СТРАТЕГИИ ОБЪЕКТА QВ параграфе рассматривается второй этап решения игры – поиск оптимальной (гарантирующей) стратегии u*q ( t ) (см.
(8.29)).((Выражения для функционала выигрыша=E1** ( tk ) E1 tk , K *∆ ρ* , tk , t, θ))1могут быть получены путем подстановки (при ρ = ρ* ) полученных в 8.2выражений для МИПФ K *∆ ( τθ, ) в интегральные уравнения. Однако такойпуть приводит к слишком громоздким результатам. В данном случае целесообразнее использовать матрицы K * ( ρ, tk , t ) (8.50), (8.73) и векторыε д* ( ρ, tk ) (8.57), (8.81).Представим функционал E1** (tk ) в виде суммы двух функционалов:(1) (2)*=E1** ( tk ) E1 ε д* ρ* , tk + λ q E1 tk , K * ρ=, tk , t(8.97)( 2 )**(1)**= E1 ( tk ) + λ q E1( tk ) ,*где(8.98)E1(1)** (tk ) =tr[ε д* (rr, tk )ε д*T ( * , tk )] ,( ())())( tk( 2 )**(8.99)E1tk ) tr ∫ K * r* , tk , t1 N 2 ( t1 ) K *T r* , tk , t1 d t1 .(=t0В случае первого функционала сложности подстановка (8.50) в (8.99)после несложных преобразований аналогично (8.92) дает(1)**E2 ( tk ) =())( t2*, tk ε д*T * , tk=r*tr ∫ V ( t1 ) V1−2 r* , t1 V ( t1 ) z ( t1 ) d t1ε д* rr t0()(()( (8.100)) ;) здесь и в (8.98) в этом случае определяется по формуле (8.57).Для второго функционала сложности ε ( ρ , t ) определяется по формуле (8.81), а K ( ρ , t , t ) получается из (8.73) с помощью операции, обратε д* ρ* , tkд***k*k1ной прямому суммированию (8.70); N 2 ( τ1 ) в обоих случаях определяетсявыражениями (8.35), (8.36).1См.
замечание 8.1.Задачи управления двухкоалиционными ММС. Часть II360Задача оптимального управления для определения оптимальной страте-гии u*q ( t ) формируется в результате следующим образом.Объект управления Q описывается системой дифференциальных уравнений в нормальной форме Коши (8.10), где x q ( t ) – вектор фазовых координат, u q ( t ) – вектор управлений.Начальное состояние объекта задается вектором x 0q , «целевое множество» – множеством X q ( tk ) .Имеется совокупность ограничений на фазовые координаты объекта,задаваемая системой hi xq ( t ) ≥ 0 (см.
8.1.3).()Классом допустимых управлений является класс измеримых на [t0 , tk ]функций; «ограничивающее множество» задается множеством U q ( t ) (см.п. 8.1.3).Утверждение 8.5. Решение сформулированной задачи оптимальногоуправления для обоих функционалов сложности существует.Для доказательства теоремы достаточно показать 1, что в условияхсформулированной задачи оптимального управления:• существует равномерная оценка для всех решений (8.10) приuq ( t ) ∈U q ;• критерий качества управления (8.97) непрерывен по x q ( t ) в R m .Но существование равномерной оценки для решений (8.10) непосредственно следует из липшицевости по u q ( t ) вектор-функции f0 (см. 8.1.3).Непрерывность же критерия качества управления (8.97) по x q ( t ) следуетиз непрерывности по x q ( t ) вектор-функции ε д* ρ* , tk и матрицы-()()функции K * ρ* , tk , t1 .Оценим пригодность для решения сформулированной задачи оптимального управления известных приближенных (численных) методов оптимального управления.
Для этого выделим четыре подхода к построениюприближенных методов решения задач оптимального управления.Первое направление связано с попытками прямо решить систему уравнений, задающих необходимые условия экстремума [166]. Обстоятельныйразбор трудностей, которые встречаются на этом пути, дан Р.П. Федоренко 2.1См., например, Ли Э.Б., Маркус Л. Основы теории оптимального управления. – М.:Наука, 1972 г. (глава 4, теорема 4).2Федоренко Р.П. Приближенное решение задач оптимального управления. – М.: Наука,1978.Глава 8. Стохастическая интегро-дифференц.
модель конфликта361Второе направление связано с построением максимизирующей последовательности траекторий – метод вариаций в фазовом пространстве.Наиболее широко используемой формой этого метода является, видимо,метод локальных вариаций Ф.Л. Черноусько [257]. Суть этого метода составляет «элементарная операция» – приближенное решение исходнойзадачи оптимального управления на малом интервале времени. Для частного («плоского») случая рассматриваемой задачи легко строится элементарная операция, подобно и метод может быть использован для поиска оптимальных управлений.
Однако в общем случае, несмотря на опытработы с этим методом, для функционала (8.97) элементарную операциюпостроить не удалось. Другие формы метода вариаций в фазовом пространстве, например, метод «киевский веник» и метод «блуждающейтрубки» [166], не требуют построения элементарной операции и могутбыть использованы для приближенного решения рассматриваемой задачи оптимального управления.Третье направление связано с построением максимизирующей последовательности управлений. Укажем здесь на метод последовательныхприближений Ф.Л.
Черноусько [257] и метод последовательной линеаризации Р.П. Федоренко. Подобно методу локальных вариаций эти методымогут быть использованы для частного («плоского») случая задачи. Однако требуемое этими методами вычисление функциональных производныхделает их из-за сложности функционала (8.97) непригодными в общемслучае.Четвертое направление связано с методом математического программирования.
Укажем здесь на разработанный «метод вариации точек переключения», предназначенный для поиска оптимальных управлений в классе кусочно-постоянных функций. Развитием этого метода можно считать«метод параметризации» задач оптимального управления1. Наиболее отчетливо особенности рассматриваемого направления проявляются в методе редукции исходной бесконечной задачи к конечномерной задаче нелинейного программирования.
Существует обширная литература, посвященная различным аспектам этого метода (см., например, библиотеку программ решения задач оптимального управления 2). В данной работе приведены убедительные примеры эффективности этого подхода. Отметим,кроме того, что преимущества направления очевидны для параметрических задач оптимального управления.
Таким образом, все методы четвертого направления могут быть рекомендованы для решения рассматриваемой задачи оптимального управления.1См., например, Горбунов В.И. Метод параметризации задач оптимального управления. –ЖВМ и МФ 1979, №2, с. 229 – 303.2Грачев Н.И., Евтушенко Ю.Г. Библиотека программ для решения задач оптимальногоуправления. – ЖВМ и МФ 1979, №2, с. 367 – 387.Задачи управления двухкоалиционными ММС.
Часть II362Таким образом, в данном пункте сформулирована задача оптимальногоуправления для нахождения оптимальной (гарантирующей) стратегии объекта Q и доказано утверждение 8.5 существования этой задачи. Аналитическое решение этой задачи не удается, вследствие чего принята ориентация на использование известных численных методов решения задач оптимального управления. На основе краткого обзора известных приближенных методов оптимального управления показана возможность использования для поставленной задачи методов перебора в пространстве фазовыхкоординат и прежде всего метода редукции исходной задачи к задаче нелинейного программирования. Вопросы алгоритмического и программного обеспечения метода поиска оптимальных (гарантирующих) решенийдля объекта Q, оценки его вычислительной сложности, с анализом путейповышения быстродействия рассмотрены в работах [66, 117] и изложены вглаве 9.8.5.
АНАЛИЗ БЛИЗОСТИ МИНИМАКСНЫХ И МАКСИМИННЫХ ОЦЕНОКЭФФЕКТИВНОСТИ В ИНТЕГРО-ДИФФЕРЕНЦИАЛЬНОЙ ПОЗИЦИОННОПРОГРАММНОЙ ЗАДАЧЕ СБЛИЖЕНИЯ-УКЛОНЕНИЯНА ОСНОВЕ ε-РАВНОВЕСИЯ8.5.1.Сравнение алгоритмических особенностейминимаксных и максиминных подходовПолное исследование рассматриваемой задачи сближения-уклонениятребует ее решения с позиции обоих сторон, т.е.