Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 18
Текст из файла (страница 18)
Поэтому на начальномэтапе поиска, вдали от равновесия q r , иерархический метод более эффективен, так как его алгоритмическая структура более работоспособна вусловиях овражности и невыпуклости компонент векторного показателя(что обеспечивает двухуровневая схема оптимизации).Использование только иерархического метода имеет следующие недостатки: сравнительно большое время вычисления функционала арбитра V ,скачкообразность итерационного процесса (малая скорость сходимости)вследствие периодического обновления начального приближения новойфункции координации q̂ 0 по формуле (2.40) и связанного с этим решенияпоследовательности mk оптимизационных задач вида (2.37).
Увеличениеλ r1 (и соответствующее уменьшение λ r 2 ) снижает скачкообразность итерационного процесса, но не улучшает сходимость, и, кроме того, в отдельных случаях приводит к преждевременному останову иерархических процедур при | V |> ε в неравновесной точке.Стабильные эффективные решения и компромиссы. Часть I862.4.2.Выбор начальных приближений этапа 2 субоптимальногометода на основе сетевых подходов (этап 1)Для определения начальных приближений равновесных решений присуществовании Нэш-равновесия или выявления равновесных «предпосылок» при отсутствии информации о существовании равновесия предлагается следующий подход.Как известно, на основе безусловной оптимизации с учетом ограничений простейшие необходимые условия равновесия q* по Нэшу принимают вид системыµi∂J i (q* || qi )∂g i (q* || qi )+ νi a i = 0,=i 1, N ,i∂q∂q(2.45)где g ia − активные ограничения i-й подсистемы, J i − скалярный показатель i-й подсистемы, qi − подвектор параметров i-й подсистемы,qi ∈ Qri ⊂ Eri ,Qri – ri -мерный куб ограничений, соответствующий параметризации про-граммного управления ПКЗУ на отрезке [t j −1 , T ] (например, при j = 1 ) вида (1.14)ui (t ) = q1i ⋅ 1[t1 − t0 ] + q2i ⋅ 1[t2 − t1 ] + 2 + qrii ⋅ 1[T − tri −1 ],где 1[ti − tk ] = 1[t − tk ] − 1[t − ti ], ti > tk .В каждом ri -мерном кубе сформируем равномерную (на основе ЛПпоследовательности [48, 238] ) или ортогональную сеть.Для каждого фиксированного набора (q ф || qi ) = (q1ф , , qi , q фN ) получаем задачу перебора J i (q || qi ) сети куба параметров i-й подсистемы сцелью минимизации, где22 ∂I i (q ф || qi ) i ∂g ai (q ф || qi ) J i (q ф || qi ) = mi + n → min.qi∂qi∂qi (2.46)Для внутренних точек qi ( νi ≡ 0) .
Пусть minI i = I i (qФ || qiopt ) .iqМногократно решаем q -подобную матричную задачу для различныхфиксированных наборов в пределах сетей j-х подсистем ( j ≠ i ) .Выбираем среди множества решений одну точку (или несколько) изусловияmin[ J i (q ф || qiopt )] = min minJ i (q || qi ) = ε .iqфqфqГлава 2. Модифицированный метод скалярной Нэш-оптимизации87Если ε – достаточно малая величина, то запоминаем точку q ф и соответствующую ей qiopt , т.е.(qф) ()i|| qiopt = q1ф,opt , , qopt, q фN,opt .Если ε – большая величина, то увеличиваем плотность ri -сетей дляуменьшения ε .
Аналогичные задачи решаем для всех N .Далее производим сравнение результатов. Если «встречаются» общиевектора q ф || qiopt при решении всех N задач, то это свидетельствует о существовании равновесия: эти вектора – потенциальные первые приближения. Если вектора параметров близки друг другу, то необходимо увеличить плотность сетей ε в многомерных ri -кубах, что, возможно, приведетк сближению векторов или к полному совпадению.Определенную информацию об отсутствии Нэш-равновесия в сетевомподходе и, возможно, в исходной задаче дает результат сохранения достаточно больших ε в части или во всех N задачах при увеличении плотности сетей. При отсутствии Нэш-равновесия можно использовать, например, результаты работы [234] по неклассическим равновесиям.Данная методика становится достаточно простой при небольшом числесистем N (где mK = N ), небольшой размерности векторов управления иих параметризации на интервале [t j −1 , T ] .Алгоритмический вариант подхода сформирован при реализации необходимого условия векторного равновесия (см.
гл. 3).2.4.3.О параллельной реализации процедур методаДля введения ПКЗУ в реальное время полезно использовать структурные возможности Пао-подхода.Действительно, судя по структурной схеме метода, на итерации одновременно решается N +1 задача оптимизации, что может быть реализованона N +1 процессоре в параллельном режиме.Для ускорения вычислительных процедур приблизительно в (N + 1) разнеобходимо сравнить время вычислений в задаче-арбитре и в однотипныхзадачах нижнего уровня. Если задача-арбитр решается по времени длительнее, чем все задачи нижнего уровня, то введение N + 1 процессоров неимеет смысла, так как часть времени N процессоров будут простаивать иувеличение стоимости вычислительной системы неправомерно.Исследование тестовых примеров показало, что время решения задачиарбитра соизмеримо с временем решения задачи в каждой системе нанижнем уровне, поэтому параллельная реализация допустима.
И решениеможет быть ускорено в N раз.Стабильные эффективные решения и компромиссы. Часть I88Ресурсы распараллеливания структурными свойствами не исчерпываются и могут быть дополнены в подсистеме моделирования на этапе формирования градиентного алгоритма и при вычислении начальных приближений, что исследовано в соответствующей главе, посвященной реализации стабильных и эффективных решений (гл.
9).2.4.4.Построение оптимальных программных управленийс использованием спектральных подходов 1Выше было указано, что для улучшения точности алгоритма Пао можетбыть применен градиентный алгоритм Ермольева. В данном пункте приводятся методические основы спектрального метода получения оптимальных программных управлений. Этот подход может считаться альтернативой градиентному методу Ермольева, поскольку он использует параметризацию функций управления, фазовых координат, функционалов качества, атакже предполагает применение градиентного метода оптимизации.
Крометого, по неклассическим равновесиям безкоалиционной игры, спектральный подход обеспечивает получение решения в виде непрерывных функций, что, как будет показано на примере, может существенно улучшитьзначения показателей качества, а также может быть использовано для анализа динамики конфликта и его прогноза.Ниже приводится основной алгоритм решения поставленной задачиспектральным методом.Пусть поведение объектов описывается векторно-матричным дифференциальным уравнением вида(2.47)x =+A ( t ) x B ( t ) u, x ( 0 ) =x 00 .Предположим, что нестационарный объект (2.47) вполне управляем.Далее, производится редукция математической модели объекта управления к конечномерному эквиваленту.
Параметризация вектор-функцийx ( t ) и u ( t ) осуществляется с помощью спектрального представлениякомпонент в ортонормированном базисе (удерживается конечное числочленов разложения)llx1=ϕxtctu=t)()(()∑v v ∑ cvu1 ϕv ( t ) 1l 1lv =0v =0xl ( t ) = .............................. , ul ( t ) = .............................. (2.48)llum=( t ) ∑ cvxn ϕv ( t )nl ( t ) ∑ cv ϕ v ( t ) xnlu=v =0v =0(индекс l далее будем опускать).1Cм.
Трофимов А.И., Егупов Н.Д., Дмитриев А.Н. Методы теории автоматическогоуправления. – М.: Энергоиздат, 1997. – 654 с.Глава 2. Модифицированный метод скалярной Нэш-оптимизации89Или, что то же самое, ФT ( t ) C x1 ФT ( t ) Cu1 uxl ( t ) ==C x , ul ( t ) = Ф ( t )= Ф ( t ) C . (2.49) T Tx x Ф ( t ) C n Ф ( t ) C m Если в результате решения задачи нелинейного программирования получены одностолбцовые матрицы коэффициентов Фурье компонент вектора управления C*u1 , C*u2 , ..., C*um , то оптимальное программное управлениеTопределяют с помощью зависимости=uk* ( t ) Ф=( t ) C*uk , k 1, m , а опти-мальные фазовые траектории находят по формулам xi ( t ) = ФT ( t ) C* xi ,i = 1, n .2.5.
ПРИМЕР ПРИМЕНЕНИЯ ДВУХЭТАПНОГО АЛГОРИТМА ПАО–НЭШОПТИМИЗАЦИИ ДЛЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ КОАЛИЦИЯМИВ КОНФЛИКТНОЙ СИТУАЦИИ ЛС СВН – ЛС ПВО2.5.1.Постановка задачиРассмотрим задачу противодействия локальной системы воздушногонападения (ЛС СВН) и локальной системы ПВО (ЛС ПВО) [173, а такжегл. 4 и гл. 10].Противодействие ЛС СВН–ЛС ПВО состоит в том, что ЛС СВН стремится преодолеть ЛС ПВО для поражения защищаемого объекта, а ЛСПВО препятствует прорыву.Последовательный алгоритм получения программно-корректируемогозакона управления активными средствами при взаимодействии ЛС СВНЛС ПВО (см.
гл. 10) представляет собой четырехэтапную процедуру, причем на каждом этапе выполняются четыре шага:Э т а п 1. Формирование конфигурации конфликта.Э т а п 2 . Целераспределение АС СВН и ПВО по активным и пассивным средствам ПВО и СВН соответственно.Э т а п 3. Имитация конфликта.Э т а п 4. Прогнозирование динамики конфликта.В данном пункте рассматривается задача только на последнем шаге:прогнозе динамики конфликта.В данной задаче является естественным поиск таких режимов функционирования ЛС СВН–ЛС ПВО, которые были бы конфликтнооптимальными.Система задается следующим образом:90Стабильные эффективные решения и компромиссы.