Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 17
Текст из файла (страница 17)
При сведении этихзадач к краевым и формировании методов прогонки [108] при достаточнобольшом N может возникнуть проблема размерности.Глава 2. Модифицированный метод скалярной Нэш-оптимизации2.3.3.81Субоптимальный метод Пао–Нэш параметризированногооптимального управления (этап 2)В данном пункте формируется «рабочий» субоптимальный метод наоснове прямого использования структуры Пао и аппроксимации оптимального управления.При этом аппроксимация ПКЗУ на такте [t j −1 , T ] заключается в параметризации программно-корректируемого позиционного управления (зависящего от начальной позиции такта).Для этого исходное управление ui (t ) , i = 1, N заменяем на управление(1.13в)ui (t ) ≅k∑ qil (1[t − t l ] − 1[t − t l +1 ]),(2.35)l = j −1где t j −1 , t1 , , t l , t l +1 , , T есть разбиение отрезка [t j −1 , T ] ; qil − параметры,qil min ≤ qil ≤ qil max .При этом ПКЗУ получен, если параметрическая оптимизация будет реализовываться на отрезках [t j −1 , T ] при измеряемых позициях x(t j −1 ) иоптимальная программа применяется на такте [t j −1 , t j ] до следующей коррекции (оптимизации на [t j , T ] при вновь измеренном x(t j ) ).Для ускорения вычислений можно применить упрощенную аппроксимацию управления на каждом [t j −1 , T ] типаT + t j −1 ; q1 при t ∈ t j −1 ,2 (2.36)ui = q при t ∈ T + t j −1 , T . 2 2В этом случае точность возрастает по мере уменьшения оставшегосявремени.
В целом исходная задача превращается в задачу нелинейногопрограммирования.Глобальный показатель в соответствии с [89, 417] будем определять ввиде ∂Θ (q || qˆ i ) Tii(2.37)=V (qˆ , q ) ∏ i i qˆ − q ,∂qi∈M k где q − старая функция координации, q̂ − новая функция координации.Вся система является иерархической (рис.
2.2) в том смысле, что координация поведения подсистем осуществляется таким образом, что вначале()82Стабильные эффективные решения и компромиссы. Часть Iобеспечиваются интересы арбитра, а потом – подсистем. При этом арбитрвыполняет роль координирующего звена всей системы. Алгоритмическуюитерацию метода поиска равновесного по Нэшу решения можно представить в виде следующей последовательности:Ша г 1. Выбор начального приближения старой функции координацииq 0 . Присваиваем q = q 0 .
Задаем ε − условие остановки.Ша г 2. Решение mk оптимизационных задач вида:определить min Qi (q ), i ∈ M K ⊂ P ,(2.38)q∈Q (M K \ i )где Q ( M K \ i ) ={q ∈ E r | qi =q i , q j ∈ Q j , j ∈ M K , j ≠ i} , а M K – множествокоалиций фиксированного коалиционного разбиения P .ОбработкарекомендацийМинимизацияфункционала арбитраqˆ 0 =ϕ{q( Ki ), i ∈ M K }V (qˆ , q ) → minqˆ ∈QМинимизация на уровне коалицийQ1 (q ) →minq∈Q ( M K \1)Qi (q ) →minq∈Q ( M K \ i )Qmk (q ) →minq∈Q ( M K \ mk )Рис. 2.2. Численный алгоритм Пао–Нэш-оптимизацииТо есть варьирование параметров в подсистеме или коалиции Ki осуществляется по компонентам партнеров при фиксированном qi , равномсоответствующей компоненте q i старой функции координации q .
Результатом решения i-й оптимизационной подзадачи является векторqi ( Ki ) = q i ;(2.39)q( Ki ) = ( M \i )( M \i )iq K ( Ki ) = q K ,где в qij − первый верхний индекс означает номер подсистемы, к которой относится соответствующая компонента, а второй индекс − номероптимизационной подзадачи (номер подсистемы, параметры которойфиксируются).Глава 2. Модифицированный метод скалярной Нэш-оптимизации83Таким образом, каждая подсистема «откликается» на функцию координации q тем, что сообщает арбитру локальную информацию о том, какими по ее, i-й подсистемы, «мнению» должны быть параметры остальныхподсистем, чтобы достигался минимум показателя Θi .Ша г 3.
Выбор начального приближения новой функции координацииq̂ 0 на основе обработки «рекомендаций» подсистем. Для вычисления q̂ 0усредняем по формуле:1 iij ˆq=λ r1q + λ r 2 ∑ q , i ∈ M K ; λ r1 , λ r 2 > 0; λ r1 + λ=r 2 1 . (2.40)mk j∈M Kj ≠iВыбор коэффициентов λ ri зависит от свойств показателя Θi и влияет0iна скорость сходимости всей алгоритмической процедуры метода.Ша г 4. Решение задачи минимизации функционала арбитра:определить min V (qˆ , q ) .(2.41)qˆ ∈Q ⊂ E rПолучаем решение q̂* .Ша г 5. Проверка условия останова алгоритма. Если | V (qˆ * , q ) |≤ ε , тополагаем, что начальное приближение для градиентного алгоритма:q 0 = qˆ * .
Алгоритм завершает работу. Если же | V (qˆ * , q ) |> ε , то полагаемq = qˆ * и возвращаемся к шагу 2.В [376] обосновывается сходимость к равновесию q r (если оно существует) и обеспечение выполнения необходимого условия равновесия поНэшу в точке q r , когда V (q r , q r ) = 0 .Полученный метод имеет следующие особенности, отличающие его отпредложенного в [376] на основе системы Эйлера–Лагранжа.1. Контрольные вычисления с тестовыми задачами [213] показали, чтоминимизацию функционала арбитра целесообразно проводить прямымиметодами, не требующими вычисления градиента целевого функционала.Это связано с большими вычислительными затратами на построение градиента ∂V (qˆ ) / ∂q в каждой точке q̂ , снижающими эффективность всегоалгоритма.
В предлагаемой версии ППП выбора параметров многокритериальных многообъектных систем «Игра» [213] и ее модификации в видеПС «МОМДИС» [48, 54, 414] для минимизации функционала арбитра Vиспользуется метод Хука–Дживса с дискретным шагом, модифицированный для решения задачи с линейными ограничениями [8].Стабильные эффективные решения и компромиссы. Часть I84При минимизации функционалов подсистем Θi хорошо зарекомендовали себя метод возможных направлений Зойтендейка [110], реализованный в [48, 213], а также метод Дэвидсона–Флетчера–Пауэлла [6, 8].Таким образом, конструкция функционала арбитра V и функционаловподсистем Θi , i ∈ M K обуславливает необходимость построения комбинированной оптимизационной процедуры, сочетающей в себе прямые иградиентные методы.
Это дает возможность повысить эффективность работы метода иерархической оптимизации.2. Вычисление начального приближения q̂ 0 новой функции координации производится по формуле (2.40). Контрольные вычисления при0,1 показали хорошую скорость сходимости [48].λ r1 =0, 9 , λ r 2 =2.4. МЕТОДЫ ПОВЫШЕНИЯ БЫСТРОДЕЙСТВИЯ АЛГОРИТМАПАО–НЭШ-ОПТИМИЗАЦИИ2.4.1.Применение градиентного алгоритма Ю.М. Ермольевадля ускорения сходимости в малой окрестностиравновесного решения (этап 3)Для ускорения сходимости иерархического алгоритма в малой окрестности равновесного решения предлагается комбинация метода Пао–Нэшоптимизации и градиентного алгоритма Ермольева [48, 103].В малой окрестности Нэш-равновесия итерационная процедура методаПао–Нэш-равновесия останавливается (если V < ε ) и формируетсяначальное приближение для алгоритма Ермольева.Итерация градиентного алгоритма имеет следующий вид [103].Вводится функция вида(2.42)Ф(q =, qˆ ) ∑ Θi (q 1 , , q i −1 , qˆ i , q i +1 , , q mk ),i∈M Kгде q , qˆ ∈ Q ⊂ E , Θi − показатель i-й подсистемы (или коалицииKi ∈ M K ).rШа г 1.
Полагаем=k 1,=q ( k ) q 0 , где q 0 берется из шага 5 итерацииПао–Нэш-оптимизации, α( k +1) =α0 − начальная шаговая длина.Ша г 2. Вычисление градиентаgrad(q ( k ) ) =∂Ф(q ( k ) , q ) / ∂qq=q(k )при. Построение итерации+1)q( k =q ( k ) − a( k ) PQ (grad(q ( k ) )),(2.43)где PQ (grad) − операция проецирования вектора grad на активные ограничения, определяющие множество Q (в ППП «Игра» [213] и ПСГлава 2.
Модифицированный метод скалярной Нэш-оптимизации85«МОМДИС» [48] реализован метод возможных направлений Зойтендейка;при совместной работе с [6] используется метод проекции градиента Розена [262]); α( k ) − шаговая длина, определяемая по эвристическому правилу[103]: если k = 1 , то α( k ) =α0 , иначе γ , если g T (q ( k ) )(q ( k ) − q ( k −1) ) < 0;(2.44)α( k ) =α( k −1) ⋅ 1T(k )(k )( k −1)) ≥ 0, γ 2 , если g (q )(q − qгде 0 < γ 2 < 1, γ1γ 2 < 1 .При решении методических контрольных задач [213] полагалось0 < γ 2 < 1, γ1γ 2 =0, 4.Проведенный анализ показывает, что комбинированное использованиеиерархического метода и градиентного алгоритма в рассматриваемой технической задаче в пункте 10.2.1 в целом повышает эффективность поискаравновесного решения по сравнению с раздельным использование указанных процедур.
Совместное применение этих алгоритмов позволяет объединить их достоинства и компенсировать недостатки. В процессе вычислительных экспериментов получены следующие оптимальные значенияосновных характеристик вычислительного процесса [48]:λ=0,9; λ=0,1;=ε 0,1; =γ1 0,8; =γ 2 0, 4 .r1r2Применение градиентного алгоритма дает высокую скорость сходимости и малые вычислительные затраты в достаточно малой окрестностиравновесного решения q r , чему соответствует | V |≤ ε . При | V |> ε имеетместо либо «заклинивание» алгоритма (вследствие наличия овражных областей), либо останов в локально равновесной точке (вследствие невыпуклости компонент векторного показателя ММС).