Главная » Просмотр файлов » Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001)

Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 17

Файл №1264203 Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (Воронов Е. М. Методы оптимизации управления многообъектными многокритериальными системами на основе стабильно-эффективных игровых решений (2001)) 17 страницаВоронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203) страница 172021-07-28СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 17)

При сведении этихзадач к краевым и формировании методов прогонки [108] при достаточнобольшом N может возникнуть проблема размерности.Глава 2. Модифицированный метод скалярной Нэш-оптимизации2.3.3.81Субоптимальный метод Пао–Нэш параметризированногооптимального управления (этап 2)В данном пункте формируется «рабочий» субоптимальный метод наоснове прямого использования структуры Пао и аппроксимации оптимального управления.При этом аппроксимация ПКЗУ на такте [t j −1 , T ] заключается в параметризации программно-корректируемого позиционного управления (зависящего от начальной позиции такта).Для этого исходное управление ui (t ) , i = 1, N заменяем на управление(1.13в)ui (t ) ≅k∑ qil (1[t − t l ] − 1[t − t l +1 ]),(2.35)l = j −1где t j −1 , t1 , , t l , t l +1 , , T есть разбиение отрезка [t j −1 , T ] ; qil − параметры,qil min ≤ qil ≤ qil max .При этом ПКЗУ получен, если параметрическая оптимизация будет реализовываться на отрезках [t j −1 , T ] при измеряемых позициях x(t j −1 ) иоптимальная программа применяется на такте [t j −1 , t j ] до следующей коррекции (оптимизации на [t j , T ] при вновь измеренном x(t j ) ).Для ускорения вычислений можно применить упрощенную аппроксимацию управления на каждом [t j −1 , T ] типаT + t j −1 ; q1 при t ∈ t j −1 ,2 (2.36)ui =  q при t ∈  T + t j −1 , T  . 2 2В этом случае точность возрастает по мере уменьшения оставшегосявремени.

В целом исходная задача превращается в задачу нелинейногопрограммирования.Глобальный показатель в соответствии с [89, 417] будем определять ввиде ∂Θ (q || qˆ i ) Tii(2.37)=V (qˆ , q ) ∏  i  i qˆ − q  ,∂qi∈M k  где q − старая функция координации, q̂ − новая функция координации.Вся система является иерархической (рис.

2.2) в том смысле, что координация поведения подсистем осуществляется таким образом, что вначале()82Стабильные эффективные решения и компромиссы. Часть Iобеспечиваются интересы арбитра, а потом – подсистем. При этом арбитрвыполняет роль координирующего звена всей системы. Алгоритмическуюитерацию метода поиска равновесного по Нэшу решения можно представить в виде следующей последовательности:Ша г 1. Выбор начального приближения старой функции координацииq 0 . Присваиваем q = q 0 .

Задаем ε − условие остановки.Ша г 2. Решение mk оптимизационных задач вида:определить min Qi (q ), i ∈ M K ⊂ P ,(2.38)q∈Q (M K \ i )где Q ( M K \ i ) ={q ∈ E r | qi =q i , q j ∈ Q j , j ∈ M K , j ≠ i} , а M K – множествокоалиций фиксированного коалиционного разбиения P .ОбработкарекомендацийМинимизацияфункционала арбитраqˆ 0 =ϕ{q( Ki ), i ∈ M K }V (qˆ , q ) → minqˆ ∈QМинимизация на уровне коалицийQ1 (q ) →minq∈Q ( M K \1)Qi (q ) →minq∈Q ( M K \ i )Qmk (q ) →minq∈Q ( M K \ mk )Рис. 2.2. Численный алгоритм Пао–Нэш-оптимизацииТо есть варьирование параметров в подсистеме или коалиции Ki осуществляется по компонентам партнеров при фиксированном qi , равномсоответствующей компоненте q i старой функции координации q .

Результатом решения i-й оптимизационной подзадачи является векторqi ( Ki ) = q i ;(2.39)q( Ki ) = ( M \i )( M \i )iq K ( Ki ) = q K ,где в qij − первый верхний индекс означает номер подсистемы, к которой относится соответствующая компонента, а второй индекс − номероптимизационной подзадачи (номер подсистемы, параметры которойфиксируются).Глава 2. Модифицированный метод скалярной Нэш-оптимизации83Таким образом, каждая подсистема «откликается» на функцию координации q тем, что сообщает арбитру локальную информацию о том, какими по ее, i-й подсистемы, «мнению» должны быть параметры остальныхподсистем, чтобы достигался минимум показателя Θi .Ша г 3.

Выбор начального приближения новой функции координацииq̂ 0 на основе обработки «рекомендаций» подсистем. Для вычисления q̂ 0усредняем по формуле:1 iij ˆq=λ r1q + λ r 2 ∑ q  , i ∈ M K ; λ r1 , λ r 2 > 0; λ r1 + λ=r 2 1 . (2.40)mk j∈M Kj ≠iВыбор коэффициентов λ ri зависит от свойств показателя Θi и влияет0iна скорость сходимости всей алгоритмической процедуры метода.Ша г 4. Решение задачи минимизации функционала арбитра:определить min V (qˆ , q ) .(2.41)qˆ ∈Q ⊂ E rПолучаем решение q̂* .Ша г 5. Проверка условия останова алгоритма. Если | V (qˆ * , q ) |≤ ε , тополагаем, что начальное приближение для градиентного алгоритма:q 0 = qˆ * .

Алгоритм завершает работу. Если же | V (qˆ * , q ) |> ε , то полагаемq = qˆ * и возвращаемся к шагу 2.В [376] обосновывается сходимость к равновесию q r (если оно существует) и обеспечение выполнения необходимого условия равновесия поНэшу в точке q r , когда V (q r , q r ) = 0 .Полученный метод имеет следующие особенности, отличающие его отпредложенного в [376] на основе системы Эйлера–Лагранжа.1. Контрольные вычисления с тестовыми задачами [213] показали, чтоминимизацию функционала арбитра целесообразно проводить прямымиметодами, не требующими вычисления градиента целевого функционала.Это связано с большими вычислительными затратами на построение градиента ∂V (qˆ ) / ∂q в каждой точке q̂ , снижающими эффективность всегоалгоритма.

В предлагаемой версии ППП выбора параметров многокритериальных многообъектных систем «Игра» [213] и ее модификации в видеПС «МОМДИС» [48, 54, 414] для минимизации функционала арбитра Vиспользуется метод Хука–Дживса с дискретным шагом, модифицированный для решения задачи с линейными ограничениями [8].Стабильные эффективные решения и компромиссы. Часть I84При минимизации функционалов подсистем Θi хорошо зарекомендовали себя метод возможных направлений Зойтендейка [110], реализованный в [48, 213], а также метод Дэвидсона–Флетчера–Пауэлла [6, 8].Таким образом, конструкция функционала арбитра V и функционаловподсистем Θi , i ∈ M K обуславливает необходимость построения комбинированной оптимизационной процедуры, сочетающей в себе прямые иградиентные методы.

Это дает возможность повысить эффективность работы метода иерархической оптимизации.2. Вычисление начального приближения q̂ 0 новой функции координации производится по формуле (2.40). Контрольные вычисления при0,1 показали хорошую скорость сходимости [48].λ r1 =0, 9 , λ r 2 =2.4. МЕТОДЫ ПОВЫШЕНИЯ БЫСТРОДЕЙСТВИЯ АЛГОРИТМАПАО–НЭШ-ОПТИМИЗАЦИИ2.4.1.Применение градиентного алгоритма Ю.М. Ермольевадля ускорения сходимости в малой окрестностиравновесного решения (этап 3)Для ускорения сходимости иерархического алгоритма в малой окрестности равновесного решения предлагается комбинация метода Пао–Нэшоптимизации и градиентного алгоритма Ермольева [48, 103].В малой окрестности Нэш-равновесия итерационная процедура методаПао–Нэш-равновесия останавливается (если V < ε ) и формируетсяначальное приближение для алгоритма Ермольева.Итерация градиентного алгоритма имеет следующий вид [103].Вводится функция вида(2.42)Ф(q =, qˆ ) ∑ Θi (q 1 , , q i −1 , qˆ i , q i +1 , , q mk ),i∈M Kгде q , qˆ ∈ Q ⊂ E , Θi − показатель i-й подсистемы (или коалицииKi ∈ M K ).rШа г 1.

Полагаем=k 1,=q ( k ) q 0 , где q 0 берется из шага 5 итерацииПао–Нэш-оптимизации, α( k +1) =α0 − начальная шаговая длина.Ша г 2. Вычисление градиентаgrad(q ( k ) ) =∂Ф(q ( k ) , q ) / ∂qq=q(k )при. Построение итерации+1)q( k =q ( k ) − a( k ) PQ (grad(q ( k ) )),(2.43)где PQ (grad) − операция проецирования вектора grad на активные ограничения, определяющие множество Q (в ППП «Игра» [213] и ПСГлава 2.

Модифицированный метод скалярной Нэш-оптимизации85«МОМДИС» [48] реализован метод возможных направлений Зойтендейка;при совместной работе с [6] используется метод проекции градиента Розена [262]); α( k ) − шаговая длина, определяемая по эвристическому правилу[103]: если k = 1 , то α( k ) =α0 , иначе γ , если g T (q ( k ) )(q ( k ) − q ( k −1) ) < 0;(2.44)α( k ) =α( k −1) ⋅  1T(k )(k )( k −1)) ≥ 0, γ 2 , если g (q )(q − qгде 0 < γ 2 < 1, γ1γ 2 < 1 .При решении методических контрольных задач [213] полагалось0 < γ 2 < 1, γ1γ 2 =0, 4.Проведенный анализ показывает, что комбинированное использованиеиерархического метода и градиентного алгоритма в рассматриваемой технической задаче в пункте 10.2.1 в целом повышает эффективность поискаравновесного решения по сравнению с раздельным использование указанных процедур.

Совместное применение этих алгоритмов позволяет объединить их достоинства и компенсировать недостатки. В процессе вычислительных экспериментов получены следующие оптимальные значенияосновных характеристик вычислительного процесса [48]:λ=0,9; λ=0,1;=ε 0,1; =γ1 0,8; =γ 2 0, 4 .r1r2Применение градиентного алгоритма дает высокую скорость сходимости и малые вычислительные затраты в достаточно малой окрестностиравновесного решения q r , чему соответствует | V |≤ ε . При | V |> ε имеетместо либо «заклинивание» алгоритма (вследствие наличия овражных областей), либо останов в локально равновесной точке (вследствие невыпуклости компонент векторного показателя ММС).

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6417
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее