Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (Воронов Е. М. Методы оптимизации управления многообъектными многокритериальными системами на основе стабильно-эффективных игровых решений (2001)), страница 7
Описание файла
PDF-файл из архива "Воронов Е. М. Методы оптимизации управления многообъектными многокритериальными системами на основе стабильно-эффективных игровых решений (2001)", который расположен в категории "". Всё это находится в предмете "оптимальное управление многообъектными многокритериальными системами (оуммс)" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 7 страницы из PDF
На первом этапе на основе сетевых подходов оценивается множество решений и выбирается начальноеприближение в «выгодной» локальной области. На втором этапе на основеначального приближения решается точная задача определения параметризованного оптимального управления или управления в форме 2,3.1.3.2.Векторный целевой показательЦелевые свойства ММС характеризуются вектором=J J x 0 ,t0 ,T ,q ,x ( ⋅)=,u ( ⋅) ,y (⋅) ( J1 ,..., J m ) ,(1.18)который представляет собой сложную функциональную связь с указанными величинами. Типичным видом i-й функции выигрыша (потерь) является функционал на t0 ≤ t ≤ TTF i ( T , x ( T ) ) + ∫ Fi ( t , x, u1 ,..., u N ) dt , i =J i ( u1 ,…, u N ) =1,..., m . (1.19)t0Свойства (1.19) даны в приложении к работе 1 (см.
реферат работы [32],стр. 4).Кроме непрерывности (1.19) по (x, u) и дифференцируемости по управлению, желаемыми свойствами являются вогнутость-квазивогнутость (выпуклость-квазивыпуклость) функционала (1.19) на множестве управлений.При общих свойствах целевого вектора проблема глобальной оптимизацииможет быть преодолена, как отмечалось в п. 1.3.1, на основе двухэтапнойструктуры методов оптимизации с сетевым глобальным анализом и приближенным решением на первом этапе и точным локальным решением навтором.Несовпадение размерности J с числом объектов означает, что некоторые объекты имеют векторную цель. Размерность показателя будет совпадать с числом объектов в ММС, если показатель каждого объекта скаляризуется.1.3.3.Коалиционная структура действий и интересов ММС(Пусть P = P ∂ , Pи)– коалиционная структура действий и интересов сразмерностью mk множества M K индексов коалиций в каждой, гдеM K = (1,…, mk ) .1См.
сноску в п. 1.2.Стабильные эффективные решения и компромиссы. Часть I34Тогда(1.20)P д = K1∂ ,..., K m∂ r Ki∂ ∩ K ∂j =0; ∪ Ki∂ =R =[1, r ] ,i≠ji∈MKгде r есть, например, размерность множества индексов вектора параметров(после параметризации управлений) или множества индексов управлений(без параметризации);(1.21)P и = K1и ,..., K mи m Kiи ∩ K иj =0; ∪ Kiи =M =[1, m ] ,ijiM≠∈Kгде m – размерность множества индексов вектора показателей.В свою очередь, каждой Kiд соответствует, например, при полной па-раметризации вектор параметров qi (или вектор ui без параметризации).Каждой Kiи соответствует целевой вектор =J KiДалее ограничиваемсяТогда разбиениеKiд={Ji}: i ∈ Kiu .K iu .mkP = K1 , , K mk : Ki ∩ K j =∅; ∪ K j =[ R, M ] ,(1.22)=1jгде R – множество индексов, например, управлений, М – множество индексов вектора показателей.Показатель каждой коалиции принимает, как правило, один из двух видов:{}J K = J i1 , , J ik ;J=K(1.23а)∑ αi J i , 0 ≤ αi ≤ 1 , ∑ αi =1 ,i∈K(1.23б)iпричем сумма индексов ik равна m.Коалиционные управления без параметризации принимают вид()u K = ui1 ,...,uik , u K ∈ U K =∏ Ui ,(1.24)i∈Kвыражения (1.11а) преобразуются к виду⋅=x f t , x, u K1 ,..., u Ki ,..., u Km , l ∈ M K .к Показатель в варианте (1.23б)T()J Ki =F Ki ( x, t ) + ∫ FKi t , x, u K1 ,..., u Km dt ,где Ф=Ki∑ αi Ф i ;i∈Kit0F=Ki∑ αi Fi .i∈Kiк(1.25)(1.26)Глава 1.
Постановка задач проектирования и управления ММС35В рамках введенной модели конфликта обозначения в определении 1.1имеют следующие соответствия:• множество стратегий X K → множество U K ;• множество исходов-состояний S → множество траекторий x(t ) ∈ X намножестве ситуаций u ( ⋅) ∈ U = ∏ U , или отображение Х, U на мноKK∈Pжество показателей J ( x ,u ) ;( )• множество возможных исходов-состояний S x K → множество возx (t ) ∈ Xможных траекторий вектора(на множестве ситуацийu u Ki = u K1 ,..., u Ki −1 , u Ki , u Ki +1 ,..., u Kmk) при фиксированном управленииu Ki , где U= U K × ... × U Ki +11(чений J x ,u ,u Kii −1× uK ×U Ki) на множестве U;× ... × U K , или множество знаmk• предпочтения коалиции K представлены максимизацией функции выигрыша (минимизацией потерь) J K на множестве X , U .1.3.4.Принципы конфликтного взаимодействия.Понятия стабильности и эффективностиВ общем случае имеют место пять принципов конфликтного взаимодействия:{}• антагонизм M K = {1, 2}, J 1 = − J 2 ;бескоалиционное взаимодействие;коалиционное взаимодействие;кооперативное взаимодействие;иерархическое взаимодействие (с правом первого хода).Так как ММС, по определению, является системой равнозначных объектов (горизонтальный набор на рис.
1.1), то задачи с правом первого ходав данной работе не рассматриваются.Уже данное перечисление показывает, что свойства конфликтных взаимодействий робастны, так как позволяют делать здравые оценки эффективности в условиях неопределенности среды, неопределенности «активного партнера» и неопределенности цели с учетом характера неопределенности и конфликтности.Как известно, в данных принципах конфликтного взаимодействия заложены три фундаментальных понятия теории игр: стабильность, эффективность и стабильно-эффективный компромисс.Стабильность ММС – это обеспечение устойчивых (уравновешенныхпо целям) процессов функционирования и проектирования многообъектных структур в условиях конфликтности (несогласованности) и/или неопределенности.••••36Стабильные эффективные решения и компромиссы.
Часть IЭффективность ММС – это достижение максимального целевого качества объектов, коалиций и ММС в целом на основе устойчивого и рационального коалицианирования.По меткому замечанию Ю.Б. Гермейера [83, 84]: «Классическая теорияигр в части теории принятия решений преждевременно и чрезмерно заформализована». Данный недостаток сказывается во многих приложениях,в которых, как правило, требуется комбинирование указанных принциповвзаимодействия, что в свою очередь требует преодоления информационнотактических несостыковок данных подходов.
Поэтому вопросы формирования компромиссов еще полностью не сняты.КлассыПризнакПо принципуконфликтноговзаимодействияАДИБДИКДИИДИКОДИПо степениконфликтностиС противоположнымиинтересамиС не противоположнымиинтересамиПо видуинформационнойситуацииОбъективнаяинформационнаяситуация (с полнойинформацией)Субъективная информационнаяситуация (изолированныеусловия, стохастические условияи т.д.)По видукомпромиссаСТЭК ММССТЭК ИСПо наличиюстратегийСтратегическиеНестратегическиеПо структурестратегийДинамическиеПо аппроксимацииВ обратныхсвязяхПо аппроксимацииигрыДифференциальныеУчет факторовнеопределенностиНеопределенность средыПо виду решенияВ чистыхстратегияхстратегийПо числуповторенийПозиционныеПрограммнокорректируемыеВ нормальнойформеПараметризованныеМногошаговые: позиционные, навыживание, стохастические и т.д.Неопределенность«активногопартнера»В смешанныхстратегияхОднотактовый конфликт(без повторения)Неопределенность целиВ стратегияхповеденияМноготактовый конфликт(с повторениями)Рис.
1.2. Частная классификация дифференциальных игр(с выделением учитываемых признаков)Глава 1. Постановка задач проектирования и управления ММС37Cтабильно-эффективный компромисс в ММС (СТЭК ММС) – этообъединение стабильности и эффективности в рамках множества решений– от полного совпадения данных свойств в одной точке пространства J(или U) до обеспечения возможной степени сближения в условиях информационно-тактических расширений соглашений.СТЭК ММС дополняют СТЭК в иерархических системах (СТЭК ИС),где реализуется право первого хода на основе субъективной информации,что составляет тему отдельного исследования.
Частная классификациядифференциальных игр с выделением учитываемых в работе свойств, которая обобщает модель конфликтной ситуации, дана на рис. 1.2, где АДИ,БДИ и т.д. – вид взаимодействия в дифференцированной игре (ДИ). Стохастические условия учтены в одном из классов АДИ (гл. 8).1.4.
АНАЛИЗ ОСНОВНЫХ ПРИНЦИПОВ ОПТИМАЛЬНОСТИ, ФОРМКОМПРОМИССОВ И МЕТОДОВ РЕШЕНИЯ НА ОСНОВЕ ПОНЯТИЙСТАБИЛЬНОСТИ И ЭФФЕКТИВНОСТИВ соответствии с понятиями стабильности и эффективности многие изсуществующих принципов оптимальности связаны с тремя базовыми: оптимальность на основе гарантированных подходов, коалиционного равновесия и кооперативных соглашений.Принцип оптимальности на основе гарантированных решений базируется на исследовании максиминных и минимаксных задач и равновесных(седловых) решений.Принцип оптимальности на основе коалиционного равновесия связан сигровыми подходами в виде скалярного Нэш-равновесия, векторных равновесий (в частности, «сильного» равновесия, векторного Нэшравновесия, Ω -равновесия и др.), коалиционного равновесия на основеV-решений («угроз и контругроз») и др.Принцип оптимальности на основе кооперативных соглашений содержит два основных взаимосвязанных направления: векторная оптимизациядля определения множества Парето-решений (без структурных свойствММС) (скаляризация, лексикографическая оптимизация, пороговая оптимизация и принцип сложности, оптимизация на основе конусов доминирования, среднеквадратическая оптимизация и др.) и исследование кооперативной игры в форме характеристической функции (с элементами учетаструктуры ММС: коллективной и индивидуальной рациональности и т.д.)(С-ядро, Н-ядро, решение Нэймана–Моргенштерна (Н-М-решение), решение на основе вектора дележа Шепли, с учетом и без учета платежей и др.).Причем решаются задачи получения множества Парето и выбора кооперативного(эффективного)компромисса(принципсложности,Ω -оптимизация, дележ по Шепли, среднеквадратическая стратегия, арбитражная схема и др.).38Стабильные эффективные решения и компромиссы.
Часть IИзвестны также определенные результаты по комбинированию стабильных и эффективных решений (некоторые условия их совпадения,методы доминирования, некоторые методы комбинирования Пареторешений, максиминных решений, Нэш-решений, предостережений типа«угроз-контругроз», работы по анализу условий вступления в коалициюи др.).Обзор существующих подходов и методов приведен в [54] и разделен поглавам. Кроме того, рекомендуются авторские рефераты некоторых фундаментальных и обзорных работ по неантагонистическим играм с анализом идополнениями: Э.М.