Лекции по дисциплине Оптимальное управление многоуровневыми ММС. Глава 2 (2016) (1245051), страница 2
Текст из файла (страница 2)
Если две пересекающиеся коалиции K и K выбирают стратегии одновременно, то они должны обменяться информацией длясогласования своего выбора, т.е. они действуют как коалиция K K . Следовательно, длятаких коалиций необходимо задавать X K K , из которого осуществляется одновременныйвыбор стратегий коалициями K и K .2) С учетом определения игры по Н.Н.
Воробьеву [43], когда действия и интересы представляютсяв разных коалиционных структурах P д и Pи соответственно, причем S Pи , X K – множествостратегий коалицииK Pд , ситуация x x Pдпорождает исходs Pи , отношенияпредпочтения формируются над коалициями K Pи , а исходное определение 1.1 игрыпринимает вид следующего определения.Определение 2.4.
Игрой с разными наборами коалиций действия и интересов называется набор N , P д , P и , SSPи , X K KPд , S xKKP дSPи, K P и (2.3)с реализацией x Pд x K , K Pд .Кроме исхода игры, вводится понятие состояния игры и множества стратегий ставятся взависимость от состояния игры.Определение 2.5 [39].
Динамической игрой называется набор N , P, S , W ,X K s ,S x ,K K , (2.4)где N , P , S, W, S W – произвольные множества игроков, коалиционных структур,неокончательных состояний игры и множества окончательных исходов игры; X K s – произвольное множество стратегий коалиции K в состоянии s S ; S x K S W – множествоисходов (как окончательных, так и неокончательных) после применения коалицией стратегийx K X K s ; K – предпочтение коалиции K на множестве конечных исходов W.Реализация динамической игры состоит из последовательности состояний игры s1 ,...,sm S икоалиционных структур P1 ,...,Pm P в данных состояниях и выбранных ситуацийx Pj s j x K KPj , x K X K s j j 1,...,m , причем в ситуациях x Pj ,s j , j m возможныисходы из S, в том числе s j 1 , а в ситуации x Pm ,sm – только из W.
То есть из следует sS x P,s S x KKPj 1 S x P ,s ,jjj 1,...,m 1 , S x Pm ,sm W .4Данная формулировка [39] расширяет обычное понятие динамической игры. В обычныхдинамических играх – основная проблема в обмене информацией между участниками игры, акоалиции образуются по предписанным правилам или до начала игры. Обычная динамическаяигра в нормальной форме соответствует одному шагу игры в определении 1.5.В рамках определения 2.1 можно сформировать, как частные случаи, определениябескоалиционных, коалиционных и кооперативных игр.Так, если зафиксировать во множестве коалиционных структур P структуру Р (или считатьP , то на фиксированной структуре P N (на N) коалиции (игроки) независимо друг отдруга выбирают свои стратегии x K X K , K P xi X i ,i N .
Пусть предпочтения коалиций(игроков) представлены их функциями выигрыша J K J i на множестве ситуаций x P x i . Ситуации становятся исходами игры. Выбор стратегии x K x iограничивает множество исходов до множества стратегий x S xK K'K 'P : x K x K , S x i x jjNкоалицией K (игроком i): xi x i .Определение 2.6. Бескоалиционной игрой при фиксированном Р называется наборГ N ,P, X K , J K ,(2.5)где Р – фиксированное разбиение, J K J i iK или J K J i J K i J i ;iпри отсутствии разбиения Р i 1, 0 i 1 , ноi– наборГ N , X i , J i .Аналогичное описание коалиционной игры приводит к следующему определению.Определение 2.7.
Коалиционной игрой называется набор Ν P X K J K ,(2.6)(2.7)K P P (при любом множестве Р K N ),X K X i , J K x J i x iK , x X N .iKДля получения определения кооперативной игры вводится характеристическая функция K ,K N , т.е. числовая функция, определенная на множестве 2 N всех подмножеств множестваигроков N, 0 .Определение 2.8. Кооперативная игра на основе характеристической функции K с 0моделирует распределение между игроками из N общего их выигрыша N согласно силекоалиции K и описывается набором N , S,где N 1,...,N ; S x x1 ,...,xN : xi i , xi N ;X K x S : xi K , x , xS xK KiKK XK ; xKX K , S x K , K , (2.8)KN ;y означает xi yi , i K .Частный случай кооперативной игры может быть сформулирован на основе векторнойоптимизации.Определение 2.9 [32]. Кооперативной игрой называется наборГ N , X , X N ,(2.9)где X N x ( N ) x X : maxxXNNi 1i 1 Ji x Ji (x )– множество ситуаций.И, наконец, в плане иерархических игр один или несколько игроков ограничивают множествоисходов остальных за счет права первого хода.
Остальные игроки в зависимости от условий5разыгрывают игру в рамках одного из четырех классов игр. В работе Э.М. Вайсборда,В.И. Жуковского [32] предложено следующее определение.Определение 2.10 [32]. Иерархической игрой называется наборГ N ,L,N L , X N , X N L ,(2.10)где N – число игроков в игре, L – число игроков, имеющих право первого хода, N L – числокоординируемых игроков, X N X i – общее множество стратегий, X N / L X i – множествоiNiN Lстратегий координируемых игроков.2.3. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ СИТУАЦИИ (НКН ВЗАИМОДЕЙСТВИЯ) В ММСВ соответствии с определениями игры математическая модель конфликтной ситуации должнасодержать четыре компоненты: математическая модель ММС с выбором описания и управляющихсил, векторный целевой показатель, характер коалиционных объединений и принципконфликтного взаимодействия на основе стабильности и эффективности.
Далее последовательнораскрывается модель конфликтной ситуации в форме дифференциальной игры в нормальнойформе, когда выбор стратегий связан с выбором управлений, которые однозначно определяютрезультат в виде значения вектора показателей игры.2.3.1. Математическая модель ММС с выбором описанияи управляющих силМатематическое описание ММС. В качестве основного описания ММС принимается системадинамико-алгебраических связей x д f t , x, q, u1 ,, u N , x t0 x0 ; аa x t , x, q, u1 ,, uN , x X ;бв y y x , q, t , q Q;г u u t , x, y , q , u U ,(2.11)где N – число объектов в ММС; x x д , xа – вектор состояния ММС с x д – динамическими и x а –алгебраическими состояниями; X – множество состояний; y – вектор выхода ММС; u U – векторуправления ММС; q Q – вектор параметров ММС, которые характеризуют параметрическуюнеопределенность в (2.11а–в) и возможную параметризацию в (2.11г).Выражения (1.11) характеризуют динамические связи (а), алгебраические связи (б), векторвыхода (в) и функцию принятия решения и управления (г).
Управление(2.12)u U U1 ...U N ,ui Ui – подвектор управления i-м объектом ММС.Свойства правых частей (2.11а), (2.11б) типичные (см., например, реферат работы [32] вприложении к1), в основном, это непрерывность и дифференцируемость, а для (2.11а) –выполнены условий Липшица.О выборе управляющих сил. Как известно, существуют три основных способа заданияуправляющих сил:1) Вектор параметров q Q ;2) Программное управление;3) Закон управления (или позиционное управление) u u t,x , u U .Свойства управлений и множеств управлений варьируются, но типичные свойства можнонайти, например в [32] (см.
реферат [32] в приложении к1). Наиболее желаемые свойства U – этосвойства выпуклости и компактности (или слабой компактности) [121].Ввиду сложности краевых задач в ММС имеет смысл ориентироваться на комбинациюприближенных гибких вычислительных схем и классических оптимизационных структуруправления, например, математического программирования и оперативного управления [203], ссущественной параметризацией управляющих сил во временных интервалах их приложения.1См. сноску в п.2.2.6Поэтому, кроме трех указанных, рассматриваются следующие комбинации в представленииуправляющих сил.4) Параметризированное векторное программное управление i-го объекта ММС ui us , где l s1.13а q j f j t ; j 1sus u s q , t l q s f t 1 t t , n 1, 2,3,..., l 1,1.13б j j jj 1 j nгде qs q1s ,…,qls Qs : us U s , Ui U s ; Qi Qs f j t – непрерывные функции, заданные наssотрезке t0 ,T (2.13а) или на отрезке t j 1 ,T (2.13б); 1 t j t j 1 – интервал применения слагаемогоуправления u s (2.13б)1 при t t j 1 , t j ;1 t j t j-1 0 при t t j 1 , t j ,при этом 1 t j t j 1 1 t t j 1 1 t t j и t0 ,t1 ,...,t j 1 ,t j ,...,T – заданное разбиение отрезка t0 ,T .Возможны обобщения (2.13а), (2.13б).