Пупков К.А., Коньков В.Г. Интеллектуальные системы (1-е изд., 2001) (1245264), страница 13
Текст из файла (страница 13)
Стратегическаязначимость, существование, двухэтапная процедура оптимизации.«Угрозой» коалицииS Kl P называется [30] возможность такогоизменения управления u S на vS U S , когдаJ S (v S , u N / S ) J S (uS , u N / S )(96)где N/S - контркоалиция, составленная из всех, кроме состава S, игроковмножества N.Из неравенства (96) следует, что хотя потери какого-либо из игроков изS могут и увеличиться, но игроки коалиции S, в свою очередь, могутдоговориться,чтобысуммарноеснижениепотерьJ S (uS , u N / S ) J ( v S , u N / S ) 0 разделить между собой поровну, уменьшивпотери каждого участника коалиции S на величину / S .Чтобы у игроков коалиции S при выполнении условия (96) не былостремления к изменению ситуации (uS , u N / S ) , у контркоалиции N/S должнабытьi Kl ,i K l i - приоритетность участника коалиции.1ui ui (t , x ) или ui ui (t )liK lвозможностьзаменитьсвоиуправленияuN / Sнауправленияv N / S U N / S так, что для набора v ( v S , v N / S )выполняются условия«контругрозы» контрокоалиции N/SJ S ( v S , v N / S ) J S (u S , u N / S )(97)J N / S ( v S , v N / S ) J N / S (v S , u N / S )Условия (97) показывают, что если коалиция S заменила (uS , u N / S )набором (v S , u N / S ) , у контркоалиции N/S есть возможность заменить набор41(v S , u N / S ) набором (v S , v N / S ) , для которого ее суммарные потери меньше, чемгде qij min qij qijmax , а qijmin и qij max значения сети параметров.при наборе (v S , u N / S ) , а суммарные потери S выше, чем при начальном наборе(uS , u N / S ) .
Поэтому коалиция S теряет стимул для замены (uS , u N / S ) наУправление (98) является параметризованной программой на r – том интервалепрограммно – корректируемого закона управления (ПКЗУ) tr , tn при r=1.Выбор начальных приближений УКУ для управления (98) каждымкомпонентомuij (t ) qij 1t ti 1 1t ti (99)(v S , u N / S ) .Определение 1. Набор (uS , u N / S ) является угрозой и контругрозой(УКУ) для коалиции S, если для любой ее угрозы существует контругрозаконтркоалиции N/S.Определение 2.
Набор (uS , u N / S ) является УКУ – оптимальнымрешением дифференциальной коалиционной игры, если для любой угрозылюбой коалиции S у контркоалиции существует контругроза.Определение 3 Ситуация u p будет коалиционным равновесием, еслиu p V и для любого K P P и u K U K ситуация u Kp минимизирует(максимизирует) по Парето вектор потерь (выигрышей) J i (u p u K )iK в UK. Вработе [29] приведены общие условия существования коалиционногоравновесия.Утверждение 1 [29]. Если множества Ui компактны, а функции Jiнепрерывны по u U N , то коалиционное равновесие u p существует, хотя быдля P N .В работе [30] эти условия конкретизированы и сформированынеобходимые или достаточные условия определения УКУ-оптимальныхрешений дифференциальной коалиционной игры.Рассмотренные условия сложны и трудноприменимы для практическихприложений за исключением «линейно-квадратичных» моделей игр [30].Поэтому, используя определенным образом условия существования УКУрешений, можно предложить следующий двухэтапный подход к ихопределению [108].На первом этапе, учитывая простейшую параметризацию управлений исоздание ортогональной сети на основе определений УКУ, формируют сетьприближенных решений.На втором этапе, используя найденные оценки множества УКУ вкачестве начальных приближений в сетевой «ячейке», решают задачуопределения точных УКУ-решений на основе понятия локальных «угроз иконтругроз» [30].Этап 1.
Выбор начальных приближений УКУ на основе построенияравномерной ортогональной сети. Формирование равномерной ортогональнойсети. Рассмотрим кусочно-непрерывные управления u j (t ) видаuj (t) q1j 1t t0 1t t1 ...qnj 1t tn1 1t tn, j Mk {mk}(98)в области параметров qi , i 1, n определяется равномерной ортогональнойсетью точек размерности mk и густоты l , в которой и находят областистабильного по УКУ взаимодействия коалиций [33].Узлы этой сети отображены в пространстве показателей J, такимобразом сформирован ее вид.Если рассматривать двухкоалиционное взаимодействие, на каждомшаге изменения управления формируют двухмерную ( mk 2 ) равномернуюортогональную сеть, представленную на рис. 20.qi 2qKi2=1l…qHi1=q Hi2=0qKi1=1 qi1Рис.
20 Структура ортогональной сети ( mk 2 )В том случае, когда мы имеем вырожденное управление, постоянное навсем этапе взаимодействия, получимu j (t ) q j constт.е. сеть формируется перед началом игры и остается неизменной на всемпродолжении взаимодействия.Густота l сети неявно характеризует точность определения областипоказателей J в целом, а также области УКУ - равновесных точек в частности.
Вкаждом конкретном случае густота, достаточная в смысле точности области J,зависит от свойств сжатия функционалов J. При этом густота сети и42размерность области q непосредственно связаны со временем оптимизации уменьшение шага сети ведет к значительному увеличению продолжительностиработы алгоритма поиска УКУ-оптимальных решений, так как количество«ячеек» сети N яi и точек сети N тi определяется при r=1из выраженийnni 1i 1N я N яi , N т N тi , N яi гдеmk qKij qНijj 1li, N тi mk qKj 1ij qНijli 1 ,n — размерность области параметров q,li — густота сети на i-ом шаге,q Н ij , q К ij —нижняя и верхняя границы i-ой компоненты векторапараметров qij .Так как УКУ–решения, полученные на первом этапе алгоритмаоптимизации методом УКУ, используются только для формирования начальныхприближений для дальнейшей оптимизации, то возможен выбор достаточнобольшого значения шага (малой густоты) сети l.
При этом имеет местоувеличение быстродействия алгоритма.Например, для ряда приложений имеет местоqK ij qH ijliшаг 5: а) если «контругроза» существует, то проверяется наличие другой«угрозы» (шаг 3);б) если «контругрозы» не существует, то данная точка не являетсяУКУ–оптимальной и происходит переход на шаг 7;шаг 6: точка (uS , u N / S ) является УКУ–решением;шаг 7: а) переходим к следующей точке сети на шаг 3;б) если перебраны все точки сформированной сети, то переходим к шагу2 для (r+1)-го интервала ПКЗУ.Этап 2.
Алгоритм оптимизации управления ММС на основемодифицированных достаточных условий локальных УКУ и метода моментовН.Н.Красовского. Общий вид достаточных условий локальных УКУЭ.Вайсборда и В.Жуковского [30]. В соответствии с общими принципамиформирования коалиционной структуры [30] вводится коалиционное разбиениеP K l ,..., K l ,..., K mk , P P , где P – множество коалиционных структур причастичномобъединенииKlАлгоритм получения сетевых УКУ-решений. Алгоритм вычислениясетевых УКУ–решений является итерационным и в общем случае имеетследующий вид:шаг 1: задается модель конфликта, определяются параметры системы;шаг 2: для r-го интервала ПКЗУ формируется равномерная ортогональная сеть cN я и N т для t [tr 1 , tn ] ;шаг 3: для точки в сети c координатами (uS , u N / S ) проверяется наличие«угрозы» коалиции S, т.е.
точки с координатами (v S , u N / S ) , длякоторой выполняется условие (96);шаг 4: а) если «угроза» существует, проверяется наличие «контругрозы»коалиции N/S, т.е. точки с координатами ( vS , v N / S ) , для которойвыполняются условие (97);б) если «угрозы» не существует, то переходим на шаг 6;ПоказательP.потерькоалицииКl: J K l (u ) K l (T , x (T )) FK l (t , x, uK1 ,..., uK m )dt, l 1,..., mk ,kt0где K l i ; FK l Fi ; u K l {ui1 ,..., ui K }, i j K l .liK l 5 10 .изTi K lКоалиционное динамическое описание системыx& f ( x, u K1 ,..., u K m ); x (t 0 ) x 0 ; u Kl U Kl k U i (100)i KlЗдесь, как и ранее, множество U i обладает свойствами [30]:1) для любого набора уравнений u(t ) {u1,..., u N } существует единственноерешение x (t ) системы (100);2) компоненты ni-мерных вектор–функций ui(t) являются кусочнонепрерывными функциями, имеющими конечное число точек разрыва (свойства1), 2) определяют множество U i )nui U i L2i (t 0 , T ) ,433) управление ui(t) называется допустимым, если u i t U i U i ;4) множество U i является открытым в смысле: для любого подмножестваU i U i при uin U i управление ui U i также принадлежит U i , еслиT2 uin (t ) ui (t ) dt ,t0Определение 5.
Если один и тот же набор управлений являетсялокальной угрозой и контругрозой для любой допустимой коалиции S, то u(t)называется локальной угрозой и контругрозой коалиционной игры.Стабильные свойства ЛУКУ обобщают известные свойства равновесия поНэшу, при которых контругроза реализуется уже для соотношения (101) сизменением знака.Для получения достаточных условий класс допустимых вариаций uS(t) и uN/S(t)ограничивается допустимыми управлениями видаv S ( t ) u S ( t ) S uS (t )где 0 — малая положительная константа;Локальной угрозой коалиции S K l (или S U K l по некоторым K l изv N / S (t ) u N / S (t ) N / S u N / S ( t ) ,lP ) является возможность замены коалицией S управления uS(t) на vS (t ) U S ,T2 uS (t ) vS (t ) dt так, чтобыt0J S ( uS , u N / S ) J S ( v S , u N / S ) .где uS U S , u N / S U N / S , а S, N/S — постоянные.Постоянные S, N/S можно выбрать настолько малыми по абсолютной величине,что при ограниченных uS , u N / S имеет место:T22 uS (t ) vS t u N / S (t ) v N / S (t ) dt (103)(101)Локальной контругрозой контркоалиции N/S является возможность заменыконтркоалициейN/SуправленияuN/S(t)наv N / S (t ) U N / S ,t0Вводятся системы вида& j(t ) A(t ) j (t ) B j (t ) u j (t ), (t0 ) 0,T2 u N / S (t ) v N / S (t ) dt так, чтобыt0где A( t ) J S ( v S , v N / S ) J S (u S , u N / S ) ,(102)Локальный характер угроз и контругроз принят к рассмотрению дляуточнения сетевых УКУ в промежутках между узлами сети.Определение 4.
Локальной угрозой и контругрозой для коалиции Sнаборуправлений(j=S, N/S) — матрицы Якоби, Y(t) — матрицафундаментальных решений. Далее для удобства будем обозначать УКУрешение, как u 0 {uS0 , u 0N S } .J N / S (vS , v N / S ) J N / S (vS , uN / S ) .называетсяff; B (t ) xu j(104)Nu(t ) {uS (t ), u N / S } U U iкоторогоi 10Теорема 1 [30].
Для того, чтобы u 0 (t ) {uS0 (t ), u N/ S } U былолокальной угрозой и контругрозой для коалиции S достаточно, чтобыа) векторы g1(s)=gS, N/S(t) и g2(s)=gN/S, N/S(t) были линейно независимы (равенство1g1(t)+2g2(t)=0 возможно лишь при 1=2=0),б) для любых допустимых uS uS (t ) имело местоT g S , S ( t ), u S ( t ) dt 0 , гдеt(,) - скалярное произведение,существует постоянная >0 такая, что на любую локальную угрозу коалиции S уконтркоалиции N/S имеется локальная контругроза.44 T, x0T T T Fk (, x0(), u0()) gk, j (t) BTj (t) Y1(t) T YT (T) K Y () dxxt Fk (t, x0(t),u0(t)), k, j S, N/S ujгдеКак и в общем случае, данные достаточные условия локальных УКУ такжеявляются сложными для практических применений.Действительно, для выполнения условия а) существует в свою очередьнеобходимое условие: если g1 и g2 линейно независимы, то определительГраммаg1, g1 g1, g 2 0,g 2 , g1 g 2 , g 2 T gi , g j dt , (,) - скалярное произведение.где gi , g j f S (0,0) f S (0,0) f 0; 0; N / S 0 , N /SSN /St0Во-первых, если это условие выполняется, то функции могут и не бытьлинейно–независимы, во-вторых, это условие трудно проверяется.Для проверки условия б) необходимо решать интегральное уравнениеT ( g S , S (t ), uS (t )) dt 0 ,t0и убедиться, что кроме тривиального решения uS (t ) 0 , которое не должновходить в U S , для всех uS (t ) U S решения нет, при этом ядро уравнения gS,S(t)имеет сложный вид.И, наконец, необходимо во всех случаях применения иметь точное описаниефункции перехода X(t,)=(Y(t),YT()) системы (104).Три данных фактора делают трудно применимым данный вид достаточныхусловий и требуют их модификации.Модифицированные достаточные условия локальной УКУ.Теорема 2.