Пупков К.А., Коньков В.Г. - Интеллектуальные исследования (Современнаяя теория управления) (1072100), страница 12
Текст из файла (страница 12)
Коалиционное динамическое описание системы
(100)
Здесь, как и ранее, множество обладает свойствами [30]:
1) для любого набора уравнений существует единственное решение
системы (100);
2) компоненты ni-мерных вектор–функций ui(t) являются кусочно-непрерывными функциями, имеющими конечное число точек разрыва (свойства 1), 2) определяют множество )
,
3) управление ui(t) называется допустимым, если ;
4) множество является открытым в смысле: для любого подмножества
при
управление
также принадлежит
, если
,
где — малая положительная константа;
Локальной угрозой коалиции (или
по некоторым
из
является возможность замены коалицией S управления uS(t) на
,
так, чтобы
. (101)
Локальной контругрозой контркоалиции N/S является возможность замены контркоалицией N/S управления uN/S(t) на ,
так, чтобы
,
. (102)
Локальный характер угроз и контругроз принят к рассмотрению для уточнения сетевых УКУ в промежутках между узлами сети.
Определение 4. Локальной угрозой и контругрозой для коалиции S называется набор управлений которого существует постоянная >0 такая, что на любую локальную угрозу коалиции S у контркоалиции N/S имеется локальная контругроза.
Определение 5. Если один и тот же набор управлений является локальной угрозой и контругрозой для любой допустимой коалиции S, то u(t) называется локальной угрозой и контругрозой коалиционной игры.
Стабильные свойства ЛУКУ обобщают известные свойства равновесия по Нэшу, при которых контругроза реализуется уже для соотношения (101) с изменением знака.
Для получения достаточных условий класс допустимых вариаций uS(t) и uN/S(t) ограничивается допустимыми управлениями вида
где , а S, N/S — постоянные.
Постоянные S, N/S можно выбрать настолько малыми по абсолютной величине, что при ограниченных имеет место:
(103)
Вводятся системы вида
(104)
где (j=S, N/S) — матрицы Якоби, Y(t) — матрица фундаментальных решений. Далее для удобства будем обозначать УКУ-решение, как
.
Теорема 1 [30]. Для того, чтобы было локальной угрозой и контругрозой для коалиции S достаточно, чтобы
а) векторы g1(s)=gS, N/S(t) и g2(s)=gN/S, N/S(t) были линейно независимы (равенство 1g1(t)+2g2(t)=0 возможно лишь при 1=2=0),
б) для любых допустимых имело место
, где
- скалярное произведение,
Как и в общем случае, данные достаточные условия локальных УКУ также являются сложными для практических применений.
Действительно, для выполнения условия а) существует в свою очередь необходимое условие: если g1 и g2 линейно независимы, то определитель Грамма
,
где ,
- скалярное произведение.
Во-первых, если это условие выполняется, то функции могут и не быть линейно–независимы, во-вторых, это условие трудно проверяется.
Для проверки условия б) необходимо решать интегральное уравнение
,
и убедиться, что кроме тривиального решения , которое не должно входить в
, для всех
решения нет, при этом ядро уравнения gS,S(t) имеет сложный вид.
И, наконец, необходимо во всех случаях применения иметь точное описание функции перехода X(t,)=(Y(t),YT()) системы (104).
Три данных фактора делают трудно применимым данный вид достаточных условий и требуют их модификации.
Модифицированные достаточные условия локальной УКУ.
Теорема 2. [108] Для того, чтобы набор был локальной угрозой и контругрозой для коалиции S достаточно, чтобы для любых допустимых
, выполнялась система неравенств:
,
где
где
- реализация угроз и контругроз,
принадлежат
, вектор малых величин j выбираем из условия
, где >0 — малая величина.
Если показатели имеют смысл показателей эффективности, то знаки второго и третьего неравенств в (105) меняются на противоположные.
Доказательство. [108] Допустим, что задана постоянная >0 и для управлений и
условия теоремы выполняются.
Введем допустимые вариации управлений
где и
.
Тогда для любого фиксированного набора управлений существует постоянная 1>0 настолько малая, что неравенство (103) выполняется при
.
Введем функцию
(107)
Тогда .
В силу свойства функций fk, Fi, i о непрерывной дифференцируемости по аргументам x, u существуют непрерывные частные производные , (k,j= S, N/S), которые при
принимают вид (106).
Из первого условия (105) следует, что у коалиции S существует допустимая вариация
управления
, реализующая угрозу (101) коалиции S. Действительно, при
.
При этом можно выбрать так, чтобы
. (108)
При выбираем
, а при
—
.
Выполнение первого условия (105) достаточно, чтобы существовала достаточно малая постоянная 2>0 такая, что при имеет место
, что следует из добавления к обеим частям (102) величины
и изменения левой части на бесконечно малую величину
. Последнее соотношение с учетом обозначения (107) принимает вид
,при
.
Таким образом, из первого условия (105) при и соответствующем знаке
следует, что управление
реализует локальную угрозу коалиции S.
Далее покажем, что из второго и третьего условий (105)
,
,
при соблюдении условия (108) существует допустимая вариация управления
, реализующая контругрозу (102) контркоалиции N/S.
Выберем
при
.
Получим
. (109)
В силу условия (108) имеет место .
Вследствие непрерывной дифференцируемости функции в окрестности
существует
такая малая, что
при
.
Так как , то при
и
. (110)
Величина находится из неравенства (103) при фиксированном управлении
, реализующем локальную угрозу S, и выбранному
при реализации контругрозы.
Из (109) следует существование постоянной такой, что при
и
. (111)
Из неравенства (110) для любого фиксированного существует окрестность
, где
и
, и при
такая, что
. (112)
При и
выполняются соотношения (103), (111), (112).
Раскрывая обозначение (107) из (111), (112) имеем: управление реализует контругрозу
.Таким образом, теорема доказана.
Алгоритм оптимизации. Условия теоремы 2. предполагают, что неравенства (105) выполняются на множестве допустимых управлений коалиции
. Следовательно, каждое из трех скалярных произведений выражения (106) представляет собой произведение вектора, зависящего от оптимального управления и траектории, на любой вектор из допустимого множества.
Если в первом слагаемом множество имеет смысл множества достижимости при t=T [172], то в интегральном члене (106) имеет место ансамбль траекторий
и множество управлений
.
Один из вариантов методического упрощения структуры алгоритма на втором этапе заключается в сведении исходной задачи к такому виду, когда для получения достаточно использовать лишь области достижимости.
Для этого вводятся дополнительные координаты
,
и исходная задача сводится к задаче с терминальным показателем
(113)
где — расширенный вектор,
.
Тогда
; (114)
(115
, (116)
где последняя система имеет вид
. (117)
В данной трактовке достаточные условия принимают вид системы
, (118)
при наличии связей (115), (116), (117).
Здесь и далее рассматриваются кусочно-непрерывные управления вида
,
где или параметризованные стратегии
.
Таким образом, необходимо найти пару , которая на множествах допустимых управлений
и
и, как следствие, на множествах
обеспечивает систему неравенств (118).
Общую алгоритмическую структуру этапа 2 теперь можно базировать на основе следующей геометрической трактовки.
Примем для рассуждений без ограничения общности результата, что размерность систем (115) и (116) .
Тогда система (118) является системой скалярных неравенств следующего вида (прочерки над переменными опускаем)
. (119)
Вектора a, b являются векторами, однозначно зависящими от u0. Вектора заполняют соответствующие области достижимости (ОД) (См. рис. 21).
Рис. 21 Топология алгоритма на основе ОД
Утверждение 2. Для того, чтобы третье неравенство системы (119) выполнялось на всей достаточно, чтобы вектор нормали b гиперплоскости находился «внутри» конуса (lI0lII), где lI и lII - вектора нормали касательных гиперплоскостей к
.
Доказательство. Достаточно учесть знак скалярного произведения при всех возможных положениях векторов
в
.
Утверждение 3. Для того, чтобы второе неравенство системы (119) выполнялось на всей достаточно, чтобы вектор нормали a гиперплоскости находился “внутри” конуса (-lI0-lII).
Доказательство базируется на учете знака скалярного произведения при всех
.
Утверждение 4. Первое неравенство системы (119) ограничивает область допустимых значений нормали a гиперплоскости второго неравенства системы пересечением конусов (-lI0-lII) и (-lIV0-lIII), где lIII и lIV - нормали к гиперплоскостям, касающимся .