Автореферат (1145355), страница 5
Текст из файла (страница 5)
Будем полагать = ∞.Пусть 0 – начальное время, (), = 1, . . . , – набор функций распределения, описывающих различные режимы функционирования системы и удовлетворяющие следующему условию:C. Функции распределения () являются абсолютно непрерывными неубывающими функциями, такими что каждая Ф.Р. стремится к 1 асимптотически, т.е. () < 1 ∀ < ∞.Пусть также = { }, 0 = 0 < 1 < · · · < −1 < = ∞ – упорядоченнаяпоследовательность моментов времени, в которые происходит изменение видаФ.Р.Составная Ф.Р. () определяется следующим образом:⎧ ∈ [0 , 1 ),⎨ 1 (), () = ( ) () + ( ), ∈ [ , +1 ),⎩ +11 ≤ ≤ − 1,где ( ) = (− )−1+1 ( )−1 , ( ) = 1 − (− )−1+1 ( )−1 , (− ) =(22)lim ().→( −0)Составная плотность распределения вероятности имеет следующий вид:⎧ ∈ [0 , 1 ),⎨ 1 (), () = ( ) (), ∈ [ , +1 ),⎩ +11 ≤ ≤ − 1.(23)Теорема 3.4.1. Пусть дан набор Ф.Р. (), 1 ≤ ≤ , таких что условиеC выполняется для каждой функции ().
Тогда составная Ф.Р. (), определенная по формуле (22), удовлетворяет C.Задача оптимизации в классе программных стратегий в кооперативнойигре Γ (0 , 0 ) приобретает следующий вид:* () = argmax∑︁=1 (0 , 0 , ) = argmax Z∑︁=1 0(1 − ( ))ℎ (( ), ( )).(24)19В § 3.4.2. описаны различные подходы к определению составной функции распределения (), ∈ [0 , ∞).
Изменения функции распределения () в моменты времени = { }, 0 = 0 < 1 < · · · < −1 < = ∞ могут быть−1одного из двух типов, соответствующих фиксированному набору = { }=1либо зависеть от состояния системы ( определяется как решение уравнения ( (− )) = 0).В § 3.4.3 изучена теоретико-игровая задача разработки невозобновляемогоресурса как пример игры Γ (0 , 0 ) с одним моментом изменения вида Ф.Р.для обоих указанных выше вариантов.
Предполагается, что игроки используют идентичное оборудование для эксплуатации месторождения, причем вероятность отказа оборудования определяется режимом эксплуатации (в данномпримере рассматривается два возможных режима). Наибольший интерес представляет случай, когда переключение режимов зависит от состояния . В этомслучае момент перехода из одного режима в другой определяется степеньюразработки месторождения, а, конкретнее, изменение Ф.Р. происходит при достижении порогового значения 0 ( ∈ [0, 1]) объема оставшегося ресурса отпервоначального значения 0 .В конце Главы 3 в § 3.5 рассматривается игра со случайным моментомначала Γ0 (0 , 0 , ). Предполагается, что дифференциальная игра лиц начинается в случайный момент времени 0 и заканчивается в фиксированныймомент времени .
Будем считать известной функцию распределения случайной величины 0 : (), ∈ [0 ; ], а также значение фазовой переменной вмомент времени 0 ((0 ) = 0 ).Под выигрышем игрока будем понимать⎡⎤Z⎢⎥ (0 , 0 , , 1 . . . , ) = E ⎣ ℎ (, (), 1 (), . . . , ())e−(−0 ) d⎦ ,(25)0где 0 — случайная величина.
Отметим, что в данной постановке мгновенныйвыигрыш игрока дисконтируется при помощи экспоненциальной функции с дисконтирующей ставкой .Утверждение 3.5.1. Пусть выполнены предпосылки Теоремы 2.2.2. Тогда в игре Γ0 (0 , 0 , ) интегральный выигрыш игрока , = 1, .
. . , имеетследующий вид:Zℎ (( ), ( )) ( )−( −0 ) . (0 , 0 , , 1 . . . , ) =(26)0В Главе 4 рассматриваются другие подходы к определению функционала выигрыша в дифференциальной игре Γ (0 , 0 , ) cо случайным моментомокончания. В § 4.1 сформулированы основные требования к конфликтно-управляемой системе, которые будут использованы в данной Главе в дальнейшем.Альтернативным подходом к задаче максимизации математического ожидания20выигрыша является задача минимизации величины, соответствующей той илииной мере риска, основанной на вычислении дисперсии или второго моментавыигрыша. В § 4.2 и § 4.3 задача минимизации дисперсии выигрыша и второгомомента в классе программных стратегий упрощены.В части II «Кооперативные дифференциальные игры со случайной продолжительностью в форме характеристической функции» описанные выше классы дифференциальных игр изучаются в форме характеристической функции.Отдельного внимания в дифференциальных играх заслуживают следующие вопросы: построение характеристической функции (0 , 0 , ; ), ⊆ ;проблема динамической и сильно динамической устойчивости кооперативныхрешений (принципов оптимальности).В Главе 5 рассматриваются кооперативные дифференциальные игры спредписанной продолжительностью Γ(0 , 0 , ).
§ 5.1 посвящен вопросу динамической устойчивости кооперативных решений в игре Γ(0 , 0 , ). В § 5.1.1– § 5.1.3 систематизированы известные результаты, объясняющие концепциюдинамической устойчивости принципов оптимальности в кооперативных дифференциальных играх. В § 5.1.4 предлагается обобщение условия защиты отиррационального поведения участников. В § 5.1.5 построен динамически устойчивый вектор Шепли для игры трех лиц, в которой задача управления объемами вредных выбросов моделируется как частный случай дифференциальнойлинейно-квадратичной игры. Все результаты получены в аналитическом виде.В § 5.2 изучается вопрос сильной динамической устойчивости –ядра в игре Γ(0 , 0 , ).
Вводится понятие опорного решения в –ядре, а также доказывается конструктивная теорема о достаточных условиях, гарантирующих сильную динамическую устойчивость –ядра. Подробно анализируются следствияоб ограничениях на характеристическую функцию, гарантирующие непустотумножества опорных решений.Рассмотрим игру Γ (0 , 0 , ). Предположим, что перед началом игры игроки договорились об использовании ими С–ядра (0 , 0 , ) в качестве принципа оптимальности (0 , 0 , ).Определение 5.2.1. [2] Будем говорить, что C–ядро (0 , 0 , ) являетсясильно динамически устойчивым кооперативным решением в игре Γ (0 , 0 , ),если1. (* (), , ) ̸= ∅, ∀ ∈ [0 , ];2.
существует такой дележ ¯ ∈ (0 , 0 , ) и такая процедура распределеZ¯ ) = (¯1 ( ), . . . , ¯ ( )), ∈ [0 , ], что ния дележа (¯=¯ ( ) и0Z(0 , 0 , ) ⊇}︀¯ ) + (* (), , ), ∀ ∈ [0 , ],({︀021где операция сложения в последнем выражении понимается как сумма множеств по Минковскому.Определение 5.2.2. Дележ ¯ ∈ (0 , 0 , ), гарантирующий сильнодинамическую устойчивость C–ядра, будем называть опорным решением.Теорема 5.2.1. Пусть (* (), , ; ) — непрерывно дифференцируемаяфункция по ∈ [0 ; ]. Пусть (* (), , ) ̸= ∅, ∀ ∈ [0 , ].
Если существуетдележ ∈ (0 , 0 , ) и соответствующая ему ПРД (), ∈ [0 , ], такая что∀ ⊂ справедливо∑︁ () ≥ −∈∑︁∈ = − (* (), , ; ),(27) (* (), , ; ),то дележ ∈ (0 , 0 , ) является опорным решением ¯ , а С–ядро (0 , −0 ) является сильно динамически устойчивым кооперативным решением в игреΓ(0 , − 0 ).Следствие 5.2.1. Пусть (* (), , ; ) — непрерывно дифференцируемая функция по ∈ [0 ; ]. Пусть существует дележ ∈ (0 , 0 , ) и соответствующая ему ПРД (), ∈ [0 , ], такая что ∀ ⊂ выполняется условие(27) Теоремы 5.1.1 .
Тогда ПРД () удовлетворяет неравенству−]︀ ∑︁ [︀ (* (), , ; ) − (* (), , ; ∖ ) ≥ (),∈∑︁ = − (* (), , ; ).(28)∈Следствие 5.2.2. Пусть характеристическая функция (* (), , ; )непрерывно дифференцируема по ∈ [0 , ] и удовлетворяет следующему условию для ∀ ⊂ ,∀ ∈ [0 , ]: (* (), , , ) ≤ [ (* (), , , ∖ ) + (* (), , , )].(29)Тогда множество опорных решений (0 , 0 , ) непусто.В § 5.2.1 предлагается алгоритм построения сильно- динамически устойчивого -ядра для игры лиц. Для игры = 2 лиц данный алгоритм можетбыть существенно упрощен.
В § 5.2.2 предложен конструктивный подход для построения множества опорных решений в игре двух лиц. Данный алгоритм былиспользован в § 5.2.3 для построения сильно-динамически устойчивого решенияв дифференциальной игре сокращения объемов вредных выбросов с ненулевойабсорбцией загрязнений для случая двух игроков. В § 5.2.4 была рассмотренаигра трех лиц из § 5.2.5. Доказано, что в данной игре управления вреднымивыбросами множество опорных решений не пусто и содержит вектор Шепли.22В § 5.3 исследуется вопрос построения характеристической функции в кооперативных дифференциальных играх с предписанной продолжительностьюΓ(0 , 0 , ). В § 5.3.1, § 5.3.2 приводятся известные определения - и - характеристических функций, на конкретных примерах дифференциальных игр анализируются достоинства и недостатки предложенных подходов.
В § 5.3.3 формулируется новый подход к построению характеристической функции ( –х.ф.),позволяющий избежать указанных недостатков.В теории кооперативных игр существуют различные способы построенияхарактеристических функций. Наиболее часто используемые классы характеристических функций могут быть обозначены в порядке их появления как -, -, -, - характеристические функции.В современной литературе под характеристической функцией в кооперативных играх понимается следующее отображение из множества всех возможных коалиций: (·) : 2 → , (∅) = 0.Отметим, что значение () является мерой стратегической силы коалиции .Важным свойством является свойство супераддитивности характеристическойфункции: (0 , 0 , , 1 ∪2 ) ≥ (0 , 0 , , 1 ) + (0 , 0 , , 2 ),(30)∀ 1 , 2 ⊆ , 1 ∩ 2 = ∅.Характеристическая функция (0 , 0 , ; ) , , ⊆ может быть определена следующим образом: игроки из используют стратегии * = {* }∈из оптимального -набора * , в то∑︀ время как оставшиеся игроки из множества ∖ минимизируют выигрыш коалиции .∈Имеем: (0 , 0 , ; ) =⎧0,⎪⎪∑︀⎪⎪⎪min (0 , * , ∖ ),⎪⎪⎪⎨ ∈ , ∈ ∖ ∈ = {∅} ⊂ , =* , ∈⎪⎪⎪⎪⎪⎪⎪⎪⎩max∑︀(31) (0 , 1 , 2 , .