Диссертация (1145356), страница 32
Текст из файла (страница 32)
. . , } (см. § 3.2). Согласно Утверждению 1.4.3 имеем () =∑︀=1 ().Тогда для игрыΓ (0 , 0 , ) справедливы результаты, сформулированные в Главе 6.Пусть игроки выбрали некоторый принцип оптимальности (0 , 0 ) в игре Γ (0 , 0 , ). Тогда для любого динамически устойчивого дележа ∈ (0 , 0 ) из формулы (6.2.7) Следствия 6.2.1 следует следующая формуладля вычисления ПРД: () = (∑︁ ()) − ( )′ , ∈ [0 , ∞), = 1, .
. . , .(7.3.14)=1Условия защиты игроков из коалиции от иррационального поведения242Глава 7. Устойчивая кооперация в играх со случайным моментом окончания. Модификациидругих участников (6.3.17) в Теореме 6.3.2 принимают вид:∑︁∈∑︁ () ≥ ( ()) (* (), ; ) − (* (), ; ),=1 ⊆ .(7.3.15)Очевидным образом могут быть модифицированы необходимые (6.6.57) идостаточные условия (6.6.55) для сильной динамической устойчивости С–ядра(см. § 6.6).7.3.1Пример. Динамически устойчивый вектор Шепли в игреΓ (0 , 0 , ).Рассмотрим пример игры двух лиц из § 3.2.1. Пусть = 1, = 1, 2, т.е.рассмотрим экспоненциальное распределение для случайных моментов отказаоборудования игроков 1 и 2.
Введем обозначение ˜ = 1 2 , = 1 + 2 , индекс− обозначает дополнение до = {1, 2}, т.е., −1 = 2 .Характеристическая функция может быть построена тремя рассмотренными в § 5.3 способами:(︀)︀˜ − 2 + 2 − 2 2 () − 22 ((), , {}) =,32)︀(︀222−2−2()− ((), , {}) = ,32 ((), , {}) =2 2 − 2 + 2 − 2() 2 − 2−.23Очевидно, что достаточное условие (6.6.55) выполнено для всех построенных характеристических функций (для ясности изложения используем краткие записи):]︀ [︀]︀ [︀21 + 22 ( ) − [ (1) + (2)] − ( ) − [ (1) + (2)] = −< 0,22243Глава 7. Устойчивая кооперация в играх со случайным моментом окончания.
Модификации]︀ [︀]︀2 + 41 2 + 22 [︀ ( )−[ (1)+ (2)] − ( )−[ (1)+ (2)] = − 1< 0,22]︀ [︀]︀ [︀(1 + 2 )2 ( ) − [ (1) + (2)] − ( ) − [ (1) + (2)] = −< 0.2Вычислим вектор Шепли на основе построенных характеристических функций. Имеем:ℎ1 (, * ()) =41 2 + 321 + 22 + 221 2 + 41 (2 − )( − 0 ) − 41 2 0 − 4 1 =43ℎ1 (, * ()) =41 2 + 321 + 22 + 221 2 + 41 (2 − )( − 0 ) − 41 2 0 − 4 1 =43ℎ1 (, * ()) =21 2 + 221 + 21 2 + 21 (2 − )( − 0 ) − 21 2 0 − 2 1 =23Вычислим ПРД по формуле (7.3.14).
Тогда для – характеристическойфункции имеем:1 ()21 2 + 21 2 − 1 2 2 − 1 (4 − 2 2 )( − 0 ) + 21 2 0.=−22Выражения для ПРД в случае –, – характеристических функций получаемпо формуле (7.3.14) аналогичным образом.7.4Принцип динамической устойчивости в игре Γ (0, 0)Рассмотрим дифференциальную игру со случайным моментом окончанияΓ (0 , 0 , ), в которой функция распределения (), ∈ [0 , ∞) может меняться во время игры (см. § 3.4). Имеем составную функцию распределения244Глава 7. Устойчивая кооперация в играх со случайным моментом окончания. Модификации (), ∈ [0 , ∞) (3.4.55), а игру с такой функцией распределения обозначимкак Γ (0 , 0 ).При предположении существования функции плотности распределения вероятностей справедлива формула для ПРД в дифференциальной игре со случайным моментом окончания (6.2.7).
В задаче с составной функцией распределения функция плотности () (3.4.55) является разрывной, но существует.Тогда Теорема 6.2.1 справедлива для данного класса задач.Следствие 7.4.1. Пусть для каждой подыгры Γ (* (), ) , ∈ [0 , ∞)*¯вектор-функция ℎ((), ) является абсолютно непрерывной функцией вре-мени , ∈ [0 , ∞). Пусть () = ()ℎ − (ℎ )′ , ∈ [−1 , ), = 1, .
. . , , = 1, . . . , .(7.4.16)Тогда в игре Γ (0 , 0 ) вектор Шепли ℎ(0 , 0 ) является динамически устойчивым дележом с ПРД (7.4.16).Доказательство. Доказательство основано на Теореме 6.2.1.Из (1.4.22), (3.4.55) имеем () =⎧⎪⎪⎪1 (),⎪⎪⎪⎪⎪⎪⎨2 (),⎪⎪⎪...⎪⎪⎪⎪⎪⎪⎩ (), ∈ [0 , 1 ), ∈ [1 , 2 ),(7.4.17) ∈ [ −1 , ∞).Тогда из (6.2.7) получаем аналитическую формулу для вычисления ПРД вигре Γ (0 , 0 ): () = ()ℎ − (ℎ )′ , ∈ [−1 , ), = 1, . . . , , = 1, . . . , .245Глава 7.
Устойчивая кооперация в играх со случайным моментом окончания. МодификацииУсловия защиты игроков из коалиции от иррационального поведения других участников (6.3.17) в Теореме 6.3.2 также могут быть переформулированыследующим образом.Следствие 7.4.2. Пусть (* (), ; ) — непрерывно дифференцируемая функция при ∈ [0 , ∞) в игре Γ (0 , 0 , ). Тогда условие (6.3.16) выполнено тогда и только тогда, когда ПРД (), ∈ [0 ; ∞) удовлетворяет неравенству∑︁ () ≥ () (* (), , ) −∈ ⊆ , ∈ [−1 , ), (* (), , ), = 1, . . . , ,(7.4.18) = 1, . . . , .Доказательство.
Следствие из Теоремы 6.3.2.Очевидным образом могут быть модифицированы необходимые (6.6.57) идостаточные условия (6.6.55) для сильной динамической устойчивости С–ядра(см. § 6.6).Часть IIIМногошаговые игры со случайнойпродолжительностью246Глава 8Кооперативные многошаговые игры сослучайным числом шагов8.1Определение многошаговой кооперативнойигры со случайным числом шаговв форме характеристической функции.В части II рассматривались кооперативные дифференциальные игры со случайной продолжительностью. С точки зрения приложений практическую значимость имеют не только дифференциальные игры, но и их дискретный вариант — многошаговые игры.Рассмотрим конечный древовидный граф = (, ). Обозначим через максимальную длину пути в графе .Пусть — множество всех вершин, а — отображение, заданное на множестве : : → 2 , () = ⊂ , ∈ .
Для конечного графа 1множество является конечным, поэтому любое его подмножество конечно (если реализовалась последовательность вершин 0 , 1 ,. . . , , то = ∅).Пусть в каждой вершине ∈ графа задана одновременная игра лиц247Глава 8.Кооперативные многошаговые игры со случайным числом шагов248в нормальной формеΓ() = ⟨, 1 , ..., , ℎ1 , ..., ℎ ⟩ ,где = {1, 2, ..., } — множество игроков, одинаковое для всех ∈ ; — множество стратегий (конечное множество) -го игрока ( ∈ ) в вершине ; ℎ = ℎ (1 , ..., ) — функция выигрыша игрока ( ∈ , ∈ ). Набор стратегий = (1 , ..., ), ∈ , ∈ , назовем ситуацией в игреΓ(). Функции выигрышей игроков в одновременной игре Γ() предполагаются неотрицательными: ℎ (1 , ..., ) > 0.Переход из одной вершины графа в другую +1 ∈ зависит от реализовавшейся ситуации на предыдущем шаге, то есть динамика игры заданарекуррентно:(8.1.1)+1 = ( , ),где — ситуация, реализовавшаяся на шаге , = 0, 1, .
. . , − 1 для конечного графа ( = ∅).Число шагов в игре является целочисленной случайной величиной , длякоторой считаем заданным распределение вероятностей { }=0 : 0 ≤ ≤ 1,∑︀=0 = 1. Здесь — вероятность того, что игра закончится на -ом шаге.Многошаговая игра (0 ) со случайным числом шагов определяется следующим образом: в вершине 0 (т.е. на нулевом шаге) графа осуществляетсяодновременная игра Γ(0 ), в которой реализуется ситуация 0 = (10 , .
. . , 0 ),далее игра либо прекращается с вероятностью 0 , либо переходит в другуювершину графа ∈ 0 соответственно с заданной динамикой (8.1.1): 1 = (0 , 0 ) ∈ (0 ). На -ом шаге игры (0 ), в вершине графа , происходит одновременная играΓ( ) = ⟨, 1 , ..., , ℎ1 , ..., ℎ ⟩Глава 8.249Кооперативные многошаговые игры со случайным числом шагови реализуется ситуация , далее игра (0 ) либо прекращается с вероятностью , либо переходит в другую вершину графа : +1 = ( , ). Напоследнем шаге игры на конечном графе 1 , игра заканчивается с вероятностью , при этом в вершине ( = ∅) разыгрывается одновременная игра Γ( ) (иначе игра заканчивается в одной из предшествующей вершин 0 , 1 , . . .
, −1 ). Предположим, что в игре (0 ) реализовалась некотораяпоследовательность ситуаций 0 , 1 , . . . , , которая однозначно определяетнекоторый путь = 0 , 1 , 2 , ... в древовидном графе . Верно и обратное:любой путь 0 , 1 , . . . , , . . . , , где = (−1 , −1 ), однозначно определяет выбор стратегий в каждой одновременной игре, а следовательно, последовательность ситуаций 0 , 1 , . .
. , . По аналогии с терминологией части IIбудем называть реализовавшийся путь траекторией игры.Математическое ожидание выигрыша -го игрока в игре (0 ) вычисляетсяпо формуле: (0 , 1 , . . . , ) =(︃ ∑︁∑︁=0)︃ℎ ( ) .(8.1.2)=0Раскроем данное выражение: (0 , 1 , . . . , ) = ℎ 0 (0 )0 + (ℎ 0 (0 ) + ℎ 1 (1 )) 1 ++ (ℎ 0 (0 ) + ℎ 1 (1 ) + ℎ 2 (2 )) 2 + .
. . + (ℎ 0 (0 ) + . . . + ℎ ( )) + . . .Заметим, что коэффициенты при "мгновенных"(пошаговых) выигрышах ℎ ( )вычисляются как∑︀=0 = 1 ,∑︀=1 = 1 − 0 , . . . ,∑︀ = 1 −−1∑︀ , . . . Сле-=0=довательно, имеем другую, более наглядную форму записи формулы (8.1.2): (0 , 1 , . . . , ) = ℎ 0 (0 ) + ℎ 1 (1 ) (1 − 0 ) + .
. . +(︃)︃(︃)︃−1−1∑︁∑︁+ℎ ( ) 1 − + . . . + ℎ ( ) 1 − .=0(8.1.3)=0Кооперативная форма игры (0 ) предполагает, что игроки перед началомигры договариваются об использовании ими таких стратегий ¯ ∈ в каж-Глава 8.Кооперативные многошаговые игры со случайным числом шагов250дой игре Γ(), что соответствующая им траектория ¯ = (¯0 , ¯1 , . . . , ¯ , . . . , ¯ )максимизировала бы математическое ожидание суммарного выигрыша всехигроков:max0 ,..., ,..., ={ }, ∈ , ∈∑︁=1 (0 , 1 , . . . , ) =(︃ ∑︁∑︁∑︁=1 =0)︃ℎ (¯ ) . (8.1.4)=0Траекторию ¯ будем далее называть оптимальной. Заметим, что ¯0 = 0 , обозначение ¯0 будет использоваться далее для того, чтобы подчеркнуть нашузаинтересованность в развитии игры вдоль оптимальной траектории.Предположим, что максимум в (8.1.4) достигается.
Также для простотыбудем полагать, что оптимальная траектория ¯ единственна. Дальнейшие рассуждения будут справедливы для любой оптимальной траектории.Для построения характеристической функции (, 0 ), ⊆ для каждой вершины ∈ положим (∅, 0 ) = 0 и определим вспомогательнуюигру с нулевой суммой , ∖ () между коалицией ⊂ , как максимизирующим игроком, и коалицией ∖ , как минимизирующим игроком. Антагонистическая игра , ∖ (0 ) на основе игры (0 ) происходит следующим образом: игроки, входящие в коалицию , выбирают такие стратегии = { }, ∈ на каждом шаге , чтобы реализовавшаяся ситуация = 0 , 1 , .