Диссертация (1149189), страница 14
Текст из файла (страница 14)
. . , l в случайной усеченной подыгре Γ̂kv (x∗k,0 , t0 + k∆t) игроки решили′выбрать другой дележ ξk (x∗k (tbr ), tbr ) из сильно динамически устойчивого ПРДядра C k (x∗k (tbr ), tbr ). Тогда существует ПРД βk′ (t, x∗k ) ∈ Bk (t, x∗k ), t ∈ [tbr , T ],которое соответствует этому дележу, т.е.:′ξk (x∗k (tbr ), tbr ) =∫T(1 − Fk (t))βk′ (t, x∗k )dt.tbrВ этом случае, суммарный выигрыш во всей игре будет распределен в соответствии с результирующим вектором ξˆ′ (x0 , T −t0 ), результирующее ПРД которогобудет иметь вид:∗ (1 − Fk (t))βk (t, xk ), t ∈ [t0 + k∆t, tbr ),β̂ ′ (t, x̂∗ ) =(1 − Fk (t))βk′ (t, x∗k ), t ∈ [tbr , t0 + (k + 1)∆t], (1 − F (t))β (t, x∗ ), t ∈ [t + j∆t, t + (j + 1)∆t],jj00j(3.4)где (1 − Fj (t))βj (t, x∗j ), j ̸= k, j = 0, .
. . , l определяет распределение суммарного выигрыша между игроками во всех кооперативных случайных подыграх,кроме Γ̂kv (x∗k,0 , t0 + k∆t), т.е. там где произошел пересмотр решения. Вектор91ξˆ′ (x0 , T − t0 ) соответствующий результирующему ПРД β̂ ′ (t, x̂∗ ) будет рассчитываться следующим образом:ξˆ′ (x0 , T − t0 ) =[∫∫Tt0tbr+t0 +k∆tβ̂ ′ (t, x̂∗ )dt =[∫l∑j=0j̸=k(1 − Fk (t))βk (t, x∗k )dt +t0 +(j+1)∆t](1 − Fj (t))βj (t, x∗j )dt +t0 +j∆t∫t0 +(k+1)∆t](1 − Fk (t))βk′ (t, x∗k )dt .
(3.5)tbrТак как βk′ (t, x∗k ) ∈ Bk (t, x∗k ), t ∈ [tbr , T ], то результирующее ПРД β̂ ′ (t, x̂∗ ) (3.4)также принадлежит множеству B̂(t, x̂∗ ). Множество всех результирующих векˆ 0 , T − t0 ), соответствующих элементам β̂(t, x̂∗ ) множества B̂(t, x̂∗ )торов ξ(x∫Tˆ 0 , T − t0 ) =ξ(xβ̂(t, x̂∗ )dtt0является результирующим решением Ŵ (x0 , T − t0 ) по определению.
В (3.5)был построен результирующий вектор ξˆ′ (x0 , T − t0 ) с результирующим ПРДβ̂ ′ (t, x̂∗ ) из множества B̂(t, x̂∗ ) и было показано, что результирующий векторξˆ′ (xt , T − t0 ) принадлежит результирующему решению Ŵ (x0 , T − t0 ), которое0было выбрано с самого начала. Теорема доказана.§ 4.Кооперативная игра добычи ограниченного ресурса со случайным обновлением информацииРассмотрим игру добычи ограниченного ресурса трех лиц аналогичную рассмотренной в главе 2, но со случайным обновлением информации. В качествепринципа оптимальности будем использовать сильно динамически устойчивоеПРД-ядро. Характеристическая функция рассчитывается также, как это сделано в [39]. В последней части примера показано свойство сильной динамическойустойчивости результирующего решения.
Вид уравнений движения и функциивыигрыша для исходной игры аналогичен описанному в главе 2. Перейдем кописанию случайной усеченной подыгры.92Случайная усеченная подыгра. Исходная игра Γ(x0 , T − t0 ) определена на временном интервале [t0 , T ]. Предположим, что в любой момент времениt ∈ [t0 +j∆t, t0 +(j+1)∆t], j = 0, . . . , l, игроки имеют усеченную информацию обигре.
Она включает в себя информацию об уравнениях движения и функцияхвыигрыша на временном интервале [t0 + j∆t, T j ], где T j - это экспоненциальная случайная величина распределенная на усеченном временном интервале[max(t0 + (j + 1)∆t, T j−1 ), T ] с функцией распределения Fj (t) и функцией плотности fj (t):)(1 − exp − λ(t − max(t0 + (j + 1)∆t, T j−1 ))(),Fj (t) =1 − exp − λ(T − max(t0 + (j + 1)∆t, T j−1 )))λ exp − λ(t − max(t0 + (j + 1)∆t, T j−1 ))().fj (t) =1 − exp − λ(T − max(t0 + (j + 1)∆t, T j−1 ))(4.1)((4.2)Обозначим через Λj (t): fj (t) , t ∈ [max(t + (j + 1)∆t, T ), T ],0j−11−Fj (t)Λj (t) = 0,t ∈ [t0 + j∆t, max(t0 + (j + 1)∆t, T j−1 )].Очевидно, что∫T∫TdFj (t) =t0 +j∆tdFj (t) = 1.max(t0 +(j+1)∆t,T j−1 )Построим соответствующую случайную усеченную подыгру Γ̂j (xj,0 , t0 +j∆t).Уравнения движения и начальные условия для этой игры имеют следующийвид:3∑√ui ,ẋ = a x(t) − bx(t) −x(t0 + j∆t) = xj,0 .i=1В соответствии с (1.3) функция выигрыша игрока i ∈ N может представлена ввиде:∫TKij (xj,0 , t0 + j∆t; u) =(1 − Fj (τ ))hi (x(τ ), u(τ ))dτ.t0 +j∆t93Рассмотрим случай, когда игроки соглашаются на кооперацию в случайнойусеченной подыгре Γ̂j (xj,0 , t0 + j∆t).
Тогда игроки будут действовать исходя измаксимизации их суммарного выигрыша.Кооперативная траектория. Максимальный суммарный выигрыш вкаждой случайной усеченной подыгре Γ̂j (xj,0 , t0 + j∆t) имеет следующий вид[48]:√W j (t, x) = Aj (t) x + C j (t),(4.3)где функции Aj (t), C j (t) удовлетворяют системе дифференциальных уравнений:[]3∑b [ 1] ,Ȧj (t) = Λj (t) +Aj (t) −Aj (t)24 ci + 2i=1aĊ j (t) = Λj (t)C j (t) − Aj (t),2jjlim A (t) = 0, lim C (t) = 0,t→Tt→Tгде Λj (t) определено в (4.3).Кооперативная траектория x∗j (t) в случайной усеченной подыгре Γ̂j (xj,0 , t0 +j∆t) может быть вычислена на временном интервале следующим образом [48]:2t∫√1∗2xj (t) = ϖj (t0 + j∆t, t) x∗j,0 + a ·ϖj (t0 + j∆t, τ )−1 dτ ,2t0 +j∆tгде t ∈ [t0 + j∆t, T j ], T j - это случайная величина распределенная по законуFj (t) (4.1):∫tϖj (t0 + j∆t, t) = expt0 +j∆t∑11− b + []2 dτ.2Aj (τ )i=14 ci + 23Начальное положение для кооперативной траектории в каждой усеченнойподыгре устанавливается из предыдущей усеченной подыгры: x∗0,0 = x0 иx∗j,0 = x∗j−1 (t0 + j∆t) для 1 ≤ j ≤ l.
Определим условно кооперативную траекторию x̂∗ (t) в игре Γ(x0 , T − t0 ) со случайным обновлением информации:x̂∗j (t) = x∗j (t),t ∈ [t0 + j∆t, t0 + (j + 1)∆t],j = 0, . . . , l.94Характеристическая функция. Характеристическую функцию будемрассчитывать также, как это было сделано в главе 2. Отличие заключается втом, что все расчеты происходят для игры со случайной продолжительностью.Рассчитаем Vj (S; xj,0 , t0 + j∆t) (Vj (S; x∗j (t), t)) для каждой коалиции S ⊂ N .В соответствии с формулой в главе 2 (2.7) максимальный суммарный выигрыш игроков Wj (t0 +j∆t, xj,0 ) (4.3) соответствует значению характеристическойфункции Vj (N ; xj,0 , t0 + j∆t) коалиции S = N в случайной усеченной подыгреΓ̂jv (xj,0 , t0 + j∆t):Vj (N ; x∗j (t), t) = Wj (t, x∗j (t)),t ∈ [t0 + j∆t, T j ],j = 0, . . .
, l.Далее нам необходимо определить значения характеристической функции дляследующих коалиций:{1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}.Для каждой коалиции вида {i}, i = 1, 3 нам необходимо определить равновесиепо Нэшу в усеченной подыгре Γ̂j (xj,0 , t0 + j∆t) и как результат Vj ({i}; x∗j (t), t).Коалиции, состоящие из одного игрока. Равновесие по Нэшу в случайной усеченной подыгре Γ̂j (xj,0 , t0 +j∆t) определяется следующими стратегиямиигроков:uji (t, x) =x4[ci + Aji (t)/2]2,i = 1, 3,где функции Aji (t) находятся из системы дифференциальных уравнений:1b ∑1−,Ȧji (t) = Aji (t) Λj (t) + +j28(ck + Ak (t)/2)24(ci + Aji (t)/2)k̸=iaĊij (t) = Λj (t)Cij (t) − Aji (t),2jjlim Ai (T ) = 0, lim Ci (T ) = 0, i = 1, 3,t→Tt→Tгде Λj (t) определено в (4.3).Выигрыш игрока i = 1, 3 в ситуации равновесия по Нэшу определяетсяфункцией:√Vij (t, x) = Aji (t) x + Cij (t),i = 1, 3.95Таким образом, значение характеристической функции для коалиций, состоящих из одного игрока S = {i}, i ∈ N , вычисляется следующим образом:Vj ({i}; x∗j (t), t) = Vij (t, x∗j (t)),t ∈ [t0 + j∆t, T ],j = 0, .
. . , l.Коалиции, состоящие из двух игроков. Значение характеристическойфункции для коалиций, состоящих из двух игроков, рассчитывается аналогичнотому, как это делается в главе 2. Рассмотрим формулы для Vj (S; xj,0 , t0 + j∆t)(Vj (S; x∗j (t), t)) в случае, когда S = {1, 2}, формулы для вычисления остальных коалиций можно получить по такому же принципу. Значения выигрышейигроков в ситуации равновесия по Нэшу имеют следующий вид:√jj(t, x) = Aj{1,2} (t) x + C{1,2}(t),V{1,2}√V3j (t, x) = Aj3 (t) x + C3j (t),jгде функции Aj{1,2} (t), Aj3 (t), C{1,2}(t), C3j (t) удовлетворяют системе дифферен-циальных уравнений:[]Ȧj{1,2} (t) = Aj{1,2} (t) Λj (t) +−∑b1+−2 8(c3 + Aj3 (t)/2)21,j4(c+A(t)/2)k{1,2}k∈S[]∑b1Ȧj3 (t) = Aj3 (t) Λj (t) + +−28(ck + Aj{1,2} (t)/2)2k∈S−14(c3 + Aj3 (t)/2),aajjĊ{1,2}(t) = Λj (t)C{1,2}(t) − Aj{1,2} (t), Ċ3j (t) = Λj (t)C3j (t) − Aj3 (t),22jjjjlim A{1,2} (t) = lim A3 (t) = lim C{1,2} (t) = lim C3 (t) = 0,t→Tt→Tt→Tt→Tгде слагаемое Λj (t) определено в (4.3).
Таким образом, значение характеристической функции коалиции S = {1, 2} вычисляется следующим образом:jVj ({1, 2}; x∗j (t), t) = V{1,2}(t, x∗j (t)),t ∈ [t0 + j∆t, T ],j = 0, . . . , l.Концепция решения. Пусть игроки в каждой кооперативной случайнойусеченной подыгре Γ̂jv (xj,0 , t0 + j∆t) используют в качестве принципа оптимальности сильно динамически устойчивое ПРД-ядро C j (x∗j (t), t) (C j (x0 , t0 )).96Это означает, что игроки в каждой случайной усеченной подыгре выбираютПРД βj (t, x∗j ) из множества Bj (t, x∗j ) (3.1), j = 0, . .
. , l. Далее строится соответствующее результирующее ПРД β̂(t, x̂∗ ) (3.2) и множество B̂(t, x̂∗ ). С поˆ ∗ (t), T − t),мощью формулы (3.3) рассчитывается результирующий вектор ξ(x̂множество всевозможных таких векторов образует результирующее решениеŴ (x̂∗ (t), T − t).Далее на примере конкретных результирующих векторов из Ŵ (x̂∗ (t), T − t)покажем, что построенное решение является сильно динамически устойчивымв игре Γ(x0 , T − t0 ) со случайным обновлением информации. Отличием этогораздела от подобного в главе 2 является то, что в главе 2 в качестве принципаоптимальности использовалось C-ядро, а значит исследовалось свойство сильной ∆t-динамической устойчивости. Это означает, что исследовалось отклонение от выбранного решения (дележа) только в моменты времени t = t0 + j∆t,j = 0, .
. . , l. В этом разделе в качестве принципа оптимальности используетсясильно динамически устойчивое ПРД-ядро, поэтому интерес представляет исследование свойства сильной динамической устойчивости. Т.е. будет исследовано отклонение от выбранного решения для любого момента времени t ∈ [t0 , T ].Численный пример.
Рассмотрим численный пример игры заданной навременном интервале длинной T − t0 = 4, в котором на интервалах времени[t0 + j∆t, t0 + (j + 1)∆t] информация об игре известна на интервале длиннойT j , где T j - это случайная величина (4.1) с λ = 0.5. Информация об игре обновляется с периодом ∆t = 1. Зафиксируем следующие параметры для уравненийдвижений a = 10, b = 0.5, для функции выигрыша c1 = 0.15, c2 = 0.65, c3 = 0.45и для начальных условий t0 = 0, x0 = 200.Во время обновления информации об игре происходит реализация случайного временного горизонта для текущей усеченной подыгры:T 0 = 2.423,T 1 = 3.538,T 2 = 3.871,T 3 = 4.Сгенерированное значение информационного горизонта в текущей усеченнойподыгре влияет на распределение продолжительности следующей усеченнойподыгры.97На графике 4.1. отображены плотности распределения.















