Диссертация (1149783), страница 13
Текст из файла (страница 13)
Если в момент τ кооперация распадается, и создается коалиция K̆, то новая траектория загрязненияs(t) определяется подстановкой в уравнение динамики (3.1.1) формул выбросов(∆)K̆ei(∆)Kl(3.3.24) для i ∈ K̆ и ei(3.3.5) для i ∈ N̆ \ K̆. Следовательно, формулатраектории будет следующей:s(∆)K̆ (t) =GK̆(1 − exp [−δ(t − τ )]) +δ+s(∆)N (τ ) exp [−δ(t − τ )]гдеGK̆ =Xi∈Nk̆1ēi − AK̆ −γγXkξ AKξKξ ⊂N̆ \K̆Рассмотрим теперь разностьAK̆∪L̆ sK̆∪L̆ (t) − AK̆ sK̆ (t) − AL̆ sL̆ (t)Учитывая (3.3.28), получаем:AK̆∪L̆ sK̆∪L̆ (t) − AK̆ sK̆ (t) − AL̆ sL̆ (t) =1= (1 − exp [−δ(t − τ )]) AK̆∪L̆ GK̆∪L̆ − AK̆ GK̆ − AL̆ GL̆ =δΛK̆∪L̆=(1 − exp [−δ(t − τ )])δγ(3.3.28)101Таким образом:WW(t)L̆(t)K̆∪L̆K̆∪L̆t, s(t)K̆K̆(t) − Wt, s (t) − ΛK̆∪L̆ΛK̆∪L̆t, s (t) =(1 − exp [−δ(t − τ )]) +δγrγL̆K̆SПоскольку r, γ, δ ≥ 0 и Λ L̆ ≤ 0, то(t)K̆∪L̆K̆∪L̆(t)K̆K̆(t)L̆L̆Wt, s(t) − Wt, s (t) − Wt, s (t) ≤ 0, что и доказывает неравенство (3.3.27)3.4Процедура распределения выигрыша в игре Γ∆ (s0, t0)Будем считать, что участники кооперации коалиций делят полученный выигрыш в соответствии с динамическим вектором Шепли.
При этом, посколькуучастниками игры Γ∆ (s0 , t0 ) являются не отдельные предприятия, а их коалиции, то, как и ранее, компоненты вектора Шепли {νKl (V )}Kl ⊂∆ рассчитываютсяпо формуле (2.4.1).(∆)NНа промежутке [t0 , ∞) коалиции используют управления ei(s(t)) в со-ответствии с формулой (3.3.17), соответствующая кооперативная траекторияs(∆)N (t) определяется формулой (3.3.18).В начальный момент времени t0 доля коалиции Kl ⊂ ∆ будет равна:X (k − 1)!(m − k)! h(t0 )∆(t0 )νKl (t0 , s0 ) =VK̆, s0 , t0 −(3.4.1)m!K̆⊆N̆i∆(t0 )VK̆ \ Kl , s0 , t0 ,где K̆ = Kl1 ∪ Kl2 ∪ ... ∪ Klk – объединение некоторого подмножества коалицийиз разбиения ∆, Klξ ⊂ ∆, ξ = 1, ..., k, k – число коалиций-участников игры,входящих в коалицию K̆, m– число коалиций-участников в разбиении ∆.Чтобы вектор Шепли поддерживался на протяжении всего времени игры,в каждый момент времени t ∈ [t0 , ∞), учитывая формулу (3.3.26), должно102выполняться равенство:(t )νK0lX (k − 1)!(m − k)! h(∆)N(t0 )K̆(∆)Nt, s(t) =Wt, s(t) −m!K̆⊆N̆i(t0 )K̆\Kl(∆)NWt, s(t)Из субаддитивности характеристической функции V(t0 )∆(3.4.2)K̆, s(t), t сле-дует индивидуальная рациональность и эффективность вектора Шепли:(t0 )Kl(∆)Nt, s(t) ≤ Wt, s(t)X (t )0(∆)N(t0 )N(∆)NνKl t, s(t) = Wt, s(t)(t )νK0l(∆)NKl ⊂∆no(t0 )(∆)N(t)Будем полагать, что функции νKl t, sKl ⊂∆дифференцируемыпо t.
Для реализации динамического вектора Шепли необходимо определитьпроцедуру распределения дележа. Определим процедуру распределения дележа, как функцию β∆ (t) = {βKl (t)}t∈[t0 ,∞) , такую что в любой момент t ∈ [t0 , ∞):Z∞(t )νK0l (t0 , s0 ) =βKl (τ ) exp [−r(τ − t0 )] dτ(3.4.3)t0Функция βKl (τ ) представляет собой затраты, которые несеткоалиция-участник Kl в момент τ .Для поддержания вектора Шепли необходимо выполнение следующего равенства:(t )νK0l Z∞t, s(∆)N (t) = βKl (τ ) exp [−r(τ − t0 )] dτ(3.4.4)tИз (3.4.3) и (3.4.4) получается:(t )νK0l (t0 , s0 )ZtβKl (τ ) exp [−r(τ − t0 )] dτ +=t0(t )+νK0l(∆)Nt, s(t)(3.4.5)103Последнее условие означает динамическую устойчивость решения относительно коалиций-участников Kl .В каждый момент τ ∈ [t0 , ∞) происходит только перераспределение общихзатрат, поэтому их сумма не меняется, т.е.XβKl (τ ) =Kl ⊂∆X Xhi(∆)Nτ, eis(∆)N(τ )Kl ⊂∆ i∈KlТеорема 3.4.1.
Функция процедуры распределения дележа βKl (t) имеет вид:X (k − 1)!(m − k)! h(t)K̆(∆)NWt, s(t) −βKl (t) = rm!K̆⊆N̆i(t)K̆\Kl(∆)N−Wt, s(t) −!X (∆)N −AKleis(∆)N (t) − δs(∆)N (t)(3.4.6)i∈NДоказательство. Компоненты вектора β∆ (t) = {βKl (t)}t∈[t0 ,∞) находятся изформулы:(t)βKl (t) = rνKl dν (t) t, s(∆)N (t)t, s(∆)N (t) − Kldt(3.4.7)(t)РассмотримdνK (t,s(∆)N (t))l.dt(t)(t)dνKl t, s(∆)N (t)∂νKl=dtОчевидно, что:(t)t, s(∆)N (t)∂νKl t, s(∆)N (t) (∆)N+ṡ(t)∂t∂tУчитывая формулу (3.4.2), (3.4.8) можно представить в виде:(t)X (k − 1)!(m − k)! nh (t)K̆ dνKl t, s(∆)N (t)(∆)N=Wtt, s(t) −dtm!K̆⊆N̆i h(t)K̆\Kl(∆)N(t)K̆(∆)N− Wtt, s(t) + Wst, s(t) −!)i X(∆)N−Ws(t)K̆\Kl t, s(∆)N (t)eis(∆)N (t) − δs(∆)N (t)i∈N(3.4.8)(3.4.9)104(t)K̆(t)K̆t, s(∆)N (t) = 0 а Wst, s(∆)N (t) = AK̆ , получаем:(t)X (k − 1)!(m − k)! dνKl t, s(∆)N (t)=AK̆ −(3.4.10)dtm!K̆⊆∆!i X(∆)Ns(∆)N (t) − δs(∆)N (t) =− AK̆\KleiИз того, что Wti∈N= AKlX(∆)Nei!s(∆)N (t) − δs(∆)N (t)i∈NТаким образом, функция βKl (t), l ∈ M имеет следующий вид:X (k − 1)!(m − k)! h(t)K̆(∆)NβKl (t) = rWt, s(t) −m!K̆⊆N̆i(t)K̆\Kl(∆)N−Wt, s(t) −!X (∆)N −AKleis(∆)N (t) − δs(∆)N (t) ,i∈Nчто и требовалось доказать.3.5Распределение выигрыша внутри коалиции KlВыигрыш, полученный в игре Γ∆ (s0 , t0 ) коалицией Kl , распределяется междуее участниками.
Вычислим теперь долю каждого предприятия i ∈ Kl . Предполагается, что внутри коалиции Kl предприятия действуют кооперативно, используя в качестве дележа динамический вектор Шепли. Но необходимо учитывать, что выигрыш коалиции Kl , равный компоненте вектора Шепли(t )νK0l t, s(∆)N (t) , в общем случае не совпадает с тем выигрышем, который коалиция получила бы, играя самостоятельно. Поэтому будем полагать, что участники коалиции Kl делят совместный выигрыш пропорционально вектору Шепли.Это означает, что доли предприятий от общего выигрыша соотносятся так же,как компоненты вектора Шепли, полученного при самостоятельной игре коалиции.
Вычисление выигрыша каждого предприятия будем проводить следующимобразом.105Определим коалиционную игру ΓKl (s0 , t0 ), в которой участвуют коалицияKl и коалиция N̆ \ Kl . Найдем характеристическую функцию в игре ΓKl (s0 , t0 )для коалиции Kl и всех ее подкоалиций L ⊂ Kl , предполагая, что коалиция Klи все ее под коалиции играют самостоятельно.
При этом предполагается, чтопредприятия, входящие в коалицию N̆ \ Kl , используют в игре Γ∆ (s0 , t0 ) своикооперативные стратегии e(∆)N s(∆)N (t) , вычисляемые по формуле (3.3.17), апредприятия, входящие в Kl , но не входящие в L − свои равновесные по Нэшустратегии в игре ΓKl (s0 , t0 ), которые будут вычислены ниже. Характеристическую функцию в игре ΓKl (s0 , t0 ) обозначим через V Kl (t0 ) (L, s(t), t), L ⊆ Kl .Вычислив характеристическую функцию, вычислим компоненты вектора Шеno(t0 )Kl(∆)Nпли для предприятий i ∈ Kl , ν̄it, s(t). Зная значение компоi∈Kl(t )Kненты ν̄i 0 l t, s(∆)N (t) , определим долю каждого предприятия i от общеговыигрыша V Kl (t0 ) Kl , s(∆)N (t), t , ωi :(t0 )Kl(∆)Nν̄t,s(t)ωi t, s(∆)N (t) = Ki(t )V l 0 Kl , s(∆)N (t), tТогда выигрыш предприятия в соответствии с долей по вектору Шеплибудет равен:(t )Kνi 0 l(∆)Nt, s(t0 )(∆)N(∆)N(t) = ωi t, s(t) νKl t, s(t) =(t )Kν̄i 0 l t, s(∆)N (t)(t0 )(∆)N νKt, s(t)lV Kl (t0 ) Kl , s(∆)N (t), tЧтобы найти данные компоненты, необходимо определить процедуру распределения дележа.
Все перечисленные функции полагаются дифференцируемыми по t и s(t).1063.6Вычисление характеристической функции в игреΓKl (s0, t0)Характеристическую функцию V Kl (t0 ) (L, s(t), t) в игре ΓKl (s0 , t0 ) будем вычислять в 2 этапа. Вначале построим равновесие по Нэшу в игре; затем найдемзначение характеристической функции для любой подкоалиции L ⊆ Kl .Для построения равновесия по Нэшу в игре ΓKl (s0 , t0 ) требуется решитьследующую систему задач минимизации:W̄ (t)i (t, s(t)) = min {Πi (s(t), t, e)} =ei∞Zhi (s(τ ), e (s(τ ))) exp [−r(τ − t)] dt ,= minei (3.6.1)ti ∈ Kl ,где W̄ (t)i (t, s(t)) – функция Беллмана, определяющая минимальные издержкипредприятия i ∈ Kl в подыгре, начинающейся в момент t ∈ [t0 , ∞), а e ={e1 , e2 , ..., en }– ситуация в игре. Динамика игры задается уравнением (3.1.1).Теорема 3.6.1.
Значение характеристической функции V Kl (t0 ) (i, s(t), t) в игреΓKl (s0 , t0 ) в ситуации равновесия по Нэшу равно:V Kl (t0 ) (i, s(t), t) = W̄ (t0 )i (t, s(t)) =Xπin − kl X πj=rs(t) +ēi −−r (r + δ)γr+δj∈Ni∈N1 X πj1 πi −+exp [−r(t − t0 )]γr + δ 2γ r + δ(3.6.2)j∈Kli ∈ KlДоказательство. Функции W̄ (t)i (t, s(t)), i ∈ Kl должны удовлетворять следу-107ющему уравнению Гамильтона-Якоби-Беллмана:(t)irW̄ (t)i (t, s(t)) − W̄t (t, s(t)) =nγ= min(ēi − ei (s(t)))2 + πi s(t)+ei2X(t)i+W̄s (t, s(t))ej (s(t)) +(3.6.3)j∈KlX (∆)Nej(s(t)) − δs(t)+j∈N \Kli ∈ KlДоказательство было приведено в работах Козловской Н.В.
[6], [7]. Даннаямодель отличается лишь тем, что предприятия, входящие в коалицию N̆ \ Kl ,используют свои оптимальные коалиционные стратегии e(∆)N s(∆)N (t) в игреΓ∆ (s0 , t0 )Функцию Беллмана W̄ (t)i (t, s(t)) представим в виде:KllW̄ (t)i (t, s(t)) = AKi s(t) + Bi ,(3.6.4)Kllгде коэффициенты AKi и Bi вычисляются по формулам:lAKi =πir+δBiKllXAKn − kl11i lAN − AKl + AK=ēj −irγγ2γj∈NВыбросы предприятия i ∈ Kl в равновесии по Нэшу в игре ΓKl (s0 , t0 ) задаются формулой:(Kl )ei(s(t)) = ēi −1 πi,γr+δi ∈ Kl(3.6.5)Значение характеристической функции V (t0 )Kl (i, s(t), t), i ∈ Kl будет сле-108дующим:V Kl (t0 ) (i, s(t), t) = W̄ (t0 )Kl (t, s(t)) =Xπin − kl X πjrs(t) +ēj −=−r (r + δ)γr+δj∈Nj∈N1 X πj1 πi −+exp [−r(t − t0 )] ,γr + δ 2γ r + δj∈Klчто и требовалось доказать.Чтобы найти характеристическую функцию V (t0 )Kl (L, s(t), t) для коалицииL ⊆ Kl , требуется решить следующую задачу минимизации:()XW̄ (t)L (t, s(t)) = minΠi (s(t), t, e) =eL= mineLX Z∞i∈L t(3.6.6)i∈Lhi (s(τ ), e (s(τ ))) exp [−r(τ − t)] dt ,L ⊂ Kl ,где W̄ (t)L (t, s(t)) – функция Беллмана, определяющая минимальные издержкикоалиции L в подыгре, начинающейся в момент t ∈ [t0 , ∞).
Динамика системы,как и ранее, определяется уравнением (3.1.1).Теорема 3.6.2. Характеристическая функция V (t0 )Kl (L, s(t), t) игры ΓKl (s0 , t0 )для произвольной коалиции L ⊆ Kl равна:V Kl (t0 ) (L, s(t), t) = W̄ (t0 )L (t, s(t)) =πiXn − kl X πji∈Lrs(t) +=ēj −−r (r + δ)γr+δj∈Nj∈NX1 X πjl−−πi exp [−r(t − t0 )]γr + δ 2γ(r + δ)Pj∈Kl \Li∈L(3.6.7)109Доказательство. Функция W̄ (t)L (t, s(t)) должна удовлетворять уравнениюГамильтона-Якоби-Беллмана:(t)LrW̄ (t)L (t, s(t)) − W̄t (t, s(t)) =(X γ2= min(ēi − ei (s(t))) + πi s(t) +eL2i∈LXX (K )+W̄s(t)L (t, s(t)) ei (s(t)) +ej l (s(t)) +i∈L(3.6.8)j∈Kl \LX (∆)N+ej(s(t)) − δs(t)j∈N \KlL ⊂ KlДоказательство данной теоремы аналогично доказательству предыдущей.Функцию Беллмана W̄ (t)L (t, s(t)) представляем в виде:KllW̄ (t)L (t, s(t)) = AKL s(t) + BL ,(3.6.9)Kllгде AKL и BL – коэффициенты, вычисляемые по формулам:Pπii∈LKlAL =r+δKlXAn − kll1 X Kl lBLKl = L ēi −AN − AK−Ajrγ2γ Lγi∈N(3.6.10)j∈Kl \LОптимальные выбросы в коалиции L задаются формулой:Pπi1 i∈L(Kl )Lei(s(t)) = ēi −, i ∈ L ⊂ Klγr+δЗначение характеристической функции V (t0 )Kl (L, s(t), t), L ⊂ Kl получа-110ется равнымV Kl (t0 ) (L, s(t), t) = W̄ (t0 )L (t, s(t)) =PπiXn − kl X πji∈L=ēi −rs(t) +−r (r + δ)γr+δi∈Nj∈N1 X πjl X πi −exp [−r(t − t0 )] ,−γr + δ 2γr+δj∈Kl \Li∈Lчто и требовалось доказать.Таким образом, характеристическая функция V Kl (t0 ) (K, s(t), t) имеет следующий вид:0K=∅ W̄ (t0 )Kl (t, s(t))K = KlKl (t0 )V(K, s(t), t) =W̄ (t0 )i (t, s(t)) K = i ∈ Kl W̄ (t0 )L (t, s(t)) K = L ⊂ Kl(3.6.11), где функции W̄ (t0 )Kl (t, s(t)), W̄ (t0 )i (t, s(t)) и W̄ (t0 )L (t, s(t)) определяются формулами (3.6.2) и (3.6.7) Необходимо определить, при каких условиях функция будет субаддитивной, т.е.