Диссертация (1149783), страница 12
Текст из файла (страница 12)
N̆ = K1 ∪ K2 ∪ ... ∪ Km ;K̆ ⊆ N̆ – любая коалиция, образованная коалициями из разбиения ∆, т.е.K̆ = Kl1 ∪ Kl2 ∪ ... ∪ Klk , где Kl1 , Kl2 , ..., Klk ⊂ ∆;(t0 )∆(t0 )∆K̆, s(t), t – характеристическая функция игры Γ∆ (s0 , t0 ).V=VИздержки каждой коалиции Kl ⊂ ∆ вычисляется как сумма издержек ееучастников:ΠKl (s0 , t0 , e) =XΠi (s0 , t0 , e) =(3.1.7)i∈Kl=XZi∈Kl∞hi (s(t), e (s(t))) exp [−r(t − t0 )] dt,t0где hi (s(t), e (s(t))) = [(Ci (ei (s(t))) + Di (s(t)))] – мгновенные издержки предприятия i ∈ Kl в момент t ∈ [t0 , ∞).3.2Кооперация между коалициями (игра Γ∆ (s0, t0))Коалиции Kl могут кооперироваться между собой, чтобы уменьшить суммарные издержки. Рассмотрим коалицию K̆ = Kl1 ∪Kl2 ∪...∪Klk , где Kl1 , Kl2 , ..., Klk ⊂∆, а l1 , l2 , ..., lk ∈ M . Издержки коалиции K̆ рассчитываются как сумма издер-88жек ее участников, т.е.
коалиций Kl1 , Kl2 , ..., Klk :ΠK̆ (s0 , t0 , e) =kXΠKlξ (s0 , t0 , e) =(3.2.1)ξ=1=kX∞XZξ=1hi (s(t), e (s(t))) exp [−r(t − t0 )] dti∈Klξ t0Учитывая дизъюнктность коалиций Klξ можно упростить выражение (3.2.1):XZ ∞ΠK̆ (s0 , t0 , e) =hi (s(t), e (s(t))) exp [−r(t − t0 )] dti∈K̆t0Для построения коалиционного решения в игре Γ∆ (s0 , t0 ) требуется найти характеристическую функцию V (t0 )∆ (K, s(t), t), и процедуру распределениядележа. В данной игре между игроками распределяются издержки.3.3Характеристическая функция в игре Γ∆(s0, t0)Поскольку участниками игры Γ∆ (s0 , t0 ) являются не отдельные предприятия,а коалиции, то при построении характеристической функции V (t0 )∆ (K, s(t), t)требуется рассматривать не все подмножества множества N , а только подмножества {Kl } ⊂ ∆ и их объединения.
Будем полагать, что характеристическаяфункция V (t0 )∆ (K, s(t), t) непрерывно дифференцируема по t и s(t).Характеристическую функцию будем искать в 3 этапа: Вначале построим равновесие по Нэшу в игре Γ∆ (s0 , t0 ); затем вычислим характеристическуюфункцию для максимальной коалиции N̆ ; затем вычислим характеристическуюфункцию для произвольного объединения коалиций K̆.Чтобы найти равновесие по Нэшу между коалициями {Kl }l∈M в игре89Γ∆ (s0 , t0 ), требуется решить следующую систему:()XW (t)Kl (t, s(t)) = minΠi (s(t), t, e) =eK lmineK l X Z∞i∈Kl t(3.3.1)i∈Klhi (s(τ ), e (s(τ ))) exp [−r(τ − t)] dt ,Kl ⊂ ∆,где hi (s(τ ), e (s(τ ))) = [(Ci (ei (s(τ ))) + Di (s(τ )))] – издержки предприятия i ∈Kl в момент τ ∈ [t, ∞), W (t)Kl (t, s(t)) – функция Беллмана, определяющаяминимальные издержки коалиции Kl в подыгре, начинающейся в момент t ∈[t0 , ∞).
Динамика системы определяется формулой (3.1.1).Нахождение равновесия по Нэшу в коалиционной игре экологического регулирования было описано в работах [6], [7], [31]. Сформулируем основные результаты в виде теоремы.Теорема 3.3.1. Характеристическая функция V (t0 )∆ (Kl , s(t), t) игры Γ∆ (s0 , t0 )в ситуации равновесия по Нэшу имеет вид:V ∆(t0 ) (Kl , s(t), t) = W (t0 )Kl (t, s(t)) =PπiXi∈Klrs(t) +ēi −=r (r + δ)i∈NXX1kξ−πj −γ (r + δ)j∈KξKξ ⊂∆\Kl!Xkl−πi exp [−r(t − t0 )]2γ(r + δ)(3.3.2)i∈KlФункция V (t0 )∆ (Kl , s(t), t) записывается также в виде:V (t0 )∆ (Kl , s(t), t) = AKl s(t) + BKl exp [−r(t − t0 )] ,где AKl и BKl – коэффициенты, вычисляемые по формулам:PπiAKl = i∈Klr+δ(3.3.3)(3.3.4)90BKl1AKl Xēi −=rγi∈NXkj AKj −Kj ∈∆\KlklAK 2γ lОптимальные выбросы для участников коалиции Kl ⊂ ∆ в равновесии поНэшу определяются формулой:(∆)Kei lP1 i∈Kl πi, i ∈ Kl(s(t)) = ēi −γ r+δ(3.3.5)Коалиционная траектория принимает следующий вид:"X1s(∆){Kl } (t) = s0 −ēi −δi∈N!P1 Xi∈Kξ πi exp [−δ(t − t0 )] +−kξγr+δKξ ⊂∆!PXX11i∈Kξ πi+ ēi −kξδγr+δi∈N(3.3.6)Kξ ⊂∆Вычислим теперь значение характеристической функции V(t0 )∆N̆ , s(t), tдля максимальной коалиции N̆ в игре Γ∆ (s0 , t0 )Издержки максимальной коалиции N̆ представляет собой сумму издержекпредприятий из всего множества N .
Следовательно, требуется решить следующую задачу минимизации:W (t)N (t, s(t)) = mineN= mineKlX Z∞i∈N t(X)Πi (s0 , t0 , e)=(3.3.7)i∈Nhi (s(τ ), e (s(τ ))) exp [−r(τ − t)] dt ,где hi (s(τ ), e (s(τ ))) = [(Ci (ei (s(τ ))) + Di (s(τ )))] – затраты предприятия i ∈ Nв момент τ ∈ [t, ∞), W (t)N (t, s(t)) – функция Беллмана, определяющая минимальные издержки коалиции N̆ в подыгре, начинающейся в момент t ∈ [t0 , ∞).Динамика системы определяется уравнением (3.1.1). Сформулируем результаты в виде теоремы.91Теорема 3.3.2. Характеристическая функция V∆(t0 )N̆ , s(t), t в игреΓ∆ (s0 , t0 ) для максимальной коалиции N̆ равна:VN̆ , s(t), t = W (t0 )N (t, s(t)) =PπiXi∈N=rs(t) +ēi −r (r + δ)i∈N!Xn−πi exp [−r(t − t0 )]2γ(r + δ)∆(t0 )(3.3.8)i∈NДоказательство. Решение задачи (3.3.7) должно удовлетворять уравнениюГамильтона-Якоби-Беллмана:(t)NrW (t)N (t, s(t)) − Wt(t, s(t)) =(X= minhi (s(τ ), e (s(τ ))) +eN(3.3.9)i∈N!)+ Ws(t)N (t, s(t))Xei (s(t)) − δs(t)i∈NРаскрывая формулу для мгновенного выигрыша предприятия и его составляющих, уравнение (3.3.9) можно переписать в виде:(t)NrW (t)N (t, s(t)) − Wt(t, s(t)) =(X γ2(ēi − ei (s(t))) + πi s(t) += mineN2i∈N!)Xei (s(t)) − δs(t)+ Ws(t)N (t, s(t))(3.3.10)i∈NПродифференцируем правую часть уравнения (3.3.10) по ei , i ∈ N и приравняем полученные частные производные нулю.
Получаем:−γ (ēi − ei (s(t))) + Ws(t)N (t, s(t)) = 0,i∈N(3.3.11)Из (3.3.11) получается формула для оптимальных выбросов:1ei (s(t)) = ēi − Ws(t)N (t, s(t)) ,γi∈N(3.3.12)92Подставляя (3.3.12) в (3.3.10), получаем следующее равенство:(t)NrW (t)N (t, s(t)) − Wt(t, s(t)) =2 Xn (t)N=Ws (t, s(t)) +(πi s(t)) +2γ(3.3.13)i∈N+Ws(t)N(t, s(t))Xēi −i∈Nn (t)N− Ws (t, s(t)) − δs(t)γФункцию Беллмана можно представить в виде:W (t)N (t, s(t)) = AN s(t) + BN ,(3.3.14)где AN и BN – коэффициенты. Из (3.3.14) видно, чтоWs(t)N (t, s(t)) = AN(3.3.15)Подставляя (3.3.15) и (3.3.14) в (3.3.13), находим AN и BN :Pπii∈NAN =r+δ!XnANēi − ANBN =r2γ(3.3.16)i∈NОптимальные выбросы предприятий в коалиции N̆ задаются формулой:Pπi1(∆)Ni∈Nei(s(t)) = ēi −, i∈N(3.3.17)γ r+δНеотрицательность значений выбросов вновь вытекает из условияPj∈N πj,γēi ≥r+δКооперативная траектория принимает следующий вид:"1 Xs(∆){N } (t) = s0 −ēi −δi∈N#!Xn−πiexp [−δ(t − t0 )] +γ(r + δ)i∈N"#XX1n+ēi −πiδγ(r + δ)i∈Ni∈N(3.3.18)93Легко видеть, что:W (t0 )N (t, s(t)) = W (t)N (t, s(t)) exp [−r(t − t0 )]Характеристическая функция для максимальной коалиции принимает вид:VN̆ , s(t), t = W (t0 )N (t, s(t)) =PπiXi∈Nrs(t) +ēi −=r (r + δ)i∈N!Xn−πi exp [−r(t − t0 )] ,2γ(r + δ)∆(t0 )i∈Nчто и требовалось доказать.Вычислим теперь характеристическую функцию для произвольной коалиции в игре Γ∆ (s0 , t0 ).
Пусть K̆ = Kl1 ∪ Kl2 ∪ ... ∪ Klk – объединение некоторогоподмножества коалиций из разбиения ∆, Klξ ⊂ ∆, ξ = 1, ..., k. Чтобы найти ха∆рактеристическую функцию VK̆, s(t), t для коалиции K̆, требуется решитьследующую задачу минимизации:(t)K̆Πi (s(t), t, e) =W(t, s(t)) = mineK̆ i∈K̆X Z∞hi (s(τ ), e (s(τ ))) exp [−r(τ − t)] dt ,= mineK̆ X(3.3.19)i∈K̆ tK̆ ⊆ N̆ ,где W (t)K̆ (t, s(t)) – функция Беллмана, определяющая минимальные затратыкоалиции K̆ в подыгре, начинающейся в момент t ∈ [t0 , ∞).
Считаем, что коалиции Kξ ⊂ N̆ \ K̆ используют свои стратегии равновесия по Нэшу в игрекоалиций, которые определяются формулой (3.3.5). Динамика системы определяется уравнением (3.1.1).94Теорема 3.3.3. Характеристическая функция V∆(t0 )K̆, s(t), t в игреΓ∆ (s0 , t0 ) для произвольной коалиции K̆ ⊆ N̆ равна:∆(t0 )VK̆, s(t), t = W (t0 )K̆ (t, s(t)) =PπiXi∈K̆=ēi −rs(t) +r (r + δ)i∈NXX1−kξπj −γ (r + δ)j∈KξKξ ⊂N̆ \K̆Xk̆πi exp [−r(t − t0 )]−2γ(r + δ)(3.3.20)i∈K̆Доказательство. Функция W (t)K̆ (t, s(t)) удовлетворяет уравнению ГамильтонаЯкоби-Беллмана:(t)K̆(t, s(t)) =rW (t)K̆ (t, s(t)) − WtXhi (s(τ ), e (s(τ ))) +mineK̆ i∈K̆!)XWs(t)K̆ (t, s(t))ei (s(t)) − δs(t)(3.3.21)i∈NK̆ ⊆ N̆Множество индексов коалиций, не входящих в K̆, обозначим за M \ k̆.Выражение (3.3.21) можно переписать в виде:Техника нахождения оптимальных стратегий для задачи (3.3.19) аналогична нахождению выигрыша максимальной коалиции N̆ .Функцию Беллмана представляем в виде:W (t)K̆ (t, s(t)) = AK̆ s(t) + BK̆ ,(3.3.22)где AK̆ и BK̆ − коэффициенты, которые определяются формулами:PπiAK̆ =i∈K̆r+δ(3.3.23)95AK̆ XBK̆ =ēi +ri∈K̆XXKξ ⊂N̆ \K̆(∆)Kξ ei−i∈Kξk̆A 2γ K̆Оптимальные выбросы в коалиции K̆ задаются формулой:Pπi1 i∈K̆(∆)K̆, i ∈ K̆ ⊂ N̆ei(s(t)) = ēi −γ r+δ(3.3.24)Коалиционная траектория в случае коалиции K̆ принимает следующийвид:PπiX1k̆i∈K̆s(∆)K̆ (t) = s0 − −ēi −δγ r+δi∈N P πi1 X i∈Kξ −kξ exp [−δ(t − t0 )] +γr+δKξ ⊂N̆ \K̆P P πiπi1 Xk̆ i∈K̆1 X i∈Kξ + ēi −−kξδγ r+δγr+δi∈N(3.3.25)Kξ ⊂N̆ \K̆Легко видеть, что:W (t0 )K̆ (t, s(t)) = W (t)K̆ (t, s(t)) exp [−r(t − t0 )]Значение характеристической функции для коалиции K̆ принимает вид:VK̆, s(t), t = W (t0 )K̆ (t, s(t)) =PπiXi∈K̆rs(t) +ēi −r (r + δ)i∈NXX1kξπj −γ (r + δ)j∈KξKξ ⊂N̆ \K̆Xk̆πi exp [−r(t − t0 )] ,2γ(r + δ)∆(t0 )i∈K̆что и требовалось доказать.96Таким образом, характеристическая функция V ∆(t0 ) (K, s(t), t) имеет вид:0K=∅ W (t0 )Kl (t, s(t)) K = Kl ⊂ ∆∆(t0 )(3.3.26)V(K, s(t), t) =(t0 )NW(t,s(t))K=N̆ W (t0 )K̆ (t, s(t)) K = K̆ ⊂ N̆ ,где функции W (t0 )Kl (t, s(t)), W (t0 )N (t, s(t)) и W (t0 )K̆ (t, s(t)) определяются формулами (3.3.2), (3.3.8) и (3.3.20) соответственно.
Требуется определить, при каких условиях характеристическая функция будет субаддитивной.Определение 3.3.1. Будем говорить, что функция V ∆(t0 ) (K, s(t), t) является субаддитивной, если для любых коалиций K̆, L̆ ⊂ N̆ , K̆ ∩ L̆ = ∅ и в любоймомент t ∈ [t0 , ∞) выполняется следующее неравенство:V∆(t0 )∆(t0 )∆(t0 )K̆, s(t), t + VL̆, s(t), t ≥ VK̆ ∪ L̆, s(t), tВ работах Козловской Н.В. [6], [7] была доказана субаддитивность характеристической функции в игре между предприятиями.Доказательство субаддитивности характеристической функции в кооперативной игре между коалициями проводится аналогичным образом, но рассматриваются только коалиции из разбиения ∆ и их объединения.Теорема 3.3.4. Характеристическая функция (3.3.26) в игре Γ∆ (s0 , t0 ) является субаддитивной.Доказательство.
Для доказательства субаддитивности достаточно показать,что для любых K̆, L̆ ⊂ N̆ , K̆ ∩ L̆ = ∅ выполняется следующее:W (t)K̆ (t, s(t)) + W (t)L̆ (t, s(t)) ≥ W (t)K̆∪L̆ (t, s(t))Учитывая (3.3.22), получаем формулы для каждой из функций:W(t)K̆t, s (t) = AK̆ sK̆ (t) + BK̆ ,K̆(3.3.27)97Wt, s (t) = AL̆ sL̆ (t) + BL̆ ,(t)K̆∪L̆K̆∪L̆Wt, s(t) = AK̆∪L̆ sK̆∪L̆ (t) + BK̆∪L̆ ,(t)L̆L̆, где sK̆ (t), sL̆ (t) и sK̆∪L̆ (t) – траектории соответствующих коалиций. Очевидно,что:AK̆∪L̆ = AK̆ + AL̆Введем обозначения:k̆ – число предприятий в коалиции K̆ ⊂ ∆;˘l – число предприятий в коалиции L̆ ⊂ ∆;kξ – число предприятий в коалиции Kξ , где ξ ∈ M .Очевидно, что число предприятий коалиции K̆ ∪ L̆, K̆ ∩ L̆ = ∅ будет k̆ + ˘l.Рассмотрим разностьW(t)K̆∪L̆K̆∪L̆t, s(t)K̆K̆(t)L̆L̆(t) − Wt, s (t) − Wt, s (t)Раскрывая формулы для каждой из функций, и учитывая (3.3.23), получаем:W(t)K̆∪L̆K̆∪L̆(t)K̆K̆(t)L̆L̆t, s(t) − Wt, s (t) − Wt, s (t) =XA= K̆∪L̆ rsK̆∪L̆ (t) +ēi +ri∈K̆∪L̆+XXKξ ⊂N̆ \{K̆∪L̆}(∆)Kξ ei−i∈Kξ−k̆ + ˘lAK̆∪L̆ −2γXAK̆ K̆rs (t) +ēi +ri∈K̆XXi∈KξKξ ⊂N̆ \K̆(∆)Kξ ei−k̆A −2γ K̆XXX (∆)K˘lAL̆ L̆ξrs (t) +ēi +ei− AL̆ =−r2γi∈L̆Kξ ⊂N̆ \L̆i∈Kξ98AK̆∪L̆r=rsK̆∪L̆ (t) +Xēi −i∈N−1γXKξ ⊂N̆ \{K̆∪L̆} k̆ + ˘lkξ AKξ −AK̆∪L̆ −2γXAK̆ K̆1rs (t) +ēi −−rγi∈NXKξ ⊂N̆ \K̆−k̆kξ AKξ − AK̆ −2γAL̆ L̆rs (t)rXēi −i∈N1γ˘lkξ AKξ − AL̆ =2γXKξ ⊂N̆ \L̆= AK̆∪L̆ sK̆∪L̆ (t) − AK̆ sK̆ (t) − AL̆ sL̆ (t)+A1 Xk̆+ K̆ kξ AKξ + AK̆ +rγ2γKξ ⊂N̆ \K̆A1+ L̆ rγXkξ AKξKξ ⊂N̆ \L̆−AK̆∪L̆ 1rγ˘l+ AL̆ −2γ˘ k̆ + l=kξ AKξ +A2γ K̆∪L̆XKξ ⊂N̆ \{K̆∪L̆}= AK̆∪L̆ sK̆∪L̆ (t) − AK̆ sK̆ (t) − AL̆ sL̆ (t)+X k̆1+ AK̆kξ AKξ + A2K̆ +rγ2Kξ ⊂N̆ \K̆+AL̆XKξ ⊂N̆ \L̆ ˘lkξ AKξ + A2L̆ −2− AK̆∪L̆XKξ ⊂N̆ \K̆∪L̆ k̆ + ˘l 2kξ AKξ −AK̆∪L̆ 299Рассмотрим выражениеXΛK̆∪L̆ = AK̆Kξ ⊂N̆ \K̆ k̆kξ AKξ + A2K̆ +2X+AL̆kξ AKξKξ ⊂N̆ \L̆X−AK̆∪L̆kξ AKξKξ ⊂N̆ \K̆∪L̆˘l+ A2L̆ −2k̆ + ˘l 2−AK̆∪L̆2Легко видеть, чтоXXkξ AKξkξ AKξ −kξ AKξ =XKξ ⊂K̆Kξ ⊂N̆Kξ ⊂N̆ \K̆Тогда ΛK̆∪L̆ можно переписать в виде:ΛK̆∪L̆X= AK̆∪L̆kξ AKξ −Kξ ⊂K̆∪L̆X−AK̆kξ AKξ − AL̆Xkξ AKξ +Kξ ⊂L̆Kξ ⊂K̆˘lk̆k̆ + ˘l 2+ A2K̆ + A2L̆ −AK̆∪L̆ =222X= AK̆Xkξ AKξ −kξ AKξ + AL̆Kξ ⊂L̆Kξ ⊂K̆˘lk̆−(k̆ + ˘l)AK̆ AL̆ − A2K̆ − A2L̆ =22= AK̆ Xkξ AKξ − ˘lAL̆ +Kξ ⊂L̆+AL̆ XKξ ⊂K̆Отметим, чтоPKξ ⊂L̆˘lk̆kξ AKξ − k̆AK̆ − A2K̆ − A2L̆22PPPkξ = ˘l;kξ = k̆;AKξ = AL̆ ;AKξ = AK̆ .Kξ ⊂K̆Kξ ⊂L̆Kξ ⊂K̆100Учитывая неотрицательность πj , j ∈ N и kξ , ξ ∈ M , получаем, что:Xkξ AKξ − k̆AK̆ ≤ 0Kξ ⊂K̆Xkξ AKξ − ˘lAL̆ ≤ 0Kξ ⊂L̆Следовательно, ΛK̆∪L̆ ≤ 0, для любых K̆, L̆ ⊂ N̆ , K̆ ∩ L̆ = ∅.Считается, что до момента времени τ коалиции действуют кооперативно,и траектория загрязнения задается формулой (3.3.18).