Диссертация (1145439), страница 40
Текст из файла (страница 40)
Предположим, для определенности, чтоn1 < n2 . Таким образом, в данной модели на временном промежутке [0, n1 ] игроки вступают в кооперацию, и необходимо определить их кооперативные стратегии. После моментаn1 до момента n2 второй агент продолжает процесс эксплуатации индивидуально.
Следовательно, выигрыши игроков имеют следующий вид:J1 =n1Xδ1t g1 (uc1t , uc2t ) , J2 =t=0n1Xt=0δ2t g2 (uc1t , uc2t ) +n2Xδ2t g2 (ua2t ) ,t=n1 +1где ucit ≥ 0 – кооперативные стратегии (интенсивность эксплуатации) агента i в моментвремени t, i = 1, 2, ua2t ≥ 0 – стратегия второго агента, эксплуатирующего ресурс индивидуально, в момент времени t.Для определения кооперативного поведения агентов эколого-экономической системы напромежутке времени [0, n1 ] применяется арбитражная схема Нэша, т.е.
решается следующая задача:(V1c (x, δ1 )[0, n1 ] − V1N (x, δ1 )[0, n1 ]) · (V2c (x, δ2 )[0, n1 ]+V2ac (xcn1 , δ2 )[n1 , n2 ] −,−V2N (x, δ2 )[0, n1 ]−V2aN (xN n1 , δ2 )[n1 , n2 ]) −→ cmaxcu1t ,u2t ≥0где ViN (x, δi )[0, n1 ] – выигрыши в равновесии по Нэшу, определенные на промежутке [0, n1 ](задача (3.1), (3.2) с n = n1 ), V2ac (xcn1 , δ2 )[n1 , n2 ] – выигрыш второго агента, когда он играетиндивидуально после n1 периодов кооперативного поведения участников, V2aN (xN n1 , δ2 )[n1 , n2 ]– выигрыш второго агента, когда он играет индивидуально после n1 периодов некооперативного поведения участников.В разделе 4.3.2 данная схема определения кооперативного поведения агентов экологоэкономической системы применена для модели «рыбных войн» с различными (фиксированными) горизонтами планирования.
Получены в явном виде кооперативные выигрыши истратегии игроков, необходимые и достаточные условия оптимальности, и доказана единственность построенного решения.Модель со случайными временами участия в процессе эксплуатации является наиболееприближенной к реальности, так как внешние случайные процессы могут вызвать расторжение кооперативного договора. Агент не может в данном случае предсказать возможностьвыхода партнера из кооперации, и необходимо учитывать данное обстоятельство при определении кооперативных выигрышей.Пусть, как и ранее, игроки (страны или фирмы) различаются горизонтами планирования, а именно первый агент эксплуатирует возобновляемый ресурс на протяжении n1239моментов времени, а второй – на протяжении n2 моментов времени. Динамика развитиявозобновляемого ресурса имеет вид (3.1).
Предполагается, что горизонты планирования n1и n2 – это независимые дискретные случайные величины с заданными распределениями.Тогда выигрыши агентов представляются в следующем виде:H1 = En1nXH2 = Eδ1t g1 (u1t , u2t )I{n1 ≤n2 } +n2³Xt=1t=1n2nXn1³Xδ2t g2 (u1t , u2t )I{n2 ≤n1 } +t=1δ1t g1 (u1t , u2t ) +δ2t g2 (u1t , u2t ) +n1X´oδ1t g1 (ua1t ) I{n1 >n2 } ,t=n2 +1n2X´oδ2t g2 (ua2t ) I{n2 >n1 } ,t=n1 +1t=1где uait – стратегия i-го игрока, когда его оппонент покидает игру, в момент времени t,i = 1, 2.Для определения кооперативного поведения используется арбитражная схема Нэша, гдев качестве точки статус-кво выступают выигрыши при некооперативном поведении.В разделе 4.3.3 данная схема определения кооперативного поведения агентов экологоэкономической системы применена для модели «рыбных войн» с различными (случайными)горизонтами планирования.
Получены в явном виде кооперативные выигрыши и стратегииигроков, необходимые и достаточные условия оптимальности, и доказана единственностьпостроенного решения.4.3.1. Асимметричная модель «рыбных войн» и равновесие по НэшуСначала приведем результат из предыдущего раздела с горизонтом планирования [0, n],который понадобится в дальнейшем исследовании.Пусть два агента эколого-экономической системы (страны или фирмы) эксплуатируютвозобновляемый ресурс на протяжении конечного ([0, n]) горизонта планирования.
Динамика развития ресурса с учетом эксплуатации имеет видxt+1 = (εxt − u1t − u2t )α , x0 = x ,(3.3)где xt ≥ 0 – размер эксплуатируемого ресурса в момент времени t, ε ∈ (0, 1) – коэффициент естественной выживаемости, α ∈ (0, 1) – коэффициент естественного роста, uit ≥ 0 –стратегия (интенсивность эксплуатации) игрока i в момент времени t, i = 1, 2.Предполагается логарифмический вид функций выигрышей игроков и наличие различных коэффициентов дисконтирования. Выигрыши агентов имеют следующий вид:Ji =nXδit ln(uit ) ,t=0где 0 < δi < 1 – коэффициент дисконтирования игрока i, i = 1, 2.(3.4)240Теорема 3.1. Равновесные по Нэшу стратегии в задаче (3.3), (3.4) имеют видεa2t−1Pj=0uN1t =tPj=0aj1tPj=0aj1aj2εa1t−1Pj=0x , uN2t =tP−1j=0aj1tPj=0aj2aj2x,−1где ai = αδi , i = 1, 2 , t = 1, . .
. , n.Выигрыши игроков –ViN (x, δi )=nXj(ai ) ln x +j=0hAlj = ln (εjPk=0ak1jPk=1jPk=0nX(δi )n−j Aij − (δi )n ln k ,(3.5)j=1akpjP)k=0aklP kijXak k=1 l(al ), l, p = 1, 2, l 6= p .ak2 − 1jk=1Размер популяции после n периодов эксплуатации имеет видl−1PnPnxN n = xα0 (εa1 a2 )j=1αjn ³Yl=1j=0lPj=0aj1aj1l−1Paj2 ´ n−l+1αj=0lPj=0aj2.(3.6)−14.3.2. Модель с фиксированными временами участия в процессе эксплуатацииРассмотрим процесс эксплуатации ресурса с динамикой (3.3) с различными горизонтами планирования. Пусть первый игрок эксплуатирует ресурс на протяжении n1 моментоввремени, а второй – на протяжении n2 моментов времени. Предположим, для определенности, что n1 < n2 .
Таким образом, в данной модели на временном промежутке [0, n1 ] игрокивступают в кооперацию, и необходимо определить их кооперативные стратегии. После момента n1 до момента n2 второй агент продолжает процесс эксплуатации индивидуально.Следовательно, выигрыши игроков имеют следующий вид:J1 =n1Xt=0δ1t ln(uc1t ) , J2 =n1Xt=0δ2t ln(uc2t ) +n2Xδ2t ln(ua2t ) ,(3.7)t=n1 +1где ucit ≥ 0 – кооперативная стратегия агента i в момент времени t, i = 1, 2, ua2t ≥ 0 –стратегия второго игрока, эксплуатирующего ресурс индивидуально, в момент времени t.Для построения кооперативных стратегий и выигрышей агентов эколого-экономической системы применяется арбитражная схема Нэша для всего периода продолжения игры.241Таким образом, необходимо решить следующую задачу:(V1c (x, δ1 )[0, n1 ] − V1N (x, δ1 )[0, n1 ]) ··(V2c (x, δ2 )[0, n1 ]+V2ac (xcn1 , δ2 )[n1 , n2 ] −−V2N (x, δ2 )[0, n1 ]−V2aN (xN n1 , δ2 )[n1 , n2 ]) =n1n1n2XXX=(δ1t ln(uc1t ) − V1N (x, δ1 )[0, n1 ])(δ2t ln(uc2t ) +δ2t ln(ua2t ) −t=0t=0t=n1 +1NaNN n1−V2 (x, δ2 )[0, n1 ]−V2 (x , δ2 )[n1 , n2 ]) →max ,uc1t ,uc2t ≥0(3.8)где ViN (x, δi )[0, n1 ] – выигрыши в равновесии по Нэшу, определенные в (3.5) (где n = n1 ),V2ac (xcn1 , δ2 )[n1 , n2 ] – выигрыш второго агента, когда он играет индивидуально после n1периодов кооперативного поведения участников, V2aN (xN n1 , δ2 )[n1 , n2 ] – выигрыш второгоагента, когда он играет индивидуально после n1 периодов некооперативного поведенияучастников.Теорема 3.2.
Кооперативные выигрыши в задаче (3.3), (3.7) имеют видcccccH1n(γ11, . . . , γ1n, γ21, . . . , γ2n; x) =111=n1Xaj1ln x+j=0=n1Xδ1n1 −jcln(γ1j)+j=11 − an1 1 +1ln x +1 − a1n1Xn1Xδ1n1 −jj=1cδ1n1 −j ln(γ1j)+j=1nXjXccai1 ln(ε−γ1j−γ2j)+δ1n1 ln k =i=1δ1n1 −jj=1a1 (1 − aj1 )ln(ε − γ1j − γ2j ) + δ1n1 ln k ,1 − a1(3.9)cccccH2n(γ11, .
. . , γ1n, γ21, . . . , γ2n; x) =111=n2Xaj2ln x +j=0n1Xδ1n1 −jcln(γ2j+j=1n1Xj=1nX+δ2n1 −jn+jXccai2 ln(ε − γ1j− γ2j)+i=1δ2n2 −j B j+δ2n1nXj=1=an2 2 +11−ln x +1 − a2n1Xj=1cδ2n1 −j ln(γ2j)+n1X+nXj=1где n = n2 − n1 .j=0a2n+j )a2 (1 −1 − a2ln(ε − γ1j − γ2j ) +δ2n2 −j B j + δ2n11 − an+12ln(1 − k) ,1 − a2δ2n1 −jj=1aj2 ln(1 − k) =(3.10)242Кооперативные стратегии игроков связаны какcεγ11cγ1t==j=t−1aj2=tn+tPPctaj2 +γ11(aj2 aj1 −(at−1+a)aj2 )11j=0j=t−1j=0j=0n1 −1n2 +1cεγ11 (a2− a2 )(1 − a1 )n2+1n1−1n2+1n1−11εa1 (1−a1 )(1−a2 )+γ1 ((a2 −a2 )(1−an1 1+1 ) − (an1 1−1 +an1 1 )(1−a1 )(1−an2 2+1 ))cε − γ1tc=γ2tn+tPtPj=0aj1=aj2j=0εat−11n+tPn+tPn+tPcε(1 − a1 )(1 − a2 ) − γ1t(1 − a2 )(1 − an1 1 +1 ), t = 1, . .
. , n .(1 − a1 )(1 − a2n2 +1 ), (3.11)(3.12)cопределяется из решения одного изСтратегия первого игрока на последнем шаге – γ11уравнений условий первого порядка, напримерccccan−1(ε − γ11(1 + a1 ))(H1n− V1 ) − a2n−1 (1 + a2 )γ11(H2n− V2 ) = 0 .1Доказательство. Рассмотрим временной промежуток [n1 , n2 ], где второй игрок эксплуатирует ресурс индивидуально. Начнем с одношаговой игры и предположим, что в конечныймомент игрок получает весь оставшийся ресурс. Еще раз заметим, что это не означает,что ресурс весь исчерпывается. В данном предположении игрок получает компенсацию(выраженную в денежных единицах, если домножить на некоторую константу) за неиспользованный им ресурс.Пусть начальный размер популяции x. Как и ранее ищем стратегию второго игрока влинейном виде ua21 = γ21 x.
Тогда выигрыш второго игрока в одношаговой игре имеет видH21 (γ21 ) = ln(γ21 x) + δ2 ln(εx − γ21 x)α = (1 + a2 ) ln x + ln(γ21 ) + a2 ln(ε − γ21 ) .Максимизируя, из условий первого порядка получим стратегию γ21 =в видеεи выигрыш1 + a2ε ´+ a2 ln a2 .1 + a2Следовательно, выигрыш второго игрока в двухшаговой игре примет вид³H21 (γ21 ) = (1 + a2 ) ln x + (1 + a2 ) lnH22 (γ21 , γ22 ) = ln(γ22 x) + δ2 H21 (γ21 ) = (1 + a2 + a22 ) ln x + ln(γ22 ) +³³ ε ´´+a2 (1 + a2 ) ln(ε − γ22 ) + δ2 (1 + a2 ) ln+ a2 ln a2 .1 + a2εи выигрыш второгоАналогично, из условий первого порядка получим γ22 =1 + a2 + a22игрока в виде³´εH22 (γ21 , γ22 ) = (1 + a2 + a22 ) ln x + (1 + a2 + a22 ) ln+1 + a2 + a22³³ ε ´´+(a2 + a22 ) ln(a2 + a22 ) + δ2 (1 + a2 ) ln+ a2 ln a2 .1 + a2243Продолжая процесс n = n2 − n1 шагов, получим, что стратегия второго игрока имеетεвид γ2n = P, а выигрыш –nja2j=0V2ac (xcn1 , δ2 )[n1 , n2 ] = H2n (γ21 , .