Диссертация (1145439), страница 36
Текст из файла (страница 36)
При этом агенты используют различные коэффициенты дисконтирования,что можно интерпретировать как их различные предпочтения во времени.Динамика развития возобновляемого ресурса имеет видxt+1 = f (xt , u1t , u2t ) , x0 = x ,(2.1)где xt ≥ 0 – размер эксплуатируемого ресурса в момент времени t, f (xt , u1t , u2t ) – функция развития возобновляемого ресурса, uit ≥ 0 – стратегия (интенсивность эксплуатации)агента i в момент времени t, i = 1, 2.Каждый агент заинтересован в максимизации конечной или бесконечной суммы дисконтированных «мгновенных» выигрышей:Ji =nXt=0Ji =∞Xt=0δit gi (u1t , u2t ) → max ,(2.2)δit gi (u1t , u2t ) → max ,(2.3)uit ≥0uit ≥0где gi (u1t , u2t ) – прибыль игрока i в момент времени t, 0 < δi < 1 – коэффициент дисконтирования агента i, i = 1, 2.NОбозначим uN = (uN1 , u2 ) – равновесие по Нэшу в задаче с бесконечным горизонтомNNпланирования (2.1), (2.3), а соответствующие выигрыши – Vi (x, δi ) , i = 1, 2.
uNt = (u1t , u2t )– равновесие по Нэшу в задаче (2.1),(2.2), а соответствующие выигрыши в n-шаговой игре– Vin (x, δi ) , i = 1, 2.Основной проблемой в данной ситуации является то, что нет возможности определитьвыигрыши агентов эколого-экономической системы при кооперативном поведении стандартными способами. В работе [94] было предложено построение кооперативного выигрышакак взвешенной суммы индивидуальных, но данный подход не является традиционным длякооперативной теории игр, где при кооперации определяется общий выигрыш всех участников, а потом используются схемы его распределения.
Более того, используя различныеметоды для определения весовых коэффициентов, авторы показали, что существуют области параметров задачи, при которых кооперативные выигрыши игроков меньше, чемнекооперативные. Поэтому, для построения и стимулирования кооперативного поведенияв диссертационной работе предложено использование арбитражной схемы Нэша.213Для задачи с бесконечным горизонтом планирования (2.1),(2.3) в диссертационной работе предлагается определение кооперативного поведения путем построения общего коэффициента дисконтирования. Предполагаем, что агенты эколого-экономической системы используют общий коэффициент дисконтирования δ, который подлежит определению.
Такимобразом, они решают задачуJ=∞hiXδ t g1 (u1t , u2t ) + g2 (u1t , u2t ) → max ,t=0u1t ,u2t ≥0где 0 < δ < 1 – неизвестный общий коэффициент дисконтирования.Обозначим определенный таким образом кооперативный выигрыш – V (x, δ).Предположим, что кооперативный выигрыш распределяется между игроками в некоторой пропорции γV (x, δ) : (1 − γ)V (x, δ). Для существования кооперативного соглашениядолжны выполняться условия рациональности кооперацииγV (x, δ) ≥ V1 (x, δ1 ) , (1 − γ)V (x, δ) ≥ V2 (x, δ2 ) .В разделе 4.2.2 для модели «рыбных войн» определены условия существования общегокоэффициента дисконтирования в случаях, когда кооперативный выигрыш распределяется между агентами пропорционально их коэффициентам дисконтирования (γ =δ1)δ1 +δ2ивпропорции γ : (1 − γ).
Получено множество допустимых параметров δ и γ, поэтому длявыбора конкретных из них в диссертационной работе предлагается использование арбитражной схемы Нэша. Таким образом, общий коэффициент дисконтирования и пропорцияраспределения кооперативного выигрыша определяются из решения задачи(γV (x, δ) − V1 (x, δ1 ))((1 − γ)V (x, δ) − V2 (x, δ2 )) → max .0<δ,γ<1Для задачи с конечным горизонтом планирования (2.1),(2.2) разработана схема определения кооперативного поведения без построения общего коэффициента дисконтирования.Для определения кооперативных стратегий и выигрышей агентов эколого-экономическойсистемы предлагается использование арбитражной процедуры Нэша.
Исследованы две переговорные схемы: для всего периода продолжения игры и рекурсивная арбитражная процедура. В первом случае кооперативное поведение агентов определяется из решения следующей задачи:(V1nc (x, δ1 ) − V1n (x, δ1 ))(V2nc (x, δ2 ) − V2n (x, δ2 )) −→ max ,u1 ,u2 ≥0а во втором – арбитражная схема применяется на каждом шаге игры.214В разделе 4.2.3 для модели «рыбных войн» применены обе схемы построения кооперативного поведения в случае асимметричности агентов эколого-экономической системы.Показано, что при использовании арбитражной схемы для определения кооперативного поведения выигрыши игроков будут больше или равны выигрышам в равновесии по Нэшу,что является отличительной особенностью разработанных схем, и не всегда выполняетсяпри применении других подходов определения кооперативного поведения [94].4.2.1.
Асимметричная модель «рыбных войн»Пусть два агента (страны или фирмы) эксплуатируют возобновляемый ресурс на протяжении бесконечного или конечного ([0, n]) горизонта планирования. Динамика развитияресурса с учетом эксплуатации имеет видxt+1 = (εxt − u1t − u2t )α , x0 = x ,(2.4)где xt ≥ 0 – размер эксплуатируемого ресурса в момент времени t, ε ∈ (0, 1) – коэффициент естественной выживаемости, α ∈ (0, 1) – коэффициент естественного роста, uit ≥ 0 –стратегия (интенсивность эксплуатации) игрока i в момент времени t, i = 1, 2.Предполагаем логарифмический вид функций выигрышей игроков и наличие различных коэффициентов дисконтирования.В разделе 4.2.2 рассмотрен бесконечный горизонт планирования, где выигрыши игроковимеют видJi =∞Xδit ln(uit ) ,(2.5)t=0где 0 < δi < 1 – коэффициент дисконтирования игрока i, i = 1, 2.Определим равновесие по Нэшу и кооперативное равновесие, используя метод динамического программирования (см.
раздел 3.2).Теорема 2.1. Равновесие по Нэшу в задаче (2.4), (2.5) имеет видuN1 =a2 (1 − a1 )a1 (1 − a2 )εx , uNεx ,2 =a1 + a2 − a1 a2a1 + a2 − a1 a2где ai = αδi , i = 1, 2.Индивидуальные выигрыши –Vi (x, δi ) = Ai ln x + Bi =гдеBi =1ln x + Bi ,1 − ai³´i1 h 1εajailn+ ln(1 − ai ) +ln ai , i,j=1,2, i6=j.1−δi 1−aia1 +a2 −a1 a21−ai(2.6)215При кооперации целью игроков является максимизация суммы их выигрышей:∞hiXJ=δ t ln(u1t ) + ln(u2t ) → max ,u1t ,u2t ≥0t=0(2.7)где δ – неизвестный общий коэффициент дисконтирования.Предполагая существование общего коэффициента дисконтирования, аналогично теореме 2.1 доказано следующее утверждение.Теорема 2.2.
Кооперативные стратегии в задаче (2.4), (2.7) имеют вид1 − αδεx .2uc1 = uc2 =Общий кооперативный выигрыш –V (x, δ) = A ln x + B =где2ln x + B ,1 − αδ(2.8)iαδ2 h 1ln ε + ln(1 − αδ) +ln(αδ) − ln 2 .1 − δ 1 − αδ1 − αδB=В разделе 4.2.3 рассмотрен конечный горизонт планирования, где выигрыши игроковимеют видJi =nXδit ln(uit ) ,(2.9)t=0где 0 < δi < 1 – коэффициент дисконтирования игрока i, i = 1, 2.Аналогично, используя метод динамического программирования, приведем результат осуществовании равновесия по Нэшу в n-шаговой игре (см. раздел 2.2).Теорема 2.3. Равновесие по Нэшу в задаче (2.4), (2.9) имеет видa1uN1t =tPaj2j=1tPj=0aj1tPj=0aj2a2εx , uN2t =−1tPj=1tPj=0aj1tPj=0aj1εx , t = 1, .
. . , n ,aj2−1где ai = αδi , i = 1, 2.Индивидуальные выигрыши в n-шаговой игре –Vin (x, δi )=nXj(ai ) ln x +j=0гдеhAji = ln ( j−1Pk=0εak1jPk=1j−1Pk=0akp(δi )n−j Aji − (δi )n ln 2 ,j=1jP)k=0ak2 − 1nXakiP kijXak k=1 i, i, p = 1, 2 , i 6= p .(ai )jk=1(2.10)2164.2.2. Общий коэффициент дисконтирования и кооперативные выигрышиВ данном разделе для построения кооперативных стратегий и выигрышей агентов эколого-экономической системы определяется общий коэффициент дисконтирования с использованием арбитражного решения Нэша. В разделе 4.2.2.1 показано, что в случае распределения кооперативного выигрыша пропорционально коэффициентам дисконтирования игроков общий коэффициент дисконтирования существует, и найдены условия его существования.В разделе 4.2.2.2 предполагается, что кооперативный выигрыш распределяется в пропорции γV (x, δ) : (1 − γ)V (x, δ), где γ – неизвестный параметр.
Найдены области существования параметров δ и γ, при которых выполняются условия рациональности кооперации.В результате получено допустимое множество параметров δ и γ. Для определения решения предложено использование арбитражной схемы Нэша. Найдены условия существования аналитического решения, в остальных случаях значения параметров δ и γ могут бытьполучены численно.4.2.2.1. Пропорциональное разделениеПредположим, что кооперативный выигрыш распределяется между игроками пропорционально их коэффициентам дисконтирования. Найдем условия, которым должен удовлетворять общий коэффициент дисконтирования δ, чтобы кооперативное поведение былорациональным, т.е.δiV (x, δ) ≥ Vi (x, δi ) , i = 1, 2.δ1 + δ2Теорема 2.4. Пусть δ2 > δ1 .
Если δ1 V2 (x, δ2 ) − δ2 V1 (x, δ1 ) < 0, то общий коэффициентдисконтирования удовлетворяет неравенствуδ < usl1 ,иначеδ < usl2 ,гдеKi + (1 + α)Mi+2αMip(Ki + (1 + α)Mi )2 + 8ai (1 − ai )Mi (ln ε − 1 − (1 − α) ln 2),+2αMiusli =Mi = (δ1 + δ2 )(ln x + Bi (1 − ai )) , Ki = 2δi (1 − ai )(α ln 2 − ln x) .217Доказательство. Рассмотрим первое неравенство³ δ´δ1δ11V (x, δ) − V1 (x, δi ) =A − A1 ln x +B − B1 >δ1 + δ2δ1 + δ2δ1 + δ2³2δ11 ´>−ln x +(δ1 + δ2 )(1 − αδ) 1 − a1³ 1´2δ1+(ln ε − 1) − ln 2 − B1 =(δ1 + δ2 )(1 − δ) 1 − αδ=P,(δ1 + δ2 )(1 − a1 )(1 − δ)(1 − αδ)где P – выпуклая парабола с вершиной2δ1 (1 − a1 )(α ln 2 − ln x) + (1 + α)M1.2αM1Поскольку M1 отрицательно и K1 = 2δ1 (1 − a1 )(α ln 2 − ln x) + (1 + α)M1 > 0, то вершина отрицательна, и имеем два корня: один из них больше чем 1, а другой имеет вид –usl1 .