Диссертация (1145439), страница 27
Текст из файла (страница 27)
Отклоняющийся же игрок (второй) наказывается уменьшением st , вследствие чего его вылов падает на промежутке [n0 , n0 + 1]. Приэтом размер популяции при отклонении практически не меняется, но увеличивается привозвращении обоих игроков к кооперативному поведению (см. рис. 3.1). Таким образом,предложенная в диссертационной работе схема кооперативного регулируемого равновесияне вредит состоянию экологической системы.В сравнении с кооперативным поведением первый игрок выигрывает 0.806 · 10−7 приотклонении игрока 2, а второй игрок проигрывает 1.263 · 10−7 .Как было показано (следствие 3.3) участие центра в регулировании кооперативногоповедения дает преимущество «честному» игроку. Его выигрыш увеличивается, а отклонившийся игрок терпит убытки.Если сравнить выигрыши игроков в процентном соотношении, беря кооперативный выигрыш за 100 %, то получим:Первый игрок получает больше на 0.1%, когда второй игрок отклоняется, и меньше на8,6 %, когда игроки используют стратегии Нэша.Второй игрок получает меньше на 0.008%, когда отклоняется, и больше на 7,3 %, когдаигроки ведут себя некооперативно.Если сравним сумму выигрышей обоих игроков, то при отклонении второго они получают меньше на 0.001%, а при использовании стратегий Нэша – на 0.1% .1593.4.
Модель, учитывающая миграциюВ данном разделе диссертационной работы проведено исследование динамической игрыуправления возобновляемыми ресурсами в дискретном времени. Эксплуатируемая территория разделена на две части, в каждой из которых игрок эксплуатирует ресурс. Агентамиэколого-экономической системы являются центр (арбитр), который разделяет территориюмежду участниками, и игроки (страны или фирмы), эксплуатирующие возобновляемыйресурс.Предполагается, что между частями территории эксплуатации существует миграционный обмен.
Таким образом, размер возобновляемого ресурса в одном районе (где ведетэксплуатацию первый игрок) зависит не только от размера ресурса и интенсивности эксплуатации в предыдущий момент времени, но и от размера ресурса и интенсивности эксплуатации в другом районе (где возобновляемый ресурс эксплуатирует второй игрок).Существует альтернативная интерпретация данной модели. Можно рассмотреть ресурсы двух видов, каждый из которых эксплуатируется игроком [107]. В этом случае миграциисоответствует процесс межвидового взаимодействия.Получены равновесие по Нэшу и кооперативное равновесие для бесконечного горизонта планирования. Для поддержания кооперативного соглашения, достигнутого в началепериода планирования, используется разработанная схема кооперативного регулируемогоравновесия (центр наказывает игроков за отклонение изменением территории эксплуатации) и динамически устойчивая процедура распределения дележа (в случае, когда центрпринимает участие в игре).
Получен в аналитическом виде вектор Шепли и динамическиустойчивая процедура распределения дележа. Проверено выполнение условия, стимулирующего рациональное поведение на каждом шаге.3.4.1. Модель и равновесияРазделим эксплуатируемую территорию на две части: s и 1 − s, где ведут эксплуатациюдва игрока. Агентами эколого-экономической системы являются центр (арбитр), которыйразделяет территорию и игроки (страны или фирмы), эксплуатирующие возобновляемыйресурс на своей выделенной территории на бесконечном промежутке времени. Модель может иметь другую интерпретацию: имеются два вида возобновляемого ресурса и игрокможет эксплуатировать только один из них.160Предполагаем, что популяция развивается в соответствии с биологическим законом [108]³ ´β1 s xt+1 = xαt 1 yt, x0 = x ,x(4.1)³ t´β2 (1−s) yt+1 = ytα2 xt,y=y,0ytгде xt ≥ 0 – размер популяции в первом районе в момент времени t, yt ≥ 0 – размерпопуляции во втором районе в момент времени t, 0 < αi < 1 – коэффициенты внутреннегороста, 0 < βi < 1 – коэффициенты миграции, i = 1, 2.Здесь αi представляет эффект прямого влияния размера популяции на размер в следующий момент времени на этой территории.
βi представляет эффект миграции междудвумя частями эксплуатируемой территории. Будем предполагать, что αi > βi , i = 1, 2, чтосоответствует ситуации, когда внутренний рост сильнее влияет на развитие популяции, чеммиграционные обмены.Первый игрок эксплуатирует xt , а второй ведет вылов популяции yt .Можно заметить, что в предложенной модели интенсивность миграции зависит также иот доли эксплуатируемой территории. Это предположение естественно, поскольку размерсреды обитания уменьшается, когда s уменьшается, и популяция должна мигрировать вдругой район.Как и в предыдущих разделах предполагается логарифмический вид функций полезности.
Рассматриваются задачи максимизации бесконечных сумм дисконтированных выигрышей двух игроков:J1 =∞Xδ1tln(u1t ) → max , J2 =u1tt=0∞Xδ2t ln(u2t ) → max ,u2tt=0(4.2)где 0 ≤ u1t ≤ xt , 0 ≤ u2t ≤ yt – стратегии (интенсивность эксплуатации) игроков в моментвремени t, 0 < δi < 1 – коэффициент дисконтирования игрока i, i = 1, 2.Динамика развития популяции с учетом эксплуатации принимает вид x = (x − u )α1 −β1 s (y − u )β1 s , x = x ,t+1t1tt2t0 y = (y − u )α2 −β2 (1−s) (x − u )β2 (1−s) , y = y .t+1t2tt1t(4.3)0Начнем исследование задачи управления возобновляемыми ресурсами с миграцией спостроения некооперативного поведения игроков.Теорема 4.1. Равновесные по Нэшу стратегии в задаче (4.2),(4.3) имеют видu1 = γ 1 x , u 2 = γ 2 y ,(4.4)161гдеγ1 =∆1∆2, γ2 =,1 − δ1 α2 + δ1 β2 (1 − s)1 − δ2 α1 + δ2 β1 s∆i = (1 − δi α2 + δi β2 (1 − s))(1 − δi α1 + δi β1 s) − δi2 s(1 − s)β1 β2 , i = 1, 2.Доказательство.
Для доказательство используем метод динамического программирования [8]. Пусть V1 (x, y) – функция выигрыша первого игрока, а V2 (x, y) – второго.Следуя принципу Беллмана эти функции удовлетворяют уравнениямα1V1 (x, y) = max {ln u1 + δ1 V1 ((x − u1 )0≤u1 ≤xV2 (x, y) = max {ln u2 + δ2 V2 ((x − u1 )α10≤u2 ≤y³ y − u ´β1 s2x − u1³ y − u ´β1 s2x − u1, (y − u2 )α2, (y − u2 )α2³ x − u ´β2 (1−s)1y − u2³ x − u ´β2 (1−s)1y − u2)} ,(4.5))} .(4.6)Будем искать функцию выигрыша в следующем виде:Vi (x, y) = Ai ln x + Bi ln y + Ci , i = 1, 2,где Ai , Bi и Ci – константы, зависящие от параметров модели.Тогда для первого игрока из (4.5) получимA1 ln x + B1 ln y + C1 = ln u1 + δ1 A1 [(α1 − β1 s) ln(x − u1 ) + β1 s ln(y − u2 )]++δ1 B1 [(α2 − β2 (1 − s)) ln(y − u2 ) + β2 (1 − s) ln(x − u1 )] + δ1 C1 .(4.7)Как и ранее предполагаем линейный вид стратегий игроков: u1 = γ1 x и u2 = γ2 y. Тогдасистема для определения констант примет видA1 = 1 + δ1 A1 (α1 − β1 s) + δ1 B1 β2 (1 − s) , B = δ A β s + δ B (α − β (1 − s)) ,11 1 11 122 C1 = ln γ1 + δ1 A1 [(α1 − β1 s) ln(1 − γ1 ) + β1 s ln(1 − γ2 )]++ δ1 B1 [(α2 − β2 (1 − s)) ln(1 − γ2 ) + β2 (1 − s) ln(1 − γ1 )] + δ1 C1 .ОткудаA1 =1 − δ1 (α2 − β2 (1 − s))δ1 β1 s, B1 =,∆1∆1где∆1 = (1 − δ1 α2 + δ1 β2 (1 − s))(1 − δ1 α1 + δ1 β1 s) − δ12 s(1 − s)β1 β2 .Аналогично для второго игрока из (4.6) получимB2 =δ2 β2 (1 − s)1 − δ2 (α1 − β1 s), A2 =,∆2∆2где∆2 = (1 − δ2 α2 + δ2 β2 (1 − s))(1 − δ2 α1 + δ2 β1 s) − δ22 s(1 − s)β1 β2 .162Для определения оптимальных стратегий максимизируем правую часть (4.7)δ1 A1 (−α1 + β1 s) − δ1 B1 β2 (1 − s)1+= 0,u1x − u1откуда получимu1 =x∆1= γ1∗ x .1 − δ1 α2 + δ1 β2 (1 − s)Аналогично для второго игрока:u2 =y∆2= γ2∗ y .1 − δ2 α1 + δ2 β1 sПокажем, что данные стратегии допустимы, т.е.
0 ≤ γi∗ ≤ 1, i = 1, 2.Для первого игрока получим условие(1 − δ1 α2 )(β1 s − α1 ) − α1 δ1 β2 (1 − s) ≤ 0илиs≤α1 (1 − δ1 α2 ) + δ1 α1 β2.β1 (1 − δ1 α2 ) + δ1 α1 β2Это неравенство выполняется ∀s: 0 ≤ s ≤ 1 при нашем предположении α1 > β1 .Аналогично для второго игрока условиеs≥(β2 − α2 )(1 − δ2 α1 )β2 (1 − δ2 α1 ) + δ2 α2 β1выполняется ∀s: 0 ≤ s ≤ 1 при предположении α2 > β2 .Получим стационарные размеры популяций из уравненийx̄ = (x̄(1 − γ1 ))α1 −β1 s (ȳ(1 − γ2 ))β1 s ,ȳ = (ȳ(1 − γ2 ))α2 −β2 (1−s) (x̄(1 − γ1 ))β2 (1−s) ,откудаx̄ = (1 − γ2 )ȳ = (1 − γ1 )β1 sK(1 − γ1 )β2 (1−s)K(1−α2 )(α1 −β1 s)+α1 β2 (1−s)K(1 − γ2 ),(1−α1 )(α2 −β2 (1−s))+α2 β1 sK,гдеK = (1 − α1 )(1 − α2 ) + (1 − α2 )β1 s + (1 − α1 )β2 (1 − s) .Рассмотрим случай с равными коэффициентами внутреннего роста и миграции, и равной долей территории эксплуатацииα1 = α2 = α, β1 = β2 = β, s =1,2163тогдаγ1 = γ2 = γи стационарные размеры равныαx̄ = ȳ = (1 − γ) 1−α .Перейдем к исследованию кооперативного поведения.
При кооперации игроки максимизируют взвешенную сумму своих выигрышей:∞Xδ t (µ1 ln(u1t ) + µ2 ln(u2t )) →t=0max0≤u1t ≤xt ,0≤u2t ≤yt,(4.8)где 0 < δ < 1 – общий коэффициент дисконтирования, 0 < µ1 , µ2 < 1 – весовые коэффициенты (µ1 + µ2 = 1).Теорема 4.2. Кооперативное равновесие в задаче (4.3),(4.8) имеет видuc1 =µ1 ∆µ2 ∆x , uc2 =y,µ1 (1 − a2 ) + b2 (1 − s)µ2 (1 − a1 ) + b1 s(4.9)гдеa1 = δα1 , a2 = δα2 , b1 = δβ1 , b2 = δβ2 ,∆ = (1 − a1 )(1 − a2 ) + b2 (1 − s)(1 − a1 ) + b1 s(1 − a2 ) .Доказательство. Доказательство аналогично теореме 4.1. Приведем только условия допустимости оптимальных стратегий.
Для первого игрока получаем условиеµ1 [(1 − δα2 )(β1 s − α1 ) − α1 δβ2 (1 − s)] − µ2 δβ2 (1 − s) ≤ 0илиs≤µ1 α1 (1 − δα2 ) + δβ2 (µ1 α1 + µ2 ).µ1 β1 (1 − δα2 ) + δβ2 (µ1 α1 + µ2 )Это неравенство выполняется ∀s: 0 ≤ s ≤ 1 при нашем предположении α1 > β1 .Аналогично для второго игрока условиеs≥µ2 (β2 − α2 )(1 − δα1 )µ2 β2 (1 − δα1 ) + δβ1 (µ2 α2 + µ1 )выполняется ∀s: 0 ≤ s ≤ 1 при нашем предположении α2 > β2 .Аналогично некооперативному случаю, если обозначимγ1c =µ2 ∆µ1 ∆, γ2c =,µ1 (1 − a2 ) + b2 (1 − s)µ2 (1 − a1 ) + b1 s164то стационарные размеры популяций при кооперации примут видx̄c = (1 − γ2c )ȳ c = (1 − γ1c )β1 sK(1 − γ1c )β2 (1−s)K(1−α2 )(α1 −β1 s)+α1 β2 (1−s)K(1 − γ2c ),(1−α1 )(α2 −β2 (1−s))+α2 β1 sK,гдеK = (1 − α1 )(1 − α2 ) + (1 − α2 )β1 s + (1 − α1 )β2 (1 − s) .Теперь рассмотрим случай с равными коэффициентами внутреннего роста и миграции,равной долей территории эксплуатации и равными весовыми коэффициентамиα1 = α2 = α, β1 = β2 = β, s = µ1 = µ2 =1,2тогдаγ1c = γ2c = γ c ,и стационарные размеры равныαx̄c = ȳ c = (1 − γ c ) 1−α .Следствие 4.1.