Диссертация (1145439), страница 28
Текст из файла (страница 28)
Кооперативное поведение не только благоприятно влияет на состояниевозобновляемого ресурса, но и выгодно обоим игрокам.Доказательство. При использовании одинаковых коэффициентов дисконтирования мыможем сравнить оптимальные стратегии игроков и стационарные размеры популяций прикооперации и при некооперативном поведенииγ=(1 − δα)(1 − δα + δβ)(1 − δα)(1 − δα + δβ)>= γc1 − δα + 1/2δβ1 − δα + δβиx̄ = ȳ < x̄c = ȳ c .Заметим, что при этом выигрыши игроков в кооперации больше, чем в равновесии поНэшуα(1 − δα)(1 − δα + δβ)(δα) 1−α >1 − δα + δβα(1 − δα)(1 − δα + δβ) ³ δα(1 − δα + δβ) − 1/2δβ ´ 1−α>= γ x̄ ,1 − δα + 1/2δβ1 − δα + 1/2δβγ c x̄c =αтак как δα > δα(1 − δα + δβ) − 1/2δβ и (1 − δα + 1/2δβ)1+ 1−α > 1 − δα + δβ.Следовательно, кооперативное поведение не только благотворно влияет на состояниеэкологической системы, но и выгодно для игроков (выигрыши игроков увеличиваются посравнению с некооперативным поведением).165Этот результат еще раз показывает, что некооперативное поведение неэффективно всилу перелова и в случае взаимодействующих видов.3.4.2.
Кооперативное регулируемое равновесиеВ данном разделе для поддержания кооперативного поведения применяется разработанная в диссертационной работе схема кооперативного регулируемого равновесия с участиемцентра. Задачей центра (арбитра) является контроль над соблюдением кооперативного договора и наказание отклоняющихся агентов путем изменения территории эксплуатации.Обозначим sc – разделение территории при кооперативном поведении обоих игроков.Центр уменьшает sc при отклонении первого игрока, а при отклонении второго – увеличивает sc .Теорема 4.3.
Кооперативное регулируемое равновесие в задаче (4.3), (4.8) имеет видµ1 ∆∗1 xµ2 ∆∗2 yγ1 (u2 ) =, γ2 (u1 ) =,µ1 (1 − a2 ) + b2 (1 − s∗1 )µ2 (1 − a1 ) + b1 s∗2(4.10)где∆∗i = (1 − a1 )(1 − a2 ) + b2 (1 − s∗i )(1 − a1 ) + b1 s∗i (1 − a2 ) , i = 1, 2 ,s∗1 = sc + η1 (u2 − uc2 ) , s∗2 = sc − η2 (u1 − uc1 ) .Коэффициенты имеют видh³ x − uc ´ (1 − sc )uc (1 − a )(µ N + b M ) i−1µ1 b1 sc212 111Mln,+1cccµ2 b2 (y − u2 )y − u2(x − u1 )∆ µ1 (1 − a2 ) + b2 (1 − sc )(4.11)³ y − uc ´µ2 b2 (1 − sc ) hsc uc2 (1 − a1 )(−µ2 N + b1 M2 ) i−12η2 =M2 ln+,µ1 b1 (x − uc1 )x − uc1(y − uc2 )∆µ2 (1 − a1 ) + b1 sc(4.12)η1 =гдеMi = 1 − ai + bi , i = 1, 2, N = b1 (1 − a2 ) − b2 (1 − a1 ) .Доказательство.
Рассмотрим отклонение второго игрокаu2 = uc2 + ∆ .Будем искать стратегию центра в видеs∗ = sc + η1 (u2 − uc2 ) .166Таким образом, центр наказывает агента, отклоняющегося от кооперативного поведения, изменением эксплуатируемой территории на величину, пропорциональную величинеотклонения.Тогда стратегия наказания, которую использует первый игрок имеет видγ1 (u2 ) =µ1 x[(1 − a1 )(1 − a2 ) + b2 (1 − s∗ )(1 − a1 )] + b1 s∗ (1 − a2 ).µ1 (1 − a2 ) + b2 (1 − s∗ )Для нахождения коэффициента η1 необходимо решить задачу максимизации выигрышавторого игрока при использовании данной схемы наказания:maxu2t∞Xδ t ln(u2t )(4.13)t=0при динамике развития популяции³´β1 s∗ xt+1 = (xt − γ1 (u2t ))α1 yt −u2t,xt −γ1 (u2t )´β2 (1−s∗ )³ yt+1 = (yt − u2t )α2 xt −γ1 (u2t ),yt −u2t(4.14)гдеs∗ = sc + η1t (u2t − uc2t ) .Понятие кооперативного регулируемого равновесия дает условие, что решение задачи(4.13),(4.14) должно достигаться на кооперативной стратегии uc2 .
Отсюда получим выражение для η1 в виде (4.11).Аналогично, при отклонении первого игрока стратегия центра ищется в видеs∗ = sc − η2 (u1 − uc1 ) ,и стратегия наказания, которую использует второй игрок имеет видγ2 (u1 ) =µ2 y[(1 − a1 )(1 − δa2 ) + b2 (1 − s∗ )(1 − a1 )] + b1 s∗ (1 − a2 ).µ2 (1 − a1 ) + b1 s∗Для определения коэффициента η2 решаем задачу максимизации выигрыша первогоигрока при использовании данной схемы наказания. Откуда получаем выражение для η2 ввиде (4.12).Еще раз заметим, что использование схемы поддержания кооперативного поведения сучастием центра выгодно для агентов эколого-экономической системы, соблюдающих кооперативное соглашение, которое достигнуто в начале периода планирования. При этомони могут не вести мониторинг действий партнера, что несет дополнительные затраты, аполностью положиться на действия некоторого контролирующего органа.1673.4.3.
ПРД и условия, стимулирующие кооперативное поведениеВ данном разделе рассмотрен случай α1 = α2 = α и β1 = β2 = β. Таким образом,динамика развития популяции имеет вид³ ´βs xt+1 = xαt yt, x0 = x ,x³ t´β(1−s) yt+1 = ytα xt, y0 = y ,ytгде xt ≥ 0 – размер популяции в первом районе в момент времени t, yt ≥ 0 – размерпопуляции во втором районе в момент времени t, 0 < α < 1 – коэффициент внутреннегороста, 0 < β < 1 – коэффициент миграции.Также предполагается использование общего коэффициента дисконтирования δ. Тогдаигроки максимизируют бесконечные суммы своих дисконтированных выигрышей:J1 =∞Xtδ ln(u1t ) → max , J2 =u1tt=0∞Xδ t ln(u2t ) → max ,u2tt=0(4.15)где 0 ≤ u1t ≤ xt , 0 ≤ u2t ≤ yt – стратегии (интенсивность эксплуатации) игроков в моментвремени t, 0 < δ < 1 – коэффициент дисконтирования.И динамика развития ресурсов с учетом эксплуатации принимает вид x = (x − u )α−βs (y − u )βs ,t+1t1tt2t y = (y − u )α−β(1−s) (x − u )β(1−s) .t+1t2tt(4.16)1tВ данной модели в отличие от предыдущего раздела центр также является игроком иего выигрыш на бесконечном промежутке времени имеет видI=∞Xδ t ln(xt yt ) → max .0≤s≤1t=0(4.17)Таким образом, центр стремится максимизировать общий размер эксплуатируемой популяции.Построим дележ в данной модели, используя вектор Шепли (2.4).Теорема 4.4.
При x0 = y0 вектор Шепли в задаче (4.15)–(4.17) имеет вид(ξ1 , ξ2 , ξs ) ,где2 − µ11ln x +(2C1 + 2C1,2,s − 2C2,s + C1,2 + C1,s − C2 − Cs ) ,2(1 − a)6(1 − δ)1 + µ11ξ2 =ln x +(−C1 + 2C1,2,s + C2,s + C1,2 − 2C1,s + 2C2 − Cs ) ,2(1 − a)6(1 − δ)ξ1 =168ξs =31ln x +(−C1 + 2C1,2,s + C2,s − 2C1,2 + C1,s − C2 + 2Cs ) ,2(1 − a)6(1 − δ)и∆C1 = C2 = ln( 1−a+0.5b)+1−a)+C1,2,s = ln( 1+2a3a1−aa1−aln(1 −∆),1−a+0.5bln(1 −1−a),1+2aCs =2a(1−a)C1,2 = ln(1 − a) +ln(1 −a1−a∆),1−a+0.5bln a ,(2−µ1 )a2∆ln(1 − 2−µ1 a(1−a+b)−(a−b)(a+1)),1−a2∆1 )a+ (1+µln(1 − 2+µ1 a(1−a+b)−2a+b),1−a2∆C1,s = µ1 ln( 2−µ1 a(1−a+b)−(a−b)(a+1))+2∆C2,s = (1 − µ1 ) ln( 2+µ1 a(1−a+b)−2a+b)где a = αδ, b = βδ, ∆ = (1 − a)(1 − a + b).Доказательство.
Последующее доказательство верно и для случая x0 6= y0 , но получаемые коэффициенты и стратегии центра имеют значительно более сложный вид. Поэтомуограничимся здесь только случаем равных начальных размеров популяций в районах.Рассмотрим случай некооперативного поведения игроков, т.е. ситуацию равновесия поНэшу.Пусть V1 (x, y) – функция выигрыша первого игрока, V2 (x, y) – второго игрока, а Vs (x, y)– центра.Уравнения Беллмана [8] для игроков имеют вид (4.5), (4.6), где α1 = α2 = α и β1 = β2 =β. А для центра:Vs (x, y) = max {ln(xy) + δVs ((x − u1 )α0≤s≤1³ y − u ´βs2x − u1, (y − u2 )α³ x − u ´β(1−s)1y − u2)} .(4.18)Как и ранее, функции выигрыша ищем в видеVi (x, y) = Ai ln x + Bi ln y + Ci , i = 1, 2, s .Тогда, по теореме 4.1 оптимальные выловы и параметры функций выигрыша игроковпримут видu1 =A1 =y∆x∆, u2 =,1 − a + b(1 − s)1 − a + bs1 − a + b(1 − s))bs1 − a + bs)δb(1 − s), B1 =, B2 =, A2 =,∆∆∆∆где∆ = (1 − a)(1 − a + b) .Для центра запишем уравнение Беллмана (4.18) в видеAs ln x + Bs ln y + Cs = ln x + ln y + δAs [(α − βs) ln(x − u1 ) + βs ln(y − u2 )]++δBs [(α − β(1 − s)) ln(y − u2 ) + β(1 − s) ln(x − u1 )] + δCs ,169максимизируя правую часть которого, получим(δAs + δBs )β(ln(x − u1 ) − ln(y − u2 )) =2δβx − u1ln= 0.1 − αδ y − u2Следовательно, оптимальная стратегия центра определяется из условияx(1 − γ1 )= 1.(1 − γ2 )yДля рассматриваемого некооперативного случая при условии x0 = y0 получим, чтоцентр должен разделять территорию поровнуs=1.2Для всех возможных коалиций, действуя аналогично, найдем оптимальные стратегииигроков и центра.
При этом стратегии игроков ищутся в линейном виде: u1t = γ1 xt , u2t =γ2 yt .Получено, что для всех возможных коалиций оптимальное управление центра определяется из следующего равенства:s:xt (1 − γ1 )= 1,(1 − γ2 )ytи ниже будут приведены выражения для s только для случая x0 = y0 .А именно, были получены следующие оптимальные стратегии:1. Коалиции {1}, {2}, {s}:s=γ1 = γ2 =1,2∆,1 − a + 0.5bгде∆ = (1 − a)(1 − a + b) .2. Гранд коалиция {1, 2, s}:s=a(1 − a + b)(1 − 2µ1 ) + b(2 − µ1 ),3bγ 1 = γ2 =1−a.1 + 2a3. Коалиции {1, 2}, {s}:s = 1 − µ1 ,γ1 = γ2 = 1 − a .1704. Коалиции {1, s}, {2}:s=−aµ1 (1 − a + b) + b(1 + a) + a(1 − a),2bγ1 = γ2 =2∆.2 − µ1 a(1 − a + b) − (a − b)(1 + a)5. Коалиции {2, s}, {1}:−aµ1 (1 − a + b) + b,2b2∆γ1 = γ2 =.2 + µ1 a(1 − a + b) − (2a − b)s=Заметим, что в рассматриваемом случае xt = yt для всех возможных коалиций, по³ x ´α−βxt+1tскольку=и x0 = y0 . Поэтому, если в общем случае выигрыш коалиции Kyt+1ytимеет вид V{K} = AK ln x + BK ln y + CK , то при нашем предположении (x0 = y0 ) выигрышкоалиции имеет видV{K} = (AK + BK ) ln x + CK .Приведем функции выигрыша для всех коалиций:1121ln x +C1 , V{s} =ln x +Cs ,1−a1−δ1−a1−δ3111V{1,2,s} =ln x +C1,2,s , V{1,2} =ln x +C1,2 ,1−a1−δ1−a1−δ2 − µ111 + µ11V{1,s} =ln x +C1,s , V{2,s} =ln x +C2,s ,1−a1−δ1−a1−δV{1} = V{2} =где коэффициенты Ci , Ci,j , Ci,j,s приведены в формулировке теоремы.Теперь можно построить вектор Шепли, используя формулу (2.4), общий вид которогоприведен в формулировке теоремы.Проверим выполнение условий, стимулирующих кооперативное поведение, для данноймодели.