Диссертация (1145439), страница 29
Текст из файла (страница 29)
Как уже было замечено, условие, стимулирующее рациональное поведение на каждом шаге, влечет условие «защиты от иррационального поведения», поэтому докажем предложенное в диссертационной работе условие:ξi (t) − δξi (t + 1) ≥ V{i} (t) − δV{i} (t + 1) .(4.19)Теорема 4.5. Условие, стимулирующее рациональное поведение на каждом шаге, выполнено для всех игроков.171Доказательство.
Для случая xt = yt условие (4.19) принимает вид:для первого игрокаi1 h 3µ1 a ³ 3a ´µ1ln− 5C1 + 2C1,2,s − 2C2,s + C1,2 + C1,s − Cs ≥ 0 ;− ln xt +26 1−a1 + 2aдля второго игрокаiµ1 − 11 h 3(1 − µ1 )a ³ 3a ´ln xt +ln− 5C1 + 2C1,2,s + C2,s + C1,2 − 2C1,s − Cs ≥ 0 ;261−a1 + 2aдля центра³ 3a ´i11 h 3a− ln xt +ln− 2C1 + 2C1,2,s + C2,s − 2C1,2 + C1,s − 4Cs ≥ 0 .26 1−a1 + 2aРассмотрим первое условие и покажем, что выражение в квадратных скобках неотрицательно.3µ1 a ³ 3a ´− 5C1 + 2C1,2,s − 2C2,s + C1,2 + C1,s − Cs =ln1 − a ³ 1 + 2a ´3µ1 a3a=ln− 5C1 + 3C1,2,s + (C1,s − 2C2,s ) − Cs −1−a1 + 2a3a1 + 2aa−ln(3a) +ln(1 + 2a) +ln a .1−a1−a1−aD =Заметим, что это убывающая по µ1 функция, поэтому достаточно проверить, что D ≥ 0при µ1 = 1. Несложно заметить также, что C1,s − 2C2,s > 0.
ТогдаaD > 3C1,2,s − 5C1 − Cs + ln(1 + 2a) +ln a =1 − a ´´³³3a∆= 3C1,2,s − 5C1 −ln 1 −+2(1−a)1−a+b/2³³´´a∆aln a −ln 1 −,+ ln(1 + 2a) +1−a2(1 − a)1 − a + b/2где ∆ = (1 − a)(1 − a + b) .Легко видеть, что выражения в скобках неотрицательны. Для завершения доказательства вспомним, что ln xt < 0 .Условия для второго игрока и центра проверяются аналогично.Результаты моделированияМоделирование было проведено для следующих параметров:α1 = α2 = 0.4 ,δ = 0.1 ,sc = 0.5 ,β1 = β2 = 0.3 , µ1 = 0.55 , µ2 = 0.45 .172Эти параметры типичны для некоторых видов рыб, обитающих в Карелии [85].
Начальный размер популяции x = y = 0.5. Число шагов 10.Сначала сравним размеры популяций при кооперативном поведении и в равновесии поНэшу. На рис. 3.5 и 3.6 показаны динамика развития популяции в некооперативном (темнаялиния) и кооперативном (светлая линия) случаях. Еще раз заметим, что кооперативноеповедение благотворно влияет на состояние обеих популяций.0.60.30.50.250.40.20.30.150.2246810Рис. 3.5. Размер популяции xt0.1246810Рис. 3.6.
Размер популяции ytКооперативное регулируемое равновесиеПусть начальные размеры популяций равны x = 0.3 и y = 0.6. Число шагов – 12. Второйигрок отклоняется в момент времени t0 = 5 и размер отклонения равен ∆ = 0.0001.На рисунках показана разница переменных задачи в случае кооперативного поведения(темная линия) и в случае отклонения второго игрока на промежутке [t0 , t0 + 1] (светлаялиния). Для лучшей видимости разницы в стратегиях представим рисунки на промежуткевремени [4, 10]. На рис.
3.7 представлена динамика популяции xt , а на рис. 3.8 – yt . На рис.3.9 и 3.10 показаны выловы игроков, соответственно. Заметим, что второй игрок увеличивает свой вылов на промежутке [5, 6], а затем существенно уменьшает вследствие наказания.Вылов же первого игрока немного уменьшается на промежутке [5, 6] и увеличивается послевозвращения второго игрока к кооперации.Процедура распределения дележаНачальный размер популяции x = y = 0.5. Число шагов 10.На рис. 3.11–3.13 показана динамически устойчивая процедура распределения дележа(βi (t)) для игрока i (темная линия), выигрыш игрока i в равновесии по Нэшу – V{i} (светлаялиния) и его компонента дележа (вектора Шепли) – ξi (0) (пунктир).Заметим, что ПРД дает больший выигрыш, чем в равновесии по Нэшу в каждый моментвремени. Таким образом, показано как распределить общий выигрыш каждого игрока ξi (0)по всему периоду продолжения игры.1730.1240.1280.1220.1260.1240.120.1220.1180.120.116456789410Рис.
3.7. Размер популяции xt5678910Рис. 3.8. Размер популяции yt0.1240.1180.1220.120.1160.1180.1140.1160.1120.114456789410Рис. 3.9. Вылов первого игрока5678910Рис. 3.10. Вылов второго игрока–0.6–0.6–0.8–0.8–1–1–1.2–1.2–1.4–1.4–1.6–1.602468Рис. 3.11. ПРД первого игрока–1.5–2–2.5–302468Рис. 3.13. ПРД центра02468Рис. 3.12. ПРД второго игрока1743.5.
Методы построения характеристической функции в моделях управлениявозобновляемыми ресурсами со многими участникамиВ данном разделе диссертационной работы исследуется задача управления возобновляемыми ресурсами со многими участниками. Разработан метод построения характеристической функции, учитывающий наличие информации у игроков о формировании коалиции (модели с отсутствием информации и с информацией). Для определения динамическиустойчивой процедуры распределения дележа с неравными компонентами предложено решение оптимизационной задачи специального вида.Агентами эколого-экономической системы являются n игроков (фирм или стран), эксплуатирующих возобновляемый ресурс в течение бесконечного промежутка времени.
Динамика развития ресурса с учетом эксплуатации имеет видxt+1 = f (xt , ut ) , x0 = x ,(5.1)где xt ≥ 0 – размер эксплуатируемого ресурса в момент времени t, uit ≥ 0 – стратегия(интенсивность эксплуатации) игрока i в момент времени t, i = 1, . . . , n, ut = (u1t , .
. . , unt ),f (xt , ut ) – функция развития возобновляемого ресурса.Каждый агент заинтересован в максимизации бесконечной суммы дисконтированных«мгновенных» выигрышей:Ji =∞Xt=0δ t gi (ut ) → max ,uit ≥0(5.2)где gi (ut ) – прибыль игрока i в момент времени t, i = 1, . . . , n, 0 < δ < 1 – коэффициентдисконтирования.Для определения кооперативных стратегий агентов эколого-экономической системы необходимо построить характеристическую функцию.
Для этого необходимо рассмотреть возможность формирования не только гранд коалиции, но и коалиции любого размера.Традиционно функция выигрыша для любой возможной коалиции строится в предположении, что игроки вне коалиции играют совместно против коалиции (антагонистическаяигра). В работе [160] был предложен подход построения характеристической функции, вкотором игроки вне коалиции действуют индивидуально, используя свои оптимальные поНэшу стратегии.
В диссертационной работе предлагается определять характеристическуюфункцию в двух необычных формах: 1) игроки вне коалиции используют свои стратегииНэша, определенные для некооперативного варианта игры (модель с отсутствием информации) [160]; 2) игроки вне коалиции строят новые стратегии Нэша в игре с N \K игроками(модель с информацией), N = {1, .
. . , n}.175Модель с отсутствием информации. В данном случае игроки, образовавшие коалициюK, не сообщают об этом другим участникам. Поэтому агенты, не входящие в коалицию(индивидуальные игроки), продолжают использовать стратегии Нэша, определенные длянекооперативного варианта игры.1NnNОбозначим uNt = (ut , . . . , ut ) – равновесие по Нэшу в игре (5.1), (5.2).Для определения общего кооперативного выигрыша коалиции K решается следующаязадача:JK∞ihXXgi (ũt ) −→ max,=δtit=0гдеu , i∈Ki∈K ui , i ∈ K ,iũ = uiN , i ∈ N \K .Модель с информацией.
В данном случае агенты, не входящие в коалицию K получаютинформацию о ее формировании. Поэтому они определяют свои стратегии как равновесныепо Нэшу в игре с N \K игроками.Для определения общего кооперативного выигрыша коалиции K решается следующаязадача:JK∞hXiXt=δgi (ũt ) −→ max,it=0гдеu , i∈Ki∈K ui , i ∈ K ,ũi = ũiN , i ∈ N \K ,а стратегии ũiN индивидуальных игроков определяются из решения задачJi =∞Xδ t gi (ut ) −→t=0max , i ∈ N \K .ui , i∈N \KВ данном разделе диссертационной работы предложенные схемы построения характеристической функции применены для модели «рыбных войн» со многими участниками.
Доказана супераддитивность полученных характеристических функций и выполнение условий,стимулирующих кооперативное поведение. Проведено сравнение состояния экологическойсистемы и выигрышей агентов в обеих предложенных схемах.Модель со многими участникамиМодель «рыбных войн» была определена [118] для двух игроков. В данном разделепредположим, что n игроков (фирм или стран) эксплуатируют возобновляемый ресурсна протяжении бесконечного промежутка времени.
Динамика развития ресурса с учетом176эксплуатации имеет видxt+1 = (εxt −nXuit )α , x0 = x ,(5.3)i=1где xt ≥ 0 – размер популяции в момент времени t, 0 < ε < 1 – коэффициент естественной выживаемости, 0 < α < 1 – коэффициент внутреннего роста, uit ≥ 0 – стратегия(интенсивность эксплуатации) игрока i в момент времени t, i = 1, . . . , n.Выигрыши агентов эколого-экономической системы на бесконечном промежутке времени имеют видJi =∞Xδ t ln(uit ) ,(5.4)t=0где 0 < δ < 1 – коэффициент дисконтирования, i = 1, .
. . , n.3.5.1. Модель с отсутствием информацииПостроим характеристическую функцию в случае, когда игроки, образовавшие коалицию, не сообщают об этом другим участникам.Теорема 5.1. Характеристическая функция для игры (5.3), (5.4), начинающейся в момент t из состояния xt имеет видV (L, xt ) =0,L = 0,V ({i}, xt ) = Vi (xt ), L = {i} ,V (K, xt ) = VK (xt ), L = K ,V (I, xt ) = VI (xt ),(5.5)L=I.Здесь выигрыш при некооперативном поведении имеет видVi (xt ) =где11ln xt +Bi ,1−a1−δ(5.6)³´a1εln+ ln(1 − a) +ln a , a = αδ .Bi =1−an − a(n − 1)1−aВыигрыш любой коалиции K –VK (xt ) =гдеBK = kk1ln xt +BK ,1 − αδ1−δ(5.7)³ 1³ ε(k − a(k − 1)) ´³1 − a´´aln+ ln+ln a .1−an − a(n − 1)k1−aВыигрыш при кооперативном поведении (формировании гранд коалиции) –VI (xt ) =1nln xt +BI ,1 − αδ1−δ(5.8)177гдеBI = nBi + n³ 1´ln(n − a(n − 1)) − ln n .1−aДоказательство.
Начнем рассмотрение с некооперативного случая. Для нахождения равновесия по Нэшу в задаче (5.3), (5.4) используем метод динамического программирования[8]. Решение уравнения БеллманаVi (x) = max{ln ui + δVi (εx −ui ≥0nXui )α }, i = 1, . . . , n(5.9)i=1ищем в видеVi (x) = Ai ln x + Bi , i = 1, .
. . , n,а оптимальные стратегии – в виде ui = γi x, i = 1, . . . , n. Так как все игроки здесь идентичны,то из уравнения (5.9) находим оптимальные выловыuNi =1−aεx , a = αδn − a(n − 1)(5.10)и некооперативные выигрыши в виде (5.6).Заметим, что некооперативные стратегии допустимы, т.к.εx −nXi=1uNi =εax < x.n − a(n − 1)Тогда динамика развития популяции при индивидуальном поведении игроков имеет видxt =tPαjαt N j=1x0 x̂εa.n − a(n − 1), t = 1, 2, . .
. , x̂N =(5.11)Теперь определим выигрыш каждой коалиции K с k игроками. Предполагается, что игроки, не входящие в коалицию, используют равновесные по Нэшу стратегии, определенныев (5.10).Решение уравнения Беллмана для игроков из коалиции KVK (x) = max{ui ∈KXi∈Kln ui + δVK (εx −Xui −i∈KXαuNi ) }(5.12)i∈N \Kищем в видеVK (x) = AK ln x + BK ,и оптимальные стратегии в виде – ui = γiK x, i ∈ K.