Диссертация (1145439), страница 18
Текст из файла (страница 18)
Для этого решаем задачу максимизациивыигрыша второго игрока при использовании данной схемы наказания:J2 (γ1 (E2 ), E2 ) → min ,E2 ≥00cx (t) = εx(t) − q1 γ1 (E2 )(1 − s + η(t)(E2 (t) −E2c (t)))x(t)−(2.20)−q2 E2 (t)(sc − η(t)(E2 (t) − E2c (t)))x(t) .Аналогично теореме 2.5 составляем уравнение Гамильтона–Якоби–Беллмана. Максимумданной функции достигается при выполнении условия´³x a2 E2 (sc − η(E2 − E2c ))x − b2 + V20 (x)q2 (sc − η(E2 − E2c ) − ηE2 ) = 0 , x(0) = x0 .(2.21)Для того, чтобы γ1 было кооперативным регулируемым равновесием, необходимо, чтобы решение задачи (2.20) достигалось на кооперативном равновесии.
Следовательно, уравнение (2.21) должно выполняться при E2 = E2c . При этом выражение в первых скобкахотлично от нуля, а выражение во вторых скобках равно нулю приη(t) =sc.E2c (t)Рассуждая аналогично при отклонении первого игрока, определим стратегию центраs∗ (t) = sc + θ(t)(E1 (t) − E1c (t)) ,а стратегию второго игрока в видеγ2 (E1 ) =2Ax(t) + µ2 p2 + B.2k2 µ2 q2 (sc + θ(t)(E1 (t) − E1c (t)))x(t)Откуда получимθ(t) =1 − sc.E1c (t)Динамически устойчивая процедура распределения дележаТеперь исследуем схему поддержания кооперативного поведения агентов эколого-экономической системы, использующую динамически устойчивую процедуру распределениядележа [49], [50].
В качестве дележа (разделения общего кооперативного выигрыша междуигроками) будем использовать вектор Шепли (1.6).98Теорема 2.7. Вектор Шепли в задаче (2.10)–(2.13) имеет вид(ξ1 , ξ2 )где1ξi = (Aξi x2 + Bξi x + Cξ1 ) , i = 1, 2 ,22ε − ρ2(2ε − ρ)Aξi =Mi , Bξi = −Mi K ,33ki p2j µi − kj p2i (1 + µi ) 2ε − ρCξi =+Mi K , i = 1, 2 ,4k1 k2 ρ33µ1 µ2 k1 k2, i, j = 1, 2, i 6= j ,Mi = ki − kj +µ1 k1 + µ2 k2p1 k2 + p2 k1K=.2εk1 k2(2.22)Доказательство. Для построения вектора Шепли рассмотрим все возможные коалиции инайдем их выигрыши.
Для этого пользуемся методом динамического программированияаналогично предыдущим теоремам.Получим стратегии игроков и функции выигрыша в следующем виде:1. Гранд коалиция {1, 2} (используем теорему 2.4 с введенными обозначениями):E1c =2Ax + p1 µ1 + B2Ax + p2 µ2 + B, E2c =,2k1 µ1 q1 (1 − s)x2k2 µ2 q2 sxV (x) = Ax2 + Bx + C ,гдеA=(2ε − ρ)µ1 µ2 k1 k2µ1 p21 k2 + µ2 p22 k1 1, B = −2AK , C = −− KB .µ1 k1 + µ2 k24ρk1 k222.
Коалиция {1} (равновесие по Нэшу):E1 =2A1 x + p1 + B1,2k1 q1 (1 − s)xV1 (x) = A1 x2 + B1 x + C1 ,гдеA1 =(2ε − ρ)k12p21, B1 = − A1 K , C1 = − 1 − KB1 .334k1 ρ 23. Коалиция {2} (равновесие по Нэшу):E2 =2A2 x + p2 + B2,2k2 q2 sxV2 (x) = A2 x2 + B2 x + C2 ,гдеA2 =(2ε − ρ)k22p21, B2 = − A2 K , C2 = − 2 − KB2 .334k2 ρ 299Тогда компоненты вектора Шепли (1.6) имеют вид111ξ1 = (A1 + A − A2 )x2 + (B1 + B − B2 )x + (C1 + C − C2 ) ,222111ξ2 = (A2 + A − A1 )x2 + (B2 + B − B1 )x + (C2 + C − C1 ) .222Подставив выражения для коэффициентов, получим утверждение теоремы.Построим динамически устойчивую процедуру распределения дележа (ПРД) для нашеймодели.Теорема 2.8.
Вектор β(t) = (β1 (t), β2 (t)), где11βi (t) = Aξi (2ε − ρ)x(t)2 + Aξi K(ρ − 2ε)x(t) + ρCξi − (ρ − ε)K 2 Aξi ,22x(t) = K + (x0 − K)e(ρ−ε)t , K =(2.23)p1 k2 + p2 k12εk1 k2является динамически устойчивой ПРД.Доказательство. Введем вектор β(t) какβi (t) = ρξi (t) −dξi (t) .dtПокажем, что такой вектор является ПРД (1.7):Z ∞Z ∞d−ρte−ρt (ρξi (t) − ξi (t)) dt = −e−ρt ξi (t)|∞e βi (t) dt =0 = ξi (0) .dt00Покажем, что такой вектор является динамически устойчивой ПРД (1.8):Rt0e−ρτ βi (τ ) dτ + e−ρt ξi (t) =Rt0e−ρτ (ρξi (τ ) −dξ (τ )) dτdt i+ e−ρt ξi (t) == −e−ρτ ξi (τ )|t0 + e−ρt ξi (t) = ξi (0) .Используя (2.22), получимβi (t) = Aξi´11ρx(t) − x (t) x(t) + Bξi (ρx(t) − x0 (t)) + ρCξi .222³10(2.24)Как было показано в (2.17) динамика развития популяции при кооперации имеет видx0 (t) = (ρ − ε)(x(t) − K) .Подставив в (2.24) и упростив, получим утверждение теоремы.100Результаты моделированияДля моделирования использовались реальные данные о многотычинковом сиге озераСямозеро [85].
Для восстановления численности сига был использован матричный методоценки запаса [1]. Данные и результаты оценки приведены в приложении. Полученныеоценки размера популяции за длительный период позволили оценить параметры функцииразвития. Для моделирования использовалась функция развития популяции в видеF (x) = εx(t) + α ,где ε – коэффициент внутреннего роста, α – предельно допустимая численность.Для данной функции полученные выше результаты верны приK=p1 k2 + p2 k1 − 2αk1 k2.2εk1 k2В озере Сямозеро можно выделить 4 района, в которых ведется лов сига. Основываясьна данных наблюдений в этих районах за ряд лет можно сделать вывод, что в р-не 1находится 16 % от всей численности популяции, в р-не 2 – 25 %, в р-не 3 – 11% и в р-не 4 –48%.
Для моделирования соединим три первых района в один и, таким образом, получимдве части озера с примерно одинаковой численностью сига.Итак, моделирование было проведено для следующего набора параметров:ε = 0.01 ,α = −100 ,ρ = 0.015 ,p1 = 70 ,p2 = 85 ,sc = 0.5 ,µ1 = 0.55 , µ2 = 0.45 , q1 = q2 = 0.002 .Регулируемое равновесие с участием центраРассмотрим случай, когда после отклонения игрок возвращается к начальному кооперативному поведению. Пусть k1 = k2 = 1 . Начальный размер популяции x(0) = 5000.
Моментвремени отклонения второго игрока t0 = 10 и размер отклонения ∆ = 0.5.Второй игрок отклоняется в момент t0 = 10, а в момент t0 + 1 возвращается к первоначальному кооперативному поведению.Далее на рисунках показана разница переменных задачи в случае кооперативного поведения (темной линией) и в случае отклонения второго игрока на промежутке [t0 , t0 + 1](светлой линией). На рис. 2.6 представлена динамика популяции. Заметим, что она не меняется при отклонении. На рис.
2.7 и 2.8 показаны промысловые усилия первого и второгоигрока, соответственно.10150001.245001.5140000.8135000.60.530000.425000.2001020300401020301020304040Рис 2.6. Размер популяцииРис 2.7. Стратегия первогоРис 2.8. Стратегия второгоx(t)игрока E1 (t)игрока E2 (t)Результаты моделирования показывают разницу между традиционным и предложенным в диссертационной работе подходами поддержания кооперативного поведения агентов эколого-экономической системы.
В случае, когда игроки сами контролируют поведениедруг друга, первый игрок вынужден также наращивать свои промысловые усилия. Этоприводит к снижению размера популяции и выигрышей участников.Здесь же, заметим, что когда второй игрок отклоняется от кооперативного поведения(увеличивает свои промысловые усилия) на промежутке [t0 , t0 + 1], то первый, наоборот,уменьшает свои промысловые усилия. При этом, размер популяции практически не меняется (см. рис. 2.6).
Это связано с изменением доли территории эксплуатации s(t), которое представлено на рис. 2.9. Видно, что s(t) уменьшается от 0.5 до 0.31 на промежутке[t0 , t0 + 1].На рис. 2.10 и 2.11 представлены выловы первого и второго игроков, соответственно.Заметим, что вылов первого игрока практически не изменяется, тогда как вылов второгоигрока резко падает на промежутке [t0 , t0 + 1].
Уменьшение вылова отклоняющего игрокавызвано уменьшением территории его эксплуатации.0.560.480.46650.4440.4240.430.3820.360.34210.32001020304001020304010203040Рис 2.9. РазделениеРис 2.10. Вылов первогоРис 2.11. Вылов второготерритории s(t)игрокаигрока102Выигрыши игроков при кооперативном поведении составляютJ1c = 5233.346 , J2c = 5776.472 ,при отклонении второго игрока –J1dev = 5233.346 , J2dev = 5749.256 .Таким образом, первый игрок не несет потерь в выигрыше, связанных с наказаниемвторого игрока.
В предложенной схеме поддержания кооперативного поведения агентовэколого-экономической системы с участием центра «честный» игрок имеет преимущество,т.к. изменение территории эксплуатации в качестве наказания отклоняющегося не затрагивает его поведение и выигрыш.В следующем разделе будут приведены результаты моделирования, которые детальнеепоказывают принципиальную разницу подходов поддержания кооперативного поведенияагентов эколого-экономической системы.Динамически устойчивая процедура распределения дележаНа рис.