Диссертация (1145439), страница 31
Текст из файла (страница 31)
Можнонаглядно увидеть как ПРД распределяет общий выигрыш (компоненту вектора Шепли –ξi (0)) по времени продолжения игры.Теперь сравним состояние популяции и выигрыши игроков при двух предложенныхсхемах построения характеристической функции.На рис. 3.17 представлена динамика развития популяции в модели без информации (темная линия) и с информацией (светлая). Заметим, что в первом случае размер популяциибольше. Таким образом, состояние экологической системы лучше, когда коалиция формируется тайно. Аналогичный результат получен и для выигрышей игроков в коалиции (см.рис. 3.18).
Выигрыш в модели с неинформированными игроками больше, чем в открытоймодели. А для индивидуальных игроков ситуация противоположная (см. рис. 3.19). Приформировании коалиции с информированными игроками их выигрыш больше.186VK(t)Vi(t)-16-18-3-20-22-3.5-24-26-4-28-30-4.5-3202468101214161820-5t0Рис. 3.18. Выигрыш игрока, не2468101214161820tРис. 3.19. Размер популяцииучаствующего в коалиции KТаким образом, при использовании обеих представленных схем построения характеристической функции устанавливается щадящий режим эксплуатации ресурса.
При этомданный эффект более выражен в модели без информации.Естественным полученным результатом является то, что участникам коалиции выгоднеене информировать остальных игроков о ее формировании. Так как, зная о сформировавшейся коалиции (модель с информацией), индивидуальные игроки меняют свои стратегии,увеличивая выигрыш по сравнению с первой моделью.3.5.3. С–ядроРассмотрим развитие представленной игры вдоль кооперативной траектории. Сначалапокажем, что С–ядро в задаче (5.3), (5.4) не пусто.С–ядро – это еще один способ разделения кооперативного выигрыша между участниками коалиции в следующей форме:ξi (t) ≥ Vi (xt ) ,Xξi (t) ≥ VK (xt ) ,i∈KXξi (t) = VN (xt ) .i∈NРассмотрим компоненту вектора Шепли i-го игрока, полученную в предыдущих разделахξi (t) =111ln xt +(Bi +ln(1 + (n − 1)(1 − a)) − ln n) .1−a1−δ1−aЛегко видеть, чтоξi (t) ≥ Vi (xt ) =11ln xt +Bi .1−a1−δ187Используя лемму 5.1 получимXξi (t) − VK (xt ) =i∈Kkk1=ln xt +(Bi +ln(1 + (n − 1)(1 − a)) − ln n)−1−a1−δ1−ak1k−ln xt +(Bi +ln(1 + (k − 1)(1 − a)) − ln k) =1−a1−δ1−a³ 1 + (n − 1)(1 − a) ´³n´k=ln− ln≥01−a1 + (k − 1)(1 − a)kиXi∈Nξi (t) =n1nln xt +(Bi +ln(1 + (n − 1)(1 − a)) − ln n) = VN (xt ) .1−a1−δ1−aСледовательно, С–ядро не пусто.Заметим, что компоненты динамически устойчивой процедуры распределения дележа,полученной в предыдущих разделах, идентичны для всех игроков:βi (t) =1(ln xt − δ ln xt+1 ) + Bi + Bξ .1−aПоэтому, для того чтобы определить другое решение (не лежащее в «центре» С–ядра)в диссертационной работе предлагается найти решение задачи оптимизации видаξi (t) ≥ Vi (xt ) ,Xξi (t) ≥ VK (xt ) ,i∈KXξi (t) = VN (xt ) ,i∈Nξi (t) − δξi (t + 1) ≥ Vi (xt ) − δVi (xt+1 )(5.23)с некоторым функционалом, зависящим от времени.Например, рассмотрим следующий функционал:TXβ1 (t) −→ max .(5.24)t=0Данный выбор можно интерпретировать следующим образом: среди всех идентичныхигроков выбирается лидер (в данном случае – первый игрок), который должен получитьнаибольшую долю общего кооперативного выигрыша.188b1(t)b2(t)b3(t)-1.6-1.6-1.6-1.8-1.8-1.8-2-2-2-2.2-2.2-2.2-2.4-2.4-2.4-2.6-2.6-2.6-2.8-2.801234t-2.801234t01234tРис.
3.20. ПРД первогоРис. 3.21. ПРД второгоРис. 3.22. ПРД третьегоигрока β1 (t)игрока β2 (t)игрока β3 (t)Приведем результаты численного решения задачи (5.23), (5.24) с тремя игроками и горизонтом планирования T = 5. Остальные параметры задачи аналогичны разделу 3.5.3.На рис. 3.20–3.22 представлены компоненты динамически устойчивой процедура распределения дележа для трех игроков.
Сплошной линией обозначено решение задачи линейногопрограммирования (5.23), (5.24), а пунктиром – ПРД (идентичное для всех игроков), полученное в предыдущих разделах.Заметим, что решение задачи (5.23), (5.24) дает первому игроку компоненту дележаβ1 (t) больше, чем в случае равного распределения.
Компонента дележа второго игрокастановится меньше, а третьего практически не меняется. Как и следовало ожидать, выделение одного из игроков в качестве лидера приводит к увеличению его доли кооперативноговыигрыша за счет уменьшения (непропорционального) выигрышей других участников коалиции.189Глава 4. Задачи управления возобновляемыми ресурсамис асимметричными агентамиВ данной главе представлены результаты исследования теоретико-игровых задач управления возобновляемыми ресурсами, учитывающих асимметрию агентов эколого-экономической системы. Рассмотрены следующие варианты несимметричности: различие в территории эксплуатации (раздел 4.1), использование различных коэффициентов дисконтирования (раздел 4.2) и различные горизонты планирования (раздел 4.3). При этом в первоймодели основное внимание уделяется проблеме устойчивости принятых соглашений, а впоследующих – методам построения кооперативного решения.В кооперативной теории игр важным показателем целесообразности формирования коалиций являются понятия внутренней и внешней устойчивости [100].
Внутренняя устойчивость означает, что игроку невыгодно выходить из коалиции и становиться индивидуальным игроком. А внешняя устойчивость означает, что независимому игроку невыгодноприсоединяться к коалиции. При этом данные понятия применяются в ситуации, когдаможет быть сформирована только одна коалиция. В представленной в разделе 4.1 модели формируются два соглашения, следовательно, должны учитываться стимулы переходаигроков из одной коалиции в другую.
Поэтому, в диссертационной работе введены понятия коалиционно внутренней и внешней устойчивости, учитывающие возможность переходамножества игроков из одной коалиции в другую. Показано, что коалиционная устойчивостьдает возможность формирования устойчивых коалиций большой размерности.В разделе 4.2 представлены результаты исследования модели, в которой агенты экологоэкономической системы используют различные коэффициенты дисконтирования. Основнойпроблемой в данной ситуации является то, что нет возможности определить выигрыши игроков при кооперативном поведении стандартными способами. В диссертационной работедля построения кооперативного выигрыша и распределения его между агентами предложено использование арбитражной схемы Нэша.
При этом исследованы два способа решенияданной задачи: построение общего коэффициента дисконтирования (раздел 4.2.1) и построение кооперативных выигрышей без его использования (раздел 4.2.2).При применении первого способа показано, что, если кооперативный выигрыш распределяется между агентами пропорционально их коэффициентам дисконтирования, то существует общий коэффициент дисконтирования, и определены условия его существования.Далее, предполагая, что кооперативный выигрыш распределяется в некоторой пропорции,необходимо определение двух параметров: доли выигрыша и общего коэффициента дискон-190тирования.
Найдены условия существования таких параметров, а для выбора конкретныхиз них предложено использование арбитражной схемы Нэша.При решении данной задачи без использования общего коэффициента дисконтированияпредложено две варианта. В первом из них кооперативные стратегии и выигрыши определяются из решения арбитражной схемы для всего периода продолжения игры. Во второмже – арбитражная схема применяется на каждом шаге для определения кооперативногоповедения. При этом точкой статус-кво является некооперативный выигрыш на каждомшаге. Показано, что при использовании обеих схем выигрыши агентов и размер эксплуатируемого ресурса больше, чем при некооперативном поведении.В разделе 4.3 исследованы модели, в которых агенты эколого-экономической системыразличаются не только коэффициентами дисконтирования, но и временами участия в процессе эксплуатации ресурса.
Рассмотрены случаи фиксированных горизонтов планирования (раздел 4.3.2) и времен участия, выраженных дискретными случайными величинами сзаданными распределениями (раздел 4.3.3). Основной задачей является построение кооперативных стратегий и выигрышей агентов в случае различных горизонтов планирования.Определение кооперативного поведения в данном случае не было исследовано ранее. Стоитотметить только работы [121], [188], в которых горизонт планирования является случайнойвеличиной с заданным распределением.Модель со случайными временами участия в процессе эксплуатации является наиболееприближенной к реальности, так как внешние случайные процессы могут вызвать расторжение кооперативного договора. Агент не может в данном случае предсказать возможностьвыхода партнера из кооперации, и необходимо учитывать данное обстоятельство при определении кооперативных выигрышей.