Автореферат (Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами), страница 4
Описание файла
Файл "Автореферат" внутри архива находится в папке "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами". PDF-файл из архива "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой докторскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени доктора физико-математических наук.
Просмотр PDF-файла онлайн
Текст 4 страницы из PDF
На рис. 2–4 показаны переменныезадачи в случае использования регулируемого равновесия: при кооперативном поведении (жирной линией), при отклонении и наказании второго игрока с применением традиционной схемы (сплошной линией) ис использованием новой схемы с участием центра (пунктиром).E1 (t)1.6x(t)180000E2 (t)1.61.41.41400001.211.21200000.811000000.60.8160000010203040Рис.2.Размерпопуляции50 t010203040Рис.3.Стратегииигрока 150 t01020304050 tРис.4.Стратегииигрока 2Таким образом, при регулировании кооперативного поведения с участием центра «честный» агент, в отличии от традиционной схемы, уменьшает интенсивность эксплуатации, но его прибыль увеличивается из-за14изменения территории эксплуатации.
Заметим также, что при использовании новой схемы кооперативного регулируемого равновесия состояние возобновляемого ресурса лучше, чем при традиционной.В третьей главе исследованы методы стимулирования кооперативного поведения агентов эколого-экономической системы в дискретныхтеоретико-игровых моделях управления возобновляемыми ресурсами.Раздел 3.1 посвящен определению равновесных стратегий в традиционной модели «рыбных войн» (Levhari D., Mirman L.J., 1980) с динамикой развития популяции видаxt+1 = (xt )α , t = 0, 1, .
. . ,где 0 < α ≤ 1. Выигрыши агентов, эксплуатирующих популяцию, имеют логарифмический вид, что связано с задачей максимизации темповроста функции производства (в данном случае – вылова).В разделе 3.2 описаны методологические схемы стимулированиякооперативного поведения агентов в дискретных задачах управлениявозобновляемыми ресурсами и условия, поддерживающие кооперативное поведение участников.
Сформулировано новое условие, стимулирующее рациональное поведение на каждом шаге.Рассмотрим теоретико–игровую модель управления возобновляемыми ресурсами в дискретном времени. В игре участвуют агенты (страны или фирмы), эксплуатирующие ресурс на бесконечном промежуткевремени. Динамика развития возобновляемого ресурса с учетом эксплуатации описывается уравнениемxt+1 = f (xt , ut ) , x0 = x ,(12)где xt ≥ 0 – размер эксплуатируемого ресурса в момент времени t,uit ≥ 0 – стратегия (интенсивность эксплуатации) i-го игрока в моментвремени t, i = 1, . . .
, n, ut = (u1t , . . . , unt ), f (xt , ut ) – функция развитиявозобновляемого ресурса.Агент эколого-экономической системы заинтересован в максимизации бесконечной суммы дисконтированных «мгновенных» выигрышей:∞XJi =δ t gi (ut ) → max ,(13)uit ≥0t=0где gi (ut ) – прибыль агента i в момент времени t, δ – коэффициентдисконтирования, 0 < δ < 1.1NnNОбозначим uNt = (ut , .
. . , ut ) – равновесие по Нэшу в игре (12),(13). При кооперации агентов максимизируется общий дисконтированный доход на бесконечном промежутке времени:∞nXXJc =δtgi (ut ) → max .(14)t=0стратегий ucti=1nc(u1ct , . . . , ut )utПусть набор=является решением задачи(12), (14) и xct – кооперативная траектория, полученная при замыкании15уравнения (12) набором стратегий uct .∞PPОбозначим выигрыш коалиции S ∈ N как J S (u) =δtgi (uit ).t=0i∈SОпределим характеристическую функцию V (S, 0) как выигрыш коалиции S в равновесии, где остальные агенты играют индивидуально, т.е.максимизируют свою функцию выигрыша, а коалиция S выступает какодин игрок, т.е.
V (S, 0) = max J S (uN /uS ) , где (uN /uS ) = {ujN , j ∈/ S,ui ,i∈Sui , i ∈ S}. Тогда выигрыши в равновесии по Нэшу имеют вид V (i, 0) == max Ji , i = 1, . . . , n, а при полной кооперации – V (N, 0) = max J c .u1 ,...,unuiКогда характеристическая функция построена, можно определитьnмножество дележейXξ = {ξ(0) = (ξ1 (0), . . . , ξn (0)) :ξi (0) = V (N, 0), ξi (0) ≥ V (i, 0), i = 1, . . . , n}.i=1Аналогично определим характеристическую функцию V (S, t) и множество дележей ξ(t) = (ξ1 (t), .
. . , ξn (t)) в каждой подыгре, начинающейся в момент времени t из состояния xct . В диссертационной работев качестве дележа используется вектор Шепли.Определение 2.4. Дележ ξ = (ξ1 , . . . , ξn ) удовлетворяет условию защиты от иррационального поведения (Yeung D.W.K., 2006), еслиtXδ τ βi (τ ) + δ t+1 V (i, t + 1) ≥ V (i, 0) , i = 1, .
. . , n(15)τ =0для t ≥ 0, где β(t) = (β1 (t), . . . , βn (t)) – динамически устойчиваяпроцедура распределения дележа (ПРД) (Петросян Л.А., 1977, Петросян Л.А., Данилов Н.Н., 1982).Это условие гарантирует участникам кооперации, что даже в случаерасторжения кооперативного соглашения их выигрыш будет не меньше,чем при изначальном некооперативном поведении. В диссертационнойработе предлагается новое условие, которое является более сильным ипроще проверяемым.Определение 2.5. Дележ ξ = (ξ1 , . .
. , ξn ) удовлетворяет условию,стимулирующему рациональное поведение на каждом шаге, еслиβi (t) + δV (i, t + 1) ≥ V (i, t) , i = 1, . . . , n(16)для t ≥ 0, где β(t) = (β1 (t), . . . , βn (t)) – динамически устойчивая ПРД.Предложенное условие дает стимул агенту эколого-экономическойсистемы поддерживать кооперацию поскольку на каждом шаге он получает от нее больше выгоды, чем от некооперативного поведения.Для моделей управления возобновляемыми ресурсами с логарифмическими и квадратичными выигрышами построены оптимальные стратегии агентов эколого-экономической системы, кооперативное регулируемое равновесие в традиционной постановке и доказано выполнениекак классического условия Янга (15), так и условия, стимулирующего16рациональное поведение на каждом шаге (16).В разделе 3.3 разработанные методы поддержания кооперативного поведения агентов применены для модели разделения экологическихресурсов типа «рыбных войн» с участием центра.
Получены некооперативные и кооперативные стратегии участников и доказаны свойстваполученных оптимальных решений.Агентами эколого-экономической системы являются центр (арбитр),который разделяет эксплуатируемую территорию на две части: s и1 − s, и игроки (страны или фирмы), эксплуатирующие возобновляемый ресурс на своей выделенной территории.Динамика развития ресурса описывается уравнениемxt+1 = (εxt − (1 − s)xt ut1 − sxt ut2 )α , x0 = x ,(17)где xt ≥ 0 – размер эксплуатируемой популяции в момент t, ε ∈ (0, 1)– коэффициент естественной выживаемости, α ∈ (0, 1) – коэффициентестественного роста популяции, uti ≥ 0 – промысловые усилия игрока iв момент времени t, i = 1, 2.При кооперации игроки максимизируют общий дисконтированныйдоход на конечном или бесконечном промежутке времени:nXδ t (µ1 ln((1 − s)xt ut1 ) + µ2 ln(sxt ut2 )) → max ,(18)t=0∞Xut1 ,ut2 ≥0δ t (µ1 ln((1 − s)xt ut1 ) + µ2 ln(sxt ut2 )) → max ,ut1 ,ut2 ≥0t=0(19)где δ ∈ (0, 1) – общий коэффициент дисконтирования, µ1 , µ2 ∈ (0, 1) –весовые коэффициенты (µ1 +µ2 = 1), отражающие значимость игроков.Для поддержания кооперативного поведения используется кооперативное регулируемое равновесие в новой постановке, где центр наказывает игроков за отклонение от кооперативного равновесия путем изменения территории эксплуатации.Теорема 3.3.
Кооперативное регулируемое равновесие в задаче (17),(18) имеет видεµ1εµ2γ1t (ut2 ) = t, γ2t (ut1 ) = t, t = 1, . . . , n ,P jPj s∗ta (1 − s∗t)a21j=0scj=01 − sc=s +(u1 − uctгде= s − ct (u2 −1 ) , t = 1, . . . , n .u2uct1Кооперативное регулируемое равновесие в задаче (17), (19) –εµ1 (1 − a)εµ2 (1 − a)γ1 (u2 ) =,γ2 (u1 ) =,∗∗1−ss21sc1 − scгде s∗2 = sc − c (u2 − uc2 ) , s∗1 = sc +(u1 − uc1 ) .u2uc1При этом кооперативные стратегии игроков в n-шаговой игре:s∗t2cuct2 ),s∗t1c17εµ2, a = αδ , t = 1, . . . , n ,tPaj (1 − sc )aj scj=0εµ1 (1 − a) j=0εµ2 (1 − a)а в (17), (19) – uc1 =, uc2 =.c1−sscСледствие 3.1.
Вид кооперативного регулируемого равновесия сохраняется и в случае с более чем одним отклонением.Следствие 3.2. При бесконечном числе шагов стационарный размерпопуляции при отклонении совпадает со стационарным размером популяции в случае кооперативного поведения.Следствие 3.3. Выполнено условие регулируемого равновесия, т.е.наказание отклоняющегося агента (в данном случае – второго) приводит к уменьшению его выигрыша, а именно J2dev ≤ J2c .При этом агент (в данном случае – первый), придерживающийся кооперативного договора, имеет преимущество, а именно J1dev ≥ J1c .Здесь Jic – выигрыш i-го игрока при использовании обоими агентамикооперативных стратегий, Jidev – выигрыш i-го игрока при отклонениии наказании второго агента, i = 1, 2.Следствие 3.4.
Размер наказания отклонившегося игрока уменьшается с увеличением числа шагов, т.е. Dn+1 < Dn , Dn = J2cn − J2dev n .Аналогичные исследования проведены для моделей, в которых функция развития зависит от размера эксплуатируемой территории. Для модели с бесконечным горизонтом планирования построена динамическиустойчивая процедура распределения дележа и доказано выполнениеусловий, стимулирующих кооперативное поведение.В разделе 3.4 исследуется дискретная теоретико-игровая модельуправления возобновляемыми ресурсами, учитывающая существованиемиграционного обмена между эксплуатируемыми участками. В явномвиде получены равновесие по Нэшу и кооперативное равновесие для бесконечного периода планирования. Для поддержания кооперативного соглашения построено кооперативное регулируемое равновесие в случае,когда центр наказывает агентов за отклонение.
Также исследован случай участия центра в данной конфликтной ситуации, в которой он стремится максимизировать общий размер эксплуатируемой популяции. Получены в аналитическом виде вектор Шепли и динамически устойчиваяпроцедура распределения дележа. Доказано выполнение условия, стимулирующего рациональное поведение на каждом шаге.Раздел 3.5 посвящен исследованию модели управления возобновляемыми ресурсами (12)–(13) со многими участниками. Разработан метод построения характеристической функции, учитывающий наличиеинформации у агентов о формировании коалиции.Традиционно функция выигрыша коалиции строится в предположеuct1 =εµ1tP, uct2 =18нии, что игроки вне коалиции играют совместно против коалиции (антагонистическая игра).