Диссертация (Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами), страница 13
Описание файла
Файл "Диссертация" внутри архива находится в папке "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами". PDF-файл из архива "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой докторскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени доктора физико-математических наук.
Просмотр PDF-файла онлайн
Текст 13 страницы из PDF
Доход при отклонении любого участника будет меньше, чем его доход прииспользовании кооперативной стратегии. Применение данной схемы поддержания кооперативного поведения агентов эколого-экономической системы представлено на рис. 2.1. Впредложенной в [103] схеме кооперативного регулируемого равновесия игрок, соблюдающий кооперативный договор наказывает отклоняющегося изменением своей кооперативнойстратегии на величину, пропорциональную величине отклонения.(u2i(t),g2(u1i(t))Агент 1Агент 2J2(g1(u2),u2)(u1i(t),g1(u2i(t))J1(u1,g2(u1))u11(t)...u1n(t)u21(t)......ресурс1u2n(t)ресурс nэкологическая системаРис 2.1.
Кооперативное регулируемое равновесиеВ диссертационной работе предлагается новая схема кооперативного регулируемого равновесия, где контроль над соблюдением кооперативного договора является задачей центра.Стратегия центра здесь – разделение территории эксплуатации. Таким образом, территория разделяется на две части: s(t) и 1 − s(t), где участники эксплуатируют возобновляемыйресурс.Динамика развития и функционалы выигрышей агентов имеют вид (1.1)–(1.5), но стратегии участников теперь зависят от s, т.е.ui (t) = ui (t, s(t)) .Пусть набор стратегий uc (t) = (uc1 (t, sc ), . . .
, ucn (t, sc )) является кооперативным равновесием в задаче (1.1),(1.4) (или (1.1),(1.5)), а sc = const – разделение территории при соблюдении кооперативного договора.67Предлагается новая схема кооперативного регулируемого равновесия, в которой агент,нарушивший договоренности, достигнутые в начале периода планирования, наказываетсяцентром изменением территории эксплуатации.Определение 1.2. Пара стратегии (γ1 , γ2 ) называется кооперативным регулируемымравновесием, еслиuc1 (t, sc ) = γ1 (uc2 (t, sc )) , uc2 (t, sc ) = γ2 (uc1 (t, sc )) ,J1 (uc1 (t, sc ), uc2 (t, sc )) ≥ J1 (u1 (t, s(t)), γ2 (u1 (t, s(t)))) ∀u1 ∈ U1 , 0 ≤ s(t) ≤ 1 ,J2 (uc1 (t, sc ), uc2 (t, sc )) ≥ J2 (γ1 (u2 (t, s(t))), u2 (t, s(t))) ∀u2 ∈ U2 , 0 ≤ s(t) ≤ 1 .Применение новой схемы поддержания кооперативного поведения агентов эколого-экономической системы представлено на рис.
2.2. В разработанной схеме кооперативного регулируемого равновесия центр наказывает отклоняющегося агента изменением территорииэксплуатации на величину, пропорциональную величине отклонения. В диссертационнойработе в явном виде получены стратегии агентов эколого-экономической системы и коэффициенты пропорциональности для моделей управления возобновляемыми ресурсами сконечным и бесконечным горизонтами планирования.Центрs(t) I(t,s,u1,u2) 1-s(t)J1(t,s)ресурс1Агент 1u11(t,s) ...u21(t,s)Агент 2J2(t,s)...u2n(t,s)u1n(t,s)ресурс nэкологическая системаРис 2.2. Новая схема кооперативного регулируемого равновесияВ разделе 2.2 для задачи управления возобновляемыми ресурсами с бесконечным горизонтом планирования в качестве метода поддержания кооперации также применяетсядинамически устойчивая процедура распределения дележа. Приведем необходимые определения.68Обозначим выигрыш любой коалиции S ∈ N как J S (u) =R∞0e−ρtPgi (x(t), u(t)).i∈SДля кооперативного варианта нашей игры определим характеристическую функциюVS (0) как выигрыш коалиции S в равновесии, где остальные участники играют индивидуально, т.е.
максимизируют свою функцию выигрыша, а коалиция S выступает как одинигрок: VS (0) = max J S (uN /uS ) , где (uN /uS ) = {uN/ S, ui (t), i ∈ S}. Тогда выигрыj (t), j ∈ui (t),i∈Sши в равновесии по Нэшу имеют вид Vi (0) = max Ji , i = 1, . . . , n, а при полной кооперацииui (t)– VN (0) =maxu1 (t),...,un (t)cJ .Когда характеристическая функция определена, можно определить множество дележей(способ разделения общего кооперативного выигрыша между агентами)nXξ = {ξ(0) = (ξ1 (0), . . .
, ξn (0)) :ξi (0) = VN (0), ξi (0) ≥ Vi (0), i = 1, . . . , n}.i=1Аналогично определим характеристическую функцию VS (t) и множество дележей ξ(t) =(ξ1 (t), . . . , ξn (t)) в каждой подыгре, начинающейся в момент времени t из состояния xc (t).Далее необходимо определить критерий выбора одного из дележей: это может быть пропорциональное решение, С–ядро, n–ядро, вектор Шепли и др.В дальнейших разделах диссертационной работы используется вектор Шепли, который является одним из самых популярных механизмов распределения общего выигрыша втеории кооперативных игр.
Он определяет правило разделения кооперативного выигрышамежду участниками кооперации какX (n − |K|)!(|K| − 1)![VK − VK\{i} ] , i ∈ N = {1, . . . , n} ,ξi =n!i∈K, K⊆N(1.6)где n – число игроков, |K| – число игроков в коалиции K, VK – выигрыш коалиции K иVK\{i} – выигрыш коалиции K без игрока i.Определение 1.3. Вектор β(t) = (β1 (t), .
. . , βn (t)) называется процедурой распределениядележа (ПРД) [49], [50], еслиZ∞ξi (0) =e−ρt βi (t) , i = 1, . . . , n .(1.7)0Основная идея этой схемы заключается в распределении кооперативного выигрыша повсему периоду продолжения игры. Тогда βi (t) можно интерпретировать как выплату агентуi в момент времени t.Определение 1.4. Вектор β(t) = (β1 (t), . . . , βn (t)) называется динамически устойчивойПРД [48], [49], если для любого t ≥ 0Z tξi (0) =e−ρτ βi (τ ) dτ + e−ρt ξi (t) , i = 1, .
. . , n .0(1.8)69Здесь игроки, следуя кооперативной траектории, придерживаются одного и того жепринципа оптимальности в каждый текущий момент времени и поэтому не имеют объективных мотивов отклоняться от ранее выбранного решения о кооперации.Приведем примеры построения схем поддержания кооперативного поведения для игрыдвух лиц с линейной функцией развития возобновляемого ресурса.2.1.1. Модель с линейной функцией роста и конечным горизонтом планированияРассмотрим теоретико-игровую модель эколого-экономической системы эксплуатациивозобновляемого ресурса с двумя агентами. Динамика развития популяции с учетом эксплуатации описывается уравнениемx0 (t) = εx(t) − u1 (t) − u2 (t) , x(0) = x0 , t ∈ [0, T ] ,(1.9)где x(t) ≥ 0 – численность популяции в момент времени t, ε > 0 – коэффициент естественного роста популяции, ui (t) ≥ 0 – стратегия (вылов) игрока i в момент времени t,i = 1, 2.Выигрыши агентов на промежутке [0, T ] имеют видZTe−ρt [ui (t)(pi − ci ui (t))]dt ,Ji = gi (x(T )) +(1.10)0где ci > 0 – затраты на вылов для i-го игрока, pi > 0 – рыночная цена продажи единицыресурса, i = 1, 2, ρ – коэффициент дисконтирования, 0 < ρ < 1.Таким образом, выигрыш игрока представляется доходом, который зависит от разницымежду прибылью от продажи ресурса и затратами на вылов с учетом дисконтирования.При этом предполагается квадратичная зависимость затрат от вылова.Функция gi (x) описывает будущий доход от эксплуатации запасов в конечный моментвремени T , и примем стандартные предположения о функции полезности: gi0 (x) ≥ 0,gi00 (x) ≤ 0.Обозначим p̂i = pi e−ρt , ĉi = ci e−ρt .
И наложим ограничение на параметры задачи ε > 2ρ.Тогда выигрыши игроков запишутся таким образомZTJi = gi (x(T )) +[ui (t)(p̂i − ĉi ui (t))]dt , i = 1, 2 .(1.11)0Сначала рассмотрим случай индивидуального поведения агентов, т.е. ситуацию равновесия по Нэшу.70Теорема 1.1. Оптимальные по Нэшу стратегии игроков в задаче (1.9)–(1.11) имеют видuNi (t) =p̂i − eε(T −t) gi0 (xN (T ))pi − eεT e(ρ−ε)t gi0 (xN (T ))=, i = 1, 2.2ĉi2ciРазмер популяции при некооперативном поведении –p1 c2 + p2 c1(1 − eεt ) +2c1 c2h c g 0 (xN (T )) + c g 0 (xN (T )) i2 11 2(eεt − e−εt ) .+eεT eρt4εc1 c2xN (t) = x0 eεt +Доказательство.
Используем принцип максимума Понтрягина [57]. Гамильтониан первогоигрока имеет видH1 (u1 , u2 , x) = p̂1 u1 − ĉ1 (u1 )2 + λ1 (εx − u1 − u2 ) ,откуда, максимизируя, получим, что оптимальная по Нэшу стратегия первого игрока примет видuN1 =p̂1 − λ1 (t),2ĉ1где λ1 (t) – сопряженная переменная, удовлетворяющая уравнениюλ01 (t) = −∂H1 (u1 , u2 , x)= −ελ1 (t) , λ(T ) = g10 (x(T )).∂xРешая сопряженное уравнение, получим стратегию первого игрока в виде, указанном вформулировке теоремы. Аналогично действуем и для второго игрока.При этом уравнение динамики развития популяции примет видx0 (t) = εx(t) −p̂1 − eε(T −t) g10 (xN (T )) p̂2 − eε(T −t) g20 (xN (T ))−, x(0) = x0 ,2ĉ12ĉ2решая которое, получим некооперативную траекторию xN (t).Для допустимости (неотрицательности) полученных стратегий необходимо выполнениеусловий pi − eεT e(ρ−ε)t gi0 (xN (T )) ≥ 0. Так как данная функция возрастает по t, то достаточно проверить при t = 0.
Таким образом, условия допустимости оптимальных стратегийпринимают видpi e−εT ≥ gi0 (xN (T )) , i = 1, 2 .p1 c2 + p2 c1p1 c2 + p2 c1возрастает, а при x0 <2c1 c22c1 c2c2 g10 (xN (T )) + c1 g20 (xN (T ))убывает неограниченно приближаясь при t → ∞ к величине.4εc1 c2Хотя принцип максимума и является только необходимым условием оптимальности, ноЗаметим, что размер популяции при x0 ≥для линейно-квадратичной задачи он является и достаточным [27]. Покажем достаточностьдля нашей модели.71Зафиксируем uN2 (t) и рассмотрим задачу максимизации прибыли первого игрока.