Автореферат (Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами), страница 3
Описание файла
Файл "Автореферат" внутри архива находится в папке "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами". PDF-файл из архива "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой докторскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени доктора физико-математических наук.
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
Такимобразом, I1 отражает затраты центра на восстановление популяции;ZTI2 = − (U (t) − x̂(t))2 dt ,(4)0где U (t) = qE(t)(1 − s(t))x(t) – вылов игрока в момент времени t, x̂(t)– уровень потребления, определяемый спросом. В данном варианте выигрыш центра – это затраты на удовлетворение спроса населения.Было проведено численное моделирование и получены значения выиг-15000010000030500009s=0s=0.2s=0.5s=0.7s=0.906Ãîä×èñëåííîñòü, øò.200000рышей агентов. Среди точек, определяемых данными выигрышами исоставляющих оптимальное по Паретомножество, найдены арбитражные решения Нэша и Калаи–Смородинского.
Нарис. 1 представлена динамика развитияпопуляции лосося в оз. Онежском приразличных долях закрытой территории.Рис.1.Популяция лососяВ разделе 1.3 предполагается, что стратегия центра – это непрерывная функция s(t). При использовании в качестве функции выигрыша центра затрат на восстановление популяции (3) построены кусочно10непрерывные стратегии агентов специального вида и доказана их оптимальность.В предположении непрерывности одной из сопряженных переменных построены все возможные оптимальные стратегии и определенымоменты переключения.Теорема 3.3. Предполагая непрерывность функции λ1 (t), равновеснаяпо Нэшу стратегия центра в задаче (1), (2), (3) может быть только½трех видов:1 , (λ1 (t) > 0) t < t0 ,∗∗1) s (t) ≡ 0, t ∈ [0, T ] ; 2) s (t) =0 , (λ1 (t) < 0) t > t0 ;3) s∗ (t) ≡ 1, t ∈ [0, T ].Для конкретных значений параметров задачи оптимальной стратегией является одна из этих трех.
При этом равновесные по Нэшустратегии игрока имеют вид(p − λ̄2 (t))qx(t) − c0, t ∈ [0, T ], где λ̄2 (t) и x(t) удовлетворяют1) E ∗ (t) =2kq 2 x(t)2³ x(t) ´1 ³c0 ´ 10−pq−+ λ̄2 (t) , x (t) = rx(t) 1−K2kqx(t)2k³´ (5)³´cc2rx(t)c000pq−−λ̄(t)r−−−ρ λ̄02 (t) = −22kq 2 x(t)2x(t)K2kqx(t)20ρTс начальными данными x(0) = x0 , λ̄2 (T ) = gx (x(T ))e ;0 , t < t0 ,(p − λ̄2 (t))qx(t) − c02) E ∗ (t) =, t > t0 ,2kq 2 x(t)2где λ̄2 (t) и x(t) удовлетворяют системе (5) с начальными даннымиx0 Kx(t0 ) =, λ̄2 (t0 ) = c2 (x0 + e−rt0 (K − x0 ))2 e(r+ρ)t0 ;x0 + e−rt0 (K − x0 )3) E ∗ (t) ≡ 0, t ∈ [0, T ].Для оптимальности таких стратегий должны выполняться условия2c0px(t) >, λ̄2 (t) < .pq4При использовании в качестве функции выигрыша центра затратна удовлетворение спроса (4) найдены оптимальные по Нэшу стратегииучастников и условия их существования.Вторая глава диссертационной работы посвящена методам поддержания кооперативного поведения агентов в теоретико-игровых моделяхуправления возобновляемыми ресурсами с непрерывным временем.
Вразделе 2.1 описаны методологические схемы поддержания кооперативного поведения.Рассмотрим динамическую модель эколого-экономической системыв непрерывном времени. Агенты (страны или фирмы) эксплуатируют11возобновляемый ресурс на конечном или бесконечном промежутке времени. Динамика развития ресурса с учетом эксплуатации описываетсяуравнениемx0 (t) = f (x(t), u(t)) , x(0) = x0 ,(6)где x(t) ≥ 0 – размер эксплуатируемого ресурса в момент времени t,ui (t) ≥ 0 – стратегия (интенсивность эксплуатации) i-го агента в моментвремени t, i = 1, .
. . , n, u(t) = (u1 (t), . . . , un (t)), f (x(t), u(t)) – функцияразвития возобновляемого ресурса.При кооперации агентов эколого-экономической системы максимизируется общий дисконтированный доход на конечном или бесконечномпромежутке времени:Z TnnnXXXJ=Ji =e−ρtgi (x(t), u(t))dt +Gi (x(T )) → max(7)i=1или0ZJ=0∞i=1e−ρtnXu(t)i=1gi (x(t), u(t))dt → max ,u(t)i=1(8)где gi (x(t), u(t)) – «мгновенная» прибыль агента i в момент времени t,ρ – коэффициент дисконтирования, 0 < ρ < 1.Пусть набор стратегий uc (t) = (uc1 (t), . .
. , ucn (t)) является решением задачи (6), (7) (или (6), (8)) и xc (t) – кооперативная траектория,полученная при замыкании уравнения (6) набором стратегий uc (t).Стратегией i-го игрока является отображение γi : Uj → Ui (uj ∈ Uj ),i, j=1,2, i6= j, где Ui – множество допустимых стратегий игрока i, i=1,2.Определение 1.1. Пара стратегии (γ1 , γ2 ) называется кооперативным регулируемым равновесием (Ehtamo H., Hamalainen R.P., 1993),еслиuc1 = γ1 (uc2 ) , uc2 = γ2 (uc1 ) ,J1 (uc1 , uc2 ) ≥ J1 (u1 , γ2 (u1 )) ∀u1 ∈ U1 ,J2 (uc1 , uc2 ) ≥ J2 (γ1 (u2 ), u2 ) ∀u2 ∈ U2 .В диссертационной работе предлагается новая схема кооперативногорегулируемого равновесия, где контроль над соблюдением кооперативного договора является задачей центра.
Стратегией центра являетсяразделение территории на две части: s(t) и 1 − s(t), где игроки эксплуатируют ресурс. Динамика развития и функционалы выигрышейагентов имеют вид (6)–(8), но стратегии участников теперь зависят отs, т.е. ui (t) = ui (t, s(t)).Пусть набор стратегий uc (t) = (uc1 (t, sc ), .
. . , ucn (t, sc )) является кооперативным равновесием в задаче (6), (7) (или (6), (8)), а sc = const –разделение территории при соблюдении кооперативного договора.В разработанной схеме кооперативного регулируемого равновесияучастник, нарушивший договоренности, достигнутые в начале игры,наказывается центром изменением территории эксплуатации.12Определение 1.2. Пара стратегии (γ1 , γ2 ) называется кооперативным регулируемым равновесием, еслиuc1 (t, sc ) = γ1 (uc2 (t, sc )) , uc2 (t, sc ) = γ2 (uc1 (t, sc )) ,J1 (uc1 (t, sc ), uc2 (t, sc )) ≥ J1 (u1 (t, s(t)), γ2 (u1 (t, s(t)))) ∀u1 ∈ U1 , s(t) ∈ (0, 1),J2 (uc1 (t, sc ), uc2 (t, sc )) ≥ J2 (γ1 (u2 (t, s(t))), u2 (t, s(t))) ∀u2 ∈ U2 , s(t) ∈ (0, 1).В модели управления возобновляемым ресурсом с линейной функцией роста получены некооперативные и кооперативные стратегии участников и доказана их оптимальность.
Доказано, что использование традиционной схемы поддержания кооперативного поведения невыгодноучастнику, соблюдающему кооперативный договор.Поэтому, в разделе 2.2 исследована новая схема поддержания кооперативного поведения с участием центра. Итак, центр разделяет эксплуатируемую территорию на две части: s(t) и 1 − s(t), где два игрокаэксплуатируют возобновляемый ресурс на протяжении конечного промежутка времени [0, T ]. Динамика развития популяции с учетом эксплуатации описывается уравнениемx0 (t) = εx(t) − q1 E1 (t)(1 − s(t))x(t) − q2 E2 (t)s(t)x(t) , x(0) = x0 , (9)где x(t) ≥ 0 – размер популяции в момент времени t, ε ≥ 0 – коэффициент внутреннего роста, E1 (t), E2 (t) ≥ 0 – промысловые усилия игроковв момент времени t и q1 , q2 > 0 – коэффициенты возможного вылована единицу промысловых усилий игроков.Предполагаем, что E1 , E2 принадлежат множеству допустимых стратегий D1 , D2 .
Пусть D1 = D2 ⊆ C([0, ∞)).Выигрыши игроков на промежутке [0, T ] имеют следующий вид:ZTJ1 = g1 (x(T ))+ e−ρt [q1 E1 (t)(1 − s(t))x(t)(p1 − k1 q1 E1 (t)(1 − s(t))x(t))]dt ,ZT0J2 = g2 (x(T )) + e−ρt [q2 E2 (t)s(t)x(t)(p2 − k2 q2 E2 (t)s(t)x(t))]dt, (10)0где pi > 0 – цена продажи ресурса, ki > 0 – затраты на эксплуатацию,0 < ρ < 1 – коэффициент дисконтирования, i = 1, 2.Теорема 2.1. Кооперативное регулируемое равновесие (в смысле определения 1.1) в задаче (9), (10) имеет видE c (t)1γi (Ej (t)) = Eic (t) + ηi (t)(Ej (t) − Ejc (t)) , где η1 (t) = 2c , η2 (t) =,E1 (t)η1 (t)ci, j=1, 2, i6=j, s – разделение территории при кооперативном поведенииобоих игроков, E1c (t), E2c (t) – кооперативные стратегии игроков видаε(T −t) eρt (µ g 0 (xc (T )) + µ g 0 (xc (T )))p1 − µ−11 12 21 e, 0 ≤ µ1 , µ2 ≤ 1 ,E1c (t) =c2k1 q1 (1 − s )x(t)ε(T −t) eρt (µ g 0 (xc (T ))+µ g 0 (xc (T )))p2 −µ−11 12 22 eE2c (t) =, µ1 +µ2 = 1 .
(11)2k2 q2 sc x(t)13Теорема 2.2. Кооперативным регулируемым равновесием (в смыслеопределения 1.2) в задаче (9), (10) являетсяε(T −t) eρt (µ g 0 (xc (T )) + µ g 0 (xc (T )))p1 − µ−11 12 21 eγ1 (E2 (t)) =,2k1 q1 (1 − s∗2 (t))x(t)ε(T −t) eρt (µ g 0 (xc (T )) + µ g 0 (xc (T )))p2 − µ−11 12 22 eγ2 (E1 (t)) =,∗ (t)x(t)2kqs2 2 1ccs1−sгде s∗2 (t) = sc − c (E2 (t) − E2c (t)) , s∗1 (t) = sc + c (E1 (t) − E1c (t)) ,E2 (t)E1 (t)и E1c (t), E2c (t) – кооперативные стратегии игроков (11).В модели с бесконечным горизонтом планирования также построено кооперативное регулируемое равновесие в обоих случаях, а такжеисследована схема поддержания кооперативного поведения, использующая динамически устойчивую процедуру распределения дележа.Во всех моделях данного раздела найдены оптимальные кооперативные и некооперативные стратегии агентов и условия их существования.
Приведены результаты численного моделирования с использованием реальных данных о многотычинковом сиге озера Сямозеро.Раздел 2.3 посвящен исследованию модели с квадратичной функцией развития популяции (модель Ферхюльста). Найдены необходимыеи достаточные условия существования кооперативных стратегий агентов эколого-экономической системы, построены две схемы кооперативного регулируемого равновесия.Проведено численное моделирование, показывающее различие методов поддержания кооперативного поведения и особенности предложенной в диссертационной работе схемы.