Диссертация (Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами), страница 12
Описание файла
Файл "Диссертация" внутри архива находится в папке "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами". PDF-файл из архива "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой докторскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени доктора физико-математических наук.
Просмотр PDF-файла онлайн
Текст 12 страницы из PDF
(3.17) выполняется при выполнении условияλ̄2 (t) < p − 2kx̂.Докажем оптимальность полученного решения.Зафиксируем s∗ и покажем, что J(s∗ , E ∗ ) ≥ J(s∗ , E). Подставляя оптимальные стратегии из системы (3.18) запишемλ02 (t) = −L(t) − M (t)λ2 (t) ,x̂ ³ax̂ ´где L(t) =b−> 0 ∀t приqx(t)qx̂ <p.2kНетрудно показать, как и ранее, что λ2 (t) > 0 ∀t .
ОбозначимH20 (x, λ2 , s∗ ) = max H2 (x, E, λ2 , s∗ ) .E≥0(3.21)61Подставив E ∗ и s∗ , получимH20 (x, λ2 , s∗ ) =c2c(b − λ2 q) (b − λ2 q)2−++ λ2 F (x) .2a(1 − s∗ )2 x2 a(1 − s∗ )x2a0H2xx(x, λ2 , s∗ ) =hi 2r2c3c−(b−λq)− λ2 ,2ax3 (1 − s∗ ) 2x(1 − s∗ )Kгде выражение в квадратных скобках отрицательно приλ2 (t) <b= pe−ρt (λ̄2 (t) < p) .q(3.22)0Следовательно, H2xx(x, λ2 , s∗ ) ≤ 0 , т.е. H20 – вогнута.Используя вогнутость и определение H20 запишем неравенствоH2 (x, E, λ2 , s∗ ) ≤ H20 (x∗ , λ2 , s∗ ) − λ02 (t)(x(t) − x∗ (t)) .Проинтегрировав и упростив, получимJ(s∗ (t), E(t)) ≤ J(s∗ (t), E ∗ (t)) .Таким образом, мы доказали, что E ∗ – оптимальная стратегия игрока при выполнении условий (3.20), (3.21) и (3.22).
При этом (3.22) верно при выполнении условия (3.20).Получаем, что условиями достаточными для оптимальности являются (3.19).Докажем оптимальность s∗ для центра. Для этого зафиксируем E ∗ и вспомним, чтоλ1 (t) = 0. Тогда гамильтониан центра имеет видH1 (x, E ∗ , λ2 , s) = −(qE ∗ (1 − s)x − x̂)2 .ОбозначимH10 (x, E ∗ , λ2 ) = max H1 (x, E ∗ , λ2 , s) .0≤s≤1Подставив E ∗ и s∗ , получимH10 (x, E ∗ , λ2 ) = 0 .СледовательноH1 (x, E ∗ , λ2 , s) < 0 = H10 (x, E ∗ , λ2 , s∗ ) .Откуда, проинтегрировав, получимI2 (s∗ , E ∗ ) ≥ I2 (s, E ∗ ) .Заметим, что вылов, равный qE ∗ (t)(1 − s∗ (t))x∗ (t), всегда равен x̂.62Приведем результаты моделирования для x̂ = 1500.
Для случая, когда начальный размер популяции x(0) = 150000, оптимальная стратегия игрока E ∗ (t) приведена на рис. 1.26.Заметим, что число судов, участвующих в ловле, необходимо поддерживать примерно науровне девяти. При этом, размер популяции возрастет с 150000 до 260000 особей (рис.
1.24)и вылов будет равен 1500 особей в единицу времени (рис. 1.27). Размер оптимальной долизакрытой для эксплуатации территории изображен на рис. 1.25, и он возрастает с 0.45 до0.7.Выигрыш игрока J = 0.148 · 109 и затраты центра нулевые I2 = 0.2600000.72400000.652200000.62000000.551800000.51600000.45020406080100Рис 1.24. Размер популяции x∗ (t)020406080100Рис 1.25. Стратегия центра s∗ (t)15019.81500.59.69.415009.21499.59020406080100Рис 1.26. Стратегия игрока E ∗ (t)1499020406080Рис 1.27.
Вылов U ∗ (t)10063Глава 2. Поддержание кооперативного поведения внепрерывных теоретико-игровых моделях управлениявозобновляемыми ресурсами2.1. Методы поддержания кооперации в непрерывных моделяхВ данной главе исследованы теоретико-игровые задачи управления возобновляемымиресурсами с применением аппарата решения динамических игр. В игре участвует центр(контролирующий орган), который разделяет территорию эксплуатации между участниками, и агенты (страны или фирмы), эксплуатирующие возобновляемый ресурс. Каждый изагентов принимает решение независимо, руководствуясь максимизацией своей прибыли отпродажи ресурса.
В главе 1 диссертационной работы был разработан новый подход, задачей центра в котором является определение оптимальной доли закрытой для эксплуатациитерритории. Автором были исследованы различные модели динамических игр управленияпромысловыми популяциями с участием центра, в которых учитывалось распределениепопуляции по территории, ее возрастная структура, миграция между участками, распределение выигрыша между игроками [36–39], [126–128], [131–136].В данной главе описанный подход с участием центра применяется к задаче разделениятерритории эксплуатации между двумя агентами (игроками) эколого-экономической системы, действующими в кооперации.
Задача поддержания кооперативного поведения агентовособенно важна для управления возобновляемыми ресурсами, что связано с тем, что кооперация благотворно влияет на состояние экологической системы. Особое значение кооперативного регулирования использования «общих ресурсов» было подчеркнуто Нобелевскимлауреатом E. Ostrom [157].Существует несколько методологических схем для исследования задачи определения иподдержания кооперативного соглашения, достигнутого в начале периода планирования.Одной из них является построение кооперативного регулируемого равновесия. Данное понятие было введено в статье [103], и является естественным продолжением работы [155]об устойчивости картеля. Регулируемое равновесие применяется для поддержания кооперативного договора и наказания участников, отклоняющихся от первоначального решенияо кооперации. В традиционном подходе агенты сами контролируют поведение друг друга,наказывая отклонившихся изменением своей оптимальной стратегии.
Построение такогокооперативного регулируемого равновесия показано в данной главе для моделей управления возобновляемыми ресурсами с конечным и бесконечным горизонтом планирования.В диссертационной работе предлагается новая схема поддержания кооперативного по-64ведения агентов, где контроль над соблюдением кооперативного договора является задачей центра. Стратегия центра здесь – разделение эксплуатируемой территории. Участник,нарушивший договоренности, достигнутые в начале периода планирования, наказываетсяцентром изменением территории эксплуатации.
В данной главе предложенная схема поддержания кооперации применена к задачам управления возобновляемыми ресурсами. Приэтом показано принципиальное отличие данной схемы от традиционной, выражающееся вэкономической целесообразности и выгодности для агентов, соблюдающий кооперативныйдоговор.Для поддержания кооперативного поведения агентов эколого-экономической системы вразделе 2.2 применяется динамически устойчивая процедура распределения дележа. Понятие динамической устойчивости впервые было математически формализовано и обоснованоЛ.А. Петросяном [48].
В работе [50] было введено понятие процедуры распределения дележадля кооперативных решений (ПРД). Динамическая устойчивость заключается в том, чтоследуя кооперативной траектории, игроки используют один и тот же принцип оптимальности в каждый момент времени и поэтому не имеют мотивов отклонятся от кооперативногоповедения. Основная идея процедуры распределения дележа заключается в распределениикооперативного выигрыша по всему периоду продолжения игры.При этом во всех моделях данной главы найдены оптимальные кооперативные и некооперативные стратегии агентов эколого-экономической системы и условия их существования.
Приведены результаты численного моделирования с использованием реальных данныхо многотычинковом сиге озера Сямозера.Основные определенияРассмотрим динамическую модель эколого-экономической системы в непрерывном времени. Агенты (страны или фирмы) эксплуатируют возобновляемый ресурс на конечномили бесконечном промежутке времени.Динамика развития ресурса с учетом эксплуатации описывается уравнениемx0 (t) = f (x(t), u1 (t), .
. . , un (t)) , x(0) = x0 ,(1.1)где x(t) ≥ 0 – размер эксплуатируемого ресурса в момент времени t, ui (t) ≥ 0 – стратегия(интенсивность эксплуатации) i-го агента в момент времени t, i=1, . . . , n,f (x(t), u1 (t), . . . , un (t)) – функция развития возобновляемого ресурса.Обозначим u(t) = (u1 (t), . . . , un (t)) – профиль стратегий всех агентов (игроков).65Как показано в главе 1 выигрыши агентов могут быть представлены функционаламиразличного вида. В данной главе будут рассматриваться выигрыши в следующем виде:Z TJi =e−ρt gi (x(t), u(t))dt + Gi (x(T ))(1.2)0иZ∞Ji =e−ρt gi (x(t), u(t))dt ,(1.3)0где gi (x(t), u(t)) – «мгновенная» прибыль агента i в момент времени t, ρ – коэффициентдисконтирования, 0 < ρ < 1.NОбозначим uN (t) = (uN1 (t), .
. . , un (t)) – равновесие по Нэшу в игре (1.1), (1.2) (или (1.1),(1.3)). При кооперации агентов эколого-экономической системы максимизируется общийдисконтированный доход на конечном или бесконечном промежутке времени:cJ =nXZTeJi =−ρt0i=1илиnXgi (x(t), u(t))dt +i=1Z∞cJ =e0−ρtnXGi (x(T )) → maxu(t)i=1nXgi (x(t), u(t))dt → max .i=1u(t)(1.4)(1.5)Пусть набор стратегий uc (t) = (uc1 (t), . . .
, ucn (t)) является решением задачи (1.1),(1.4)(или (1.1),(1.5)) и xc (t) – кооперативная траектория, полученная при замыкании уравнения(1.1) набором стратегий uc (t).В связи с использованием кооперативных стратегий возникает задача поддержаниясоглашения, достигнутого в начале периода планирования, и наказания отклоняющихсяучастников. Одним из методов поддержания кооперативного поведения агентов экологоэкономической системы является кооперативное регулируемое равновесие [103].
Приведемопределение данного понятия для игры двух лиц.Стратегией i-го игрока является отображение γi : Uj → Ui (uj ∈ Uj ), i, j = 1, 2, i 6= j,где Ui – множество допустимых стратегий игрока i, i = 1, 2.Определение 1.1. [103] Пара стратегии (γ1 , γ2 ) называется кооперативным регулируемым равновесием, еслиuc1 = γ1 (uc2 ) , uc2 = γ2 (uc1 ) ,J1 (uc1 , uc2 ) ≥ J1 (u1 , γ2 (u1 )) ∀u1 ∈ U1 ,J2 (uc1 , uc2 ) ≥ J2 (γ1 (u2 ), u2 ) ∀u2 ∈ U2 .66Таким образом, при использовании в качестве решения регулируемого равновесия агентам невыгодно отклонятся от кооперативного договора, достигнутого в начале периодапланирования.