Диссертация (Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами), страница 8
Описание файла
Файл "Диссертация" внутри архива находится в папке "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами". PDF-файл из архива "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой докторскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени доктора физико-математических наук.
Просмотр PDF-файла онлайн
Текст 8 страницы из PDF
1.3 представлена предложенная в диссертационной работе схема экологического регулирования для эколого-экономической системы сомногими участниками.Центрs(t)J1(t,s)Агент 1u11(t,s) ...I(t,s,u1,...,un)...u1n(t,s)un1(t,s)s(t)Агент n... unn(t,s)Jn(t,s)ресурс1ресурс nэкологическая системаРис 1.3. Схема регулирования с участием центра34Динамика развития возобновляемого ресурса с учетом эксплуатации описывается уравнениемx0 (t) = f (x(t), u(t, s(t)), 0 ≤ t ≤ T, x(0) = x0 ,где x(t) ≥ 0 – размер эксплуатируемого ресурса в момент времени t, f (x(t), u(t, s(t)) –функция развития возобновляемого ресурса, u(t, s(t)) ≥ 0 – стратегия (интенсивность эксплуатации) агента в момент времени t.Таким образом, интенсивность эксплуатации агента определяется в зависимости от долиэксплуатируемой территории.
В дальнейшем будем предполагать, что интенсивность эксплуатации пропорциональна размеру ресурса на открытой для эксплуатации территории,т.е. x(t)(1 − s(t)).Выигрыш агента задается функционалом, состоящим из интегральной части – прибыли, зависящей от интенсивности эксплуатации, на конечном промежутке планирования инекоторой терминальной выплаты (например, компенсации за неиспользованный ресурс)Z TJ=g(x(t), u(t, s(t))) dt + G(x(T )) .0В разделе 1.2.1 предполагается, что доля закрытой для эксплуатации части территорииявляется фиксированной величиной s(t) ≡ s и решается задача оптимального управления.
Определено оптимальное поведение участника, доказаны необходимые и достаточныеусловия существования решения.В разделе 1.2.2 вводятся функционалы, определяющие выигрыш центра, видаZ TI=γ(x(t), u(t, s(t))) dt ,0и для разрешения возникающего конфликта применяются арбитражные схемы Нэша иКалаи–Смородинского. Приведены результаты численного моделирования.В разделе 1.3 предполагается, что стратегия центра – это непрерывная функция s(t).Для различных видов функционала центра построены равновесные по Нэшу стратегииагентов эколого-экономической системы, доказаны необходимые и достаточные условиясуществования оптимального решения.1.2.1.
Модель с одним участникомРассмотрим задачу управления возобновляемыми ресурсами, в которой центр (контролирующий орган) определяет долю закрытой для эксплуатации части территории, обозначенную s(t), 0 ≤ s(t) ≤ 1. Часть, на которой эксплуатация разрешена, соответственно равна351 − s(t). Участник (игрок) эксплуатирует ресурс на протяжении T периодов времени. Дляопределенности будем рассматривать процесс эксплуатации промысловой рыбной популяции.
Динамика развития популяции с учетом эксплуатации описывается уравнениемx0 (t) = F (x(t)) − qE(t)(1 − s(t))x(t), 0 ≤ t ≤ T, x(0) = x0 ,(2.1)где x(t) ≥ 0 – размер популяции в момент времени t, F (x(t)) – функция развития популяции, E(t) ≥ 0 – промысловые усилия игрока, измеряемые, например, в количестве кораблей,участвующих в ловле в момент времени t, 0 ≤ s(t) ≤ 1 – доля закрытой для эксплуатациичасти территории и q > 0 – коэффициент возможного вылова на единицу промысловыхусилий игрока.В данном разделе функция развития популяции имеет следующий вид (модель Ферхюльста [16]):³x´F (x) = rx 1 −,Kгде r > 0 – коэффициент внутреннего роста, K > 0 – максимальная емкость экологической системы.
Таким образом, если начальный размер популяции меньше максимальнойемкости, то популяция (в отсутствие вылова) растет до достижения размера K и стабилизируется на этом уровне. Если же начальный размер популяции больше K, то размерпопуляции уменьшается и стабилизируется на уровне максимальной емкости экологическойсистемы.Выигрыш игрока представим в следующем виде:ZTe−ρt [Π(q, s(t), x(t), E(t)) · qE(t)(1 − s(t))x(t) − c0 E(t)]dt ,J = g(x(T )) +0где 0 < ρ < 1 – коэффициент дисконтирования, c0 > 0 – затраты на вылов и Π – функцияцены, определенная какΠ(q, s(t), x(t), E(t)) = p − kqE(t)(1 − s(t))x(t) , p, k > 0 .Здесь p – фиксированная начальная рыночная цена.
Следовательно, цена на рынкеформируется как разница между начальной ценой и размером вылова (модель Курно [14]),приведенным в денежные единицы при помощи коэффициента k.Таким образом, выигрыш игрока выражается разницей между доходом от продажиресурса и затратами на вылов. При этом предполагается, что затраты пропорциональныпромысловым усилиям.36Функция g(x) описывает будущий доход от эксплуатации запасов в конечный моментвремени T .
Следуя обычным предположениям на функцию полезности, пусть g 0 (x) ≥ 0,g 00 (x) ≤ 0.Перепишем функцию выигрыша следующим образом:ZTJ = g(x(T )) +1[− aE 2 (t)(1 − s(t))2 x2 (t) + bE(t)(1 − s(t))x(t) − cE(t)]dt ,2(2.2)0где a = 2kq 2 e−ρt , b = pqe−ρt , c = c0 e−ρt .Рассмотрим сначала задачу максимизации прибыли игрока при заданной фиксированной доле закрытой для эксплуатации части территории s(t) = s = const:J(E(t), x(t)) → max ,E(t)≥0где x(t) удовлетворяет (2.1) .(2.3)Теорема 2.1. E ∗ (t), x∗ (t), λ(t) являются решением задачи (2.3), еслиE ∗ (t) =(b − qλ(t))(1 − s(t))x∗ (t) − c,0≤t≤T,a(1 − s(t))2 x∗ (t)2x∗ 0 (t) = F (x∗ (t)) − qE ∗ (t)(1 − s(t))x∗ (t), 0 ≤ t ≤ T, x∗ (0) = x0 ,λ0 (t) = −E ∗ (t)(1 − s(t))(b − aE ∗ (t)(1 − s(t))x∗ (t))−− λ(t)(F 0 (x∗ (t)) − qE ∗ (t)(1 − s(t))) , 0 ≤ t ≤ T , λ(T ) = gx0 (x∗ (T )) ,и выполнены следующие условия:2c03cx (t) > xm =, b − λ(t)q ≥.pq(1 − s(t))2xm (1 − s(t))∗Доказательство.
Используя принцип максимума Понтрягина [57], запишем гамильтониан1H(x, E, λ, s) = − aE 2 (1 − s)2 x2 + bE(1 − s)x − cE+2+ λ(F (x) − qE(1 − s)x) .Максимизируя, получим оптимальную стратегию игрокаE(x, λ, t) =(b − qλ)(1 − s)x − c,a(1 − s)2 x2где λ – сопряженная переменная, удовлетворяющая уравнениюλ0 = −∂H= −E(1 − s)(b − aE(1 − s)x) − λ(Fx0 − qE(1 − s))∂xс условием трансверсальности λ(T ) = gx0 (x(T )) .37Подставляя найденную оптимальную стратегию E ∗ (t) в (2.1) и уравнение для сопряженной переменной, получаем следующую систему уравнений:³´x(t) ´ q ³cq20x (t) = rx(t) 1 −−b−+ λ(t) , x(0) = x0 ,Kax(t)(1 − s(t))a³´cc0λ (t) = − 2b−−ax (t)(1 − s(t))x(t)(1 − s(t))³´cq2rx(t)− λ(t) r −− 2, λ(T ) = gx0 (x∗ (T )) .Kax (t)(1 − s(t))(2.4)Окончательно, подставляя выражения для a, b, c, получаем2c0eρtrx2 (t)0−++ λ(t) , x(0) = x0 ,x (t) = rx(t) −K2k 2kqx(t)(1 − s(t))2k0 −ρt0 2 −ρtcpe(c)eλ0 (t) = −+−2kqx2 (t)(1 − s(t)) 2kq 2 x3 (t)(1 − s(t))2´³2rx(t)c0− λ(t) r −−, λ(T ) = gx0 (x∗ (T )) .K2kqx2 (t)(1 − s(t))Хотя принцип максимума и является только необходимым условием оптимальности, нодля линейно-квадратичной задачи он является и достаточным [27].
Покажем достаточностьдля нашей модели.Сначала докажем, что λ(t) > 0 ∀t.Из системы (2.4) можно записатьλ0 (t) = −L(t) − M (t)λ(t) ,cc0где L(t) > 0 ∀t, т.к. x (t) >=, а по условию x∗ (t) > xm .b(1 − s(t))pq(1 − s(t))Найдем сопряженную переменную. Решение однородного уравнения λ0 (t) = −M (t)λ(t)∗−имеет вид λ(t) = c1 (t)eRtM (τ )dτ.0Подставляя в неоднородное уравнение, получимRt− M (τ )dτ0c1 (t)e 0RτRtОткуда c1 (t) = − L(τ )e0ТогдаM (p)dp= −L(t) .dτ + c2 .0λ(t) = e−RtM (τ )dτ0Zt(c2 −RτL(τ )e0M (p)dp) dτ .0Из условия трансверсальности λ(T ) > 0 , следовательноZTc2 ≥RτL(τ )e00M (p)dpZtdτ ≥RτL(τ )e00M (p)dpdτ ∀t ∈ [0, T ] .38Тогдаλ(t) > 0 ∀t .ОбозначимH 0 (x, λ, s) = max H(x, E, λ, s) = H(x, E ∗ , λ, s) .E≥0Подставив выражение для E ∗ , H 0 примет видH 0 (x, λ, s) =c2c(b − λq) (b − λq)2−++ λF (x) .2a(1 − s)2 x2 a(1 − s)x2aПокажем, что H 0 вогнута0(x, λ, s) =Hxx³´ 2r2c3c−(b−λq)− λ,ax3 (1 − s) 2x(1 − s)Kb − λq ≥3c∀x > xm .2x(1 − s)Следовательно0Hxx(x, λ, s) ≤ 0 ,т.е.
H 0 – вогнута.Пусть E ∗ (t), x∗ (t), λ(t) удовлетворяют условиям теоремы.По определениюH(x, E, λ, s) ≤ H 0 (x, λ, s) ,по вогнутостиH 0 (x, λ, s) ≤ H 0 (x∗ , λ, s) + Hx0 (x∗ , λ, s)(x − x∗ ) .Из условия λ0 (t) = −Hx0 (x∗ , λ, s) получимH(x, E, λ, s) ≤ H 0 (x∗ , λ, s) − λ0 (t)(x − x∗ ) .Проинтегрируем по всему периоду планированияRTH(x, E, λ, s)dt ≤0+RT0RTH 0 (x∗ , λ, s)dt − λ(t)(x(t) − x∗ (t))|T0 +0λ(t)(x0 (t) − x∗ (t)0 )dt .0Используя функционалы выигрышейZTJ = g(x(T )) +01[− aE 2 (t)(1 − s(t))2 x2 (t) + bE(t)(1 − s(t))x(t) − cE(t)]dt239иZT∗∗J = g(x (T )) +1[− aE ∗ 2 (t)(1 − s(t))2 x∗ 2 (t) + bE ∗ (t)(1 − s(t))x∗ (t) − cE ∗ (t)]dt ,20запишем неравенство в видеJ+RTλ(t)(F (x) − qE(1 − s)x) dt − g(x(T )) ≤0≤ J∗ +RTλ(t)(F (x∗ ) − qE ∗ (1 − s)x∗ ) dt − g(x∗ (T ))−0−λ(T )(x(T ) − x∗ (T )) +RTRTλ(t)x0 (t)dt −00илиJ+RTλ(t)x0 (t)dt − g(x(T )) ≤ J ∗ +0−λ(T )(x(T ) − x∗ (T )) +RTRT0λ(t)x∗ (t)dt − g(x∗ (T ))−0λ(t)x0 (t)dt −00λ(t)x∗ (t)dtRT0λ(t)x∗ (t)dt .0ОткудаJ − (g(x(T )) − g(x∗ (T ))) ≤ J ∗ − λ(T )(x(T ) − x∗ (T )) ,J ≤ J ∗ − λ(T )(x(T ) − x∗ (T )) + (g(x(T )) − g(x∗ (T ))) ≤≤ J ∗ − λ(T )(x(T ) − x∗ (T )) + gx0 (x∗ (T ))(x(T ) − x∗ (T )) == J ∗ − λ(T )(x(T ) − x∗ (T )) + λ(T ))(x(T ) − x∗ (T )) .СледовательноJ ≤ J∗ .Таким образом, мы доказали, что E ∗ – оптимальное решение задачи (2.3).Следствие 2.1.
Пусть выигрыш (компенсация) в конечный момент времени имеет видpq(α − 1)x0 + c0g(x(T )) = αpe−ρT x(T ). При s ≤ s̄ =оптимальная стратегия игрока E ∗ (t)pqx0 (α − 1)положительнанавсемпромежутке[0, T ].Иначена[0, t̄],где1 ³ x0 (pqK(1 − s)(1 − α) − c0 ) ´оптимальное управление равно нулю.t̄ = − lnrc0 (K − x0 )Доказательство. При невыполнении условия b − qλ(t) ≥c(1−s(t))x(t)выражение для E(t)может быть отрицательным. Так как мы ограничиваемся неотрицательными стратегиями,то воспользуемся следующей схемой.Ясно, что игроку невыгодно производить вылов пока размер популяции не достигаетопределенного уровня.
Поэтому, определим некоторую точку t̄, до которой E(t) = 0.Тогда на промежутке [0, t̄] выигрыш игрока равен J = g(x(t̄)).40А уравнение развития популяции принимает видx0 (t) = rx(t) −rx2 (t),Kоткудаx(t) =x0 +Kx0−rte (K− x0 ).Заметим, что условие трансверсальности принимает видλ(t̄) = gx0 (x(t̄)) .Предположим, для определенности, что g(x(T )) = αpe−ρT x(T ). Таким образом, игрок вконечный момент времени получает в качестве компенсации некоторую долю α от прибыли,которая могла бы быть получена от продажи оставшегося ресурса. Тогда, в нашем случаеλ(t̄) = pαe−ρt̄ .Найдем t̄ из условия равенства нулю управления(b − qλ(t̄))(1 − s(t))x(t̄) − c = 0 .Получим1 ³ x0 (pqK(1 − s)(1 − α) − c0 ) ´t̄ = − ln.rc0 (K − x0 )Найдем условие для применения этой схемыt̄ = 0 =⇒ s̄ =pq(α − 1)x0 + c0.pqx0 (α − 1)Результаты моделированияПриведем примеры численного моделирования для следующих параметров:r = 0.06 ,K = 300000 , ρ = 0.02 ,p = 6000 , q = 0.002 ,k = 0.8 ,c0 = 500000 , α = 0.02 , T = 100 .Пусть начальный размер популяции x(0) = 150000.