Диссертация (Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами), страница 10
Описание файла
Файл "Диссертация" внутри архива находится в папке "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами". PDF-файл из архива "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой докторскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени доктора физико-математических наук.
Просмотр PDF-файла онлайн
Текст 10 страницы из PDF
Игрок эксплуатирует ресурс протяжении T периодов времени. Рассматривается задача управления процессом эксплуатации промысловойпопуляции, динамика развития которой описывается уравнением (2.1).Выигрыш игрока, как и ранее, имеет видZTe−ρt [Π(q, s(t), x(t), E(t)) · qE(t)(1 − s(t))x(t) − c0 E(t)]dt ,J = g(x(T )) +(3.1)0где 0 < ρ < 1 – коэффициент дисконтирования, c0 > 0 – затраты на вылов и Π – функцияцены, определенная какΠ(q, s(t), x(t), E(t)) = p − kqE(t)(1 − s(t))x(t), p, k > 0 .Для определенности, предположим, что терминальный выигрыш игрока имеет видg(x(T )) = αpx(T )e−ρT , т.е.
игрок в конечный момент времени получает компенсацию, пропорциональную прибыли от продажи оставшегося ресурса.Обозначив a = 2kq 2 e−ρt , b = pqe−ρt , c = c0 e−ρt , запишем функцию выигрыша игрока ввиде (2.2).В качестве функционала, определяющего выигрыш центра, рассмотримZT(x(t) − x̄(t))2 dt ,I1 = −(3.2)0где x̄(t) – размер популяции, оптимальный для воспроизводства.В данном случае I1 – это относительная величина, отражающая затраты центра навосстановление эксплуатируемой популяции.47Таким образом, в данном разделе игрок и центр являются участниками динамическойигры. В качестве решения возникающего конфликта рассмотрим равновесие по Нэшу, т.е.такие стратегии s∗ и E ∗ , которые удовлетворяют следующим неравенствам:J(s∗ , E ∗ ) ≥ J(s∗ , E) , ∀E ,I1 (s∗ , E ∗ ) ≥ I1 (s, E ∗ ) , ∀s .(3.3)Зафиксируем стратегию игрока и найдем оптимальное поведение центра, используяпринцип максимума [57].
Гамильтониан центра имеет видH1 (x, E, λ1 , s) = −(x − x̄)2 + λ1 (F (x) − qE(1 − s)x) .Представив H1 = λ1 qExs+ {оставшаяся часть, не зависящая от s}, получим, что стратегия s, на которой H1 достигает максимума имеет видПри λ1 > 0 =⇒ s(t) ≡ 1 ,при λ1 = 0 =⇒ s(t) любое , при λ < 0 =⇒ s(t) ≡ 0 .1Уравнение для сопряженной переменной λ1 с условием трансверсальности примет видλ01 = −∂H1= 2(x − x̄) − λ1 (Fx0 (x) − qE(1 − s)) , λ1 (T ) = 0 .∂xЗафиксируем теперь стратегию центра. Тогда гамильтониан игрока имеет вид1H2 (x, E, λ2 , s) = − aE 2 (1 − s)2 x2 + bE(1 − s)x − cE + λ2 (F (x) − qE(1 − s)x) .2Максимум достигается на·(b − qλ2 )(1 − s)x − cE(t) =a(1 − s)2 x2¸+.Стратегия игрока неотрицательна при выполнении условия(b − qλ2 )(1 − s)x ≥ c .(3.4)Уравнение для λ2 с условием трансверсальности имеет видλ02 = −∂H2= −E(1 − s)(b − aE(1 − s)x) − λ2 (Fx0 − qE(1 − s)) , λ2 (T ) = gx0 (x∗ (T )) .∂xБудем искать управление центра в виде кусочно-непрерывной функции.48Замечание 3.1.
Управление E(t), которое максимизирует подынтегральное выражение в(3.1), называется «близорукой стратегией» [103]. Оно имеет видE(t) =pq(1 − s(t))x(t) − c02kq 2 (1 − s(t))2 x(t)2и достигает максимального значенияEm =p2c0при xm =.8kc0 qpq(1 − s(t))Условимся рассматривать далее стратегии игрока E(t)<Em , для которыхx(t) ≥ xm ∀t .Достаточным условием этого являетсяF (xm ) − qEm xm ≥ 0или, что эквивалентно,s≤1−16kc20 r.Kpq(8kc0 r − p)(3.5)1.3.1.1.
Стратегии специального видаЯсно, что стратегия, которая дает центру наибольший выигрыш, т.е. наименьшие затраты на восстановление популяции, это такое s∗ , при котором x(t) ≡ x̄.Заметим, что стабилизация размера популяции на уровне x̄ возможна начиная с какогото момента времени, поэтому существуют два варианта:1) При x(0) < x̄, сначала стратегия центра равна 1, т.е. эксплуатация не ведется, а затемs∗ такое, что x(t) ≡ x̄ при t > t0 .2) При x(0) > x̄, сначала стратегия центра равна нулю, т.е. ведется неограниченный вылов,а затем s∗ такое, что x(t) ≡ x̄ при t > t0 .Теорема 3.1. Рассматривается случай x(0) < x̄.Равновесие по Нэшу в задаче (2.1), (3.1), (3.2) имеет вид 0, t < t , 1, t < t ,00и E ∗ (t) =s∗ (t) = Ē(t) , t ≥ t , s̄(t) , t ≥ t00гдеs̄(t) = 1 −(p − λ̄2 (t))qx̄(1 − s̄(t)) − c0c0 K, Ē(t) =,2kq 2 x̄2 (1 − s̄(t))2x̄q(K(p − λ̄2 (t)) − 2rkx̄(K − x̄))t0 =1 ³ x̄(K − x0 ) ´ln,rx0 (K − x̄)(3.6)49и s̄(t) удовлетворяет условию (3.5), а такжеλ̄2 (t) =(t−T )(r x̄+Kρ)(t−T )(r x̄+Kρ)(K − x̄)2 ³ pr2r2 x̄k ´KK−(1 − e) + αperx̄ + Kρ K − x̄K(3.7)удовлетворяет следующим условиям:nppc0 oM − < λ̄2 (t) < min , M −,24x̄qгде M = p −(3.8)2rkx̄(K − x̄).KДоказательство.
Пусть 1 , (λ (t) > 0) t < t ,10∗s (t) = s̄(t) , (λ (t) = 0) t ≥ t .10При s = 1 оптимальная стратегия игрока равно нулю (отсутствие эксплуатации) и динамика развития популяции описывается уравнением³x(t) ´, x(0) = x0 .x0 (t) = rx(t) 1 −KОткуда находим, чтоx(t) =x0 +Kx0−rte (K− x0 ).Момент времени переключения стратегии центра находим из условия x(t0 ) = x̄, откуда1 ³ x̄(K − x0 ) ´.t0 = lnrx0 (K − x̄)При t > t0 оптимальная стратегия игрока имеет видĒ(t) =(b − qλ2 (t))x(t)(1 − s̄(t)) − c,ax(t)2 (1 − s̄(t))2а система для x(t) и сопряженной переменной примет вид´³cq2x(t) ´ q ³0−b−+λ(t), x(t0 ) = x̄ ,x(t)=rx(t)1−2Kax(t)(1−s̄(t))a³´ccb−−λ02 (t) = − 2ax (t)(1 − s̄(t))x(t)(1 − s̄(t))³´2rx(t)cq −λ2 (t) r −− 2, λ2 (T ) = gx0 (x∗ (T )) = αpe−ρT .Kax (t)(1 − s̄(t))Сделав замену λ̄2 (t) = λ2 eρt , получим´³1 ³c01x(t) ´0−pq −+ λ̄2 (t) , x(t0 ) = x̄ ,x (t) = rx(t) 1 −K2kq(1 − s̄(t))x(t)2k³´c0c00pq −−λ̄2 (t) = −2kq 2 (1 − s̄(t))x2 (t)(1 − s̄(t))x(t)³´2rx(t)c0 −λ̄2 (t) r −−−ρ, λ̄2 (T ) = αp .K2kqx(t)2 (1 − s̄(t))50При t > t0 x(t) ≡ x̄ и из первого уравнения системы, записанного в общем виде x0 (t) =rx(t)(1 − x(t)/K) − qE(t)x(t)(1 − s(t)) получимs(t) = 1 −r(K − x).KqE(t)Окончательно, подставляя выражение для Ē(t), получимs̄(t) = 1 −c0 K,x̄q(K(p − λ̄2 (t)) − 2rkx̄(K − x̄))а из второго уравненияλ̄2 (t) =(t−T )(r x̄+Kρ)(t−T )(r x̄+Kρ)(K − x̄)2 ³ pr2r2 x̄k ´KK−(1 − e) + αpe.rx̄ + Kρ K − x̄KТакая стратегия центра, естественно, существует не всегда, а при выполнении неравенства 0 < s̄(t) < 1, откуда получим условиеλ̄2 (t) < M −c0.x̄q(3.9)Докажем оптимальность полученных стратегий при t > t0 .Для центра s̄(t) очевидно является оптимальным, т.к.
дает нулевые затраты.Зафиксируем s̄ и покажем, что J(s̄, Ē) ≥ J(s̄, E). Подставляя стратегии участниковзапишем уравнение для сопряженной переменной в видеλ02 (t) = −L(t) − N (t)λ2 (t) ,где L(t) = −³´ccb−> 0 ∀t приax̄2 (1 − s̄(t))x̄(1 − s̄(t))x̄ >c0,pq(1 − s̄(t))что выполнено при условии (3.5).Общее решение этого уравнения имеет видλ2 (t) = e−RtN (τ )dτt0Zt(c2 −RτL(τ )et0N (p)dpdτ ) .t0Из условия трансверсальности λ2 (T ) > 0 , следовательноZTc2 ≥RτL(τ )et0t0N (p)dpZtdτ ≥RτL(τ )et0N (p)dpt0Тогдаλ2 (t) > 0 ∀t > t0 .dτ ∀t ∈ [t0 , T ] .51Обозначим при t > t0H20 (x, λ2 , s̄) = max H2 (x, E, λ2 , s̄) .E≥0Подставив выражение для Ē, H20 примет видH20 (x, λ2 , s̄) =c2c(b − λ2 q) (b − λ2 q)2++ λ2 F (x) .−2a(1 − s̄)2 x2a(1 − s̄)x2aПокажем, что H20 вогнутаH20 xx (x, λ2 , s̄)b − λ2 q ≥³´ 2r2c3c= 3− (b − λ2 q) − λ2 (t) ,ax (1 − s̄) 2x(1 − s̄)K3cпри2x(1 − s̄)x ≡ x̄ >2c0pq(1 − s̄(t))(3.10)и11λ2 (t) < pe−ρt (λ̄2 (t) < p) ,44(3.11)а λ2 (t) > 0 ∀t > t0 .
Следовательно,H20 xx (x, λ2 , s̄) ≤ 0 , т.е. H20 – вогнута.Из вогнутости и определения H20 следует неравенство0H2 (x, E, λ2 , s̄) ≤ H20 (x̄, λ2 , s̄) + H2x(x̄, λ2 , s̄)(x(t) − x̄) .Из условия λ02 (t) = −H20 x (x̄, λ2 , s̄) получимH2 (x, E, λ2 , s̄) ≤ H20 (x̄, λ2 , s̄) − λ02 (t)(x(t) − x̄) .Проинтегрировав и упростив, запишемJ(s̄, E) +RTλ2 (t)(F (x) − qE(1 − s̄)x) dt − g(x(T )) ≤ J(s̄, Ē) +t0−q Ē(1 − s̄)x̄) dt − g(x̄(T )) − λ2 (T )(x(T ) − x̄(T )) +RTRTλ2 (t)(F (x̄)−t0λ2 (t)x0 (t)dt −t0RTλ2 (t)x̄(t)0 dt .t0ОткудаJ(s̄, E) ≤ J(s̄, Ē) − λ2 (T )(x(T ) − x̄(T )) + (g(x(T )) − g(x̄(T ))) .Из вогнутости g(x) следует g(x(T )) − g(x̄(T )) ≤ gx0 (x̄(T ))(x(T ) − x̄(T )), что вместе сусловием трансверсальности gx0 (x̄(T )) = λ2 (T ) даетJ(s̄(t), E(t)) ≤ J(s̄(t), Ē(t)) .52Таким образом, мы доказали, что Ē – оптимальная стратегия игрока при t > t0 при выполнении условий (3.9)–(3.11).
При этом очевидно стратегия неотрицательна, т.к. условие(3.4) для Ē выполнено при выполнении условий (3.10) и (3.11).Подставляя выражение для s̄(t), условие (3.10) преобразуется в λ̄2 (t) > M − p2 .Окончательно на сопряженную переменную накладываются следующие условияnppc0 oM − < λ̄2 (t) < min , M −.24x̄q2400008220000620000041800002160000020406080100020406080100Рис 1.12. Размер популяции x∗ (t)Рис 1.13. Стратегия игрока E ∗ (t)2e+0610.91.5e+060.80.71e+060.650000000.520406080100Рис 1.14.
Сопряженная переменная λ1 (t)0.4020406080100Рис 1.15. Стратегия центра s∗ (t)Приведем пример для x̄ = 250000. Все остальные параметры соответствуют разделу1.2. Для случая, когда начальный размер популяции x(0) = 150000, точка t0 = 26.82, послекоторой λ1 (t) ≡ 0 (рис. 1.14). Следовательно, сначала стратегия центра s∗ = 1, а затемs∗ = s̄(t) (рис. 1.15). Оптимальная стратегия игрока E ∗ (t) приведена на рис. 1.13. Приэтом, размер популяции возрастет с 150000 до 250000 особей и затем держится на этомуровне (рис.
1.12).Проверим выполнение условий для λ̄2 (t). При заданных параметрах M = 2000, M − p2 =−1000, min{ 14 p, M −c0}x̄q= 1000. Получим условие −1000 < λ̄2 (t) < 1000. Моделирование53показало, что λ̄2 (t) возрастающая функция, λ̄2 (0) = 285 и λ̄2 (T ) = 300, т.е. условия выполнены. Затраты центра I1 = −0.829 · 1011 .Теорема 3.2. Рассматривается случай x(0) > x̄.Равновесие по Нэшу в задаче (2.1), (3.1), (3.2) имеет вид 0, t < t , (p−λ̂2 (t))qx(t)−c0 , t < t ,002kq 2 x(t)2s∗ (t) =и E ∗ (t) = s̄(t) , t ≥ tĒ(t) , t ≥ t0 ,0(3.12)где x(t) и λ̂2 (t) определяются из системы (3.13) и удовлетворяют условиямx(t) >2c0p, λ̂2 (t) < ,pq4s̄(t), Ē(t), λ̄2 (t) имеют вид (3.6), (3.7) и удовлетворяют условиям (3.5), (3.8).Доказательство.
Пусть 0 , (λ (t) < 0) t < t ,10s∗ (t) = s̄(t) , (λ (t) = 0) t ≥ t .10При s = 0 оптимальная стратегия игрока имеет видE ∗ (t) =(p − λ̂2 (t))qx(t) − c0,2kq 2 x(t)2и определяется из следующей системы³x(t) ´1 ³c0 ´10x(t)=rx(t)1−−pq−+ λ̂2 (t) ,K2kqx(t)2k³´2rx(t)p1c0λ01 (t) = 2(x(t) − x̄) − λ1 (t) r −−+λ̂2 (t) +,K2kx(t) 2kx(t)2kqx(t)2³³´c0c0 ´2rx(t)c00λ̂(t)=−pq−−λ̂(t)r−−−ρ 222kq 2 x(t)2x(t)K2kqx(t)2(3.13)с начальными данными x(t0 ) = x̄, λ1 (t0 ) = 0.При t > t0 действуя аналогично теореме 3.1, получимs̄(t) = 1 +c0 K,x̄q(2rkx̄(K − x̄) − K(p − λ̄2 (t)))(t−T )(r x̄+Kρ)(t−T )(r x̄+Kρ)2r2 x̄k ´(K − x̄)2 ³ prKK−(1 − e) + αpe.λ̄2 (t) =rx̄ + Kρ K − x̄KТеперь мы знаем λ̄2 (t0 ) = λ̂2 (t0 ) и для нахождения точки t0 необходимо решить систему(3.13), так, чтобы x(0) = x0 .Аналогично, такая стратегия центра существует при условииλ̄2 (t) < M −c0.x̄q54Дополнительные условия на λ̄2 (t) получим в процессе доказательства оптимальностиĒ(t) как в теореме 3.1.