Диссертация (Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами), страница 11
Описание файла
Файл "Диссертация" внутри архива находится в папке "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами". PDF-файл из архива "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой докторскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени доктора физико-математических наук.
Просмотр PDF-файла онлайн
Текст 11 страницы из PDF
А условия для x(t) и λ̂2 (t) получим доказывая оптимальность E ∗ (t)при t < t0 .15000010014000080130000601200004011000010000020020406080Рис 1.16. Размер популяции x∗ (t)0-200000-400000-600000-800000-1e+06-1.2e+06-1.4e+06-1.6e+06204060800100100Рис 1.18. Сопряженная переменная λ1 (t)20406080100Рис 1.17. Стратегия игрока E ∗ (t)0.80.60.40.20020406080100Рис 1.19. Стратегия центра s∗ (t)Приведем пример для x̄ = 100000 и p = 20000. Для случая, когда начальный размерпопуляции x(0) = 150000, точка t0 = 74.95, после которой λ1 (t) ≡ 0 (рис.
1.18). Следовательно, сначала стратегия центра s∗ = 0, а затем s∗ = s̄(t) (рис. 1.19). Оптимальнаястратегия игрока E ∗ (t) приведена на рис. 1.17. При этом, размер популяции убывает со150000 до 100000 особей (рис. 1.16). Затраты центра I1 = −0.506 · 1011 .551.3.1.2. Стратегии общего видаТеперь предположим, что условия существования стратегий специального вида не выполняются. Тогда применим общую схему построения оптимальных стратегий.Теорема 3.3. Предполагая непрерывность функции λ1 (t), стратегия центра может бытьтолько трех видов:1) s∗ (t) ≡ 0, t ∈ [0, T ]; 1 , (λ (t) > 0) t < t ,102) s∗ (t) = 0 , (λ (t) < 0) t > t ;103) s∗ (t) ≡ 1, t ∈ [0, T ].Для конкретных значений параметров задачи оптимальной стратегией является одна из этих трех.
При этом оптимальные стратегии игрока имеют вид(p − λ̄2 (t))qx(t) − c01) E ∗ (t) =, t ∈ [0, T ],2kq 2 x(t)2где λ̄2 (t) и x(t) удовлетворяют системе³x(t) ´1 ³c0 ´10x(t)=rx(t)1−−pq−+ λ̄2 (t) ,K2kqx(t)2k³´2rx(t)p1c0λ01 (t) = 2(x(t) − x̄) − λ1 (t) r −−+λ̄2 (t) +,K2kx(t) 2kx(t)2kqx(t)2³³´c0 ´2rx(t)c0c00λ̄pq−−λ̄(t)r−−−ρ(t)=− 222kq 2 x(t)2x(t)K2kqx(t)2(3.14)с начальнымиданными x(0) = x0 , λ1 (T ) = 0, λ̄2 (T ) = gx0 (x(T ))eρT = αp;0 , t < t0 ,∗2) E (t) =(p − λ̄2 (t))qx(t) − c0, t > t0 ,2kq 2 x(t)2где λ̄2 (t) и x(t) удовлетворяют системе (3.14) с начальными даннымиx0 Kx(t0 ) =, λ1 (t0 ) = 0, λ̄2 (t0 ) = c2 (x0 + e−rt0 (K − x0 ))2 e(r+ρ)t0 , λ1 (T ) = 0,−rtx0 + e 0 (K − x0 )λ̄2 (T ) = αp;3) E ∗ (t) ≡ 0, t ∈ [0, T ].Для оптимальности таких стратегий должны выполняться условияx(t) >Доказательство.
1) Пустьp2c0, λ̄2 (t) < .pq4 0 , (λ (t) < 0) t < t ,10∗s (t) = 1 , (λ (t) > 0) t > t .10Тогда при s = 0 оптимальная стратегия игрока имеет видE ∗ (t) =(b − qλ2 (t))x(t) − c,ax(t)2(3.15)56где x(t), λ2 (t) удовлетворяют системе³x(t) ´0x(t)=rx(t)1−− qE ∗ (t)x(t) ,K³´2rx(t)∗0λ1 (t) = 2(x(t) − x̄) − λ1 (t) r −− qE (t) ,K ³´ λ0 (t) = −E ∗ (t)(b − aE ∗ (t)x(t)) − λ (t) r − 2rx(t) − qE ∗ (t) ,22Kили, сделав замену, λ̄2 (t) = λ2 (t)eρt , системе (3.14) с единственным заданным начальнымзначением x(0) = x0 .При s = 1 оптимальная стратегия игрока равна нулю и получим систему³x(t) ´0x (t) = rx(t) 1 −,K³2rx(t) ´λ01 (t) = 2(x(t) − x̄) − λ1 (t) r −,K³´ λ0 (t) = −λ (t) r − 2rx(t)22Kс начальными данными λ1 (T ) = 0, λ2 (T ) = gx0 (x(T )) = αpe−ρT .Предположим, что x(t0 ) = γ, тогда решение этой системы имеет видx(t) =γK,γ + e−r(t−t0 ) (K − γ)(γ + e−r(t−t0 ) (K − γ))2 er(t−t0 ) (γ(2x̄ − K) + 2x̄e−r(T −t0 ) (K − γ))λ1 (t) =−(K − γ)r(γ + e−r(T −t0 ) (K − γ))2er(t−t0 ) (γ(2x̄ − K) + 2x̄e−r(t−t0 ) (K − γ))−,(K − γ)r(γ + e−r(t−t0 ) (K − γ))2 er(t−t0 ) αpe−ρTλ2 (t) =.(γ + e−r(T −t0 ) (K − γ))2 er(T −t0 )Так как в точке t0 сопряженная переменная λ1 равна нулю, то, решая уравнение λ1 (t0 ) =0, получим1 ³ γ(K + γ − 2x̄) ´t0 = T + ln.r(K − γ)(2x̄ − γ)Для того, чтобы t0 < T необходимо x(t0 ) = γ < x̄.
Но тогда λ01 (t0 ) < 0, т.е. λ1 (t) убываетв точке t0 , а по условию должна возрастать. Следовательно, это невозможно и t0 = T , т.е.s∗ = 0 , t ∈ [0, T ] .Таким образом, доказано, что в классе непрерывных функций λ1 (t) стратегии вида(3.15) не может существовать.2) Пусть 1 , (λ (t) > 0) t < t ,10∗s (t) = 0 , (λ (t) < 0) t > t .1057При s = 1 оптимальная стратегия игрока равна нулю и получим следующую систему³x(t) ´0x(t)=rx(t)1−,K³2rx(t) ´λ01 (t) = 2(x(t) − x̄) − λ1 (t) r −,K³´ λ0 (t) = −λ (t) r − 2rx(t)22Kс начальным значением x(0) = x0 .Решение этой системы имеет видx(t) =x0 K,x0 + e−rt (K − x0 )−rtλ1 (t) = c1 (x0 + eert x0 (K − 2x̄) 2x̄(K − x0 ) e +−,(K − x0 )rr2 rtλ2 (t) = c2 (x0 + e−rt (K − x0 ))2 ert .При s = 0 оптимальная стратегия игрока примет видE ∗ (t) =(b − qλ2 (t))x(t) − c,ax(t)2где x(t), λ2 (t) удовлетворяют системе³x(t) ´0x(t)=rx(t)1−− qE ∗ (t)x(t) ,K³´2rx(t)λ01 (t) = 2(x(t) − x̄) − λ1 (t) r −− qE ∗ (t) ,K ³´ λ0 (t) = −E ∗ (t)(b − aE ∗ (t)x(t)) − λ (t) r − 2rx(t) − qE ∗ (t)22Kили, сделав замену, λ̄2 (t) = λ2 (t)eρt , системе (3.14) с начальными данными, полученнымиx0 Kиз предыдущей системы x(t0 ) =, λ1 (t0 ) = 0, λ2 (t0 ) = c2 (x0 + e−rt0 (K −−rtx0 + e 0 (K − x0 )x0 ))2 ert0 .Для оптимального решения необходимо найти t0 и c2 , так, чтобы выполнялись условиятрансверсальности λ1 (T ) = 0, λ2 (T ) = αpe−ρT .Оптимальность полученных стратегий доказывается аналогично разделу 1.3.1.1, откудаи получаем условия на x(t) и λ2 (t).Рассмотрим примеры моделирования для x̄ = 200000.
Для случая, когда начальныйразмер популяции x(0) = 150000, существует точка t0 = 4.5283, в которой λ1 (t) меняет знак(рис. 1.21). Следовательно, сначала центр закрывает всю территорию для эксплуатацииs∗ = 1, а затем игрок ведет неограниченный вылов s∗ = 0. Оптимальная стратегия игрокаE ∗ (t) приведена на рис. 1.22. При этом размер популяции возрастет с 150000 до 230000особей (рис. 1.20), и вылов примерно составляет 2500 особей (рис. 1.23).582200005e+064e+062000003e+062e+061800001e+061600000-1e+06020406040608010010080Рис 1.20.
Размер популяции x∗ (t)Рис 1.21. Сопряженная переменная λ1 (t)7654321020250020001500100050020406080100Рис 1.22. Стратегия игрока E ∗ (t)020406080100Рис 1.23. Вылов U ∗ (t)Выигрыш игрока J = 0.289 · 109 , затраты центра I1 = −0.696 · 1011 .1.3.2. Задача определения территории эксплуатации с функционалом I2Как и ранее, центр определяет долю закрытой для эксплуатации части территории s(t),0 ≤ s(t) ≤ 1.
Игрок эксплуатирует ресурс на протяжении T периодов времени. Динамикаразвития популяции описывается уравнением (2.1).Функция выигрыша игрока аналогична предыдущей модели и имеет вид (3.1).В качестве функционала, определяющего выигрыш центра, рассмотримZT[qE(t)(1 − s(t))x(t) − x̂(t)]2 dt ,I2 = −(3.16)0где первое выражение в квадратных скобках дает вылов, а x̂(t) – уровень потребления,определяемый спросом.В данном случае I2 – относительная величина, отражающая затраты центра на удовлетворение спроса населения в данном ресурсе.59Как и в предыдущем разделе, в качестве решения конфликта выступает равновесие поНэшу, т.е.
необходимо решить задачу (3.3) с функционалом центра I2 .Зафиксируем стратегию игрока. Применяя принцип максимума, гамильтониан центрапримет видH1 (x, E, λ1 , s) = −(qE(1 − s)x − x̂)2 + λ1 (F (x) − qE(1 − s)x) .Максимум H1 достигается наs=1−2x̂ − λ1.2qExУравнение для сопряженной переменной λ1 с условием трансверсальности примет видλ01 = −∂H= 2(qE(1 − s)x − x̂)qE(1 − s) − λ1 (Fx0 (x) − qE(1 − s)) , λ1 (T ) = 0 .∂xТеперь зафиксируем стратегию центра.
Гамильтониан игрока примет вид1H2 (x, E, λ2 , s) = − aE 2 (1 − s)2 x2 + bE(1 − s)x − cE + λ2 (F (x) − qE(1 − s)x) .2Тогда максимум H2 достигается на·¸+(b − qλ2 )(1 − s)x − cE(t) =.a(1 − s)2 x2Стратегия игрока неотрицательна при выполнении условия(b − qλ2 )(1 − s)x ≥ c .(3.17)Уравнение для сопряженной переменной λ2 с условием трансверсальности имеет видλ02 = −∂H2= −E(1 − s)(b − aE(1 − s)x) − λ2 (Fx0 − qE(1 − s)) , λ2 (T ) = gx0 (x∗ (T )) .∂xПодставив стратегию центра s в выражение для E, получимE ∗ (t) =(2x̂ − λ1 (t))(2qb − 2q 2 λ2 (t) − 2ax̂ + aλ1 (t)),0≤t≤T,4cq 2s∗ (t) = 1 −2cq.x∗ (t)(2qb − 2q 2 λ2 (t) − 2ax̂ + aλ1 (t))Подставляя оптимальные стратегии в систему, получим³x(t) ´ 2x̂ − λ1 (t)0−,x(t)=rx(t)1−K2³´³x̂λ1 (t)2rx(t)x̂λ1 (t) ´0λ1 (t) = −λ1 (t)−) − λ1 (t) r −−+x(t) 2x(t)Kx(t) 2x(t)³´2rx(t)= −λ1 (t) r −,K2x̂ − λ1 (t) 2bq − a(2x̂ − λ1 (t))λ02 (t) = −+−2qx(t)2q³x̂λ1 (t) ´2rx(t)−+.− λ2 (t) r −Kx(t) 2x(t)60³2rx(t) ´Решением λ01 (t) = −λ1 (t) r −, λ1 (T ) = 0 является λ1 (t) ≡ 0 .KТогда система принимает вид³x(t) ´ x0 (t) = rx(t) 1 −− x̂ ,K ´³³x̂ax̂2rx(t)x̂ ´ λ02 (t) = −b−− λ2 (t) r −−.qx(t)qKx(t)Или, сделав замену λ̄2 (t) = λ2 (t)eρt и подставив выражения для a и b:³x(t) ´ x0 (t) = rx(t) 1 −− x̂ , x(0) = x0 ,K³´x̂2rx(t)x̂ λ̄02 (t) = −(p − 2kx̂) − λ̄2 (t) r −−− ρ , λ̄2 (T ) = eρT gx0 (x(T )) .qx(t)Kx(t)(3.18)Итак, доказаны необходимые условия следующего утверждения.Теорема 3.4.
Стратегииx̂(p − λ̄2 (t) − 2kx̂)c0∗E (t) =, s (t) = 1 − ∗,c0x (t)q(p − λ̄2 (t) − 2kx̂)∗такие, что x∗ (t), λ̄2 (t) удовлетворяют системе (3.18) и выполнены следующие условия:x̂ <pc0, λ̄2 (t) < p − 2kx̂ , x∗ (t) >2kq(p − 2kx̂ − λ̄2 (t))(3.19)являются оптимальным по Нэшу решением задачи (2.1), (3.1), (3.16).Доказательство. Полученная выше стратегия центра существует при 0 < s∗ (t) < 1, т.е.когда выполняются условияλ̄2 (t) < p − 2kx̂ , x∗ (t) >c0.q(p − 2kx̂ − λ̄2 (t))(3.20)Стратегия игрока положительна, т.к.