Диссертация (1145439), страница 10

Файл №1145439 Диссертация (Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами) 10 страницаДиссертация (1145439) страница 102019-06-292019-06-29СтудИзба

Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 10)

Игрок эксплуатирует ресурс протяжении T периодов времени. Рассматривается задача управления процессом эксплуатации промысловойпопуляции, динамика развития которой описывается уравнением (2.1).Выигрыш игрока, как и ранее, имеет видZTe−ρt [Π(q, s(t), x(t), E(t)) · qE(t)(1 − s(t))x(t) − c0 E(t)]dt ,J = g(x(T )) +(3.1)0где 0 < ρ < 1 – коэффициент дисконтирования, c0 > 0 – затраты на вылов и Π – функцияцены, определенная какΠ(q, s(t), x(t), E(t)) = p − kqE(t)(1 − s(t))x(t), p, k > 0 .Для определенности, предположим, что терминальный выигрыш игрока имеет видg(x(T )) = αpx(T )e−ρT , т.е.

игрок в конечный момент времени получает компенсацию, пропорциональную прибыли от продажи оставшегося ресурса.Обозначив a = 2kq 2 e−ρt , b = pqe−ρt , c = c0 e−ρt , запишем функцию выигрыша игрока ввиде (2.2).В качестве функционала, определяющего выигрыш центра, рассмотримZT(x(t) − x̄(t))2 dt ,I1 = −(3.2)0где x̄(t) – размер популяции, оптимальный для воспроизводства.В данном случае I1 – это относительная величина, отражающая затраты центра навосстановление эксплуатируемой популяции.47Таким образом, в данном разделе игрок и центр являются участниками динамическойигры. В качестве решения возникающего конфликта рассмотрим равновесие по Нэшу, т.е.такие стратегии s∗ и E ∗ , которые удовлетворяют следующим неравенствам:J(s∗ , E ∗ ) ≥ J(s∗ , E) , ∀E ,I1 (s∗ , E ∗ ) ≥ I1 (s, E ∗ ) , ∀s .(3.3)Зафиксируем стратегию игрока и найдем оптимальное поведение центра, используяпринцип максимума [57].

Гамильтониан центра имеет видH1 (x, E, λ1 , s) = −(x − x̄)2 + λ1 (F (x) − qE(1 − s)x) .Представив H1 = λ1 qExs+ {оставшаяся часть, не зависящая от s}, получим, что стратегия s, на которой H1 достигает максимума имеет видПри λ1 > 0 =⇒ s(t) ≡ 1 ,при λ1 = 0 =⇒ s(t) любое , при λ < 0 =⇒ s(t) ≡ 0 .1Уравнение для сопряженной переменной λ1 с условием трансверсальности примет видλ01 = −∂H1= 2(x − x̄) − λ1 (Fx0 (x) − qE(1 − s)) , λ1 (T ) = 0 .∂xЗафиксируем теперь стратегию центра. Тогда гамильтониан игрока имеет вид1H2 (x, E, λ2 , s) = − aE 2 (1 − s)2 x2 + bE(1 − s)x − cE + λ2 (F (x) − qE(1 − s)x) .2Максимум достигается на·(b − qλ2 )(1 − s)x − cE(t) =a(1 − s)2 x2¸+.Стратегия игрока неотрицательна при выполнении условия(b − qλ2 )(1 − s)x ≥ c .(3.4)Уравнение для λ2 с условием трансверсальности имеет видλ02 = −∂H2= −E(1 − s)(b − aE(1 − s)x) − λ2 (Fx0 − qE(1 − s)) , λ2 (T ) = gx0 (x∗ (T )) .∂xБудем искать управление центра в виде кусочно-непрерывной функции.48Замечание 3.1.

Управление E(t), которое максимизирует подынтегральное выражение в(3.1), называется «близорукой стратегией» [103]. Оно имеет видE(t) =pq(1 − s(t))x(t) − c02kq 2 (1 − s(t))2 x(t)2и достигает максимального значенияEm =p2c0при xm =.8kc0 qpq(1 − s(t))Условимся рассматривать далее стратегии игрока E(t)<Em , для которыхx(t) ≥ xm ∀t .Достаточным условием этого являетсяF (xm ) − qEm xm ≥ 0или, что эквивалентно,s≤1−16kc20 r.Kpq(8kc0 r − p)(3.5)1.3.1.1.

Стратегии специального видаЯсно, что стратегия, которая дает центру наибольший выигрыш, т.е. наименьшие затраты на восстановление популяции, это такое s∗ , при котором x(t) ≡ x̄.Заметим, что стабилизация размера популяции на уровне x̄ возможна начиная с какогото момента времени, поэтому существуют два варианта:1) При x(0) < x̄, сначала стратегия центра равна 1, т.е. эксплуатация не ведется, а затемs∗ такое, что x(t) ≡ x̄ при t > t0 .2) При x(0) > x̄, сначала стратегия центра равна нулю, т.е. ведется неограниченный вылов,а затем s∗ такое, что x(t) ≡ x̄ при t > t0 .Теорема 3.1. Рассматривается случай x(0) < x̄.Равновесие по Нэшу в задаче (2.1), (3.1), (3.2) имеет вид 0, t < t , 1, t < t ,00и E ∗ (t) =s∗ (t) = Ē(t) , t ≥ t , s̄(t) , t ≥ t00гдеs̄(t) = 1 −(p − λ̄2 (t))qx̄(1 − s̄(t)) − c0c0 K, Ē(t) =,2kq 2 x̄2 (1 − s̄(t))2x̄q(K(p − λ̄2 (t)) − 2rkx̄(K − x̄))t0 =1 ³ x̄(K − x0 ) ´ln,rx0 (K − x̄)(3.6)49и s̄(t) удовлетворяет условию (3.5), а такжеλ̄2 (t) =(t−T )(r x̄+Kρ)(t−T )(r x̄+Kρ)(K − x̄)2 ³ pr2r2 x̄k ´KK−(1 − e) + αperx̄ + Kρ K − x̄K(3.7)удовлетворяет следующим условиям:nppc0 oM − < λ̄2 (t) < min , M −,24x̄qгде M = p −(3.8)2rkx̄(K − x̄).KДоказательство.

Пусть 1 , (λ (t) > 0) t < t ,10∗s (t) = s̄(t) , (λ (t) = 0) t ≥ t .10При s = 1 оптимальная стратегия игрока равно нулю (отсутствие эксплуатации) и динамика развития популяции описывается уравнением³x(t) ´, x(0) = x0 .x0 (t) = rx(t) 1 −KОткуда находим, чтоx(t) =x0 +Kx0−rte (K− x0 ).Момент времени переключения стратегии центра находим из условия x(t0 ) = x̄, откуда1 ³ x̄(K − x0 ) ´.t0 = lnrx0 (K − x̄)При t > t0 оптимальная стратегия игрока имеет видĒ(t) =(b − qλ2 (t))x(t)(1 − s̄(t)) − c,ax(t)2 (1 − s̄(t))2а система для x(t) и сопряженной переменной примет вид´³cq2x(t) ´ q ³0−b−+λ(t), x(t0 ) = x̄ ,x(t)=rx(t)1−2Kax(t)(1−s̄(t))a³´ccb−−λ02 (t) = − 2ax (t)(1 − s̄(t))x(t)(1 − s̄(t))³´2rx(t)cq −λ2 (t) r −− 2, λ2 (T ) = gx0 (x∗ (T )) = αpe−ρT .Kax (t)(1 − s̄(t))Сделав замену λ̄2 (t) = λ2 eρt , получим´³1 ³c01x(t) ´0−pq −+ λ̄2 (t) , x(t0 ) = x̄ ,x (t) = rx(t) 1 −K2kq(1 − s̄(t))x(t)2k³´c0c00pq −−λ̄2 (t) = −2kq 2 (1 − s̄(t))x2 (t)(1 − s̄(t))x(t)³´2rx(t)c0 −λ̄2 (t) r −−−ρ, λ̄2 (T ) = αp .K2kqx(t)2 (1 − s̄(t))50При t > t0 x(t) ≡ x̄ и из первого уравнения системы, записанного в общем виде x0 (t) =rx(t)(1 − x(t)/K) − qE(t)x(t)(1 − s(t)) получимs(t) = 1 −r(K − x).KqE(t)Окончательно, подставляя выражение для Ē(t), получимs̄(t) = 1 −c0 K,x̄q(K(p − λ̄2 (t)) − 2rkx̄(K − x̄))а из второго уравненияλ̄2 (t) =(t−T )(r x̄+Kρ)(t−T )(r x̄+Kρ)(K − x̄)2 ³ pr2r2 x̄k ´KK−(1 − e) + αpe.rx̄ + Kρ K − x̄KТакая стратегия центра, естественно, существует не всегда, а при выполнении неравенства 0 < s̄(t) < 1, откуда получим условиеλ̄2 (t) < M −c0.x̄q(3.9)Докажем оптимальность полученных стратегий при t > t0 .Для центра s̄(t) очевидно является оптимальным, т.к.

дает нулевые затраты.Зафиксируем s̄ и покажем, что J(s̄, Ē) ≥ J(s̄, E). Подставляя стратегии участниковзапишем уравнение для сопряженной переменной в видеλ02 (t) = −L(t) − N (t)λ2 (t) ,где L(t) = −³´ccb−> 0 ∀t приax̄2 (1 − s̄(t))x̄(1 − s̄(t))x̄ >c0,pq(1 − s̄(t))что выполнено при условии (3.5).Общее решение этого уравнения имеет видλ2 (t) = e−RtN (τ )dτt0Zt(c2 −RτL(τ )et0N (p)dpdτ ) .t0Из условия трансверсальности λ2 (T ) > 0 , следовательноZTc2 ≥RτL(τ )et0t0N (p)dpZtdτ ≥RτL(τ )et0N (p)dpt0Тогдаλ2 (t) > 0 ∀t > t0 .dτ ∀t ∈ [t0 , T ] .51Обозначим при t > t0H20 (x, λ2 , s̄) = max H2 (x, E, λ2 , s̄) .E≥0Подставив выражение для Ē, H20 примет видH20 (x, λ2 , s̄) =c2c(b − λ2 q) (b − λ2 q)2++ λ2 F (x) .−2a(1 − s̄)2 x2a(1 − s̄)x2aПокажем, что H20 вогнутаH20 xx (x, λ2 , s̄)b − λ2 q ≥³´ 2r2c3c= 3− (b − λ2 q) − λ2 (t) ,ax (1 − s̄) 2x(1 − s̄)K3cпри2x(1 − s̄)x ≡ x̄ >2c0pq(1 − s̄(t))(3.10)и11λ2 (t) < pe−ρt (λ̄2 (t) < p) ,44(3.11)а λ2 (t) > 0 ∀t > t0 .

Следовательно,H20 xx (x, λ2 , s̄) ≤ 0 , т.е. H20 – вогнута.Из вогнутости и определения H20 следует неравенство0H2 (x, E, λ2 , s̄) ≤ H20 (x̄, λ2 , s̄) + H2x(x̄, λ2 , s̄)(x(t) − x̄) .Из условия λ02 (t) = −H20 x (x̄, λ2 , s̄) получимH2 (x, E, λ2 , s̄) ≤ H20 (x̄, λ2 , s̄) − λ02 (t)(x(t) − x̄) .Проинтегрировав и упростив, запишемJ(s̄, E) +RTλ2 (t)(F (x) − qE(1 − s̄)x) dt − g(x(T )) ≤ J(s̄, Ē) +t0−q Ē(1 − s̄)x̄) dt − g(x̄(T )) − λ2 (T )(x(T ) − x̄(T )) +RTRTλ2 (t)(F (x̄)−t0λ2 (t)x0 (t)dt −t0RTλ2 (t)x̄(t)0 dt .t0ОткудаJ(s̄, E) ≤ J(s̄, Ē) − λ2 (T )(x(T ) − x̄(T )) + (g(x(T )) − g(x̄(T ))) .Из вогнутости g(x) следует g(x(T )) − g(x̄(T )) ≤ gx0 (x̄(T ))(x(T ) − x̄(T )), что вместе сусловием трансверсальности gx0 (x̄(T )) = λ2 (T ) даетJ(s̄(t), E(t)) ≤ J(s̄(t), Ē(t)) .52Таким образом, мы доказали, что Ē – оптимальная стратегия игрока при t > t0 при выполнении условий (3.9)–(3.11).

При этом очевидно стратегия неотрицательна, т.к. условие(3.4) для Ē выполнено при выполнении условий (3.10) и (3.11).Подставляя выражение для s̄(t), условие (3.10) преобразуется в λ̄2 (t) > M − p2 .Окончательно на сопряженную переменную накладываются следующие условияnppc0 oM − < λ̄2 (t) < min , M −.24x̄q2400008220000620000041800002160000020406080100020406080100Рис 1.12. Размер популяции x∗ (t)Рис 1.13. Стратегия игрока E ∗ (t)2e+0610.91.5e+060.80.71e+060.650000000.520406080100Рис 1.14.

Сопряженная переменная λ1 (t)0.4020406080100Рис 1.15. Стратегия центра s∗ (t)Приведем пример для x̄ = 250000. Все остальные параметры соответствуют разделу1.2. Для случая, когда начальный размер популяции x(0) = 150000, точка t0 = 26.82, послекоторой λ1 (t) ≡ 0 (рис. 1.14). Следовательно, сначала стратегия центра s∗ = 1, а затемs∗ = s̄(t) (рис. 1.15). Оптимальная стратегия игрока E ∗ (t) приведена на рис. 1.13. Приэтом, размер популяции возрастет с 150000 до 250000 особей и затем держится на этомуровне (рис.

1.12).Проверим выполнение условий для λ̄2 (t). При заданных параметрах M = 2000, M − p2 =−1000, min{ 14 p, M −c0}x̄q= 1000. Получим условие −1000 < λ̄2 (t) < 1000. Моделирование53показало, что λ̄2 (t) возрастающая функция, λ̄2 (0) = 285 и λ̄2 (T ) = 300, т.е. условия выполнены. Затраты центра I1 = −0.829 · 1011 .Теорема 3.2. Рассматривается случай x(0) > x̄.Равновесие по Нэшу в задаче (2.1), (3.1), (3.2) имеет вид 0, t < t , (p−λ̂2 (t))qx(t)−c0 , t < t ,002kq 2 x(t)2s∗ (t) =и E ∗ (t) = s̄(t) , t ≥ tĒ(t) , t ≥ t0 ,0(3.12)где x(t) и λ̂2 (t) определяются из системы (3.13) и удовлетворяют условиямx(t) >2c0p, λ̂2 (t) < ,pq4s̄(t), Ē(t), λ̄2 (t) имеют вид (3.6), (3.7) и удовлетворяют условиям (3.5), (3.8).Доказательство.

Пусть 0 , (λ (t) < 0) t < t ,10s∗ (t) = s̄(t) , (λ (t) = 0) t ≥ t .10При s = 0 оптимальная стратегия игрока имеет видE ∗ (t) =(p − λ̂2 (t))qx(t) − c0,2kq 2 x(t)2и определяется из следующей системы³x(t) ´1 ³c0 ´10x(t)=rx(t)1−−pq−+ λ̂2 (t) ,K2kqx(t)2k³´2rx(t)p1c0λ01 (t) = 2(x(t) − x̄) − λ1 (t) r −−+λ̂2 (t) +,K2kx(t) 2kx(t)2kqx(t)2³³´c0c0 ´2rx(t)c00λ̂(t)=−pq−−λ̂(t)r−−−ρ 222kq 2 x(t)2x(t)K2kqx(t)2(3.13)с начальными данными x(t0 ) = x̄, λ1 (t0 ) = 0.При t > t0 действуя аналогично теореме 3.1, получимs̄(t) = 1 +c0 K,x̄q(2rkx̄(K − x̄) − K(p − λ̄2 (t)))(t−T )(r x̄+Kρ)(t−T )(r x̄+Kρ)2r2 x̄k ´(K − x̄)2 ³ prKK−(1 − e) + αpe.λ̄2 (t) =rx̄ + Kρ K − x̄KТеперь мы знаем λ̄2 (t0 ) = λ̂2 (t0 ) и для нахождения точки t0 необходимо решить систему(3.13), так, чтобы x(0) = x0 .Аналогично, такая стратегия центра существует при условииλ̄2 (t) < M −c0.x̄q54Дополнительные условия на λ̄2 (t) получим в процессе доказательства оптимальностиĒ(t) как в теореме 3.1.

Характеристики

Тип файла

PDF-файл

Размер

3,67 Mb

Материал

Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами

Тип материала

Докторская диссертация

Предмет

Физико-математические науки

Высшее учебное заведение

СПбГУ

Список файлов диссертации

kooperacija-i-konkurencija-v-dinamicheskih-modeljah-upravlenija-vozobnovljaemymi-resursami.rar

Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами

Автореферат.pdf

Диссертация.pdf

Прочти меня!!!.txt

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.