Главная » Просмотр файлов » Автореферат

Автореферат (1145355), страница 4

Файл №1145355 Автореферат (Теоретико-игровые задачи со случайной продолжительностью) 4 страницаАвтореферат (1145355) страница 42019-06-29СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 4)

Динамика игры задается системой обыкновенных дифференци­альных уравнений (1), для которой выполняются требования Предположения1.1.1. Функция мгновенного выигрыша ℎ (( ), ( )) игрока в момент време­ни , ∈ [0 , ), зависит от фазовой переменной (0 , 0 , , (·)) и текущихзначений управлений ( ), где (·) = {1 (·), . . . , (·)} — –набор допустимыхуправлений игроков. Предполагается, что ℎ являются непрерывными функци­ями своих аргументов.Математическое ожидание выигрыша игрока (︂Z)︂ (0 , 0 , , 1 , .

. . , ) = E ℎ (( ), ( ))0в игре Γ (0 , 0 , ) имеет вид:Z (0 , 0 , , 1 , . . . , ) =0⎡⎤Z⎣ ℎ (( ), ( )) ⎦ (), = 1, . . . , .(6)0При развитии игры во времени, в каждый промежуточный момент , ∈ (0 ; ), игроки попадают в подыгру Γ ((), , ) с начальным состоянием() = . Очевидно, что игра может закончиться до момента с вероятностью (), а вероятность продолжить игру после момента равна (1 − ()). Тогдапод выигрышем в подыгре Γ ((), , ) будем понимать условное математи­ческое ожидание выигрыша, а именно:Z Z (, , , 1 , .

. . , ) =ℎ (( ), ( )) (),(7)где (), ≥ – функция распределения момента окончания игры в подыг­ре Γ ((), , ). Нетрудно заметить, что () является условной функциейраспределения, а именно функцией распределения момента окончания игрыпри условии, что игра не закончилась до момента , ∈ (0 , ). Кроме того,необходимо, чтобы () удовлетворяла стандартному условию нормировки при ∈ (0 , ). Условная функция распределения () вычисляется по следующейформуле: () = () − (),1 − () ∈ [, ).(8)14Очевидно, что в подыгре Γ ((), , ) условная плотность распределения () определяется следующим образом: () = (), ∈ [, ).1 − ()(9)Таким образом, при предположении о существовании плотности () = () и учитывая равенства (7) и (9), запишем интегральный выигрыш игрока, = 1, .

. . , , в подыгре Γ ((), , ):′1 (, , , 1 , . . . , ) =1 − ()Z Zℎ (( ), ( )) ().(10)В § 2.2 изучается вопрос упрощения функционала выигрыша в дифферен­циальной игре Γ (0 , 0 , ). Математическое ожидание интегрального выигры­ша игрока для игры Γ (0 , 0 , ) является функционалом нестандартного длязадач оптимального управления вида, т.к. содержит повторное интегрирование.В § 2.2 данный функционал приведен к стандартному виду при помощи заменыпорядка интегрирования.

Кроме того, в § 2.2.2 рассматривается случай смешан­ного функционала выигрыша игрока, т.е. интегрального и терминального вы­игрыша. В § 2.2.3 изучается вопрос об упрощении функционала выигрыша дляобщего случая линейно-квадратичных дифференциальных игр.Рассмотрим интегральный выигрыш игрока , который имеет вид (6). Неумаляя общности, в этом разделе положим 0 = 0. Кроме того, введем болеекомпактное обозначение ℎ ( ) = ℎ (( ), ( )). Ниже будет рассмотрен случай = ∞ как наиболее сложный.Теорема 2.2.1. Пусть функции мгновенного выигрыша ℎ (), = 1, . .

. , являются неотрицательными и интегрируемыми функциями времени , ∈[0 , ∞). Тогда выигрыш игрока (6) может быть представлен в следующем виде:∞Z Z∞Zℎ ( ) () = (1 − ( ))ℎ ( ). (0 , 0 , 1 , . . . , ) =0 0(11)0В общем случае имеет место следующий результат.Теорема 2.2.2. [4] Ожидаемый выигрыш (6) может быть представлен ввиде (11), если выполняются следующие условия:1.Zlim (1 − ( ))ℎ () = 0.

→∞0152. Следующие интегралы существуют в смысле несобственных интеграловРимана:⃒⃒∞Z ⃒Z⃒⃒⃒⃒ ℎ ( ) ⃒ () < +∞,⃒⃒⃒⃒ = 1, . . . , .0 0Следствие 2.2.1. Интегральный выигрыш (6) имеет следующий вид:Z (0 , 0 , , 1 , . . . , ) =−ℎ (( ), ( ))R0(),(12)0 ()где () = 1− () .В общем случае для подыгры Γ ((), , ) имеем следующий вид выиг­рыша для игрока :Zℎ (( ), ( ))− (, , , 1 , . . . , ) =R().(13)Теоретические результаты демонстрируются для дифференциальной игрыуправления объемами вредных выбросов в атмосферу (§ 2.2.1) и дифференци­альной игры управления капиталовложениями в рекламную кампанию (§ 2.2.4).В § 2.3 игра Γ (0 , 0 , ) изучается в кооперативной форме, причем задачарассматривается со смешанными выигрышами игроков.

Перед началом игрыигроки договариваются об использовании ими допустимых управлений * =(*1 , . . . , * ), максимизирующих совокупный ожидаемый выигрыш игроков:∑︁∑︁ Z [︂ (0 , 0 , , 1 , . . . , ) =(1 − ( ))ℎ (( ), 1 , . . . , )+=1,...,=1,..., 0]︂+ ( ) (( )) . (14)Дальнейшее изложение предполагает, что кооперативная траектория существу­ет и является единственной.Обозначим как ℎ(( ), ) =выигрыш, (( )) =∑︀∑︀ℎ (( ), 1 , .

. . , ) совокупный мгновенный=1 (( )) – суммарный терминальный выигрыш.=1Рассмотрим следующую задачу максимизации:11 − ()Z [︂]︂(1 − ())ℎ(, ) + ()(()) ,˙ = (, ), () = .(15)16В § 2.3.1 данная задача решается в классе позиционных управлений, (, ) —соответствующая функция Беллмана. Для простоты рассмотрим случай ∈R1 .Теорема 2.3.1. Пусть существует непрерывно дифференцируемая по сво­им аргументам функция (, ()), удовлетворяющая уравнению(︂)︂ () () =+ max ℎ(, ) +() +(, )1 − ()1 − ()(16)с краевым условием lim (, )=0, и существует допустимое управление * (, ), →(︁)︁доставляющее максимум выражению ℎ(, ) ++, тогдауправление * (, ) является оптимальным и выполняется равенство (0 , 0 ) = (0 , 0 , , ).Следствие 2.3.1.

Уравнение Гамильтона-Якоби-Беллмана (16) имеет сле­дующий вид:(︂)︂ (, ) (, )+ max ℎ(, ) + ()() +(, ) . (17)() (, ) = ()1− () () (, )В § 2.3.2 уравнение (17) выведено другим способом, который не предполагаетпредварительного упрощения интегрального выигрыша игрока.

В § 2.3.3 и в§ 2.3.4 оптимальные управления найдены, соответственно, в классе программ­ных и позиционных стратегий для приложений дифференциальных игр в об­ласти природоохранного менеджмента (§ 2.3.3) и совместной разработки место­рождения игроками (§ 2.3.4).В Главе 3 рассматриваются некоторые модификации игры Γ (0 , 0 , )со случайным моментом окончания, а именно, в § 3.1 — § 3.4 введены клас­сы дифференциальных игр, обозначенные как Γ, (0 , 0 , ), Γ (0 , 0 , ),Γ , (0 , 0 , ), Γ (0 , 0 ).В § 3.1 изучается игра Γ, (0 , 0 , ), которая заканчивается в случай­ный момент времени c функцией распределения (), ∈ [0 , ], причеммгновенные выигрыши игроков дисконтируются при помощи функции дискон­тирования −(0 , ) , т.е.⎛⎞Z (0 , 0 , ) = ⎝ −(0 , ) ℎ (( ), 1 , .

. . ) ⎠(18)0где (0 , ) – ставка дисконтирования.ставкой дисконтирования (0 , )=R В случае дисконтирования с интегральной,()(0 , 0 , ). Для игры Γ,() (0 , 0 , )0 ( ) используется обозначение Γв § 3.1.1 выводится уравнение типа Гамильтона– Якоби – Беллмана.Рассмотрим игру Γ,() (0 , 0 , ) с интегральной ставкой дисконтирова­ния.17Теорема 3.1.1. Пусть существует непрерывно дифференцируемая по сво­им аргументам функция (, ()), удовлетворяющая уравнению(︂)︂)︂ () ()+ max ℎ(, , ) +() +(, )() + =1 − ()1 − ()(19)*с краевым условием lim (, )=0 и существует допустимое управление (, ), →(︁)︁ ()доставляющее максимум выражению ℎ(, , ) + 1− () () + (, ) , тоуправление * (, ) является оптимальным.В § 3.1.2 приведен пример дифференциальной игры 2 лиц, в которой иг­роки различных типов (развитая и развивающаяся страны) участвуют в игреуправления вредными выбросами.В § 3.2 изучается игра Γ (0 , 0 ), являющаяся модификацией игры сослучайным моментом окончания Γ (0 , 0 , ), для которой может быть полученряд специальных свойств, основанных на виде функции распределения случай­ной величины , заданной следующим образом.

Пусть – случайная величинас известной функцией распределения (), = 1, , соответствующая момен­ту окончания конфликтно-управляемого процесса для игрока , = 1, . Будемпредполагать, что { }=1 – независимые случайные величины. В данном раз­деле предполагаем, что игра начинается в момент 0 и заканчивается в моментпервой остановки игры для какого-либо из игроков, т.е.(︂ = min{1 , 2 , . .

. , }.(20)∏︀Для случайной величины имеем: () = 1 − =1 (1 − ()).Динамика игры задается системой обыкновенных дифференциальных урав­нений (1). Выигрыши игроков предполагаются интегральными и, при выполне­нии предпосылок Теоремы 2.2.2, имеют вид (12). В данном разделе предпола­гаем = ∞. Результаты для конечного временного интервала [0 ; ] могутбыть получены аналогичным образом.Утверждение 3.2.1. В игре Γ (0 , 0 ) интегральный выигрыш игрока, = 1, . . .

, имеет следующий вид:∞Z (0 , 0 , ) =−ℎ (( ), ( ))R0(),(21)0∑︀где () = =1 ().В работе рассмотрены два примера игры Γ (0 , 0 , ) из области при­родоохранного менеджмента, в которых управление ищется в классе программ­ных (§ 3.2.1) и позиционных (§ 3.2.2) управлений. В § 3.2.1 изучается дифферен­циальная игра управления вредными выбросами, в которой случайные вели­чины имеют распределение Вейбулла с параметрами , .

В § 3.2.2 однатеоретико-игровая задача оптимальной разработки невозобновляемого ресурсарешена для произвольной функции распределения ().18В § 3.3 сформулирована следующая модификация игры Γ (0 , 0 , ).Пусть в игре принимают участие два игрока ( = 2), причем игра прекращаетсяв момент времени = min{1 , 2 }, однако в отличие от предыдущей поста­новки задачи, асимметрия заключается в том, что оставшийся игрок такжеполучает терминальный выигрыш Φ (( )). Для данной постановки в § 3.2.1выигрыш приводится к стандартному виду, в § 3.2.2 сформулировано уравнениетипа Гамильтона– Якоби – Беллмана.Далее в Главе 3 в § 3.4 рассматривается теоретико-игровая задача Γ (0 , 0 ),в которой вероятностное распределение момента окончания игры не можетбыть описано с помощью некоторого стандартного распределения. В этом слу­чае предлагается использовать составную функцию распределения (), ∈[0 , ∞), заданную специальным образом.

Характеристики

Тип файла
PDF-файл
Размер
353,67 Kb
Высшее учебное заведение

Список файлов диссертации

Теоретико-игровые задачи со случайной продолжительностью
Свежие статьи
Популярно сейчас
Почему делать на заказ в разы дороже, чем купить готовую учебную работу на СтудИзбе? Наши учебные работы продаются каждый год, тогда как большинство заказов выполняются с нуля. Найдите подходящий учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6418
Авторов
на СтудИзбе
307
Средний доход
с одного платного файла
Обучение Подробнее