Автореферат (1149188), страница 3

Файл №1149188 Автореферат (Кооперативные дифференциальные игры с динамическим обновлением информации) 3 страницаАвтореферат (1149188) страница 32019-06-292019-06-29СтудИзба

Кооперативные дифференциальные игры с динамическим обновлением информации

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 3)

(11)В разделе 2.5 описывается и формализуется математически связь решений (∗ (), ),̂ (̂ ∗ (), − ) ввыбранных игроками в усеченных подыграх с результирующим решением игресдинамическимобновлениеминформации.Наосновевведенногопонятияхарактеристической функцииV(; ̂ ∗ (), − ) определяются такие принципы оптимальности,как пропорциональное решение, вектор Шепли, C-ядро и сильно динамически устойчивое ПРДядро.Определение 2.5.1. Пропорциональным решением в Γ(0 , − 0 ) с динамическим обновлениеминформации, с характеристической функцией V(; ̂ ∗ (), − ) будем называть такой дележ̂ (̂ ∗ (), − ),ПРД которого рассчитывается следующим образом:Prop̂ () =V({};̂ ∗ (),−)∑∈ V({};̂ ∗ (),−)(− V(; ̂ ∗ (), − )) , ∈ [0 , ]. (12)Теорема 2.5.2.

Пусть в каждой усеченной подыгреΓ̂ (∗ (), , 0 + ∆ + ): (∗ (), , 0 + ∆ + ) = (∗ (), , 0 + ∆ + ), (16)где ∈ [0 + ∆, 0 + ( + 1)∆ + ], = 0, … , , тогда̂ (̂ ∗ (), − ) = (̂ ∗ (), − ), ∀ ∈ [, ], (17)где̂ (̂ ∗ (), − )-этопропорциональноерешение,рассчитанноенаосновехарактеристической функции V(; ̂ ∗ (), − ) (10).Определение 2.5.2. Вектором Шепли в (0 , − 0 ) с динамическим обновлением информации,с характеристической функцией (; ̂ ∗ (), − ) будем называть следующий дележ:̂ (̂ ∗ (), , 0 + ∆ + ) =ℎ=∑⊂∈(|| − ||)! (|| − 1)!( (; ̂ ∗ (), − ) − (\{}; ̂ ∗ (), − ).

(15)||!11Теорема 2.5.1. Пусть в каждой усеченной подыгреΓ̂ (∗ (), , 0 + ∆ + ): (∗ (), , 0 + ∆ + ) = ℎ (∗ (), , 0 + ∆ + ), (13)где ∈ [0 + ∆, 0 + ( + 1)∆ + ], = 0, … , , тогда̂ (̂ ∗ (), − ), ∀ ∈ [, ], (14)̂ (̂ ∗ (), − ) = ℎ̂ (̂ ∗ (), − ) - это вектор Шепли, рассчитанный на основе характеристическойгде ℎфункции V(; ̂ ∗ (), − ) (10).Определение 2.5.3. C-ядром в Γ(0 , − 0 ) с динамическим обновлением информации схарактеристической функцией V(; ̂ ∗ (), − )будем называть множество ̂ (̂ ∗ (), −)дележей ̂(̂ ∗ (), − ), каждый из которого удовлетворяет следующем условию:∑ ̂(̂ ∗ (), − ) ≥ V(; ̂ ∗ (), − ), ∀ ⊆ . (18)∈Теорема 2.5.3.

Пусть в каждой усеченной подыгреΓ̂ (∗ (), , 0 + ∆ + ): (∗ (), , 0 + ∆ + ) = (∗ (), , 0 + ∆ + ), (19)где∀ ∈ [0 + ∆, 0 + ( + 1)∆], = 0, … , ,тогдадлявсех (∗ (), , 0 + ∆ + ) ∈ (∗ (), , 0 + ∆ + ) для которых выполняется условие:∑ (∗ (), , 0 + ∆ + ) − (; ∗ (), , 0 + ∆ + ) ≥∈∗∗≥ ∑ (,1, 0 + ( + 1)∆ + , 0 + ∆ + ) − (; ,1, 0 + ( + 1)∆ + , 0 + ∆ + ), (20)∈верно, что̂(̂ ∗ (), − ) ∈ ̂ (̂ ∗ (), − ), ∀ ∈ [, ], (21)где ̂ (̂ ∗ (), − ) - это C-ядро, рассчитанное на основе результирующей характеристическойфункции V(; ̂ ∗ (), − ).Определение 2.5.4.

ПРД-ядром в Γ(0 , − 0 )с динамическим обновлением информации с̂ (̂ ∗ (), − )характеристической функцией V(; ̂ ∗ (), − ) будем называть множество дележей ̂(̂ ∗ (), − ) ПРД ̂ (, ̂ ∗ ), каждого из которых удовлетворяет следующем условию:[V(; ̂ ∗ (), − ) − V(\; ̂ ∗ (), − )] ≥ ∑ ̂ (, ̂ ∗ ) ≥[V(; ̂ ∗ (), − )],∈∀ ⊂ . (22)Теорема 2.5.4. Пусть в каждой усеченной подыгреΓ̂ (∗ (), , 0 + ∆ + ) (∗ (), , 0 + ∆ + ) = (∗ (), , 0 + ∆ + ) ≠ ∅, (23)где ∀ ∈ [0 + ∆, 0 + ( + 1)∆], = 0, … , , тогда верно, что̂ (̂ ∗ (), − ), ∀ ∈ [, ], (24)̂ (̂ ∗ (), − ) = ̂ (̂ ∗ (), − ) - это ПРД-ядро, рассчитанное на основе характеристической функциигде V(; ̂ ∗ (), − )12В разделе 2.6 теоретические результаты апробируются на кооперативной игре добычиограниченного ресурса с предписанной продолжительностью и динамическим обновлениеминформации, в качестве принципа оптимальности используется C-ядро.

Приводятся результатычисленного моделирования в среде Matlab. Построение C-ядра происходит на основе результатаполученного в теореме 2.5.3, а именно на основе формулы (18).Третья глава.Третья глава посвящена описанию и изучению кооперативных дифференциальных игр спредписаннойпродолжительностью,динамическимобновлениеминформацииистохастическим прогнозом. Для кооперативной дифференциальной игры с предписаннойпродолжительностью предложен подход, когда игроки используют стохастический прогноз дляпредсказания изменения информации об игре в будущем. Определено понятиекомбинированной усеченной подыгры, которое позволяет моделировать использованиеигроками прогноза. Доказано свойство сильной ∆ −динамической устойчивости.

На примерепродемонстрировано несколько подходов, использующих прогнозы, проведено сравнение исделаны выводы.В разделе 3.1 приводится определение комбинированной усеченной подыгры,объясняется, каким образом на основе этого понятия можно смоделировать поведения игроков,которые используют прогноз для принятия решения.Определение 3.1.1. Пусть = 0, … , . Комбинированная усеченная подыгра Γ̂ (,0 , 0 +∆, )определена на временном интервале[0 + ∆, ] следующим образом. На временноминтервале [0 + ∆, 0 + ( + 1)∆]уравнения движения, функция выигрыша в усеченнойподыгре игре и исходной игре Γ(0 , − 0 ) совпадают. Но на интервале (0 + ( + 1)∆, ]усеченная подыгра Γ̂ (,0 , 0 + ∆, ) является стохастической игрой.

Уравнения движения ифункция выигрыша в комбинированной усеченной подыгре имеют следующий вид: = (, 1,…, ) + (, ) ∙ (, )(), (0 + ∆) = ,0 , (25)где(, ) = {0, ∈ [0 + ∆, 0 + ( + 1)∆],1, ∈ (0 + ( + 1)∆, ],(26)а выигрыш игрока ∈ определяется математическим ожиданием (,0 , 0+ ∆, ; ) = { ∫ ℎ ((), ()) + (())} . (27)0 +∆В разделе 3.2 описывается решение комбинированной усеченной подыгры.Вразделе3.3дляэтогоклассаигрвведемпонятие условной кооперативной̂ ̂ ∗ ), результирующего векторатраектории{̂ ∗ ()}=0 ({̂ ∗ ()}+∞=0 ), результирующего ПРД (, ̂ (̂ ∗ (), − )(Ŵ (̂ ∗ (), )) так же, как и в главе 2 в̂(̂ ∗ (), − ), результирующего решения Wопределениях 2.2.1., 2.3.1., 2.3.2., 2.3.3.̂ (0 , − 0 ) является сильно ∆-динамически устойчивым в игреТеорема 3.3.1. Решение Γ(0 , − 0 ) с динамическим обновлением информации и стохастическим прогнозом.13В разделе 3.4 теоретические результаты апробируются на кооперативной игре добычиограниченного ресурса с динамическим обновлением информации и стохастическимпрогнозом, приводится сравнение нескольких вариантов прогнозов, и делаются выводы.Четвертая глава.Четвертая глава посвящена описанию и изучению кооперативных дифференциальных игр спредписанной продолжительностью и случайным обновлением информации.

В этом случае,игроки, получая обновленную информацию о структуре игры, не имеют точной информации втечение, которого информация будет верна. Единственное, что им известно, это то, чтовеличина информационного горизонта является случайной величиной, распределение которойизвестно. Понятие усеченной подыгры здесь основано на понятии дифференциальной игры сослучайной продолжительностью и названо случайной подыгрой. В качестве кооперативногорешения используется сильно динамически устойчивое ПРД-ядро.В разделе 4.1 приводится определение случайной усеченной подыгры, объясняется, какимобразом на основе этого понятия можно смоделировать поведения игроков, которые получаютточную информацию о структуре игры, но уверены только в вероятностных характеристиках еепродолжительности.Определение 4.1.1.

Пусть = 0, … , . Случайная усеченная подыгра Γ̂ (,0 , 0 + ∆) определенана интервале [0 + ∆, ], где , - это случайная величина, которая принимает значения из[max(0 + ( + 1)∆, −1 ) , ], где −1 - это реализация случайного информационногогоризонта в случайной усеченной подыгре Γ̂−1 (−1,0 , 0 + ( − 1)∆). Уравнения движения ифункция выигрыша в усеченной игре и исходной игре Γ(0 , − 0 ) на временном интервале [0 +∆, ] совпадают:̇ = (, 1 , … , ),(0 + ∆) = ,0 .

(33)Функция выигрыша игрока ∈ имеет следующий вид: (,0 , 0+ ∆; ) =∫∫ ℎ ((), ()) () , (34)0 +∆ 0 +∆где () - это функция распределения случайной величины :∫ () =0 +∆ () = 1. (35)∫max(0 +(+1)∆,−1 )Формула для выигрыша игрока ∈ (34) для каждой случайной усеченнойподыгрыΓ̂ (,0 , 0 + ∆) была записана в следующем виде:∫∫ ℎ ((), ()) () =0 +∆ 0 +∆∫ (1 − ())ℎ ((), ()), (36)0 +∆где () = 0 для ∈ [0 + ∆, −1 ].14В разделе 4.2 описывается сильно динамически устойчивое ПРД-ядро, как решениеслучайной усеченной подыгры, строится условно кооперативная траектория {̂ ∗ ()}=0 также,как в определении 2.2.1.В качестве принципа оптимальности∗∗ (,0, 0 + ∆, ) ⊂ (,0, 0 + ∆, ) (37)∗в каждой случайной усеченной подыгре Γ̂ (,0, 0 + ∆) используется сильно динамическиустойчивое ПРД-ядро (∗ (), ), определенное в главе 1 для случая конечной игры[2].Предполагается, что функция (; ∗ (), ) является непрерывно дифференцируемой по, ∈ [0 + ∆, ].

Определяется множество векторов (, ∗ ):[ (; ∗ (), ) − (\; ∗ (), )] ≥ ≥ ∑( 1 − () (, ∗ ()) ≥ − [ (; ∗ (), ), (, ∗ ) = { () = (1 (), … , ()) : −∈∑( 1 − () (, ∗ ()) = −∈[ (; ∗ (), )], ∀ ⊂ }. (38)Предполагается, что (, ∗ ) ≠ ∅, = 0, … , , тогда с помощью множества (, ∗ ) можноопределить следующее множество векторов (∗ (), ), ПРД (, ∗ ()) каждого из которыхпринадлежит множеству (, ∗ ).В разделе 4.3 описывается решение в исходной игре с динамическим обновлениеминформации, доказывается свойство сильной динамической устойчивости. Для того, чтобыпостроить решение в игре Γ(0 , − 0 ) со случайным обновлением информации используетсясемейство множеств (, ∗ ), = 0, … , .

Сначала строится множество ПРД для всей игрыΓ(0 , − 0 )следующимобразом:длякаждогонабора (, ∗ ) ∈ (, ∗ ), = 0, … , определяются результирующее ПРД ̂ (, ̂ ∗ ), результирующий вектор ̂(̂ ∗ (), − ) и̂ (̂ ∗ (), − ) также, как это сделано в определениях 2.3.1., 2.3.2,результирующее решение W2.3.3.̂ (̂ ∗ (), − ) ≠ ∅, тогда решение ̂ (0 , − 0 ) является сильноТеорема 4.3.1. Пусть динамически устойчивым в игре Γ(0 , − 0 ) со случайным обновлением информации.В разделе 4.4 теоретические результаты апробируются на кооперативной игре добычиограниченного ресурса трех лиц, демонстрируется свойство сильной динамическойустойчивости выбранного решения. В качестве решения используется сильно динамическиустойчивое ПРД-ядро, приведены результаты численного моделирования в среде Matlab.В заключении приведены основные результаты работы.15Публикации по теме диссертации.1.Петросян О.

Характеристики

Тип файла

PDF-файл

Размер

700,97 Kb

Материал

Кооперативные дифференциальные игры с динамическим обновлением информации

Тип материала

Кандидатская диссертация

Предмет

Физико-математические науки

Высшее учебное заведение

СПбГУ

Список файлов диссертации

kooperativnye-differencialnye-igry-s-dinamicheskim-obnovleniem-informacii.rar

Кооперативные дифференциальные игры с динамическим обновлением информации

Автореферат.pdf

Диссертация.pdf

Прочти меня!!!.txt

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.