Главная » Просмотр файлов » Диссертация

Диссертация (1149189), страница 14

Файл №1149189 Диссертация (Кооперативные дифференциальные игры с динамическим обновлением информации) 14 страницаДиссертация (1149189) страница 142019-06-29СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 14)

. . , l в случайной усеченной подыгре Γ̂kv (x∗k,0 , t0 + k∆t) игроки решили′выбрать другой дележ ξk (x∗k (tbr ), tbr ) из сильно динамически устойчивого ПРДядра C k (x∗k (tbr ), tbr ). Тогда существует ПРД βk′ (t, x∗k ) ∈ Bk (t, x∗k ), t ∈ [tbr , T ],которое соответствует этому дележу, т.е.:′ξk (x∗k (tbr ), tbr ) =∫T(1 − Fk (t))βk′ (t, x∗k )dt.tbrВ этом случае, суммарный выигрыш во всей игре будет распределен в соответствии с результирующим вектором ξˆ′ (x0 , T −t0 ), результирующее ПРД которогобудет иметь вид:∗ (1 − Fk (t))βk (t, xk ), t ∈ [t0 + k∆t, tbr ),β̂ ′ (t, x̂∗ ) =(1 − Fk (t))βk′ (t, x∗k ), t ∈ [tbr , t0 + (k + 1)∆t], (1 − F (t))β (t, x∗ ), t ∈ [t + j∆t, t + (j + 1)∆t],jj00j(3.4)где (1 − Fj (t))βj (t, x∗j ), j ̸= k, j = 0, .

. . , l определяет распределение суммарного выигрыша между игроками во всех кооперативных случайных подыграх,кроме Γ̂kv (x∗k,0 , t0 + k∆t), т.е. там где произошел пересмотр решения. Вектор91ξˆ′ (x0 , T − t0 ) соответствующий результирующему ПРД β̂ ′ (t, x̂∗ ) будет рассчитываться следующим образом:ξˆ′ (x0 , T − t0 ) =[∫∫Tt0tbr+t0 +k∆tβ̂ ′ (t, x̂∗ )dt =[∫l∑j=0j̸=k(1 − Fk (t))βk (t, x∗k )dt +t0 +(j+1)∆t](1 − Fj (t))βj (t, x∗j )dt +t0 +j∆t∫t0 +(k+1)∆t](1 − Fk (t))βk′ (t, x∗k )dt .

(3.5)tbrТак как βk′ (t, x∗k ) ∈ Bk (t, x∗k ), t ∈ [tbr , T ], то результирующее ПРД β̂ ′ (t, x̂∗ ) (3.4)также принадлежит множеству B̂(t, x̂∗ ). Множество всех результирующих векˆ 0 , T − t0 ), соответствующих элементам β̂(t, x̂∗ ) множества B̂(t, x̂∗ )торов ξ(x∫Tˆ 0 , T − t0 ) =ξ(xβ̂(t, x̂∗ )dtt0является результирующим решением Ŵ (x0 , T − t0 ) по определению.

В (3.5)был построен результирующий вектор ξˆ′ (x0 , T − t0 ) с результирующим ПРДβ̂ ′ (t, x̂∗ ) из множества B̂(t, x̂∗ ) и было показано, что результирующий векторξˆ′ (xt , T − t0 ) принадлежит результирующему решению Ŵ (x0 , T − t0 ), которое0было выбрано с самого начала. Теорема доказана.§ 4.Кооперативная игра добычи ограниченного ресурса со случайным обновлением информацииРассмотрим игру добычи ограниченного ресурса трех лиц аналогичную рассмотренной в главе 2, но со случайным обновлением информации. В качествепринципа оптимальности будем использовать сильно динамически устойчивоеПРД-ядро. Характеристическая функция рассчитывается также, как это сделано в [39]. В последней части примера показано свойство сильной динамическойустойчивости результирующего решения.

Вид уравнений движения и функциивыигрыша для исходной игры аналогичен описанному в главе 2. Перейдем кописанию случайной усеченной подыгры.92Случайная усеченная подыгра. Исходная игра Γ(x0 , T − t0 ) определена на временном интервале [t0 , T ]. Предположим, что в любой момент времениt ∈ [t0 +j∆t, t0 +(j+1)∆t], j = 0, . . . , l, игроки имеют усеченную информацию обигре.

Она включает в себя информацию об уравнениях движения и функцияхвыигрыша на временном интервале [t0 + j∆t, T j ], где T j - это экспоненциальная случайная величина распределенная на усеченном временном интервале[max(t0 + (j + 1)∆t, T j−1 ), T ] с функцией распределения Fj (t) и функцией плотности fj (t):)(1 − exp − λ(t − max(t0 + (j + 1)∆t, T j−1 ))(),Fj (t) =1 − exp − λ(T − max(t0 + (j + 1)∆t, T j−1 )))λ exp − λ(t − max(t0 + (j + 1)∆t, T j−1 ))().fj (t) =1 − exp − λ(T − max(t0 + (j + 1)∆t, T j−1 ))(4.1)((4.2)Обозначим через Λj (t): fj (t) , t ∈ [max(t + (j + 1)∆t, T ), T ],0j−11−Fj (t)Λj (t) = 0,t ∈ [t0 + j∆t, max(t0 + (j + 1)∆t, T j−1 )].Очевидно, что∫T∫TdFj (t) =t0 +j∆tdFj (t) = 1.max(t0 +(j+1)∆t,T j−1 )Построим соответствующую случайную усеченную подыгру Γ̂j (xj,0 , t0 +j∆t).Уравнения движения и начальные условия для этой игры имеют следующийвид:3∑√ui ,ẋ = a x(t) − bx(t) −x(t0 + j∆t) = xj,0 .i=1В соответствии с (1.3) функция выигрыша игрока i ∈ N может представлена ввиде:∫TKij (xj,0 , t0 + j∆t; u) =(1 − Fj (τ ))hi (x(τ ), u(τ ))dτ.t0 +j∆t93Рассмотрим случай, когда игроки соглашаются на кооперацию в случайнойусеченной подыгре Γ̂j (xj,0 , t0 + j∆t).

Тогда игроки будут действовать исходя измаксимизации их суммарного выигрыша.Кооперативная траектория. Максимальный суммарный выигрыш вкаждой случайной усеченной подыгре Γ̂j (xj,0 , t0 + j∆t) имеет следующий вид[48]:√W j (t, x) = Aj (t) x + C j (t),(4.3)где функции Aj (t), C j (t) удовлетворяют системе дифференциальных уравнений:[]3∑b [ 1] ,Ȧj (t) = Λj (t) +Aj (t) −Aj (t)24 ci + 2i=1aĊ j (t) = Λj (t)C j (t) − Aj (t),2jjlim A (t) = 0, lim C (t) = 0,t→Tt→Tгде Λj (t) определено в (4.3).Кооперативная траектория x∗j (t) в случайной усеченной подыгре Γ̂j (xj,0 , t0 +j∆t) может быть вычислена на временном интервале следующим образом [48]:2t∫√1∗2xj (t) = ϖj (t0 + j∆t, t)  x∗j,0 + a ·ϖj (t0 + j∆t, τ )−1 dτ  ,2t0 +j∆tгде t ∈ [t0 + j∆t, T j ], T j - это случайная величина распределенная по законуFj (t) (4.1):∫tϖj (t0 + j∆t, t) = expt0 +j∆t∑11− b + []2  dτ.2Aj (τ )i=14 ci + 23Начальное положение для кооперативной траектории в каждой усеченнойподыгре устанавливается из предыдущей усеченной подыгры: x∗0,0 = x0 иx∗j,0 = x∗j−1 (t0 + j∆t) для 1 ≤ j ≤ l.

Определим условно кооперативную траекторию x̂∗ (t) в игре Γ(x0 , T − t0 ) со случайным обновлением информации:x̂∗j (t) = x∗j (t),t ∈ [t0 + j∆t, t0 + (j + 1)∆t],j = 0, . . . , l.94Характеристическая функция. Характеристическую функцию будемрассчитывать также, как это было сделано в главе 2. Отличие заключается втом, что все расчеты происходят для игры со случайной продолжительностью.Рассчитаем Vj (S; xj,0 , t0 + j∆t) (Vj (S; x∗j (t), t)) для каждой коалиции S ⊂ N .В соответствии с формулой в главе 2 (2.7) максимальный суммарный выигрыш игроков Wj (t0 +j∆t, xj,0 ) (4.3) соответствует значению характеристическойфункции Vj (N ; xj,0 , t0 + j∆t) коалиции S = N в случайной усеченной подыгреΓ̂jv (xj,0 , t0 + j∆t):Vj (N ; x∗j (t), t) = Wj (t, x∗j (t)),t ∈ [t0 + j∆t, T j ],j = 0, . . .

, l.Далее нам необходимо определить значения характеристической функции дляследующих коалиций:{1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}.Для каждой коалиции вида {i}, i = 1, 3 нам необходимо определить равновесиепо Нэшу в усеченной подыгре Γ̂j (xj,0 , t0 + j∆t) и как результат Vj ({i}; x∗j (t), t).Коалиции, состоящие из одного игрока. Равновесие по Нэшу в случайной усеченной подыгре Γ̂j (xj,0 , t0 +j∆t) определяется следующими стратегиямиигроков:uji (t, x) =x4[ci + Aji (t)/2]2,i = 1, 3,где функции Aji (t) находятся из системы дифференциальных уравнений:1b ∑1−,Ȧji (t) = Aji (t) Λj (t) + +j28(ck + Ak (t)/2)24(ci + Aji (t)/2)k̸=iaĊij (t) = Λj (t)Cij (t) − Aji (t),2jjlim Ai (T ) = 0, lim Ci (T ) = 0, i = 1, 3,t→Tt→Tгде Λj (t) определено в (4.3).Выигрыш игрока i = 1, 3 в ситуации равновесия по Нэшу определяетсяфункцией:√Vij (t, x) = Aji (t) x + Cij (t),i = 1, 3.95Таким образом, значение характеристической функции для коалиций, состоящих из одного игрока S = {i}, i ∈ N , вычисляется следующим образом:Vj ({i}; x∗j (t), t) = Vij (t, x∗j (t)),t ∈ [t0 + j∆t, T ],j = 0, .

. . , l.Коалиции, состоящие из двух игроков. Значение характеристическойфункции для коалиций, состоящих из двух игроков, рассчитывается аналогичнотому, как это делается в главе 2. Рассмотрим формулы для Vj (S; xj,0 , t0 + j∆t)(Vj (S; x∗j (t), t)) в случае, когда S = {1, 2}, формулы для вычисления остальных коалиций можно получить по такому же принципу. Значения выигрышейигроков в ситуации равновесия по Нэшу имеют следующий вид:√jj(t, x) = Aj{1,2} (t) x + C{1,2}(t),V{1,2}√V3j (t, x) = Aj3 (t) x + C3j (t),jгде функции Aj{1,2} (t), Aj3 (t), C{1,2}(t), C3j (t) удовлетворяют системе дифферен-циальных уравнений:[]Ȧj{1,2} (t) = Aj{1,2} (t) Λj (t) +−∑b1+−2 8(c3 + Aj3 (t)/2)21,j4(c+A(t)/2)k{1,2}k∈S[]∑b1Ȧj3 (t) = Aj3 (t) Λj (t) + +−28(ck + Aj{1,2} (t)/2)2k∈S−14(c3 + Aj3 (t)/2),aajjĊ{1,2}(t) = Λj (t)C{1,2}(t) − Aj{1,2} (t), Ċ3j (t) = Λj (t)C3j (t) − Aj3 (t),22jjjjlim A{1,2} (t) = lim A3 (t) = lim C{1,2} (t) = lim C3 (t) = 0,t→Tt→Tt→Tt→Tгде слагаемое Λj (t) определено в (4.3).

Таким образом, значение характеристической функции коалиции S = {1, 2} вычисляется следующим образом:jVj ({1, 2}; x∗j (t), t) = V{1,2}(t, x∗j (t)),t ∈ [t0 + j∆t, T ],j = 0, . . . , l.Концепция решения. Пусть игроки в каждой кооперативной случайнойусеченной подыгре Γ̂jv (xj,0 , t0 + j∆t) используют в качестве принципа оптимальности сильно динамически устойчивое ПРД-ядро C j (x∗j (t), t) (C j (x0 , t0 )).96Это означает, что игроки в каждой случайной усеченной подыгре выбираютПРД βj (t, x∗j ) из множества Bj (t, x∗j ) (3.1), j = 0, . .

. , l. Далее строится соответствующее результирующее ПРД β̂(t, x̂∗ ) (3.2) и множество B̂(t, x̂∗ ). С поˆ ∗ (t), T − t),мощью формулы (3.3) рассчитывается результирующий вектор ξ(x̂множество всевозможных таких векторов образует результирующее решениеŴ (x̂∗ (t), T − t).Далее на примере конкретных результирующих векторов из Ŵ (x̂∗ (t), T − t)покажем, что построенное решение является сильно динамически устойчивымв игре Γ(x0 , T − t0 ) со случайным обновлением информации. Отличием этогораздела от подобного в главе 2 является то, что в главе 2 в качестве принципаоптимальности использовалось C-ядро, а значит исследовалось свойство сильной ∆t-динамической устойчивости. Это означает, что исследовалось отклонение от выбранного решения (дележа) только в моменты времени t = t0 + j∆t,j = 0, .

. . , l. В этом разделе в качестве принципа оптимальности используетсясильно динамически устойчивое ПРД-ядро, поэтому интерес представляет исследование свойства сильной динамической устойчивости. Т.е. будет исследовано отклонение от выбранного решения для любого момента времени t ∈ [t0 , T ].Численный пример.

Рассмотрим численный пример игры заданной навременном интервале длинной T − t0 = 4, в котором на интервалах времени[t0 + j∆t, t0 + (j + 1)∆t] информация об игре известна на интервале длиннойT j , где T j - это случайная величина (4.1) с λ = 0.5. Информация об игре обновляется с периодом ∆t = 1. Зафиксируем следующие параметры для уравненийдвижений a = 10, b = 0.5, для функции выигрыша c1 = 0.15, c2 = 0.65, c3 = 0.45и для начальных условий t0 = 0, x0 = 200.Во время обновления информации об игре происходит реализация случайного временного горизонта для текущей усеченной подыгры:T 0 = 2.423,T 1 = 3.538,T 2 = 3.871,T 3 = 4.Сгенерированное значение информационного горизонта в текущей усеченнойподыгре влияет на распределение продолжительности следующей усеченнойподыгры.97На графике 4.1. отображены плотности распределения.

Характеристики

Список файлов диссертации

Кооперативные дифференциальные игры с динамическим обновлением информации
Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
7021
Авторов
на СтудИзбе
260
Средний доход
с одного платного файла
Обучение Подробнее