Автореферат (1149188), страница 3
Текст из файла (страница 3)
(11)В разделе 2.5 описывается и формализуется математически связь решений (∗ (), ),̂ (̂ ∗ (), − ) ввыбранных игроками в усеченных подыграх с результирующим решением игресдинамическимобновлениеминформации.Наосновевведенногопонятияхарактеристической функцииV(; ̂ ∗ (), − ) определяются такие принципы оптимальности,как пропорциональное решение, вектор Шепли, C-ядро и сильно динамически устойчивое ПРДядро.Определение 2.5.1. Пропорциональным решением в Γ(0 , − 0 ) с динамическим обновлениеминформации, с характеристической функцией V(; ̂ ∗ (), − ) будем называть такой дележ̂ (̂ ∗ (), − ),ПРД которого рассчитывается следующим образом:Prop̂ () =V({};̂ ∗ (),−)∑∈ V({};̂ ∗ (),−)(− V(; ̂ ∗ (), − )) , ∈ [0 , ]. (12)Теорема 2.5.2.
Пусть в каждой усеченной подыгреΓ̂ (∗ (), , 0 + ∆ + ): (∗ (), , 0 + ∆ + ) = (∗ (), , 0 + ∆ + ), (16)где ∈ [0 + ∆, 0 + ( + 1)∆ + ], = 0, … , , тогда̂ (̂ ∗ (), − ) = (̂ ∗ (), − ), ∀ ∈ [, ], (17)где̂ (̂ ∗ (), − )-этопропорциональноерешение,рассчитанноенаосновехарактеристической функции V(; ̂ ∗ (), − ) (10).Определение 2.5.2. Вектором Шепли в (0 , − 0 ) с динамическим обновлением информации,с характеристической функцией (; ̂ ∗ (), − ) будем называть следующий дележ:̂ (̂ ∗ (), , 0 + ∆ + ) =ℎ=∑⊂∈(|| − ||)! (|| − 1)!( (; ̂ ∗ (), − ) − (\{}; ̂ ∗ (), − ).
(15)||!11Теорема 2.5.1. Пусть в каждой усеченной подыгреΓ̂ (∗ (), , 0 + ∆ + ): (∗ (), , 0 + ∆ + ) = ℎ (∗ (), , 0 + ∆ + ), (13)где ∈ [0 + ∆, 0 + ( + 1)∆ + ], = 0, … , , тогда̂ (̂ ∗ (), − ), ∀ ∈ [, ], (14)̂ (̂ ∗ (), − ) = ℎ̂ (̂ ∗ (), − ) - это вектор Шепли, рассчитанный на основе характеристическойгде ℎфункции V(; ̂ ∗ (), − ) (10).Определение 2.5.3. C-ядром в Γ(0 , − 0 ) с динамическим обновлением информации схарактеристической функцией V(; ̂ ∗ (), − )будем называть множество ̂ (̂ ∗ (), −)дележей ̂(̂ ∗ (), − ), каждый из которого удовлетворяет следующем условию:∑ ̂(̂ ∗ (), − ) ≥ V(; ̂ ∗ (), − ), ∀ ⊆ . (18)∈Теорема 2.5.3.
Пусть в каждой усеченной подыгреΓ̂ (∗ (), , 0 + ∆ + ): (∗ (), , 0 + ∆ + ) = (∗ (), , 0 + ∆ + ), (19)где∀ ∈ [0 + ∆, 0 + ( + 1)∆], = 0, … , ,тогдадлявсех (∗ (), , 0 + ∆ + ) ∈ (∗ (), , 0 + ∆ + ) для которых выполняется условие:∑ (∗ (), , 0 + ∆ + ) − (; ∗ (), , 0 + ∆ + ) ≥∈∗∗≥ ∑ (,1, 0 + ( + 1)∆ + , 0 + ∆ + ) − (; ,1, 0 + ( + 1)∆ + , 0 + ∆ + ), (20)∈верно, что̂(̂ ∗ (), − ) ∈ ̂ (̂ ∗ (), − ), ∀ ∈ [, ], (21)где ̂ (̂ ∗ (), − ) - это C-ядро, рассчитанное на основе результирующей характеристическойфункции V(; ̂ ∗ (), − ).Определение 2.5.4.
ПРД-ядром в Γ(0 , − 0 )с динамическим обновлением информации с̂ (̂ ∗ (), − )характеристической функцией V(; ̂ ∗ (), − ) будем называть множество дележей ̂(̂ ∗ (), − ) ПРД ̂ (, ̂ ∗ ), каждого из которых удовлетворяет следующем условию:[V(; ̂ ∗ (), − ) − V(\; ̂ ∗ (), − )] ≥ ∑ ̂ (, ̂ ∗ ) ≥[V(; ̂ ∗ (), − )],∈∀ ⊂ . (22)Теорема 2.5.4. Пусть в каждой усеченной подыгреΓ̂ (∗ (), , 0 + ∆ + ) (∗ (), , 0 + ∆ + ) = (∗ (), , 0 + ∆ + ) ≠ ∅, (23)где ∀ ∈ [0 + ∆, 0 + ( + 1)∆], = 0, … , , тогда верно, что̂ (̂ ∗ (), − ), ∀ ∈ [, ], (24)̂ (̂ ∗ (), − ) = ̂ (̂ ∗ (), − ) - это ПРД-ядро, рассчитанное на основе характеристической функциигде V(; ̂ ∗ (), − )12В разделе 2.6 теоретические результаты апробируются на кооперативной игре добычиограниченного ресурса с предписанной продолжительностью и динамическим обновлениеминформации, в качестве принципа оптимальности используется C-ядро.
Приводятся результатычисленного моделирования в среде Matlab. Построение C-ядра происходит на основе результатаполученного в теореме 2.5.3, а именно на основе формулы (18).Третья глава.Третья глава посвящена описанию и изучению кооперативных дифференциальных игр спредписаннойпродолжительностью,динамическимобновлениеминформацииистохастическим прогнозом. Для кооперативной дифференциальной игры с предписаннойпродолжительностью предложен подход, когда игроки используют стохастический прогноз дляпредсказания изменения информации об игре в будущем. Определено понятиекомбинированной усеченной подыгры, которое позволяет моделировать использованиеигроками прогноза. Доказано свойство сильной ∆ −динамической устойчивости.
На примерепродемонстрировано несколько подходов, использующих прогнозы, проведено сравнение исделаны выводы.В разделе 3.1 приводится определение комбинированной усеченной подыгры,объясняется, каким образом на основе этого понятия можно смоделировать поведения игроков,которые используют прогноз для принятия решения.Определение 3.1.1. Пусть = 0, … , . Комбинированная усеченная подыгра Γ̂ (,0 , 0 +∆, )определена на временном интервале[0 + ∆, ] следующим образом. На временноминтервале [0 + ∆, 0 + ( + 1)∆]уравнения движения, функция выигрыша в усеченнойподыгре игре и исходной игре Γ(0 , − 0 ) совпадают. Но на интервале (0 + ( + 1)∆, ]усеченная подыгра Γ̂ (,0 , 0 + ∆, ) является стохастической игрой.
Уравнения движения ифункция выигрыша в комбинированной усеченной подыгре имеют следующий вид: = (, 1,…, ) + (, ) ∙ (, )(), (0 + ∆) = ,0 , (25)где(, ) = {0, ∈ [0 + ∆, 0 + ( + 1)∆],1, ∈ (0 + ( + 1)∆, ],(26)а выигрыш игрока ∈ определяется математическим ожиданием (,0 , 0+ ∆, ; ) = { ∫ ℎ ((), ()) + (())} . (27)0 +∆В разделе 3.2 описывается решение комбинированной усеченной подыгры.Вразделе3.3дляэтогоклассаигрвведемпонятие условной кооперативной̂ ̂ ∗ ), результирующего векторатраектории{̂ ∗ ()}=0 ({̂ ∗ ()}+∞=0 ), результирующего ПРД (, ̂ (̂ ∗ (), − )(Ŵ (̂ ∗ (), )) так же, как и в главе 2 в̂(̂ ∗ (), − ), результирующего решения Wопределениях 2.2.1., 2.3.1., 2.3.2., 2.3.3.̂ (0 , − 0 ) является сильно ∆-динамически устойчивым в игреТеорема 3.3.1. Решение Γ(0 , − 0 ) с динамическим обновлением информации и стохастическим прогнозом.13В разделе 3.4 теоретические результаты апробируются на кооперативной игре добычиограниченного ресурса с динамическим обновлением информации и стохастическимпрогнозом, приводится сравнение нескольких вариантов прогнозов, и делаются выводы.Четвертая глава.Четвертая глава посвящена описанию и изучению кооперативных дифференциальных игр спредписанной продолжительностью и случайным обновлением информации.
В этом случае,игроки, получая обновленную информацию о структуре игры, не имеют точной информации втечение, которого информация будет верна. Единственное, что им известно, это то, чтовеличина информационного горизонта является случайной величиной, распределение которойизвестно. Понятие усеченной подыгры здесь основано на понятии дифференциальной игры сослучайной продолжительностью и названо случайной подыгрой. В качестве кооперативногорешения используется сильно динамически устойчивое ПРД-ядро.В разделе 4.1 приводится определение случайной усеченной подыгры, объясняется, какимобразом на основе этого понятия можно смоделировать поведения игроков, которые получаютточную информацию о структуре игры, но уверены только в вероятностных характеристиках еепродолжительности.Определение 4.1.1.
Пусть = 0, … , . Случайная усеченная подыгра Γ̂ (,0 , 0 + ∆) определенана интервале [0 + ∆, ], где , - это случайная величина, которая принимает значения из[max(0 + ( + 1)∆, −1 ) , ], где −1 - это реализация случайного информационногогоризонта в случайной усеченной подыгре Γ̂−1 (−1,0 , 0 + ( − 1)∆). Уравнения движения ифункция выигрыша в усеченной игре и исходной игре Γ(0 , − 0 ) на временном интервале [0 +∆, ] совпадают:̇ = (, 1 , … , ),(0 + ∆) = ,0 .
(33)Функция выигрыша игрока ∈ имеет следующий вид: (,0 , 0+ ∆; ) =∫∫ ℎ ((), ()) () , (34)0 +∆ 0 +∆где () - это функция распределения случайной величины :∫ () =0 +∆ () = 1. (35)∫max(0 +(+1)∆,−1 )Формула для выигрыша игрока ∈ (34) для каждой случайной усеченнойподыгрыΓ̂ (,0 , 0 + ∆) была записана в следующем виде:∫∫ ℎ ((), ()) () =0 +∆ 0 +∆∫ (1 − ())ℎ ((), ()), (36)0 +∆где () = 0 для ∈ [0 + ∆, −1 ].14В разделе 4.2 описывается сильно динамически устойчивое ПРД-ядро, как решениеслучайной усеченной подыгры, строится условно кооперативная траектория {̂ ∗ ()}=0 также,как в определении 2.2.1.В качестве принципа оптимальности∗∗ (,0, 0 + ∆, ) ⊂ (,0, 0 + ∆, ) (37)∗в каждой случайной усеченной подыгре Γ̂ (,0, 0 + ∆) используется сильно динамическиустойчивое ПРД-ядро (∗ (), ), определенное в главе 1 для случая конечной игры[2].Предполагается, что функция (; ∗ (), ) является непрерывно дифференцируемой по, ∈ [0 + ∆, ].
Определяется множество векторов (, ∗ ):[ (; ∗ (), ) − (\; ∗ (), )] ≥ ≥ ∑( 1 − () (, ∗ ()) ≥ − [ (; ∗ (), ), (, ∗ ) = { () = (1 (), … , ()) : −∈∑( 1 − () (, ∗ ()) = −∈[ (; ∗ (), )], ∀ ⊂ }. (38)Предполагается, что (, ∗ ) ≠ ∅, = 0, … , , тогда с помощью множества (, ∗ ) можноопределить следующее множество векторов (∗ (), ), ПРД (, ∗ ()) каждого из которыхпринадлежит множеству (, ∗ ).В разделе 4.3 описывается решение в исходной игре с динамическим обновлениеминформации, доказывается свойство сильной динамической устойчивости. Для того, чтобыпостроить решение в игре Γ(0 , − 0 ) со случайным обновлением информации используетсясемейство множеств (, ∗ ), = 0, … , .
Сначала строится множество ПРД для всей игрыΓ(0 , − 0 )следующимобразом:длякаждогонабора (, ∗ ) ∈ (, ∗ ), = 0, … , определяются результирующее ПРД ̂ (, ̂ ∗ ), результирующий вектор ̂(̂ ∗ (), − ) и̂ (̂ ∗ (), − ) также, как это сделано в определениях 2.3.1., 2.3.2,результирующее решение W2.3.3.̂ (̂ ∗ (), − ) ≠ ∅, тогда решение ̂ (0 , − 0 ) является сильноТеорема 4.3.1. Пусть динамически устойчивым в игре Γ(0 , − 0 ) со случайным обновлением информации.В разделе 4.4 теоретические результаты апробируются на кооперативной игре добычиограниченного ресурса трех лиц, демонстрируется свойство сильной динамическойустойчивости выбранного решения. В качестве решения используется сильно динамическиустойчивое ПРД-ядро, приведены результаты численного моделирования в среде Matlab.В заключении приведены основные результаты работы.15Публикации по теме диссертации.1.Петросян О.















