Диссертация (1145356), страница 31
Текст из файла (страница 31)
Модификации7.1Принцип динамической устойчивостив игре Γ,(0, 0, )Рассмотрим кооперативную дифференциальную игру Γ, (0 , 0 , ) с непостоянной функцией дисконтирования −(0 ,) и случайным моментом окончания (см. § 3.1). Сформулируем проблему динамической и сильно динамическойустойчивости для задачи дисконтирования с интегральной ставкой дисконтирования (0 , ) =∫︀ 0( ) , которая очевидным образом может быть обобще-на на случай произвольного дисконтирования −(0 ,) .Заметим, что определения § 6.1, сформулированные для игры Γ (0 , 0 , ),справедливы для игры Γ, (0 , 0 , ).
Аналогично 6.1 определим кооператив,ную игру Γ (0 , 0 , ) в форме характеристической функции. Сформулируем основные результаты относительно проблемы динамической устойчивости233234Глава 7. Устойчивая кооперация в играх со случайным моментом окончания. Модификациидля такого класса игр.Пусть игроки выбрали некоторый принцип оптимальности (0 , 0 ). Положим (0 , 0 ) ∈ (0 , 0 ).Определение 7.1.1. Пусть существует вектор-функция () = { ()}=1,..., , т.,ч. компоненты дележа (0 , 0 ) = { (0 , 0 )}=1,..., в игре Γ (0 , 0 , ) представимы в виде∫︁∞(1 − ()) (0 , 0 ) =−∫︀ 0() (), = 1, .
. . , .(7.1.1)0Тогда вектор-функцию () = { ()} будем называть процедурой распреде,ления дележа (ПРД) в игре Γ (0 , 0 , ).В данном определении не требуем неотрицательности ПРД () ≥ 0 в отличие от Определения 6.2.1. При использовании данного ограничения ПРД может быть сделана неотрицательной при использовании регуляризации (6.5.24),которая переносится на класс игр Γ, (0 , 0 , ) без изменений.Определение 7.1.2. Дележ (0 , 0 ) ∈ (0 , 0 ) в игре Γ, (0 , 0 , ) являетсядинамически устойчивым, если существует такая процедура распределениядележа (ПРД) ( ), ∈ [0 , ∞), ∈ ,∫︁∞−(1 − ()) (0 , 0 ) =∫︀ 0() (), ∈ ,0что вдоль кооперативной траектории * (), ∈ [0 ; ∞) выполняется следующее свойство: дележ (* (), ) = { (* (), )}, ∀ ∈ [0 , ∞), вычисленныйпо формуле∫︀ () 0 ( (), ) =1 − ()*такжепринадлежит∞∫︁(1 − ())−∫︀ 0() (),всоответствующей = 1, .
. . , , (7.1.2) (* (), )*Γ, ( (), ), ∀ ∈ [0 , ∞).подыгре235Глава 7. Устойчивая кооперация в играх со случайным моментом окончания. МодификацииОпределение 7.1.3. Будем называть принцип оптимальности (0 , 0 ) динамически устойчивым принципом оптимальности (ДУПО) в игреΓ, (0 , 0 , ), если любой дележ (0 , 0 ) ∈ (0 , 0 ) является динамическиустойчивым.Очевидно, что из формул (1.4.23), (1.4.22) имеем∫︀ ()∫︀ 0(()+())= 0.1 − ()Тогда, принимая во внимание (7.1.2), заметим, что любой дележ (0 , 0 ) из ди,намически устойчивого принципа оптимальности (0 , 0 ) в игре Γ (0 , 0 , )может быть представлен в следующем виде:∫︁ (0 , 0 ) =−∫︀ 0(()+())− () + ∫︀ 0(()+()) (* (), ),0∀ ∈ [0 , ∞), = 1, . .
. , .После дифференцирования по окончательно получаем аналитическуюформулу для ПРД: () = (() + ()) (* (), ) − ( (* (), ))′ .Фактически, мы доказали следующие утверждения.*Теорема 7.1.1. Пусть для каждой подыгры Γ, ( (), ) , ∈ [0 , ∞)вектор-функция (* (), ) является абсолютно непрерывной функцией времени , ∈ [0 , ∞).
Пусть () = (() + ()) (* (), ) − ( (* (), ))′ .(7.1.3)Тогда в игре Γ, (0 , 0 , ) вектор (0 , 0 ) является динамически устойчивым дележом с ПРД (7.1.3).Доказательство. Доказательство аналогично доказательству Теоремы 6.2.1.236Глава 7. Устойчивая кооперация в играх со случайным моментом окончания. МодификацииЗамечание 7.1.1. Очевидно, что результаты Теоремы 7.1.1 обобщают результаты Теоремы 6.2.1 (при () = 0 получаем результаты для игры Γ (0 , 0 , )).Кроме того, в Теореме 7.1.1 используется не вектор Шепли, а произвольныйдележ.Утверждение 7.1.1.
Пусть дележ {¯ (0 , 0 )} динамически устойчив в иг¯ре Γ, (0 , 0 , ). Тогда { (0 , 0 )} может быть представлен в следующемвиде:¯ (0 , 0 ) =∫︁−∫︀ 0(()+())− () + ∫︀ 0(()+()) ¯ (* (), ),0(7.1.4)∀ ∈ [0 , ∞), = 1, . . . , .Доказательство. Доказательство аналогично доказательству Утверждения6.2.1.При постоянном дисконтировании имеем () = , для детерминированного случая (см. Замечание 1.4.1) () = 0. Тогда из (7.1.3) следует () = − ( )′ ,что совпадает с формулой для ПРД (6.2.10) с точностью до обозначения параметра дисконтирования . При отсутствии дисконтирования () ≡ 0, тогдаиз (7.1.3) получаем (6.2.7).Аналогичным образом можно обобщить результаты § 6.3 о защите игроковот иррационального поведения других участников.Аналогично (6.3.17) имеем следующий вид «усиленных» условий Янга: (0 , 0 , ) ≤∑︀ ∫︀−∫︀ 0(()+())− () + ∫︀ 0(()+()) (* (), , ),∈ 0∀ ∈ [0 , ∞), ⊆ .(7.1.5)237Глава 7.
Устойчивая кооперация в играх со случайным моментом окончания. МодификацииТеорема 7.1.2. Пусть (* (), ; ) — непрерывно дифференцируемая функция при ∈ [0 , ∞) в игре Γ, (0 , 0 , ). Тогда условие (7.1.5) выполненотогда и только тогда, когда ПРД (), ∈ [0 ; ∞) удовлетворяет неравенству∑︁ () ≥ (() + ()) (* (), ; ) −∈ (* (), ; ), ⊆ .(7.1.6)Доказательство. Доказательство аналогично доказательству Теоремы 6.3.2.7.2Сильно динамически устойчивое С–ядро в игреΓ, (0 , 0 , )Пусть перед началом игры игроки договорились об использовании ими С–ядра (0 , 0 ) в качестве принципа оптимальности (0 , 0 ). Сформулируемосновные определения и результаты о сильной динамической устойчивостиC–ядра, являющиеся обобщением результатов § 6.6.Определение 7.2.1.
Будем говорить, что C–ядро (0 , 0 ) является сильно ди,намически устойчивым кооперативным решением в игре Γ (0 , 0 , ), если1. (* (), ) ̸= ∅, ∀ ∈ [0 , ∞);¯ )(0 , 0 ) и такая ПРД (∫︁ ∞ ∫︀ − (()+()) ¯(¯1 ( ), . . . , ¯ ( )), ∈ [0 , ∞), что ¯ = 0 ( ) и2. существует такой дележ ¯∈=0{︂^ =∫︁−0∫︀ (()+()) ¯0 ()−+∫︀ (()+()) 0^}︂∈ (0 , 0 ),∈∀{^ }∈ ∈ (* (), ), ∀ ∈ [0 , ∞). (7.2.7)Следуя Определению 6.6.2, дележ ¯ ∈ (0 , 0 ), гарантирующий сильнодинамическую устойчивость C–ядра, будем называть опорным решением.238Глава 7. Устойчивая кооперация в играх со случайным моментом окончания.
МодификацииТеорема 7.2.1. Пусть (* (), ; ), ⊆ — непрерывно дифференцируемая функция по ∈ [0 ; ∞). Пусть (* (), ) ̸= ∅, ∀ ∈ [0 , ∞). Если существует дележ ∈ (0 , 0 ) и соответствующая ему ПРД (), ∈ [0 , ∞),такая что ∀ ⊂ справедливо∑︁ () ≥ (() + ()) (, * (), ) −∈ (, * (), ),(7.2.8)то дележ ∈ (0 , 0 ) является опорным решением ¯ , а С–ядро (0 , 0 )является сильно динамически устойчивым кооперативным решением в игреΓ, (0 , 0 , ).Доказательство. Доказательство аналогично доказательству Теоремы 5.2.1.Аналогично Следствию 5.2.1 можно показать, что выполнение неравенств(7.2.8) влечет∑︁ () ≤ (() + ())[ (, * (), ) − ( ∖ , * (), )]−(7.2.9)∈−[ (, * (), ) − ( ∖ , * (), )].Заметим, что достаточные условия (7.2.8) гарантируют выполнение «усиленных» условий Янга (7.1.6).
Таким образом, игроки будут защищены и ототклонений от соглашений в рамках кооперативного договора, и от иррационального отклонения от кооперативного в пользу некооперативного поведения.Пусть (0 , 0 , ) ⊆ (0 , 0 ) — множество опорных решений в С–ядре (0 , 0 ).Тогда справедливо следующее Следствие 7.2.1 из Теоремы 7.2.1.Следствие 7.2.1. Пусть характеристическая функция (* (), , ) непрерывно дифференцируема по ∈ [0 , ∞) и удовлетворяет следующему условию239Глава 7.
Устойчивая кооперация в играх со случайным моментом окончания. Модификациидля ∀ ⊂ , ∀ ∈ [0 , ∞):( (, * (), ) − [ ( ∖ , * (), ) + (, * (), )]) ≤(() + ())( (, * (), ) − [ ( ∖ , * (), ) + (, * (), )]). (7.2.10)Тогда множество опорных решений (0 , 0 ) непусто.При отсутствии дисконтирования () = 0 из неравенства (7.2.8) получаем(6.6.57), которое для детерминированного случая (() = 0, см.
Замечание1.4.1) вырождается в (5.2.35).Аналогично, при отсутствии дисконтирования () = 0 из неравенства(7.2.10) получаем (6.6.59), которое для детерминированного случая (() ≡ 0)вырождается в (5.2.37). Таким образом, сформулированные в данном разделе утверждения покрывают полученные ранее результаты для дифференциальных игр с предписанной и случайной продолжительностью, а также длядифференциальных игр с дисконтированием.7.2.1Пример.
Динамически устойчивый вектор Шепли в игреΓ, (0 , 0 , ).,Рассмотрим пример игры Γ (0 , 0 , ) из § 3.1.2. Для данной задачи характеристическая функция может быть построена любым из приведенных в § 5.3способом (см. [218]). В данной работе аналитические выражения для значений–, – характеристических функций не приводятся в силу их громоздкости.Отметим, что (0 , 0 , ) = (0 , 0 , ) = (0 , 0 , ), что соответствуетмаксимальному суммарному выигрышу игроков (3.1.16).Выражение для (0 , 0 , {}), = 1, 2, определенной согласно (5.3.78), может быть получено при помощи принципа максимума Понтрягина аналогичновычислениям (·, {}) в § 3.1.2.
Пусть {} = {1}. Тогда игрок 1 используетоптимальное управление *1 из оптимального набора * = (1 , 2 ) (3.1.13), а240Глава 7. Устойчивая кооперация в играх со случайным моментом окончания. Модификацииигрок 2 минимизирует выигрыш 1 (0 , 0 , *1 , 2 ) первого игрока. Тогда имеем: (0 , 0 , {1}) =(︀)︀1 ( + ) 2 + (( + 2 ) + ) + 2− ( + )2( + )2 2 + 2 ( + + ) −−2 ( + )2(︀)︀4 2 2 + 4 + 4 2 + 2 2 + 2 2 + 2 (2 + + 1 ) 1 −++ ( + )2 ( + 2 )31 1 1 1 1 0+++ 2++,2( − ) ( + ) ( + ) ( + ) ( + ) ( + ) ( + ) + (7.2.11)аналогично получаем (0 , 0 , {2}).Аналитические выражения для вектора Шепли могут быть непосредственно получены по формуле (5.1.9), однако в силу громоздкости выражений здесьне приводятся. Согласно Определению 7.1.2 и Теореме 7.1.1 дележ{ (* (), )}=1,2 (вектор Шепли) будет являться динамически устойчивым,если компоненты вектора Шепли распределены во времени согласно (7.1.3).Отметим, что в данном примере игрок 1 является «детерминированным» игроком (см.
Замечание 1.4.1), а для игрока 2 мгновенный выигрыш дисконтируется с постоянной ставкой () = и экспоненциальным распределением() = . Имеем следующие формулы для ПРД из (7.1.3):1 () = 1 (* (), ) − (1 (* (), ))′ ,(7.2.12)1 () = ( + )2 (* (), ) − (2 (* (), ))′ .(7.2.13)График ПРД для вектора Шепли, построенного для – характеристическойфункции (7.2.1) приведен ра Рис. 7.1. Графики ПРД для других видов характеристической функции на качественном уровне имеют аналогичный вид.241Глава 7. Устойчивая кооперация в играх со случайным моментом окончания. МодификацииРис. 7.1: ПРД 1 (), 2 ()7.3Принцип динамической и сильно динамической устойчивости в игре Γ (0, 0, )Рассмотрим частный случай игры Γ (0 , 0 , ), в которой случайный моментокончания может быть представлен как = min{1 , .