Диссертация (1149189), страница 4
Текст из файла (страница 4)
Введем следующее обозначение:U (S; x∗ (t), T − t) = −dV (S; x∗ (t), T − t),dtt ∈ [t0 , T ],S ⊆ N.(2.2)Определение 1.2.3. B(t), ∀t ∈ [t0 , T ] - множество интегрированных вектор функций, каждая из которых удовлетворяет системе неравенств:{B(t) = β(t) = (β1 (t), . . . , βn (t)) :∑∗∗U (N ; x (t), T − t) − U (N \ S; x (t), T − t) ≥βi (t) ≥ U (S; x∗ (t), T − t),∀S ⊂ N,∑i∈S}βi (t) = U (N ; x (t), T − t) (2.3)∗i∈NЕсли C-ядро не пусто, то оба неравенства в (2.3) выполняются одновременно(см.
(1.5), 1.6). В следующем параграфе на основе определенного множестваB(t) будем строить множество дележей (решение) в игре Γv (x0 , T − t0 ). Такимобразом, в следующем параграфе будет показано, что множество B(t) можетинтерпретироваться, как множество процедур распределения дележей для некоторого кооперативного решения в игре Γv (x0 , T − t0 ).§ 3.Определение соответствующего множества дележейНа основе множества векторов B(t) определим следующее множество.Определение 1.3.1. Пусть множество B(t) ̸= ∅, ∀t ∈ [t0 , T ]. ПРД-ядромC(x∗ (t), T − t) назовем множество вектор функций α(t), удовлетворяющихусловию (3.1) для всех вектор функций β(t) ∈ B(t):∫Tα(t) =β(τ )dτ,tt ∈ [t0 , T ].(3.1)20Отметим, что множество C(x∗ (t), T − t) было построено на основе функцийβ(t).
Докажем, что полученные на основе β(t) векторы α(t) являются дележами, а функции β(t), таким образом, могут быть интерпретированы как ПРД изопределения 1.2.1.Утверждение 1.3.1. Пусть множество B(t) ̸= ∅ и ПРД-ядро C(x∗ (t), T −t) ̸= ∅, ∀t ∈ [t0 , T ]. Множество C(x∗ (t), T − t) является подмножествоммножества дележей в игре Γv (x∗ (t), T −t), т.е. C(x∗ (t), T −t) ⊆ E(x∗ (t), T −t),t ∈ [t0 , T ].Доказательство.
Пусть α(t) ∈ C(x∗ (t), T −t). Докажем, что любой элементα(t) из множества C(x∗ (t), T −t) является элементом множества E(x∗ (t), T −t).Покажем, что условия в (1.4) выполнены для ∀α(t) ∈ C(x∗ (t), T − t).Докажем первое равенство (условие коллективной рациональности) в (1.4).По определению 1.3.1., имеем∑βi (t) = U (N ; x∗ (t), T − t) = −i∈NdV (N ; x∗ (t), T − t),dtтогда, интегрируя обе части равенства, получаем требуемое равенство в (1.4)∑ ∫T∑дляβ(τ)dτ=αi (t). Второе неравенство (условие индивидуальнойiti∈Ni∈Nрациональности) в (1.4) следует из определения множества B(t) (2.3).
Функцииβ(t) выбираются так, что выполнены неравенства (2.3), в том числе, справедливо нижнее неравенство в (2.3) для S = {i}. Тогдаβi (t) ≥ U ({i}; x∗ (t), T − t) = −dV ({i}; x∗ (t), T − t).dt(3.2)Проинтегрируем обе части неравенства (3.2), тогда имеем:∫Tαi (t) =βi (τ )dτ ≥ V ({i}; x∗ (t), T − t).(3.3)tПо определению 1.3.1. имеем, что величина в левой части неравенства (3.3)является элементом из множества C(x∗ (t), T − t), т.е. может быть обозначенакак αi (t). Таким образом, для любого элемента из множества C(x∗ (t), T −t), t ∈21[t0 , T ] справедливо (1.4), т.е. все элементы множества C(x∗ (t), T − t) являютсяэлементами множества дележей E(x∗ (t), T − t). Утверждение доказано.Отметим, что неравенство (3.2) впервые было сформулировано в работе [46]и названо условием защиты от иррационального поведения участников. Такимобразом, выполнение данного условия, которое имеет место по построению множества, также гарантирует множеству C(x∗ (t), T − t) некоторые другие полезные свойства устойчивости (см., например, [37, 2]).Согласно доказанному Утверждению 1.3.1.
множество B(t) может быть интерпретировано как множество ПРД, т.е. дележи, полученные на основе некоторых функций β(t), удовлетворяющих условиям (2.3), могут быть распределеныво времени игры согласно тем же функциям β(t) по правилу (3.1). Следовательно, множество C(x∗ (t), T − t) является динамически устойчивым принципомоптимальности по построению (см. опред. 1.2.2.).Справедливо следующее утверждение.Утверждение 1.3.2. Пусть C-ядро игры Γv (x∗ (t), T −t) и множество B(t)не пусто ∀t ∈ [t0 , T ]. Тогда множество C(x∗ (t), T − t) является подмножеством C-ядра C(x∗ (t), T − t) в игре Γv (x∗ (t), T − t), t ∈ [t0 , T ].Доказательство.
Для доказательства этого утверждения необходимо доказать, что для любого дележа ξ(x∗ (t), T − t) ∈ C(x∗ (t), T − t) выполняетсянеобходимое и достаточное условие принадлежности C–ядру [1]:∑ξi (x∗ (t), T − t) ≥ V (S; x∗ (t), T − t),S ⊂ N.(3.4)i∈SВыполнение нормировочного условия было показано в утверждении 1.3.1. Неравенство (3.4) следует из определения множества B(t) (2.3):∑βi (t) ≥ U (S; x∗ (t), T − t) = −i∈SdV (S; x∗ (t), T − t).dt(3.5)Проинтегрируем обе части неравенства (3.5) по t:∑∫Ti∈S tβi (τ )dτ ≥ V (S; x∗ (t), T − t).(3.6)22Из (3.1) следует, что левая часть неравенства (3.6) равнатывая, чтождения.∑∫T∑ξi (x∗ (t), T −t).
Учи-i∈Sβi (τ )dτ = V (N ; x∗ (t), T − t) получаем справедливость утвер-i∈N tМножество C(x∗ (t), T − t) является непустым, если не пусто C-ядро во всехтекущих подыграх, а само C(x∗ (t), T − t) является подмножеством из C-ядра.§ 4.Свойство сильной динамической устойчивостиПРД-ядраОпределение 1.4.1. Решение C(x0 , T − t0 ) является сильно динамическиустойчивым в игре Γv (x0 , T − t0 ), если1. C(x∗ (t), T − t) ̸= ∅, ∀t ∈ [t0 , T ];2. ∀ξ(x0 , T − t0 ) ∈ C(x0 , T − t0 ) существует ПРД β(τ ), τ ∈ [t0 , T ], такая∫ Tчто ξ(x0 , T − t0 ) =β(τ )dτ , и выполняется условие:t0∫tC(x0 , T − t0 ) ⊃β(τ )dτ ⊕ C(x∗ (t), T − t), ∀t ∈ [t0 , T ].t0Здесь символ ⊕ определяется следующим образом.
Пусть a ∈ Rn , B ⊂ Rn ,тогда a ⊕ B = {a + b : b ∈ B}. Построенное ПРД-ядро C(x∗ (t), T − t) являетсясильно динамически устойчивым принципом оптимальности.Сильная динамическая устойчивость ПРД-ядра означает, что при развитииигры вдоль кооперативной траектории x∗ (t) для любого дележа ξ(x0 , T − t0 ) ∈C(x0 , T − t0 ) существует ПРД такая, что отклонение в момент t от этого дележаˆ ∗ (t), T − t) из C(x∗ (t), T − t) приведет к суммарнымв пользу другого дележа ξ(x¯ 0 , T −t0 )выплатам в игре Γ(x0 , T −t0 ), соответствующим некоторому дележу ξ(xтакже из ПРД-ядра C(x0 , T − t0 ).Теорема 1.4.1. Пусть C-ядро C(x∗ (t), T − t) ̸= ∅, и ПРД-ядро C(x∗ (t), T −t) ̸= ∅, ∀t ∈ [t0 , T ].
Тогда ПРД-ядро C(x∗ (t), T − t) является сильно динамически устойчивым решением в игре Γv (x0 , T − t0 ).Доказательство. Из непустоты С-ядра и ПРД-ядра следует, что для любого дележа ξ(x0 , T − t0 ) ∈ C(x0 , T − t0 ) ⊆ C(x0 , T − t0 ) существует ПРД βi (t),23т.ч. ξi (x0 , T − t0 ) =∫Tt0βi (t)dt, i ∈ N . Развитию игры во времени соответствуетдвижение вдоль кооперативной траектории x∗ (t), t ∈ [t0 , T ], на которой игрокив каждый момент времени попадают в текущие подыгры Γv (x∗ (t), T − t).Пусть в начале игры Γv (x0 , T −t0 ) игроки выбрали в качестве решения дележξ(x0 , T − t0 ) ∈ C(x0 , T − t0 ), в момент времени tbr , tbr ∈ [t0 , T ] произошло˜ ∗ (tbr ), T − tbr ) из ПРДотклонение от ξ(x∗ (t), T − t) в пользу другого дележа ξ(xˆ 0 , T − t0 ) =ядра C(x∗ (tbr ), T − tbr ). Покажем, что результирующий дележ ξ(x∫ tbr˜ ∗t0 β(t)dt + ξ(x (tbr ), T − tbr ) также принадлежит ПРД-ядру C(x0 , T − t0 ). Т.е.∫Tˆ 0 , T − t0 ), причем β̂(t) ∈докажем, что существует ПРД β̂(t), т.ч.
t0 β̂(t)dt = ξ(xB(t) удовлетворяет условию (2.3). По определению множества C(x0 , T − t0 ),˜ ∗ (tbr ), T −tbr ) соответствуют ПРД β(t) ∈ B(t), t ∈ [t0 , T ]дележу ξ(x0 , T −t0 ) и ξ(xи β̃(t) ∈ B(t), t ∈ [tbr , T ] (2.3).По построению β̂(t) имеет видβ(t),β̂(t) =β̃(t),t ∈ [t0 , tbr ],t ∈ (tbr , T ].Для того, чтобы показать, что β̂(t) ∈ B(t), ∀t ∈ [t0 , T ], необходимо доказать, что β̂(t) является интегрируемой функцией. Функции β(t) и β̃(t) являются интегрируемыми по построению, т.к.
β(t), β̃(t) ∈ B(t), на отрезке [t0 , T ]и [tbr , T ] соответственно. Из определения интегрируемости функций β(t), β̃(t)следует, что пределы интегральных сумм на интервалах [t0 , tbr ] и (tbr , T ] сходятся. Отсюда следует, что сходится и сумма этих интегральных сумм. Так какβ̂(t) ∈ B(t), ∀t ∈ [t0 , T ], то по определению множества C(x0 , T − t0 ) получаем,ˆ 0 , T − t0 ) ∈ C(x0 , T − t0 ).что ξ(xТеорема доказана.24§ 5.Сильно динамически устойчивое ПРД-ядро вдифференциальной игре управления объемамивредных выбросовПроиллюстрируем алгоритм построения сильно динамически устойчивогоПРД-ядра C(x0 , T −t0 ) для одного частного случая линейно-квадратичной дифференциальной игры, изученной в работе [37].















