Диссертация (1149783), страница 9
Текст из файла (страница 9)
обладает индивидуальной рациональностью и эффективностью.(t )νK0l (τ, x∗N (τ )) ≥ W (t0 )Kl τ, x∗Kl (τ )X (t )νK0l (τ, x∗N (τ )) = W (t0 )N (τ, x∗N (τ )) ,Kl ⊂∆Для реализации динамического вектора Шепли необходимо определитьпроцедуру распределения дележа, чтобы компенсировать переходные изменения. Определим процедуру распределения дележа, как функциюB∆ (t) = {BKl (t)}Tt=t0 , такую что:(t )νK0lt0 , x0NZTBKl (s) exp [−r(s − t0 )] ds +=(2.4.5)t0+Xexp [−r(T − t0 )] qi (x∗i (T ))1/2i∈KlФункция BKl (s) представляет собой платеж, получаемый коалицией Kl вмомент s ∈ [t0 , T ].Рассмотрим текущие подыгры Γ∆ (x∗N (t), T − t) вдоль условно-оптимальнойno(t0 )∗0кооперативной траектории xN (t).
Будем полагать, что функция νKl t0 , xNKl ⊂∆может быть выбрана как дифференцируемая по t.Чтобы вектор Шепли поддерживался на всем протяжении игры, необходи-57мо, чтобы в каждый момент выполнялось равенство:Z T(t0 )νKl (t, x∗N (t)) =BKl (s) exp [−r(s − t0 )] ds +tX+exp [−r(T − t0 )] qi (x∗i (T ))1/2(2.4.6)i∈KlИз (2.4.5) и (2.4.6) получаем, что:Z t(t0 )(t )0νKl t0 , xN =BKl (s) exp [−r(s − t0 )] ds + νK0l (t, x∗N (t))(2.4.7)t0Последнее условие означает временную состоятельность или динамическую устойчивость решения относительно коалиций-участников Kl ⊂ ∆.Необходимо также показать динамическую устойчивость решения относительно каждой отдельной фирмы.
Это будет сделано в последующих разделах.Отметим, что, как и раньше, в каждый момент s ∈ [t0 , T ] происходит только перераспределение совместного выигрыша, поэтому сумма доходов игроковне меняется, т.е.XBKl (s) =Kl ⊂∆X Xhi (s, xi (s), ui (s)) =(2.4.8)Kl ⊂∆ i∈Kl=X Xh∗1/2Pi xi (s)i− ci ui (s)Kl ⊂∆ i∈KlИз определения функции BKl (s) получается чтоd (s)νKl (t, x∗N (t)) BKl (s) = −dtt=sПоэтому формулу для BKl (s) получаем из (2.4.6), дифференцируя(s)(s)νKl (t, x∗N (t)) по t. Используя для компонент вектора Шепли νKl (t, x∗N (t)) фор-58мулу (2.4.4), получаем, чтоX (k − 1)!(m − k)! nh (s)K̆BKl (s) = −Wts, x∗K̆ (s) −m!K̆⊆N̆i(s)K̆\Kl∗s, xK̆\K (s) +− WtlhiXK̆∗∆∗∗Wx(s)s,x(s)fx(s),u(s)−+jNjjK̆(2.4.9)j∈K̆hiX(s)K̆\Kl∗∆ ∗∗Wxhs, xK̆\K (s) fh [xN (s), uh (s)] .−lh∈K̆\Kl2.5Построение кооперативной игры между членами коалиции KlВыигрыш, полученный в игре Γ∆ x0N , T − t0 , коалиция Kl делит между своими фирмами-участниками.
Требуется вычислить долю каждой фирмы от полученного выигрыша. Снова будем считать, что внутри коалиции Kl фирмы действуют кооперативно. В качестве дележа снова используется динамический вектор Шепли. Это означает, что можно определить кооперативную игру ΓKl (x0Kl , T −t0 ), в которой Kl – это множество игроков, а V = V (t0 )Kl (L, xL (t), T − t) – характеристическая функция, где L ⊆ Kl .Для вычисления доли выигрыша каждой фирмы i ∈ Kl необходимо построить характеристическую функцию в игре ΓKl (x0Kl , T − t0 ) и определитьпроцедуру распределения дележа.Характеристическую функцию будем строить следующим образом. Вначале построим характеристическую функцию для всей коалиции Kl , затем дляпроизвольной коалиции L ⊂ Kl . При построении характеристической функциидля коалиции Kl необходимо учитывать, что она участвует в игре коалицийΓ∆ (x0N , T − t0 ) и поэтому получает больший выигрыш, чем могла бы получить,играя самостоятельно. Поскольку любая подкоалиция K ⊂ Kl не включена в59разбиение ∆, то можно считать, что она не имеет тех бонусов, какие доступныдля коалиции Kl , и для нее характеристическая функция будет строиться безучета игры коалиций.Значение характеристической функции V (t0 )Kl Kl , x0Kl , T − t0 должно равняться максимальному гарантированному выигрышу, который может получитькоалиция Kl .
Если бы коалиция играла самостоятельно, ее максимальный гарантированный выигрыш был бы равен функции W (t0 )Kl t0 , x0Kl , определяемойформулой (1.2.4). Эта функция определяет выигрыш коалиции Kl в равновесиипо Нэшу в игре коалиций Γ∆ (x0N , T −t0 ). Но в игре Γ∆ (x0N , T −t0 ) коалиции объединены в альянс, и каждая получает долю дохода, равную компоненте вектора(t )Шепли νK0l t0 , x0N , которые вычисляются по формуле (2.4.3). В силу индиви(t )дуальной рациональности вектора Шепли νK0l t0 , x0N ≥ W (t0 )Kl t0 , x0Kl , коалиция Kl получает больший выигрыш, чем при самостоятельной игре. Поэтомухарактеристическая функция для нее буде равна:(t )V (t0 )Kl Kl , x0Kl , T − t0 = νK0l t0 , x0N(2.5.1)Поскольку вектор Шепли в игре Γ∆ x0N , T − t0 сохраняет индивидуальную рациональность в любой подыгре Γ∆ (x∗N (t), T − t), то и в любой подыгреΓKl x∗Kl (t), T − t сохраняется равенство:(t )V (t0 )Kl Kl , xKl (t), T − t = νK0l (t, x∗N (t))(2.5.2)Для случая произвольной коалиции L ⊂ Kl и, в частности, случая отдельной фирмы i ∈ Kl вычисление характеристической функции аналогичны приведенным в разделе 1.3.1.
Функция V (t0 )Kl (L, xL (t), T − t) находится посредством60решения следующей задачи максимизации:V Kl (t0 ) (L, xL (t), T − t) = max (HL (xL (t), T − t, uL (t))) =uL!X= maxHi (xi (t), T − t, ui (t)) =uL= max uL(2.5.3)i∈LTXZhi (s, xi (s), ui (s)) exp [−r(s − t0 )] ds+i∈L t!+Xexp [−r(T − t0 )] qi [xi (T )]1/2 ,L ⊂ Kl .i∈LИспользуя технику, приведенную в разделе 1.3.1, получаем:V (t0 )Kl (L, xL (t), T − t) = W (t0 )L (t, xL (t)) ="#X=ALi (t) [xi (t)]1/2 + C L (t) exp [−r(t − t0 )] ,(2.5.4)i∈Lгде величины ALi (t) i∈L и C L (t) находятся из дифференциальных уравнений(1.3.7).Оптимальные управления для коалиции L находятся из формул (1.3.8)Таким образом, характеристическая функция V (t0 )Kl (K, xK (t), T − t) в игре ΓKl (x0Kl , T − t0 ) имеет следующий вид:0, ν (t0 ) (t, x∗ (t)) ,NKl(t0 )KlV(K, xK (t), T − t) =W (t0 )i (t, xi (t)) , W (t0 )L (t, x (t)) ,LK=∅K = Kl(2.5.5)K = {i}K = L ⊂ KlСупераддитивность функции V (t0 )Kl (K, xK (t), T − t) очевидным образомвытекает из супераддитивности функции W (t0 )K (t, xK (t)), а также из условия(t )νK0l (t, x∗N (t)) ≥ W (t0 )Kl t, x∗Kl (t) .612.6Вектор Шепли в игре ΓKl (x0Kl , T − t0)Вычислив характеристическую функцию в игре ΓKl (x0Kl , T − t0 ), введем процедуру распределения совместного выигрыша.
В качестве дележа полученноговыигрыша коалиции Kl , где l ∈ M , будем вновь динамический вектор Шеплиo n (t0 )Kl0(t0 )Kl0.t0 , xNνt0 , xN = νii∈KlПоскольку коалиция Kl участвует в игре коалиций Γ∆ x0N , T − t0 , то ееучастники коалиции будут максимизировать совместный выигрыш W (t0 )N (t, xN (t)),используя набор оптимальных управлений {u∗i (t)}i∈Kl , полученных по формуле(2.3.9), на промежутке [t0 , T ] и реализовывать соответствующие оптимальныетраектории {x∗i (t)}i∈Kl , полученные из системы (2.3.10).В начальный момент времени t0 доля кооперативного выигрыша фирмыi ∈ Kl будет равна:(t )Kνi 0 lt0 , x0NX (k − 1)!(kl − k)! h=V (t0 )Kl K, x0K , T − t0 −kl !K⊆Kli− V (t0 )Kl K \ i, x0K\i , T − t0 ,(2.6.1)где kl = |Kl | – число участников коалиции Kl .Вектор Шепли должен поддерживаться на протяжении всей игры.
В момент времени t ∈ [t0 , T ] в состоянии x∗Kl (t) для фирмы i ∈ Kl , учитывая формулу (2.5.5), должен быть обеспечен соответствующий принцип распределениядележа:(t )Kνi 0 l(t, x∗N (t))X (k − 1)!(kl − k)! h=W (t0 )K (t, x∗K (t)) −kl !K⊆Kli(t0 )K\i∗−Wt, xK\i (t) +i1 h (t0 )∗(t0 )Kl \i∗+ν (t, xN (t)) − Wt, xKl \i (t)kl Kl(2.6.2)Для реализации динамического вектора Шепли необходимо в каждый момент времени выполнять перераспределение совместного выигрыша. Предпола-62(t0 )Klгается, что компоненты вектора Шепли νi(t, x∗N (t)) непрерывно дифферен-цируемы вдоль всей кооперативной траектории. Используя технику, аналогичную той, которая приведена в разделе 1.3.2, определяем процедуру распределеnoTKlKlния дележа, как функцию B (t) = Bi (t), такую что в каждый моментt=t0t ∈ [t0 , T ]:(t )Kνi 0 l(t, x∗N (t))TZBiKl (s) exp [−r(s − t0 )] ds +=(2.6.3)t+ exp [−r(T − t0 )] qi (x∗i (T ))1/2Функция BiKl (s) представляет собой платеж, получаемый игроком i в момент s.
Формула BiKl (s) определяется из производной компонента вектора Шепли:d(s)KBiKl (s) = −νi l (t, x∗N (t)) dtt=sНеобходимо учитывать, что характеристическая функцияV (t0 )Kl (K, xK (s), T − s) определяется через компонент вектора Шепли(t )νK0l (s, x∗N (s)) в игре коалиций Γ∆ x0N , T − t0 , который зависит от состоянийучастников разбиения ∆. Следовательно, частные производные компонент(s)Klνi(s, x∗N (s)) по состояниям коалиций Kξ ⊂ ∆, Kξ 6= Kl будут отличаться от(s)Klнуля.
Рассмотрим подробнее частные производные Vt(s)KlVx j(K, xK (s), T − s) и(K, xK (s), T − s). Если коалиция K не равна Kl , то характеристическаяфункция V (s)Kl (K, xK (s), T − s) = W (s)K (s, x∗K (s)). Для фирмы j ∈/ K част(s)Kная производная Wxj(s, x∗K (s)) = 0, поэтому их можно не рассматривать. Вслучае если K = Kl , характеристическая функция V (s)Kl (Kl , xKl (s), T − s) =(s)νKl (s, x∗N (s)).
В этом случае необходимо учитывать частные производные повсем j ∈ N .Таким образом, функция BiKl (s) принимает вид:63X (k − 1)!(kl − k)! nh (s)KWt(s, x∗K (s)) − (2.6.4)=−kl !K⊂Klii X h(s)K\i(s)K∗∗Wxj (s, xK (s)) fjN x∗N (s), u∗j (s) −−Wts, xK\i (s) +BiKl (s)j∈Ki(s)K\i∗N∗∗−Wxhs, xK\i (s) fh [xN (s), uh (s)] +h∈K\i1 nh (t0 ) i(s)Kl \i∗∗+νKl (s, xN (s)) − Wts, xKl \i (s) +tklX h (t ) iνK0l(s, x∗N (s)) fjN x∗N (s), u∗j (s) −+X hxjj∈N−X hl \iWx(s)Khh∈N \ii∗N∗∗s, xKl \i (s) fh [xN (s), uh (s)]Необходимо доказать динамическую устойчивость построенного решения.Теорема 2.6.1. Коалиционное решение, построенное через процедуры распределения выигрыша BKl (s), Kl ⊂ ∆ и BiKl (s), i ∈ Kl , значения которых определяются формулами (2.4.9) и (2.6.4), будет динамически устойчивым.Доказательство. Для доказательства требуется показать, что в каждый момент происходит только перераспределение выигрыша между всеми фирмами{i} ∈ N , а общая сумма выигрышей остается неизменной, т.е.
требуется доказать равенство:X XX XBiKl (s) =Kl ⊂∆ i∈Klhi (s, xi (s), ui (s)) =(2.6.5)Kl ⊂∆ i∈Kl=X Xh∗1/2Pi xi (s)i− ci ui (s)Kl ⊂∆ i∈KlРанее уже было установлено, что в каждый момент времени происходит перераспределение совместного выигрыша между коалициями-участниками игрыΓ∆ x0N , T − t0 . Следовательно, равенство (2.6.5) можно переписать в виде:X XXBiKl (s) =BKl (s)(2.6.6)Kl ⊂∆ i∈KlKl ⊂∆64Данное равенство очевидно, если показать, чтоPi∈KlBiKl (s) = BKl (s) длялюбой коалиции-участникаKl ⊂ ∆. Суммируя компоненты BiKl (s), легко установить, что:XBiKl (s)=−i∈Kl+Xh(s)νKli∈Nixih(s)νKlit(s, x∗N (s)) +!∗(s, x∗N (s)) fiN x∗N (s), uN,i (s)(s)где правая часть представляет собой полную производную νKl (s, x∗N (s)) по t собратным знаком, которая по определению равна BKl (s).
Следовательно, полученное коалиционное решение будет динамически устойчивым.Отметим, что внутри коалиции Kl уже нет простого перераспределениявыигрышей, т.е.XBiKl (s)i∈Kl6=XiX h ∗1/2hi (s, xi (s), ui (s)) =Pi xi (s) − ci ui (s) ,i∈Kli∈Klт.к. каждая фирма i ∈ Kl использует стратегию u∗i (s), определяемую по формуле (2.3.9) и максимизирующую выигрыш всего технологического альянса, ане отдельно Kl .2.7ES-вектор в игре ΓKl (x0Kl , T − t0)Рассмотрим теперь другой способ распределения выигрыша внутри коалиции.В качестве дележа возьмем ES-вектор.Определение 2.7.1. Вектор ξKlnoKl(V ) = ξi (V )называется ES-вектором,i∈Klесли его компоненты представлены в следующем виде:X1V Kl (j) ,ξiKl (V ) = V Kl (i) + V Kl (Kl ) −klj∈Kl65где V Kl (i) – значение характеристической функции в игре ΓKl (x0Kl , T − t0 )в ситуации равновесия по Нэшу, а V Kl (Kl ) – значение характеристическойфункции для максимальной коалиции KlВ начальный момент времени t0 доля кооперативного выигрыша фирмыi ∈ Kl будет равна:(t0 )Klt0 , x0N = V (t0 )Kl i, x0i , T − t0 + X (t )KV 0 l j, x0j , T − t0 Kl , x0Kl , T − t0 −ξi+1 (t0 )KlVkl(2.7.1)j∈KlДанный дележ должен поддерживаться на всем протяжении игры, т.е.