Диссертация (1149783), страница 6
Текст из файла (страница 6)
Подставляя их в (1.3.13), получаем: X X S1 ∪S2S1S1S1(t), T − t, ui (t) ≥Hi xi (t), T − t, ui (t)(1.3.14)Hi xii∈Si∈S1XHi X1S1 ∪S2S2S2S2xi(t), T − t, ui (t) ≥Hi xi (t), T − t, ui (t)i∈S2i∈S2Сложив неравенства (1.3.14), получаем: X X S1 ∪S2S1S1 ∪S2S2Hi xi(t), T − t, ui (t) +Hi xi(t), T − t, ui (t) ≥i∈S1i∈S≥X2 X S1S1S2S2Hi xi (t), T − t, ui (t) +Hi xi (t), T − t, ui (t)i∈S1i∈S2noS1 ∪S2Обозначим через ui(s)i∈S1 ∪S2управления, максимизирующие суммывыигрышей в коалиции S1 ∪ S2 .
Получаем:33XHixiS1 ∪S2 (t), T−t, uSi 1 ∪S2 (t)=(1.3.15)i∈S1 ∪S2(=≥XHiXmaxui ,i∈S1 ∪S2HiS1 ∪S2xi(t), T − t, ui (t))≥i∈S ∪S2 1XS1 ∪S2S1S1 ∪S2S2xi(t), T − t, ui (t) +Hi xi(t), T − t, ui (t) ≥i∈S1i∈S≥XHi 2X S1S1S2S2xi (t), T − t, ui (t) +Hi xi (t), T − t, ui (t) =i∈S1i∈S= maxui ,i∈S1( 2XHiS1xi (t), T − t, ui (t))+i∈S1+ maxui ,i∈S2(XHiS2xi (t), T − t, ui (t))i∈S2По определению:(Xmaxui ,i∈S1 ∪S2maxui ,i∈S1maxui ,i∈S2(XHiS1 ∪S2xi(t), T − t, ui (t))=(1.3.16)i∈S1 ∪S2= W (t0 )S1 ∪S2 (t, xS1 ∪S2 (t)))= W (t0 )S1 (t, xS1 (t))Hi xSi 1 (t), T − t, ui (t)i∈S( 1XHiS2xi (t), T − t, ui (t))= W (t0 )S2 (t, xS2 (t))i∈S2Подставляя (1.3.16) в (1.3.15) получаем, что:W (t0 )S1 ∪S2 (t, xS1 ∪S2 (t)) ≥ W (t0 )S1 (t, xS1 (t)) + W (t0 )S2 (t, xS2 (t)) ,что и требовалось доказатьСупераддитивность функции V Kl (t0 ) (K, xK (t), T − t) очевидным образомвытекает из супераддитивности функции W (t0 )K (t, xK (t)).1.3.3Процедура распределения выигрыша в игре ΓKl x0 , T − t0Определив характеристическую функцию в игре ΓKl x0 , T − t0 , введем процедуру распределения совместного выигрыша.
В качестве дележа полученного34выигрыша коалиции Kl , l ∈ M будем использовать динамический вектор Шепли.Участники коалиции будут максимизировать совместный выигрыш, используя набор оптимальных управлений u∗i (t)i∈Kl , полученных по формуле (1.2.7)на промежутке [t0 , T ] и реализовывать соответствующие оптимальные траектории x∗i (t)i∈Kl , полученные из системы (1.2.8).В начальный момент времени t0 доля выигрыша фирмы i ∈ Kl будет равна:X (k − 1)!(kl − k)! h(t0 )Kl0νit0 , xKl =V Kl (t0 ) K, x0K , T − t0 −kl !K⊆KliKl (t0 )0−VK \ i, xK\i , T − t0 ,где kl = |Kl | – число участников коалиции Kl .
Вектор Шепли должен поддерживаться на протяжении всей игры. В момент времени t ∈ [t0 , T ] в состоянииx∗Kl (t) ∈ x∗N (t) для игрока i ∈ Kl должен быть обеспечен соответствующийпринцип распределения дележа:(t )Kνi 0 lt, x∗Kl (t)X (k − 1)!(kl − k)! h=V Kl (t0 ) (K, x∗K (t), T − t) −kl !K⊆KliKl (t0 )∗−VK \ i, xK\i (t), T − tУчитывая (1.3.9), можно переписать формулу для компонент вектора Шепли в следующем виде:(t )Kνi 0 lt, x∗Kl (t)X (k − 1)!(kl − k)! h=W (t0 )K (t, x∗K (t)) −kl !K⊆Kli(t0 )K\i∗−Wt, xK\i (t)(1.3.17)Для реализации динамического вектора Шепли необходимо в каждый момент времени выполнять перераспределение совместного выигрыша. Необходимо определить процедуру распределения дележа. Данная техника приведе(t )Kна в книгах [15], [41].
Компоненты вектора Шепли νi 0 l t, x∗Kl (t) предполагаются непрерывно дифференцируемыми вдоль всей кооперативной траекто-35рии. Определяем процедуру распределения выигрыша, как функцию B Kl (t) =noTKlBi (t), такую что:t=t0(t0 )Klνit0 , x0Kl =ZTBiKl (s) exp [−r(s − t0 )] ds +(1.3.18)t0+ exp [−r(T − t0 )] qi [x∗i (T )]1/2Функция BiKl (s) представляет собой выигрыш, получаемый фирмой i ∈ Klв момент s ∈ [t0 , T ]. Для того, чтобы вектор Шепли поддерживался внутрикоалиции в каждый момент должно выполняться равенство:(t0 )Klνit, x∗Kl (t) =ZTBiKl (s) exp [−r(s − t0 )] ds +(1.3.19)t+ exp [−r(T − t0 )] qi [x∗i (T )]1/2Из (1.3.19) получаем, что:(t0 )Klνit0 , x0Kl =ZtBiKl (s) exp [−r(s − t0 )] ds +t0(t0 )Kl+νit, x∗Kl (t)Из определения функции процедуры распределения выигрыша BiKl (s) получается что:BiKl (s)d (s)Kl∗νt, xKl (t) |t=s=−dt iПоэтому формулу для BiKl (s) получаем из (1.3.19), дифференцируя(s)Kνi l t, x∗Kl (t) по t.(s)KИспользуя для компонентов вектора Шепли νi l t, x∗Kl (t) формулу (1.3.17)и учитывая, чтоd(s)Kdt W(s, x∗K (s))=(s)KWt(s, x∗K (s))iP h (s)K∗+Wxj (s, xK (s)) fjKl x∗Kl (s), u∗j (s) ,j∈K36получаем, что:X (k − 1)!(kl − k)! nh (s)KWt(s, x∗K (s)) − (1.3.20)=−kl !K⊆Klii X h(s)K\i(s)K∗∗Wxj (s, xK (s)) fjKl x∗Kl (s), u∗j (s) −− Wts, xK\i (s) +BiKl (s)j∈KhiX ∗Kl(s)K\i∗∗−Wxhs, xK\i (s) fh xKl (s), uh (s)h∈K\iПолученное решение будет динамически устойчивым (состоятельным вовремени).Отметим, что в каждый момент s ∈ [t0 , T ] внутри коалиции Kl ⊂ ∆ происходит только перераспределение выигрыша, т.е.
значение суммарного выигрыша не изменяется. Это означает, что в суммы выигрышей фирм-участниковдо и после перераспределения равны:iXXh102Kl∗∗Bi (s) =Pi [xi (s)] − ci ui (s)i∈Kl1.4(1.3.21)i∈KlКоалиционное решение. Построение устойчивого PMS∆0вектора в игре Γ x , T − t0Определим теперь игру Γ∆ x0 , T − t0 – игру с коалиционной структурой, где∆ = {K1 , K2 , ..., Km } – фиксированное разбиение множества игроков N , M =∆(t0 ){1, ..., m} – множество индексов, VK̆, xK̆ (t), T − t – характеристическаяфункция коалиционной игры Γ∆ x0 , T − t0 , которая имеет вид:V ∆(t0 ) (K, xK (t), T − t) = V Kl (t0 ) (K, xK (t), T − t) , K ⊆ Kl ,(1.4.1)где V Kl (t0 ) (K, xK (t), T − t) – характеристическая функция кооперативной игрыΓKl x0 , T − t0 .
Игра формируется следующим образом. Вначале формируютсякоалиции и получают свой выигрыш, затем выигрыши коалиций распределяются между их участниками.37Алгоритм построения коалиционного решения следующий:1. Вычисление равновесия по Нэшу в игре коалиций Γ∆ x0 , T − t0 . Коалиции действуют как отдельные игроки, каждый участник коалиции i ∈ Klмаксимизирует выигрыш своей коалиции Kl .
Равновесие по Нэшу в игре коалиций получается решением системы задач:!W (t0 )Kl (t, xKl (t)) = maxuKlXHi (xi (t), T − t, ui (t))i∈KlKl ⊂ ∆Выигрыш коалиции задается формулой (1.2.4), при этом равновесные стратегии участников коалиции определяются формулой (1.2.7), а их технологическое развитие задается системой (1.2.8).2. Распределение выигрыша коалиции Kl между ее участниками. Определяется кооперативная игра ΓKl x0 , T − t0 , затем в ней вычисляется характеристическая функция V Kl (t0 ) (K, xK (t), T − t) и вектор Шепли. Характеристическая функция игры ΓKl x0 , T − t0 определяется формулой (1.3.9), компонентывектора Шепли задаются формулой (1.3.17).
Для реализации вектора Шеплиопределяется процедура распределения дележа. Мгновенный выигрыш, получаемая фирмой i ∈ Kl в результате этой процедуры, определяется формулой(1.3.20).3. Построение динамически устойчивого (состоятельного во времени) PMSвектора.P M S(t) = {P M S(t)1 (t), P M S(t)2 (t), ..., P M S(t)n (t)}(t )KP M S(t)i (t) = νi 0 l t, x∗Kl (t) ,(t0 )Klt, x∗Kl (t) – компонента вектора Шепли для фирмы i ∈ Kl в игреx0 , T − t0где νiΓKlОпределение 1.4.1. Под коалиционным решением понимается вектор ζ(t) ={ζ1 (t), ζ2 (t), ..., ζn (t)}, такой, что ζi (t) = ζiKl (t) – компонента дележа в коопе-38ративной игре ΓKl x0 , T − t0 , где выигрыш коалиции Kl равен ее выигрышу вравновесии по Нэшу в игре Γ∆ x0 , T − t0 .Таким образом, PMS-вектор в игре Γ∆ x0 , T − t0 строится через компоненты вектора Шепли в игре ΓKl x0 , T − t0 , задаваемые через формулы(1.3.17), реализуемые через процедуру распределения дележа, задаваемую формулой (1.3.20).1.5Численный примерПриведем численный пример.
Пусть n = 4. Рассматривается случай, когдачетыре фирмы объединяются в коалиции с целью максимизации совместного выигрыша. Объединение происходит на заранее согласованном временномпериоде [t0 , T ], в конце которого технологии фирм ликвидируются, и коалициирасформировываются. На множестве фирм N = {1, 2, 3, 4} задано разбиение∆ = {{1, 2}, {3, 4}}, состоящее из двух коалиций.Пусть заданы начальные параметры:t0 = 0 – начальный момент игры; T = 20 – конечный момент игры; r = 0, 1– размер дисконта; δ = 0, 2 – уровень устаревания технологий;Динамика состояния каждой коалиции задается дифференциальным уравнением (1.1.5), где:x01 = x02 = x03 = x04 = 0.5 – начальные состояния фирм;α1 = α2 = α3 = α4 = 0.6 – константы, определяющие прибавку в технологии фирм;[2,1]= b1[1,2]= b2[1,3]= b3[1,4]= b4b1b2b3b4[3,1]= b1[3,2]= b2[2,3]= b3[2,4][4,1]= 0.05[4,2]= 0.05[4,3]= 0.05[3,4]= b4= 0.05 – константы, представляющие собой эффектыпередачи технологий между фирмами.39Выигрыш каждой коалиции определяется формулой (1.1.6), где:P1 = 1.2, P2 = 0.3, P3 = 0.6, P4 = 0.15 – константы, определяющиечистую операционную прибыль фирм;c1 = 0.5; c2 = 0.5; c3 = 0.5; c4 = 0.5 – константы, определяющие инвестиционный вклад фирм в технологическое развитие;q1 = 0.1; q2 = 0.1; q3 = 0.1; q4 = 0.1 – константы, определяющие ликвиднуюстоимость технологий фирм на момент конца игры T .Ниже на рисунке 1.1 представлены графики динамики состояний фирм длякоалиций:На рисунке 1.2 представлены графики выигрышей фирм в коалициях доперераспределения:40На рисунке 1.3 изображены графики выигрышей фирм в коалициях послеперераспределения:Результаты вычислений приведены в таблицах 1.1 и 1.2.