Диссертация (1149783), страница 5
Текст из файла (страница 5)
Подставляя полученные выражения в (1.2.2), имеем:Xh(t0 )Kl−Wt(t, xKl (t)) =Pi [xi (t)]1/2 exp [−r(t − t0 )] −i∈Klhi2(αi ) xi (t)(t0 )KlWxi(t, xKl (t)) exp [r(t − t0 )] +−4ciX(αi )2 xi (t) (t0 )KlWxi+Wx(ti 0 )Kl (t, xKl (t))(t, xKl (t)) exp [r(t − t0 )] +2cii∈KlX [j,i]+bj [xj (t)xi (t)]1/2 − δxi (t)2j∈Kl , j6=iW (t0 )Kl (T, xKl (T )) =Xexp [−r(T − t0 )] qi [xi (T )]1/2i∈KlПолучили уравнение в частных производных. Решая его, получаем:#"X1/2lW (t0 )Kl (t, xKl (t)) =AK+ C Kl (t) exp [−r(t − t0 )] ,(1.2.4)i (t) [xi (t)]i∈KlKllгде величины {AKi (t)}i∈Kl , C (t) являются решением дифференциальных урав-нений:lȦKi (t)X b[i,j]δjKllAi (t) −AK(t) − Pi= r+22 jj∈Kl ,j6=i(1.2.5)24X α2ilĊ (t) = rC (t) −AKi (t)16ciKlKli∈KllAKi (T ) = qi ,C Kl (T ) = 0,i ∈ KlДанные уравнения решаются также, с использованием стандартной техники.
Из уравнений (1.2.4) и (1.2.5) находим формулы частных производных:#"X(t )K1/2lWt 0 l (t, xKl (t)) =ȦK+ Ċ Kl (t) −(1.2.6)i (t) [xi (t)]i∈Kl"−r#!X1/2lAK+ C Kl (t)i (t) [xi (t)]exp [−r(t − t0 )]i∈Kl1 l−1/2exp [−r(t − t0 )]Wx(ti 0 )Kl (t, xKl (t)) = AKi (t) [xi (t)]2Из формул (1.2.6) получаем оптимальные управления:αi2 h Kl i2∗∗uKl (t) = {ui (t)}i∈Kl =A (t)16(ci )2 ii∈Kl(1.2.7)Динамика развития коалиции Kl принимает вид:ẋi (s) =αi2 KlAi (s) [xi (s)]1/2 +4ciX[j,i]bj [xj (s)xi (s)]1/2 − δxi (s)(1.2.8)j∈Kl , j6=ixi (t0 ) = x0i ,i ∈ Kl ,s ∈ [t0 , T ]Таким образом, равновесной стратегией коалиции Kl будет вектор u∗Kl (t) ={u∗i (t)}i∈Kl , компоненты которого находятся по формуле (1.2.7), а траекторияразвития коалиции при этом определяется по уравнению (1.2.8).1.3Распределение выигрыша внутри коалиции KlВыигрыш, полученный коалицией Kl , распределяется между входящими в неефирмами.Будем считать, что внутри коалиции Kl фирмы действуют кооперативно.Это означает, что можно определить кооперативную игру ΓKl x0 , T − t0 , в которой участниками являются фирмы из Kl .
Чтобы определить долю каждой25фирмы, необходимо вычислить характеристическую функцию в игре и определить процедуру распределения выигрыша. Вначале вычислим характеристическую функцию.1.3.1Вычисление значений характеристической функциив игре ΓKl x0 , T − t0Обозначим характеристическую функцию в игре ΓKl x0 , T − t0 заV (t0 )Kl (L, xL (t), T − t). Вначале вычислим ее для максимальной коалиции Kl ,затем для отдельной фирмы, а затем для произвольной коалиции L ⊂ Kl . Какуже отмечалось, коалиции фирм никак не взаимодействуют между собой, поэтому стратегии фирм, не входящих в коалицию L, при вычислении функцииV (t0 )Kl (L, xL (t), T − t) не учитываются.Для максимальной коалиции Kl характеристическая функцияV (t0 )Kl (Kl , xKl (t), T − t) уже вычислена. Ее значение равно W (t0 )Kl (t, xKl (t)),это выигрыш, который получает коалиция Kl в равновесии по Нэшу в игре коалиций.
Оптимальные управления фирм при этом считаются по формуле (1.2.7).Остается вычислить ее для случая одного игрока и для случая произвольнойкоалиции.В случае одного игрока значение характеристической функции будет равно значению выигрыша игрока в равновесии по Нэшу в игре ΓKl x0 , T − t0 .Отметим, что в данной игре коалиции также не взаимодействуют между собой и не влияют на развитие друг друга. Поэтому поиск равновесия по Нэшуозначает максимизацию выигрыша каждой фирмы i ∈ Kl .Для того чтобы найти равновесие по Нэшу, требуется решить систему задач26оптимизации:V Kl (t0 ) (i, xi (t), T − t) = max (Hi (xi (t), T − t, ui )) =ui TZ= max hi (s, xi (s), ui (s)) exp [−r(s − t0 )] +uit1/2+ exp [−r(T − t0 )] qi [xi (T )],i ∈ KlПри этом уравнение динамики фирмы i задается уравнением (1.1.1).
Согласно теореме 1.2.1 необходимо найти функции V Kl (t0 ) (i, xi (t), T − t), которые удовлетворяют системе уравнений Беллмана:Kl (t0 )−Vt(i, xi (t), T − t) == max {hi (t, xi (t), ui (t)) exp [−r(t − t0 )] +uioKl (t0 )+ Vxi(i, xi (t), T − t) fi [xi (t), ui (t)]V Kl (t0 ) (i, xi (T ), T ) = exp [−r(T − t0 )] qi [xi (T )]1/2 ,где fi [xi (t), ui (t)] = αi [ui (s)xi (s)]1/2 − δxi (s)Выражение, стоящее под знаком максимума, обозначим за S Kl (ui )S Kl (ui ) = hi (t, xi (t), ui (t)) exp [−r(t − t0 )] ++VxKi l (t0 ) (i, xi (t), T − t) fi [xi (t), uKl (t)]Берем производную S Kl (ui ) по управлению ui :∂S Kl (ui )= −ci exp [−r(T − t0 )] +∂uiαi [xi (t)]1/2Kl (t0 )+Vxi(i, xi (t), T − t)2 [ui (t)]1/2Приравнивая эту производную нулю, получаем:i2αi2 h Kl (t0 )ui (t) =V(i, xi (t), T − t) exp [r(t − t0 )] xi (t)4(ci )2 xi(1.3.1)27Неотрицательность управления ui (t) следует из неотрицательности xi (s).Подставляя полученное выражение в (1.3.1) получаем:Kl (t0 )−Vt(i, xi (t), T − t) = Pi [xi (t)]1/2 exp [−r(t − t0 )] −i2αi2 xi (t) h Kl (t0 )−Vx i(i, xi (t), T − t) exp [r(t − t0 )] −4(ci )2−δVxKi l (t0 ) (i, xi (t), T − t) , i ∈ KlV Kl (t0 ) (i, xi (T ), T ) = exp [−r(T − t0 )] qi [xi (T )]102Решая полученное уравнение в частных производных, получаем:V Kl (t0 ) (i, xi (t), T − t) = W (t0 )i (t, xi (t)) =hi{i}1/2{i}= Ai (t) [xi (t)] + C (t) exp [−r(t − t0 )] ,(1.3.2){i}где величины Ai (t) и C {i} (t) являются решением дифференциальных уравнений:δ{i}{i}Ȧi (t) = r +Ai (t) − Pi2α2 {i}Ċ {i} (t) = rC {i} (t) − i Ai (t)16ci{i}Ai (T ) = qi , C {i} (T ) = 0(1.3.3)Первое уравнение блочно-рекурсивной системе (1.3.3) - линейное диффе{i}ренциальное уравнение первого порядка относительно Ai (t), которое можетбыть решено независимо с помощью стандартной техники.
Подстановка реше{i}ния Ai (t) во второе уравнение (1.3.3) дает линейное дифференциальное уравнение относительно C {i} (t) Решение C {i} (t) может быть получено, используястандартную технику, но в общем случае оно получается крайне громоздким.При решении конкретных задач рекомендуется использовать численные методы.Из формул (1.3.2) и (1.3.3) получаем формулы для частных производныхи находим равновесную стратегию для фирмы i:αi2 h {i} i2{i}ui (t) =A (t)i ∈ Kl16(ci )2 i(1.3.4)28Вычислим теперь характеристическую функцию для произвольной коалиции L ⊂ Kl .
Функция V Kl (t0 ) (L, xL (t), T − t) находится через решение следующей задачи оптимизации:V Kl (t0 ) (L, xL (t), T − t) = max (HL (xL (t), T − t, uL (t))) =uL!X= maxHi (xi (t), T − t, ui (t)) =uL= max uLXi∈LZThi (s, xi (s), ui (s)) exp [−r(s − t0 )] +i∈L t!+Xexp [−r(T − t0 )] qi [xi (T )]1/2i∈LСогласно теореме 1.2.1 функция V Kl (t0 ) (L, xL (t), T − t) удовлетворяетследующему уравнению Беллмана:Kl (t0 )−Vt= max(XuL(L, xL (t), T − t) =(1.3.5)hi (t, xi (t), ui (t)) exp [−r(t − t0 )] +i∈L)+XVxKi l (t0 ) (L, xL (t), T − t) fiL [xL (t), ui (t)]i∈LV Kl (t0 ) (L, xL (T ), T ) =Xexp [−r(T − t0 )] qi [xi (T )]102i∈Lгде fiL [xL (t), ui (t)] = αi [ui (s)xi (s)]1/2 +P[j,i]bj [xj (s)xi (s)]1/2 − δxi (s)j∈L, j6=iСнова обозначим выражение, стоящее под знаком максимума за S (uL ):XS (uL ) =hi (t, xi (t), ui (t)) exp [−r(t − t0 )] +i∈L+XVxKi l (t0 ) (L, xL (t), T − t) fiL [xL (t), ui (t)]i∈LИспользуя аналогичную технику, приведенную ранее, получаем:V Kl (t0 ) (L, xL (t), T − t) = W (t0 )L (t, xL (t)) =#X=ALi (t) [xi (t)]1/2 + C L (t) exp [−r(t − t0 )] ,"i∈L(1.3.6)29где величины ALi (t) и C L (t) являются решением дифференциальных уравнений:X b[i,j]δjȦLi (t) = r +ALj (t) − PiALi (t) −22(1.3.7)j∈L,j6=iX α2iĊ (t) = rC (t) −ALi (t)16ciLLi∈LALi (T ) = qi ,C L (T ) = 0,i∈LИз уравнений выше находим формулы частных производных, из которыхполучаем формулы оптимальных управлений для коалиции L:uLi (t) =αi2 L 2A (t)16(ci )2 ii∈L(1.3.8)Таким образом, характеристическая функция V Kl (t0 ) (K, xK (t), T − t) в игре ΓKl x0 , T − t0 имеет следующий вид:0K=∅ W (t0 )Kl (t, xK (t))K = KllKl (t0 )(1.3.9)V(K, xK (t), T − t) =(t0 )iW(t,x(t))K={i}∈Kil W (t0 )L (t, x (t)) K = L ⊂ KL1.3.2lСупераддитивность характеристической функцииV Kl (t0 ) (K, xK (t), T − t)Следует установить супераддитивность функции V Kl (t0 ) (K, xK (t), T − t).Определение 1.3.1.
Функция V Kl (t0 ) (K, xK (t), T − t) является супераддитивной, если для любых коалиций L1 , L2 ⊂ Kl , L1 ∩ L2 = ∅ выполняется условие:V Kl (t0 ) (L1 ∪ L2 , xL1 ∪L2 (t), T − t) ≥≥ V Kl (t0 ) (L1 , xL1 (t), T − t) + V Kl (t0 ) (L2 , xL2 (t), T − t)30Учитывая (1.3.9), если функция W (t0 )K (t, xK (t)) является супераддитивной, то из нее очевидным образом следует супераддитивность функцииV Kl (t0 ) (K, xK (t), T − t).
Покажем супераддитивность функции W (t0 )K (t, xK (t))для любой коалиции L ⊆ K. Для начала приведем без доказательства теоремуо сравнении решений ([3]).Теорема 1.3.1. (О сравнении решений) Пусть даны две задачи Коши:ẏ1 (t) = f1 (t, y1 (t)) ,y1 (t0 ) = y10ẏ2 (t) = f2 (t, y2 (t)) ,y2 (t0 ) = y20Для каждой задачи выполнены условия существования и единственностирешения, и кроме того выполняется условие:f1 (t, u(t)) ≥ f2 (t, u(t)) ,∀ (t, u(t))Тогда, если y10 ≥ y20 , то при всех t ≥ t0 выполняется:y1 (t, t0 , y10 ) ≥ y2 (t, t0 , y20 )Перейдем к доказательству супераддитивности функции W (t0 )K (t, xK (t)).Теорема 1.3.2.
Функция W (t0 )K (t, xK (t)), задаваемая формулами (1.2.4), (1.3.2)и (1.3.6), является супераддитивнойДоказательство. теоремы 1.3.2 Рассмотрим две коалиции S1 , S2 ⊂ Kl , S1 ∩S2 = ∅ и их объединение S1 ∪ S2 . Функция W (t0 )K (t, xK (t)) для каждой изкоалиций принимает следующий вид:W (t0 )S1 ∪S2 (t, xS1 ∪S2 (t)) =TiX Z h102= maxPi [xi (s)] − ci ui (s) exp [−r(s − t0 )] ds+uS1 ∪S2i∈S1 ∪S2 t!+Xi∈S1 ∪S2exp [−r(T − t0 )] qi [xi (T )]10231W (t0 )S1 (t, xS1 (t)) =TiXZ h102= maxPi [xi (s)] − ci ui (s) exp [−r(s − t0 )] ds+uS1i∈S1 t!+Xexp [−r(T − t0 )] qi [xi (T )]102i∈S1W (t0 )S2 (t, xS2 (t)) =TiXZ h102= maxPi [xi (s)] − ci ui (s) exp [−r(s − t0 )] ds+uS1i∈S1 t!+Xexp [−r(T − t0 )] qi [xi (T )]102 .i∈S1При этом уравнения движений для каждой из коалиций имеют вид:ẋi (s) = fiS1 ∪S2 [s, xS1 ∪S2 (s), ui (s)] = αi [ui (s)xi (s)]1/2 +X[j,i]+bj [xj (s)xi (s)]1/2 − δxi (s)j∈S1 ∪S2 , j6=ixi (t0 ) = x0i ,i ∈ S1 ∪ S2 ,(1.3.10)s ∈ [t0 , T ]ẋi (s) = fiS1 [s, xS1 (s), ui (s)] = αi [ui (s)xi (s)]1/2 +X [j,i]+bj [xj (s)xi (s)]1/2 − δxi (s)(1.3.11)j∈S1 , j6=ixi (t0 ) = x0i ,i ∈ S1 ,s ∈ [t0 , T ]ẋi (s) = fiS2 [s, xS2 (s), ui (s)] = αi [ui (s)xi (s)]1/2 +X [j,i]+bj [xj (s)xi (s)]1/2 − δxi (s)j∈S2 , j6=ixi (t0 ) = x0i ,i ∈ S2 ,s ∈ [t0 , T ]Из условия xi (s) > 0 для ∀i ∈ N следует, что для любых ui :fiS1 ∪S2 [s, xS1 ∪S2 (s), ui (s)] ≥ fiS1 [s, xS1 (s), ui (s)] ,i ∈ S1fiS1 ∪S2 [s, xS1 ∪S2 (s), ui (s)] ≥ fiS2 [s, xS2 (s), ui (s)] ,i ∈ S2(1.3.12)32Обозначим решения уравнений(1.3.10), (1.3.11) и (1.3.12) соответственноnononoS1 ∪S2S1S2через xi(s), xi (s)и xi (s).i∈S1 ∪S2i∈S1i∈S2Учитывая теорему 1.3.1, получаем, что для любых допустимых ui (s) уровень технологии фирмы xSi 1 ∪S2 (s) ≥ xSi 1 (s),i ∈ S1 и xiS1 ∪S2 (s) ≥ xSi 2 (s),i∈S2 .Из выражения для выигрыша предприятия (1.1.2) получается, что для любого допустимого ui выигрыш фирмы Hi (xi (t), T − t, ui ) в коалиции S1 ∪ S2больше, чем выигрыш той же фирмы в коалиции S1 или в S2 .S1 ∪S2S1Hi xi(t), T − t, ui (t) ≥ Hi xi (t), T − t, ui (t)i ∈ S1Hi xSi 1 ∪S2 (t), T − t, ui (t) ≥ Hi xSi 2 (t), T − t, ui (t)i ∈ S2Суммируя выигрыши фирм по коалициям, получаем: X X S1S1 ∪S2(t), T − t, ui (t) ≥Hi xi (t), T − t, ui (t)Hi xii∈Si∈S1X(1.3.13)Hi X1S1 ∪S2S2xi(t), T − t, ui (t) ≥Hi xi (t), T − t, ui (t)i∈S2i∈S2noS1Обозначим через ui (s)i∈S1noS2и ui (s)управления, максимизирую-i∈S2щие суммы выигрышей в коалиции S1 и S2 .