Диссертация (1149189), страница 8
Текст из файла (страница 8)
. . , l выполняетсяξim (x∗m,0 , t0 + m∆t, t0 + m∆t + T ) − ξim (x∗m,1 , t0 + (m + 1)∆t, t0 + m∆t + T ) ≥Vm ({i}; x∗m,0 , t0 +m∆t, t0 +m∆t+T )−Vm ({i}; x∗m,1 , t0 +(m+1)∆t, t0 +m∆t+T )(4.7)и для ∀t ∈ [t0 + j∆t, t0 + (j + 1)∆t], m = 0, . . . , l выполняетсяξij (x∗j (t), t, t0 + j∆t + T ) − ξij (x∗j,1 , t0 + (j + 1)∆t, t0 + j∆t + T ) ≥Vj ({i}; x∗j (t), t, t0 + j∆t + T ) − Vj ({i}; x∗j,1 , t0 + (j + 1)∆t, t0 + j∆t + T ).
(4.8)Видно, что выполнение условия (4.8) для ∀t ∈ [t0 + j∆t, t0 + (j + 1)∆t],m = 0, . . . , l влечет выполнение условия (4.7). Перепишем условие (4.8):ξij (x∗j (t), t, t0 + j∆t + T ) − Vj ({i}; x∗j (t), t, t0 + j∆t + T ) ≥≥ ξij (x∗j,1 , t0 + (j + 1)∆t, t0 + j∆t + T ) − Vj ({i}; x∗j,1 , t0 + (j + 1)∆t, t0 + j∆t + T ).(4.9)Условие (4.9) означает, что в каждой усеченной подыгре изменение значенийхарактеристической функции и дележа в зависимости от времени происходитравномерно относительно друг друга.Теорема доказана.В этом разделе было введено понятие характеристической функцииV (S; x0 , T − t0 ) в игре Γ(x0 , T − t0 ) с динамическим обновлением информаˆ 0 , T − t0 ) действительноции.
Было показано, что результирующий вектор ξ(xявляется дележом в классическом понимании при выполнении дополнительныхусловий. Стоит заметить, что условие (4.2) выполняется не всегда.§ 5.Связь решения в усеченных подыграх и результирующего решенияНа основе введенного понятия характеристической функции V (S; x̂∗ (t), T −t) определим такие принципы оптимальности, как пропорциональное решение,49вектор Шепли, C-ядро и сильно динамически устойчивое ПРД-ядро в игреΓ(x0 , T − t0 ) с динамическим обновлением информации:Определение 2.5.1.Пропорциональным решением в Γ(x0 , T − t0 ) сдинамическим обновлением информации, с характеристической функцией∗ˆV (S; x̂∗ (t), T − t) будем называть дележ P rop(x̂(t), T − t), ПРД которого рассчитывается следующим образом:β̂iP rop (t)=d(∗dt V ({i}; x̂ (t), T − t)−∑ d∗ (t), T − t)V({i};x̂dti∈N)d∗V (N ; x̂ (t), T − t) ,dtt ∈ [t0 , T ].
(5.1)Определение 2.5.2.Вектором Шепли в Γ(x0 , T − t0 ) с динамическим обновлением информации, с характеристической функцией V (S; x̂∗ (t), T − t) будем называть следующий дележ:ˆ i (x∗ (t), t, t0 + j∆t + T ) =Shj∑ (|N | − |S|)!(|S| − 1)!|N |!S⊂Ni∈S(·)· V (S; x̂ (t), T − t) − V (S\{i}; x̂ (t), T − t) . (5.2)∗∗Определение 2.5.3.C-ядром в Γ(x0 , T − t0 ) с динамическим обновлениеминформации, с характеристической функцией V (S; x̂∗ (t), T − t) будем назыˆ ∗ (t), T − t), каждый из котороговать множество Ĉ(x̂∗ (t), T − t) дележей ξ(x̂удовлетворяет следующем условию:∑ˆ ∗ (t), T − t) ≥ V (S; x̂∗ (t), T − t),ξ(x̂∀S ⊆ N,t ∈ [t0 , T ].(5.3)i∈SОпределение 2.5.4.Сильно динамически устойчивым ПРД-ядром в игреΓ(x0 , T − t0 ) с динамическим обновлением информации, с характеристическойˆ ∗ (t), T −t) дележейфункцией V (S; x̂∗ (t), T −t) будем называть множество C(x̂ˆ ∗ (t), T − t), ПРД β̂(t, x̂∗ ) каждого из которых удовлетворяет следующемξ(x̂50условию:−∑ddV (S; x̂∗ (t), T −t)−V (N \S; x̂∗ (t), T −t) ≥β̂i (t, x̂∗ ) ≥ − V (S; x̂∗ (t), T −t),dtdti∈S∑d∀S ⊂ N,β̂i (t, x̂∗ ) = − V (N ; x̂∗ (t), T − t).
(5.4)dti∈NПокажем, что если игроки в каждой усеченной подыгре будут выбирать дележ ξj (x∗j (t), t, t0 +j∆t+T ) ∈ Ej (x∗j (t), t, t0 +j∆t+T ) на основе Vj (S; x∗j (t), t, t0 +j∆t + T ), j = 0, . . . , l по одинаковому правилу, то предложенный результируюˆ ∗ (t), T − t) соответствует дележу, выбранному по такому же пращий дележ ξ(x̂вилу на основе предложенной характеристической функции V (S; x̂∗ (t), T − t).Докажем это для приведенных принципов оптимальности.Сначала покажем, что если в каждой усеченной подыгре Γ̂j (x∗j , t, t0 +j∆t+T )игроки будут выбирать вектор Шепли Shj (x∗j (t), t, t0 + j∆t + T ) в качествеˆ ∗ (t), T − t) (3.3) будетдележа, то соответствующий результирующий вектор ξ(x̂ˆ ∗ (t), t, t0 + j∆t + T ) (5.2), рассчитанным насовпадать с вектором Шепли Sh(xjоснове результирующей характеристической функции V (S; x̂∗ (t), T − t) (4.1).Теорема 2.5.1.
Пусть в каждой усеченной подыгре Γ̂j (x∗j , t, t0 + j∆t + T ):ξj (x∗j (t), t, t0 + j∆t + T ) = Shj (x∗j (t), t, t0 + j∆t + T ),где t ∈ [t0 + j∆t, t0 + j∆t + T ], j = 0, . . . , l. Тогда результирующий векторˆ ∗ (t), T − t) будет совпадать с Sh(x̂ˆ ∗ (t), T − t) (5.2):ξ(x̂ˆ ∗ (t), T − t) = Sh(x̂ˆ ∗ (t), T − t),ξ(x̂∀t ∈ [t, T ],ˆ ∗ (t), T − t) - это вектор Шепли, рассчитанный на основе результигде Sh(x̂рующей характеристической функции V (S; x̂∗ (t), T − t) (4.1).Доказательство.ˆ ∗ (t), T − t) рассчитывается сВ данном случае результирующий дележ ξ(x̂помощью формул (3.2), (3.3) на основе значений Shj (x∗j (t), t, t0 + j∆t + T ) вкаждой усеченной подыгре Γ̂j (x∗j (t), t, t0 + j∆t + T ):51[l∑ˆ ∗ (t), T − t) =ξ(x̂Shm (x∗m,0 , t0 + m∆t, t0 + m∆t + T )−m=j+1]− Shm (x∗m,1 , t0 + (m + 1)∆t, t0 + m∆t + T ) +[]+ Shj (x∗j (t), t, t0 + j∆t + T ) − Shj (x∗j,1 , t0 + (j + 1)∆t, t0 + j∆t + T ) , (5.5)где Shj (x∗j (t), t, t0 + j∆t + T ), t ∈ [t0 + j∆t, t0 + j∆t + T ], j = 0, .
. . , l рассчитывается по формулеShji (x∗j (t), t, t0 + j∆t + T ) =·(∑ (|N | − |S|)!(|S| − 1)!S⊂Ni∈SVj (S; x∗j (t), t, t0+ j∆t + T ) −|N |!·Vj (S\{i}; x∗j (t), t, t0)+ j∆t + T ) . (5.6)ˆ ∗ (t), T − t) рассчитывается по формуле (5.2). Подставим в определениеSh(x̂ˆ ∗ (t), T − t) (5.2) выражение для V (S; x̂∗ (t), T − t) (4.1), пусть t ∈ [t0 +Sh(x̂j∆t, t0 + (j + 1)∆t]:ˆ ∗ (t), T − t) =Sh(x̂(·∑ (|N | − |S|)!(|S| − 1)!|N |!S⊂Ni∈S[l∑[Vm (S; x∗m,0 , t0 + m∆t, t0 + m∆t + T )−m=j+1−·Vm (S; x∗m,1 , t0]+ (m + 1)∆t, t0 + m∆t + T ) −[− Vm (S\{i}; x∗m,0 , t0 + m∆t, t0 + m∆t + T )−]]− Vm (S\{i}; x∗m,1 , t0 + (m + 1)∆t, t0 + m∆t + T ) +[+−Vj (S; x∗j,1 , t0[Vj (S; x∗j (t), t, t0 + j∆t + T )−][+ (j + 1)∆t, t0 + j∆t + T ) − Vj (S\{i}; x∗j (t), t, t0 + j∆t + T )−])]− Vj (S\{i}; x∗j,1 , t0 + (j + 1)∆t, t0 + j∆t + T ).
(5.7)52При подстановке (5.6) в (5.5) и после выноса знака суммы мы получим правуючасть (5.7).Теорема доказана.Покажем, что если в каждой усеченной подыгре Γ̂j (x∗j (t), t, t0 + j∆t + T )игроки будут выбирать пропорциональное решение P ropj (x∗j (t), t, t0 + j∆t +ˆ ∗ (t), T − t)T ) (5.3), то результирующий вектор, определенный по формуле ξ(x̂∗ˆ(3.3) будет совпадать с пропорциональным решением P rop(x̂(t), T − t) (5.1),рассчитанным на основе характеристической функции V (S; x̂∗ (t), T − t) (4.1).Теорема 2.5.2. Пусть в каждой усеченной подыгре Γ̂j (x∗j , t, t0 + j∆t + T )ξj (x∗j (t), t, t0 + j∆t + T ) = P ropj (x∗j (t), t, t0 + j∆t + T ),где t ∈ [t0 + j∆t, t0 + j∆t + T ], j = 0, . . .
, l. Тогда результирующий вектор∗ˆ ∗ (t), T − t) будет совпадать с P rop(x̂ˆξ(x̂(t), T − t) (5.1):∗ˆ ∗ (t), T − t) = P rop(x̂ˆξ(x̂(t), T − t),∀t ∈ [t, T ],∗ˆгде P rop(x̂(t), T −t) - это пропорциональное решение, рассчитанное на основехарактеристической функции V (S; x̂∗ (t), T − t) (4.1).ˆ ∗ (t), T − t)Доказательство. В данном случае результирующий вектор ξ(x̂рассчитывается с помощью формулы (3.2) для ПРД на основе комбинации значений ПРД для пропорционального решения (5.3) в каждой усеченной подыгрена временном интервале [t0 + j∆t, t0 + (j + 1)∆t]. Пусть i ∈ N :βiP rop,j (t)=d∗(dt Vj ({i}; xj , t, t0 + j∆t + T )∑ d∗dt Vj ({i}; xj , t, t0 + j∆t + T )i∈N)d∗− Vj (N ; xj , t, t0 + j∆t + T ) (5.8).dt∗ˆПокажем, что формула для P rop(x̂(t), T − t), а именно для его ПРДβ̂ P rop (t) (5.1) сводится к правой части (5.8).
Подставим в (5.1) выражениедля V (S; x̂∗ (t), T − t) (4.1). Рассмотрим отдельно одно из слагаемых. Пусть53t ∈ [t0 + j∆t, t0 + (j + 1)∆t]:)dd (−V ({i}; x̂∗ (t), T − t) = −dtdt−Vk ({i}; x∗k,0 , t0(l[∑Vk ({i}; x∗k,0 , t0 + k∆t, t0 + k∆t + T )−k=j+1]+ (k + 1)∆t, t0 + k∆t + T ) +)]+ Vj ({i}; x∗j (t), t, t0 + j∆t + T ) − Vj ({i}; x∗j,0 , t0 + (j + 1)∆t, t0 + j∆t + T ) .[(5.9)Из (5.9) видно, что для t ∈ [t0 + j∆t, t0 + (j + 1)∆t], j = 0, .
. . , l под знакомпроизводной находится только одно слагаемое, зависящее от t, поэтому))d(d(∗∗−Vj ({i}; xj (t), t, t0 + j∆t + T ) .V ({i}; x̂ (t), T − t) = −(5.10)dtdtПодставим (5.10) и аналогичную формулу для V (N ; x̂∗ (t), T −t) в (5.1). Нетрудно убедиться, что в этом случае правые части (5.8) и (5.1) совпадают.Теорема доказана.Покажем теперь, что если в каждой усеченной подыгре Γ̂j (x∗j , t, t0 +j∆t + T ) игроки будут выбирать в качестве принципа оптимальности C-ядроCj (x∗j (t), t, t0 +j∆t+T ), то результирующее решение, каждый элемент которогоˆ ∗ (t), T − t) рассчитан по формуле (3.3), будет являться C-ядром, рассчитанξ(x̂ным на основе результирующей характеристической функции V (S; x̂∗ (t), T − t)(4.1).Теорема 2.5.3. Пусть в каждой усеченной подыгре Γ̂j (x∗j , t, t0 + j∆t + T ):Wj (x∗j (t), t, t0 + j∆t + T ) = Cj (x∗j (t), t, t0 + j∆t + T ),где ∀t ∈ [t0 + j∆t, t0 + j∆t + T ], j = 0, .
. . , l, тогда для всех ξj (x∗j (t), t, t0 + j∆t +T ) ∈ Cj (x∗j (t), t, t0 + j∆t + T ), для которых выполняется условие∑ξij (x∗j (t), t, t0 + j∆t + T ) − Vj (S; x∗j (t), t, t0 + j∆t + T ) ≥i∈S≥∑ξij (x∗j,1 , t0 +(j +1)∆t, t0 +j∆t+T )−Vj (S; x∗j,1 , t0 +(j +1)∆t, t0 +j∆t+T ),i∈S(5.11)54верно, чтоˆ ∗ (t), T − t) ∈ Ĉ(x̂∗ (t), T − t),ξ(x̂∀t ∈ [t, T ],где Ĉ(x̂∗ (t), T − t) - это C-ядро, рассчитанное на основе результирующей характеристической функции V (S; x̂∗ (t), T − t) (4.1).Доказательство. Стоит отметить, что для доказательства этой теоремынеобходимо будет доказать два утверждения:1.
Если игроки в каждой усеченной подыгре будут выбирать дележξj (x∗j (t), t, t0 + j∆t + T )∈Cj (x∗j (t), t, t0 + j∆t + T ) на основеVj (S; x∗j (t), t, t0 + j∆t + T ), j = 0, . . . , l, то предложенный результируюˆ ∗ (t), T − t) будет принадлежать C-ядру Ĉ(x̂∗ (t), T − t),щий вектор ξ(x̂рассчитанному на основе предложенной характеристической функцииV (S; x̂∗ (t), T − t).2. C-ядро Ĉ(x̂∗ (t), T − t) (5.3) не должно содержать дележейˆ ∗ (t), T − t), для которых нельзя найти набора дележей в усеченξ(x̂ных подыграх ξj (x∗j (t), t, t0 + j∆t + T ) ∈ Cj (x∗j (t), t, t0 + j∆t + T ).Докажемпервоеусловие,аименно,чтоеслинабордележейξij (x∗j (t), t, t0 + j∆t + T ), удовлетворяет системе неравенств:∑ξij (x∗j (t), t, t0 + j∆t + T ) ≥ Vj (S; x∗j (t), t, t0 + j∆t + T ),S ⊂ N,i∈Sдля любых t ∈ [t0 + j∆t, t0 + j∆t + T ], j = 0, .
. . , l, i = 1, . . . , n, то результируˆ ∗ (t), T − t) удовлетворяет системе неравенств:ющий вектор ξ(x̂∑ξˆi (x̂∗ (t), T − t) ≥ V (S; x̂∗ (t), T − t),∀t ∈ [t0 , T ],S ⊂ N.(5.12)i∈Sˆ ∗ (t), T − t) в левую часть (5.12). В правую частьПодставим выражение для ξ(x̂(5.12) подставим (4.1). Поступим также, как и в теореме 3.4.1. Покажем, длялюбого S ⊂ N , t ∈ [t0 + j∆t, t0 + j∆t + T ] выполнение (5.12) сводится к выполнению условия (5.11). Первое условие доказано.Перейдем к доказательству второго условия, а именно, что в множественаборов дележей ξij (x∗j (t), t, t0 + j∆t + T ), i = 1, . . . , n, j = 0, . . .














