Оптимизация системы логистики в бизнесе на основе теоретикоигровой модели (1142526), страница 12
Текст из файла (страница 12)
игру с большим количествомстратегий свести к игре с меньшим количеством стратегий. Одним из способовподобногоредуцирования,являетсяпринципдоминированиястратегийотносительно выигрышей игрока A .Прежде чем проанализировать применение принципа доминирования приформировании структуры множества ( S C ) O ( HurP( λ ))стратегий, оптимальных вомножестве S C чистых стратегий по синтетическому критерию Гурвица, введемнекоторые определения.В рамках игры с матрицей выигрышей (2.1), в случае если выполняютсянеравенства:a µj ≥ aνj , j ∈ J .(2.48)Принято говорить, что µ -я строка (a µ1 , a µ 2 ,, a µn ) матрицы Α доминирует ν ю строку (aν 1 , aν 2 , , aνn ) , или, что ν -я строка (aν 1 , aν 2 , , aνn ) доминируется µ -йстрока (aµ1 , aµ 2 , , aµn ) , и записывать соответственно (aµ1 , aµ 2 , , aµn ) ≥ (aν 1 , aν 2 , , aνn )или (aν 1 , aν 2 , , aνn ) ≤ (aµ1 , aµ 2 , , aµn ) .Если все неравенства (2.48) строгие, то это означает, что µ -я строка(aµ1 , aµ 2 , , aµn )строгодоминируетν -юстроку(aν 1 , aν 2 , , aνn ) ,изаписьсоответственно (aµ1 , aµ 2 , , aµn ) > (aν 1 , aν 2 , , aνn ) или (aν 1 , aν 2 , , aνn ) < (aµ1 , aµ 2 , , aµn ) .В случае, когда все неравенства (2.48) обращаются в равенства, это значит,что строки равны или взаимно дублируемы.80Представленные выше определения можно применить и в отношениистратегий.Теперь сформулируем и докажем теорему о применении принципадоминирования при формировании структуры множества ( S C ) O ( HurP( λ ))стратегий,оптимальных во множестве S C чистых стратегий по синтетическому критериюГурвица.Теорема 5.
Доминанта оптимальна во множестве чистых стратегий и покритерию Гурвица относительно выигрышей с любым показателем оптимизмаλ ∈ [0,1] , и по критерию Гурвица относительно рисков с показателем оптимизмаσ ∈ [0,1] .Доказательство.Пусть стратегия Ak - доминанта. Тогда akj ≥ aij , i ∈ [1, m], j ∈ [1, n] и, следовательно, наосновании определения (2.13),Hurkp (λ ) = ( M k − wk )λ + wk = (max{akj : j ∈ J }− min{akj : j ∈ J }) ++ min{akj : j ∈ J } ≥ (max{aij : j ∈ J }− min{aij : j ∈ J }) ++ min{aij : j ∈ J } = ( M i − wi )λ + Wi = Huri p (λ ), i ∈ [1, m] .Это неравенство означает, что Hurkp (λ ) = max{Huri p (λ ) : i ∈ [1, m]} = HurSp λ ) иCпотомуAk ∈ ( S C ) O ( HurP( λ )).(2.49)Стратегия Ak доминанта, поэтому k -я строка матрицы рисков R A [51;52;[53] нулевая.
А это означает, чтоSavk = µ k = 0 .Следовательно, поопределению (2.20),Hurkr (σ ) = ( µ k − Savk )σ + Savk = 0 .(2.50)Отсюда и из неравенства 0 ≤ HurSr (σ ) следует [48]C{}0 ≤ HurSrC (σ ) = min Huri r (σ ) : i ∈ [1, m] ≤ Hurkr (σ ) = 0 , т.е.HurSrC (σ ) = 0 .(2.51)Из равенств (2.50) и (2.51) получаем: Hurkr (σ ) = HurSr (σ ) , согласно (2.22)C81Ak ∈ ( S C ) O ( Hurr(σ )).(2.52)Принадлежности (2.50) и (2.51) означает справедливость принадлежности(2.49) и (2.52) влекут за собой справедливость принадлежностиAk ∈ ( S C ) O ( Hurp( λ ))∩ ( S C ) O ( Hurr(σ )).(2.53)Таким образом, теорема 5 доказана.
■Замечание 1. В процессе доказательства теоремы 5 мы показали: если вигре с природой существует доминанта, то цена игры в чистых стратегиях покритерию Гурвица относительно рисков с любым показателем оптимизма σ ∈ [0,1]равна нулю.Следствие 1 (из замечания 1). Если в игре с природой существуетдоминанта, то для цены игры в чистых стратегиях по синтетическому критериюГурвица для любых показателей α , λ , σ ∈ [0,1] имеет место формулаHurSprC (0, λ , σ ) = − HurSrC (σ ) .(2.54)Но по замечанию 1, HurSr (σ ) = 0 . Тогда HurSpr (0, λ , σ ) = 0 .CCС другой стороны, также по замечанию 1, правая часть равенства (2.54)равна нулю.
Таким образом, равенство (2.54) имеет место при α = 0 .При α = 1 выше было показано, что HurSpr (1, λ , σ ) = − HurSp (λ ) . Но это равенствоCC- равенство (2.54) при α = 1 .Таким образом, справедливость равенства (2.54) при α = 1 также доказана.Теперь пусть 0 < α < 1 . На основании теоремы 5 существующая по условиюдоминанта оптимальна во множестве чистых стратегий по критерию Гурвица иотносительно выигрышей и относительно рисков.
Но тогда справедливоравенство (2.35).По замечанию 1, HurSr (σ ) = 0 , σ ∈ [0,1] . Подставим это значение в равенствоC(2.35) и получим равенство (2.54). ■Теорема 6. Доминанта оптимальна во множестве чистых стратегий посинтетическому критерию Гурвица с любыми выигрыш-показателем α ∈ [0,1] ,82показателем оптимизма относительно выигрышей λ ∈ [0,1] , и показателемоптимизма относительно рисков σ ∈ [0,1] .Доказательство. Пусть стратегия Ak - доминанта. Тогда по теореме 5справедлива( S C ) O ( Hurp( λ ))принадлежность∩ ( S C ) O ( Hurr(σ ))(2.53),изкоторойследует:пересечение= Ø, т.е. выполняется условие (2.44) теоремы 4. Тогда поэтой теореме имеет место равенство (2.43).Из равенства (2.2.3.17) и принадлежности (2.53) получаем:Ak ∈ ( S C ) O ( Hurpr(α ,λ ,σ )), 0 < α < 1.(2.55)Синтетический критерий Гурвица HurSpr (α , λ , σ ) при α = 0 эквивалентенCкритерию Гурвица относительно рисков [42], а по теореме 5 доминантаоптимальна по критерию Гурвица относительно рисков.
Поэтому доминантаоптимальна по синтетическому критерию Гурвица HurSpr (α , λ , σ ) при α = 0 , т.е.CAk ∈ ( S C ) O ( Hurpr( 0 ,λ ,σ )).(2.56)При α = 1 синтетический критерий Гурвица HurSpr (α , λ , σ ) превращается вCкритерий Гурвица относительно выигрышей Hur p (λ ) , а по теореме 5 доминантаоптимальна по критерию Гурвица относительно выигрышей Hur p (λ ) . Поэтомудоминанта оптимальна по синтетическому критерию Гурвица Hur pr (α , λ , σ ) приα = 1 , т.е.
Ak ∈ ( S C ) O ( Hurpr(1,λ ,σ )).Из принадлежностей (2.54), (2.55) и (2.56) получаем, что Ak ∈ ( S C ) O ( Hurpr(α ,λ ,σ )),α ∈ [0,1] , λ ∈ [0,1] , σ ∈ [0,1] . Теорема доказана ■Результатом описанных действий, становится уменьшения размерностиматрицы Α . Таким образом, использование принципа доминирования стратегийA весьма полезно. Но для столбцов матрицы Α , т.е. состояний природы,применение данного принципа невозможно. Природа не может выбирать своисостояния исходя из наиболее выгодных для нее и наименее выгодных для игрокаA стратегий. Она принимает их неопределенным образом.83Синтетический критерий Гурвица оптимальности смешанных стратегийОсновные понятия синтетического критерия Гурвица с показателемоптимизмаα ∈ [0, 1]( Hur pr (α , λ ,σ ) –критерия)длясмешанныхстратегийопределяются следующим образом:Hur pr ( P;α , λ , σ ) = αHur p ( P; λ ) − (1 − α ) Hur r ( P;σ ) == [ Hur p ( P; λ ) + Hur r ( P; σ )]α − Hur r ( P; σ ) , P ∈ S(2.57)– показатель эффективности стратегии P по синтетическому критериюГурвица ( Hur pr ( P;α , λ ,σ ) – критерию)HurSpr (α , λ , σ ) = max{Hur pr ( P;α , λ , σ ) : P ∈ S }(2.58)– Hur pr (α , λ ,σ ) -цена игры в смешанных стратегиях.Стратегия P O называется Hur pr ( P;α , λ ,σ ) – оптимальной во множествесмешанных стратегий, если равнозначно следующееP O ∈ S O ( Hurpr(α ,λ ,σ ))⇔ Hur pr ( P O ;α , λ , σ ) = HurSpr (α , λ , σ ) .(2.59)Надо заметить, что выбор игроком A значения выигрыш-показателя α ∈ [0,1]является субъективным и связан с психологическими особенностями игрока A ,определяющими его отношение к выигрышам и рискам.Теорема 7.
В любой игре с природой существует стратегия, оптимальнаяво множестве смешанных стратегий по синтетическому критерию Гурвица прилюбых выигрыш-показателе и показателях оптимизма относительно выигрышейи рисков.Доказательство. Лабскером Л. Г. в [48] была доказана непрерывностьпоказателя эффективности Hur p ( P; λ ) стратегии P по Hur p (λ ) – критерию при84любом показателе оптимизма λ ∈ [0,1] относительно выигрышей, как функцииаргумента P на множестве S .Также Лабскером Л. Г. в [48] доказана непрерывность Hur r ( P; σ ) при любомпоказателе оптимизма σ ∈ [0,1] относительно рисков, как функции аргумента P намножестве S .Следовательно, из (2.57) получаем непрерывностьмножестве S как линейной комбинацииHur pr ( P; α , λ , σ )нанепрерывных функций Hur p ( P; λ ) иHur r ( P; σ ) с коэффициентами α и (1 − α ) .
А так как множество S - симплекс и,следовательно, замкнуто и ограничено в ℜ n , то по теореме Вейерштрасса [40])функция Hur pr ( P; α , λ , σ ) достигает на этом множестве своего наибольшегозначения, т.е. для каждой тройки значений α , λ , σ ∈ [0,1] существует смешаннаястратегия P O , такая, что Hur pr ( P; α , λ , σ ) = HurSpr (α , λ , σ ) ■При α = 0 из (2.57) получим: Hur pr ( P;0, λ , σ ) = − Hur r ( P; σ ) , т.е. синтетическийкритерий Гурвица превращается в критерий «противоположный» критериюГурвица относительно рисков с показателем оптимизма σ , и уже не зависит отпоказателя оптимизма λ относительно выигрышей.При α = 1 из (2.57) имеем: Hur pr ( P;1, λ , σ ) = Hur r ( P; σ ) , т.е.
синтетическийкритерий Гурвица превращается в критерий Гурвица относительно выигрышей споказателем оптимизма λ и уже не зависит от показателя оптимизма σотносительно рисков.Теорема 8. Следующие условия эквивалентныa) Для каждого значения выигрыш-показателя оптимизма α ∈ (0,1) множествостратегий,оптимальныхвомножествесмешанныхстратегийпосинтетическому критерию Гурвица, совпадает с множеством стратегий,оптимальных во множестве смешанных стратегий и по критерию Гурвица85относительно выигрышей и по критерию Гурвица относительно рисков, т.е.справедливо равенство:S O ( Hurpr(α ,λ ,σ ))= S O ( Hurp( λ ))∩ S O ( Hurr(σ )), α ∈ (0,1) , λ , σ ∈ [0,1] .(2.60)b) Множество стратегий, оптимальных во множестве смешанных стратегий ипо критерию Гурвица относительно выигрышей и по критерию Гурвицаотносительно рисков не пусто:S O ( Hurp( λ ))∩ S O ( Hurr(σ ))≠ Ø, λ , σ ∈ [0,1] .(2.61)c) Цена игры HurSpr (α , λ , σ ) в смешанных стратегиях по синтетическомукритерию Гурвица с выигрыш-показателем α ∈ [0,1] представляется линейнойкомбинацией цен игры в смешанных стратегиях по критерию Гурвицаотносительно выигрышей и по критерию Гурвица относительно рисков скоэффициентами соответственно α и (1 − α )HurSpr (α , λ , σ ) = αHurSp (λ ) − (1 − α ) HurSr (σ ) .(2.62)d) График цены игры HurSpr (α , λ , σ ) в смешанных стратегиях по синтетическомукритерию Гурвица с выигрыш-показателем α ∈ [0,1] как функции аргументаα ∈ [0,1]представляетсобойотрезоквполосе0 ≤α ≤1сначаломHurSpr (0) = − HurSr (σ ) и концом HurSpr (1) = HurSp (λ ) .Доказательство: Теорема будет считаться доказанной, если будет доказанасправедливость следующей замкнутой цепочки импликацииa ) ⇒ b) ⇒ c ) ⇒ d ) ⇒ a ) .(2.63)Начнем доказательство теоремы с того, что докажем импликациюa ) ⇒ b) .(2.64)86Предположим справедливость условия a) , т.е.
справедливо равенство (2.60).Так как по теореме 7 при каждом значении выигрыш-показателя α ∈ [0,1]существует стратегия HurSpr (α , λ , σ ) - оптимальнаястратегий, то множество So ( Hur pr (α ,λ ,σ ))во множестве смешанных- не пусто. Тогда из равенства (2.60) следует(2.61), таким образом, импликация (2.62) доказана.Докажем импликацию b) ⇒ c) .(2.65)Пусть выполняется условие b) , т.е. выполняется (2.61). Тогда найдутсястратегии P O и P O ∈ S O ( Hurp( λ ))∩ S O ( Hurr(σ )), λ , σ ∈ [0,1] .В силу этой принадлежности для каждого α ∈ [0,1] по определениям (2.59) и(2.58) будем иметь:αHurSp (λ ) − (1 − α ) HurSr (σ ) = αHurSp ( P O ; λ ) − (1 − α ) HurSr ( P O ;σ ) =(2.66)= Hur pr ( P O ;α , λ , σ ) ≤ HurSpr (α , λ , σ ).Докажем неравенство, обратное неравенству (2.25){}HurSpr (α , λ , σ ) = max Hur pr ( P; α , λ , σ ) : P ∈ S ={[≤ max{[αHur= α max{Hur]}= max αHur ( P; λ ) − (1 − α ) Hur ( P; σ ) : P ∈ S ≤pppr]{[}( P; λ ) : P ∈ S }− (1 − α ) min{Hur]}( P; λ ) : P ∈ S + max (α − 1) Hur ( P; σ ) : P ∈ S =rr}(2.67)( P; σ ) : P ∈ S == αHurSp (λ ) − (1 − α ) HurSr (σ ).Неравенства (2.64) и (2.66) доказывают равенство (2.58).Импликация b) ⇒ c) доказана.Теперь докажем импликацию c) ⇒ d ) .Пусть выполняется условие c) , т.е.














