Оптимизация системы логистики в бизнесе на основе теоретикоигровой модели (1142526), страница 10
Текст из файла (страница 10)
Подобный63фактор весьма значим,поэтому оставлять его без внимания весьманецелесообразно.В связи с этим, была предпринята попытка исследования и анализасинтетического принципа оценки оптимальности стратегий с совместной точкизрения выигрышей и рисков [48].Данный раздел посвящен полученному в результате исследования и анализасинтетического принципа оценки оптимальности, новому синтетическомукритерию Гурвица, позволяющего игроку в процессе принятия решенийучитывать как выигрыши, так и риски [42,1, 2, 3].2.2.1 Критерий Гурвица оптимальности стратегий относительновыигрышейДанный критерий относится к группе комбинированных критериев,основное предназначение которых состоит в том, чтобы с помощью методовкомбинирования - взвешивания, достичь обобщения классических критериев исмягчить их экстремальные принципы определения оптимальных стратегий.Соответственно опираясь на подобные критерии, игрок может надеяться,что принимаемые решения будут более эффективны, чем те, которыепринимаются на основе только классических критериев.64Несмотря на вышесказанное, также стоит отметить, что взвешенный подходк выбору стратегии, предлагаемый критерием Гурвица относительно выигрышей,не всегда приводит к взвешенному результату.
Возникает проблема сглаживаниякритерием Гурвица крайнего пессимизма критерия Вальда и крайнего оптимизмамаксимаксного критерия [42].Критерий Гурвица оптимальности чистых стратегий относительно выигрышейПусть λ ∈ [0, 1] и (1 − λ ) ∈ [0, 1] - показатели оптимизма и соответственнопессимизма игрока A при выборе стратегии, эффективность которой оцениваетсяим только с позиций выигрышей.При выборе значений показателя λ (или 1 − λ ), которые игрокAопределяет исходя из субъективных соображений на него, как правило, влияетмера ответственности.
Это означает, что чем ближе к нулю показатель оптимизма,тем больше желание принимающего решение застраховаться и соответственнонаоборот.Hur p (λ ) -показательэффективностистратегииAiопределяетсяследующим образом:Примечание - Буква «p» первая буква от английского «payoff».Huri p (λ ) = (1 − λ )Wi + λM i = ( M i − Wi )λ + Wi , i = 1,2,..., m .Соответственно, если λ = 0 , то(2.13)Hur p (λ ) - показатель эффективностистратегии Ai превращается в W - показатель эффективности этой стратегии, т.е.показатель эффективности стратегии по критерию Вальда, и в M -показательэффективности, т.е.
в показатель эффективности по максимаксному критерию приλ = 1 , а при λ ∈ (0, 1) является выпуклой комбинацией W -показателя и M показателя эффективности.65Hur p (λ ) -ценой игры в чистых стратегиях по критерию Гурвица споказателем оптимизмаλ ∈ [0, 1] называется максимальный изHur p (λ ) -показателей эффективности чистых стратегий:HurSpC (λ ) = max{Huri p (λ ) : i = 1,2,..., m} .(2.14)Hur p (λ ) -оптимальной стратегией во множестве чистых стратегий покритерию Гурвица с показателем оптимизмаλ ∈ [0, 1] называется чистаястратегия Ak ( k ∈ {1,2,..., m} ), показатель эффективности которой совпадает сHur p (λ ) -ценой игры:Hurkp (λ ) = HurSpC (λ ) .(2.15)Критерий Гурвица оптимальности смешанных стратегий относительновыигрышейВ предыдущем параграфе был определен критерий Гурвица оптимальностичистых стратегий игрока A , который способствует нахождению чистой стратегииоптимальной в рамках данного критерия среди чистых стратегий.Тем не менее, в процессе игры при многократном выборе одних и тех жестратегий, при условии неизменности множества состояний природы, могутвозникать ситуации, когда игроку хочется изменить свой образ выбора стратегии,и в таком случае, Лабскером Л.
Г. в [48] рекомендуется перейти к случайномувыбору стратегий с определенной вероятностью, или, говоря иначе использоватьсмешанные стратегии.Примечание – Смешанная стратегия P = ( p1 , p 2 ,..., p m ) , pi ≥ 0 , i = 1,2,..., m ,∑mi =1pi = 1 , –действие игрока A , состоящее в случайном выборе чистой стратегии Ai с вероятностью pi ,i = 1,2,..., m .66Итак, имеется игра с природой с матрицей выигрышей (2.1), дополненнаястрокой, в которой представлены показатели благоприятности состояний природыβ j = max{aij : i = 1,2,..., m} , j = 1,2,..., n .Множество всех смешанных стратегий P = ( p1 , p2 ,..., pm ) , pi ≥ 0 , i = 1,2,..., mобозначим через S . Выигрыш H ( P, П j ) , P ∈ S , j = 1,2,..., n , в игровой ситуации( P, П j ) , определяется следующей формулой:H ( P, П j ) = ∑i =1 pi aij , j = 1,2,..., n ,m(2.16),где, aij , i = 1,2,..., m; j = 1,2,..., n, - элементы матрицы выигрышей (2.1).эффективностиHur p (λ ) –показательсмешаннойстратегииPрассчитывается по формуле:Hur p ( P; λ ) = (1 − λ )W ( P) + λM ( P) = [ M ( P) − W ( P)]λ + W ( P) , P ∈ S ,(2.17)где W ( P) = min H ( P, П j ) , и M ( P) = max H ( P, П j ) – показатели эффективности1≤ j ≤ n1≤ j ≤ nсмешанной стратегии P соответственно по критерию Вальда и максимаксномукритерию.Hur p (λ ) -цена игры в смешанных стратегиях определяется следующей формулой:HurSp (λ ) = max{Hur p ( P; λ ) : P ∈ S } .Hur p (λ ) –оптимальнойстратегиейвомножестве(2.18)смешанныхстратегийназывается стратегия P O , если равнозначны следующие соотношения:P O ∈ S O ( Hurp( λ ))⇔ Hur p ( P O ; λ ) = HurSp (λ ) .(2.19)672.2.2 Критерий Гурвица оптимальности стратегий относительно рисковКритерий Гурвица оптимальности стратегий относительно рисков, такжекак и критерий Гурвица оптимальности стратегий относительно выигрышейотносится к группе комбинированных критериев для выбора оптимальныхстратегий в условиях полной неопределенности.Суть критерия Гурвица оптимальности относительно рисков состоит всглаживании крайнего пессимизма критерия Сэвиджа и крайнего оптимизмаминиминного критерия, как и в предыдущем случае с критерием Гурвицаотносительно выигрышей [54].Критерий Гурвица оптимальности чистых стратегий относительно рисковПусть σ ∈ [0, 1] и (1 − σ ) ∈ [0, 1] - показатели соответственно оптимизма ипессимизма игрока A при выборе стратегии, эффективность которой оцениваетсяим только с позиций игровых рисков.Выбор значений показателя σ (или (1 − σ ) ), также как и в рамках критерияГурвица оптимальности чистых стратегий относительно выигрышей, игрок Aопределяет исходя из меры ответственности, принимаемой при выборе стратегии.При σ = 0 критерий Гурвица относительно рисков обращается в критерийСэвиджа, при σ = 1 соответственно в миниминный критерий, а при σ ∈ (0, 1)является выпуклой комбинацией этих показателей.68В качестве Hur r (σ ) - показателя эффективности стратегии Ai будемрассматривать число:Примечание – буква «r» от английского слова «risk».Hurir (σ ) = (1 − σ ) Savi + σµi = ( µi − Savi )σ + Savi , i = 1,2,..., m .(2.20)Hur r (σ ) -ценой игры в чистых стратегиях по критерию Гурвица споказателемσ ∈ [0, 1]оптимизманазываетсяминимальныйизHur r (σ ) - показателей эффективности чистых стратегий:HurSrC (σ ) = min{Hurir (σ ) : i = 1,2,..., m} .Hur r (σ ) -оптимальной во множестве(2.21)чистых стратегий по критериюГурвица с показателем оптимизма σ ∈ [0, 1] называется чистая стратегия Ak( k ∈ {1,2,..., m} ), показатель эффективности которой совпадает с Hur r (σ ) -ценойигры:Hurkr (σ ) = HurSrC (σ ) .(2.22)Также заметим, что в частности показатели оптимизма в критериях Гурвицаотносительно выигрышей и относительно рисков могут совпадать: λ = σ .Критерий Гурвица оптимальности смешанных стратегий относительно рисковПрежде чем привести основные понятия критерия Гурвица относительнорисков, напомним определение риска:[]r ( P, П j ) = max{H (U , П j ) : U ∈ S } − H ( P, П j ) = β j − H ( P, П j ) = ∑ pij rij , j = 1,2,, n (2.23)mi =1– число, обозначающее риск при выборе игроком A смешанной стратегииP = ( p1 , p 2 ,, p m ) ∈ S и при состоянии природы П j .69Теперь введем основные понятия критерия Гурвица относительно рисков споказателем оптимизма σ ∈ [0, 1] ( Hur r (σ ) –критерия) для смешанных стратегий:Hur r ( P;σ ) = (1 − σ ) Sav( P) + σµ ( P) = [ µ ( P) − Sav( P)]σ + Sav( P) , P ∈ S(2.24)– Hur r (σ ) –показатель неэффективности стратегии P , где Sav( P) = max r ( P, П j ) , и1≤ j ≤ nµ ( P) = min r ( P, П j )1≤ j ≤ n– показатели неэффективности смешанной стратегииPсоответственно по критерию Сэвиджа и миниминному критерию.HurSr (σ ) = min{Hur r ( P;σ ) : P ∈ S }(2.25)– Hur r (σ ) -цена игры в смешанных стратегиях.СтратегияназываетсяPOоптимальной( Hur r (σ ) –оптимальной)вомножестве смешанных стратегий, если равнозначно следующее:P O ∈ S O ( Hurr(σ ))⇔ Hur r ( P O ;σ ) = HurSr (σ ) .(2.26)2.2.3 Синтетический критерий ГурвицаСинтетический критерий Гурвица оптимальности чистых стратегийСинтетическийкритерийГурвицасвыигрыш-показателемα ∈ [0, 1] ,показателями оптимизма относительно выигрышей λ ∈ [0, 1] и относительно70рисковσ ∈ [0, 1]предлагаетлинейно-комбинированныйподходквыборустратегий.С содержательной точки он представляет собой выпуклую комбинациюкритерия Гурвица относительно выигрышей и относительно рисков.
Для егоопределения введем в рассмотрение выигрыш-показатель α ∈ [0, 1] и рискпоказатель (1 − α ) степени предпочтения, отдаваемого игроком A соответственновыигрышам и игровым рискам.Какужебылосказановыше,данныйкритерийпозволяетлицупринимающему решение подходить к анализу имеющихся данных болеевзвешенно, что в свою очередь приводит к выбору оптимального со всех позицийрешения в рамках применяемого критерия.Выбор игроком A значения выигрыш-показателя α из отрезка [0, 1]субъективенизависитотпсихологическихособенностейигрокаA,определяющих его отношение к выигрышам и рискам.При α = 0 и, следовательно, 1 − α = 1 , игрок A при выборе стратегииабстрагируется от выигрышей, сконцентрировав свое внимание только на рисках.И, наоборот, при α = 1 игрок A во главу угла ставит выигрыши, абстрагируясь отрисков.Синтетический критерий Гурвица Hur pr (α , λ , σ ) определим следующимисоставляющими.Эффективность стратегии Ai ( i ∈ {1,2,..., m} ) по Hur pr (α , λ , σ ) -критериюопределяется Hur pr (α , λ , σ ) -показателем:Huri pr (α , λ , σ ) = αHuri p (λ ) − (1 − α ) Hurir (σ ) == [ Huri p (λ ) + Hurir (σ )]α − Hurir (σ ) , i = 1,2,..., m .(2.27)71Из чего видно, что Hur pr (α , λ , σ ) - показатель эффективности стратегии Aiявляетсялинейнойфункциейаргументаαсугловымкоэффициентом[ Huri p (λ ) + Hurir (σ )] и, следовательно, ее графиком служит прямолинейныйотрезок в полосе 0 ≤ α ≤ 1, наклон которого определяется знаком угловогокоэффициента.Hur pr (α , λ , σ ) -ценой игры в чистых стратегиях называется наибольшийHur pr (α , λ , σ ) - показатель эффективности:HurSprC (α , λ , σ ) = max{Huri pr (α , λ , σ ) : i = 1,2,..., m} .СтратегияAk( k ∈ {1,2,..., m} ) будет(2.28)Hur pr (α , λ , σ ) - оптимальной вомножестве чистых стратегий, если ее Hur pr (α , λ , σ ) - показатель эффективностисовпадает с Hur pr (α , λ , σ ) - ценой игры в чистых стратегиях:Hurkpr (α , λ , σ ) = HurSprC (α , λ , σ ) .(2.29)Так как множество чистых стратегий, конечно, то будет иметься, хотя быодна, чистая стратегия с наибольшим Hur pr (α , λ , σ ) - показателем эффективности,другими словами в любой игре с природой есть стратегия, оптимальная вомножестве чистых стратегий по синтетическому критерию Гурвица.Множество стратегий, Hur pr (α , λ , σ ) - оптимальных во множестве чистыхстратегий, обозначается как ( S C )O ( Hurpr(α ,λ ,σ )).При α = 0 из (2.27) получаем: Huri pr (0, λ , σ ) = − Hurir (σ ) , т.е.















