145758 (Теория принятий решений), страница 8
Описание файла
Документ из архива "Теория принятий решений", который расположен в категории "". Всё это находится в предмете "теория организации" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "рефераты, доклады и презентации", в предмете "теория организации" в общих файлах.
Онлайн просмотр документа "145758"
Текст 8 страницы из документа "145758"
В матрице методом минимакса находим седловую точку: (2,4), таким образом, x* = ( 0, 1 ), y* = ( 0, 0, 0, 1 ), v* = - 180 ден.ед.
Ответ: нужно купить специализированное оборудование.
Однако в играх с природой положение коренным образом меняется: уже в условии заложена устойчивая смешанная стратегия природы: у = ( 0,3; 0,4; 0,2; 0,1) и мы знаем, что именно этой стратегии придерживается природа.
Если же человек - первый игрок - будет продолжать играть оптимально, то его выигрыш составит v(x*) = - 150 0,3 - 160 0,4 - 170 0,2 - 180 0,1 = - 161 , а если применит первую, неоптимальную стратегию, то математическое ожидание его выигрыша составит v(x') = - 100 0,3 - 140 0,4 - 180 0,2 - 220 0,1 = - 144 .
Таким образом, первому игроку выгодно играть неоптимально !
Ответ: не покупать специализированное оборудование.
Существенное различие между значениями v(x*) и v(x') обьясняется тем, что смешанная стратегия природы неоптимальна и она, "отклоняясь" от своей оптимальной стратегии "недополучает" 36 ден.единиц выигрыша.
2. Игры с природой в условиях неопределенности.
Если распределение вероятностей будущих состояний природы не известно, вся информация о природе сводится к перечню ее возможных состояний.
Пример. Игра "Поставщик".
Выпуск продукции фирмы существенно зависит от скоропортящегося материала, например, молока или ягод, поставляемого партиями стоимостью 100ед. Если поставка не прибывает в срок, фирма теряет 400 ед. от недовыпуска продукции. Фирма может послать к поставщику свой транспорт (расходы 50 ед.), однако опыт показывает, что в половине случаев транспорт возвращается ни с чем. Можно увеличить вероятность получения материала до 80%, если предварительно послать своего представителя, но расходы увеличатся еще на 50 ед. Существует возможность приобретать более дорогой (на 50%) материал-заменитель у другого, вполне надежного поставщика, однако, кроме расходов на транспорт (50 ед.) возможны дополнительные издержки хранения материала в размере 30 ед., если его количество на складе превысит допустимую норму, равную одной партии.
Какой стратегии должен придерживаться завод в сложившейся ситуации?
Формализация. У природы два состояния: поставщик надежный и поставщик ненадежный. У фирмы - четыре стратегии: 1) не осуществлять никаких дополнительных действий, 2) послать к поставщику свой транстпорт, 3) послать к поставщику представителя и транстпорт, 4) купить и привезти материал-заменитель от другого поставщика.
Составим таблицу расчетов:
Затраты и убытки фирмы-изготовителя | ||||||
Ситуация | Стоимость материала | Недовыпуск продукции | Транспорт | Команди-ровочные расходы | Издержки хранения | Общая сумма |
1 1 | - 100 | 0 | 0 | 0 | 0 | - 100 |
1 2 | 0 | - 400 | 0 | 0 | 0 | - 400 |
2 1 | - 100 | 0 | - 50 | 0 | 0 | - 150 |
2 2 | - 50 | - 200 | - 50 | 0 | 0 | - 300 |
3 1 | - 100 | 0 | - 50 | - 50 | 0 | - 200 |
3 2 | - 80 | - 80 | - 50 | - 50 | 0 | - 260 |
4 1 | - 250 | 0 | - 50 | 0 | - 30 | - 330 |
4 2 | - 150 | 0 | - 50 | 0 | 0 | - 200 |
Решение. На основе полученных результатов вычислений можно составить платежную матрицу:
min | max | ||
- 100 | - 400 | - 400 | |
- 150 | - 300 | - 300 | |
- 200 | - 260 | - 260 | - 260 |
- 330 | - 200 | - 330 |
Ответ. Нужно придерживаться третьей стратегии и затраты не превысят 260 ед., если послать к поставщику представителя и транстпорт.
1. Рассмотренный способ поиска оптимального решения называется критерием Вальда (Максиминный критерий принятия решения). Выбирается решение, гарантирующее получение выигрыша не меньше, чем maxmin:
vW = maxi minj aij = -260 ед.
Применяя этот критерий мы представляем на месте природы активного и злонамеренного противника. Это пессимистичный подход.
2. Максимаксный критерий. Самый благоприятный случай:
vM = maximaxj aij = -100 ед.
Если фирма ничего не предпримет, то потратит не больше 100 единиц. Это критерий абсолютного оптимизма.
3. Критерий пессимизма-оптимизма Гурвица.
Представляется логичным, что при выборе решения вместо двух крайностей в оценке ситуации придерживаться некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего, благоприятного поведения природы. Такой компромиссный вариант и был предложен Гурвицем. Согласно этому подходу для каждого решения необходимо определить линейную комбинацию min и max выигрыша и взять ту стратегию, для которой эта величина окажется наибольшей:
vH = maxi [ maxi aij + (1-) minj aij ], где - “степень оптимизма” , 0 1.
При = 0 критерий Гурвица тождественен критерию Вальда, а при =1 совпадает с максиминным решением.
На выбор значения степени оптимизма оказывает влияние мера ответственности: чем серьезнее последствия ошибочных решений, тем больше желание принимающего решение застраховаться, то есть степень оптимизма ближе к нулю.
Влияние степени оптимизма на выбор решения в задаче “Поставщик”.
Степень оптимизма | ||||||||||
Решение | 0,1 | 0,2 | 0,3 | 0,4 | 0,5 | 0,6 | 0,7 | 0,8 | 0,9 | |
А1 | 1 стратегия | -370 | -340 | -310 | -280 | -250 | -220 | -190* | -160* | -130* |
А2 | 2 стратегия | -285 | -270 | -255 | -240 | -225* | -210* | -195 | -180 | -165 |
А3 | 3 стратегия | -254* | -248* | -242* | -236* | -230 | -224 | -218 | -212 | -206 |
А4 | 4 стратегия | -317 | -304 | -281 | -278 | -265 | -252 | -239 | -226 | -213 |
Величина vH для каждого значения отмечена*. При 4/9 критерий Гурвица рекомендует в задаче “Поставщик” решение А3, при 4/9 2/3 - решение А2. В остальных случаях А1. А4 не выгодно во всех случаях.
4. Критерий Сэвиджа (критерий минимакса риска).
На практике, выбирая одно из возможных решений, часто останавливаются на том, осуществление которого приведет к наименее тяжелым последствиям, если выбор окажется ошибочным. Этот подход к выбору решения математически был сформулирован американским статистиком Сэвиджем в 1954 году и получил название принципа Сэвиджа. Он особенно удобен для экономических задач и часто применяется для выбора решений в играх человека с природой.
По принципу Сэвиджа каждое решение характеризуется величиной дополнительных потерь, которые возникают при реализации этого решения, по сравнению с реализацией решения, правильного при данном состоянии природы. Естественно, что правильное решение не влечет за собой никаких дополнительных потерь, и их величина равна нулю.
При выборе решения, наилучшим образом соответствующего различным состояниям природы, следует принимать во внимание только эти дополнительные потери, которые по существу, будут являться следствием ошибок выбора.
Для решения задачи строится так называемая “матрица рисков”, элементы котрой показывают, какой убыток понесет игрок (ЛПР) в результате выбора неоптимального аврианта решения.
Риском игрока rij при выборе стратегии i в условиях (состояниях) природы j называется разность между максимальным выигрышем, который можно получить в этих условиях и выигрышем, который получит игрок в тех же условиях, применяя стратегию i.
Если бы игрок знал заранее будущее состояние природы j, он выбрал бы стратегию, которой соответствует max элемент в данном столбце: maxi aij, тогда риск: rij = maxi aij - aij.
Критерий Сэвиджа рекомендует в условиях неопределенности выбирать решение, обеспечивающее минимальное значение максимального риска:
vS = mini maxj rij = mini maxj (maxi aij - aij).