Метод указания к лаб работам ИСО (1066243), страница 2
Текст из файла (страница 2)
Можно также указать определенный набор вариантов ее структуры, то есть набор альтернатив
Из этого перечня выбирают альтернативу наиболее эффективную в смысле минимального влияния на функционирования системы отклонений от нормальных условий.
Выбор наилучшей альтернативы часто затруднен, поскольку информация о возможных ситуациях недостаточна или отсутствует. В этих случаях могут быть полезны методы и модели теории игр. Составим матрицу альтернатив и состояний:
.
- альтернативы, одну из которых мы хотим выбрать
- возможные отклонения от возможных условий.
- эффективность альтернативы
в условиях
.
Таблица, в которой записывают правила игры, в теории игр называют платежной матрицей. Эта таблица содержит выигрыши игрока А, называемого максимизирующим игроком, и проигрыши игрока В, называемого минимизирующим.
Если выигрыш одного партера равен проигрышу другого, то такие игры называют антагонистические. Рассмотрим пример такой игры (таблица. 1)
| B A | I | II | III |
| 1 | 2 | -1 | 1 |
| 2 | -2 | 1 | -1 |
| 3 | -2 | 1 | -2 |
| 4 | 2 | -2 | 3 |
табл. 1
Принцип Вальда
Если речь идет только об одной партии игры, рассуждение игроков согласно этому принципу следующее:
Игрок А.
Мои минимальный выигрыш для каждой стратегии (1, 2, 3, 4) будет такой (-1; -2; -2; -2).
Я выбираю максимум из минимальных выигрышей, то есть играю чистую стратегию 1.
- нижняя цена игры (гарантированный выигрыш)
Игрок В Мои максимальный проигрыш для стратегии ( I, II, III ) будет соответственно
(2; 1; 3), следовательно β - верхняя цена игры равна 1 (максимальный проигрыш 1).
Я выбираю минимум среди максимальных проигрышей – то есть избираю чистую стратегию II.
Очевидно, что выбор стратегии, отличных от стратегий определяемых принципом фон Неймана, только увеличивает риск каждого игрока.
| B A | I | II |
| 1 | -1 | 1 |
| 2 | (1) | 2 |
| 3 | 0 | -1 |
Поиск максимина
приводит игрока А к стратегии (2) – откуда минимальный гарантированный выигрыш – (1).
Поиск минимакса
приводит игрока А к стратегии (I) – откуда минимальный гарантированный проигрыш – (1).
Здесь максимин и минимакс совпадают. Они имеют в качестве своего значения один и тот же элемент, который называется седловой точкой (наименьший в своей строке и наибольший в своем столбце)
Тогда, каким бы ни было число партий в матче, выбираемые оптимальные стратегии останутся одними и теми же. В каждой партии А будет выигрывать, а В будет проигрывать 1.
В предыдущем примере матрица не имеет седловой точки.
Представим себе, что противники решили играть матч. Рассуждения противников будут следующие.
Игрок А.
Независимо от принятой противником стратегии, я выбираю строки 1, 2, 3, 4 с частотами
так, чтобы обеспечить выигрыш не меньший, чем (g).
Игрок В.
Независимо от принятой противником стратегии, я выбираю столбец (I, II, III) с частотами
так чтобы обеспечить проигрыш не больший, чем (g).
Мы пришли к задачам линейного программирования ( прямой и двойственной).
Существование смешанной оптимальной стратегии – содержание теоремы Фон Неймана.
Здесь мы находим понятие равновесия (едина значение игры), устойчивости и безопасности (невозможность для каждого игрока отклониться от оптимальной стратегии без дальнейшего риска)
Задачи принятия решения в условиях неопределенности
Ранее уже отмечалось, что в один из принципов классификации задач исследования операций тесно связан с понятием информационного состояния лица, принимающего решение. В соответствии с эти принципом все задачи исследования операций могут быть поделены на три класса: детерминированные, стохастические и неопределенные.
О принадлежности задачи исследования операций к классу детерминированных задач говорят в случае обладания лицом, принимающим решение, полного объема необходимой ему информации. Поэтому их также называют задачами принятия решений в условиях определенности.
В случае ограниченности или неточности информации возможна одна из двух ситуаций: принятие решений в условиях риска (задачи принятия решений в условиях риска) и принятие решений в условиях неопределенности (задачи принятия решений в условиях неопределенности). В первой ситуации неполнота исходной информации выражена в наличии законов распределения случайных величин, входящих в стохастические модели принятия решений. Во второй же ситуации априорная информация о законах распределения этих случайных величин не доступна.
Ниже приведены наиболее часто применимые на практике критерии принятия решений в условиях неопределенности:
-
критерий Лапласа;
-
критерий минимакса (максимина);
-
критерий Сэвиджа;
-
критерий Гурвица.
-
критерий благоприятного в среднем решения.
Основное различие между выше перечисленными критериями определяется стратегией поведения лица, принимающего решение, в условиях неопределенности. Так, например, критерий Лапласа основан на более оптимистичных взглядах лица, принимающего решение, чем, например, критерий минимакса, а критерий Гурвица, в свою очередь, можно использовать при различных подходах: от наиболее пессимистичного до наиболее оптимистичного. Таким образом, данные критерии, несмотря на свою количественную природу, в большой степени отражают субъективную оценку ситуации в предметной области, в которой приходится принимать решение, лица, принимающего решение.
Несмотря не бесспорную полезность и применимость выше перечисленных критериев, при их использовании оказывается довольно много подводных камней. Например, довольно серьезную проблему представляет собой отсутствие общих правил оценки применимости того или иного критерия при принятии решения в условиях неопределенности в конкретной ситуации. Это связано с тем, что поведение самого лица, принимающего решение, обусловленное неопределенностью ситуации, само по себе является наиболее важным фактором при выборе подходящего критерия принятия решений.
При рассмотрении проблем принятия решений в условиях неопределенности мы исходим из предположения, что выбор решения из множества допустимых решений осуществляется одним лицом. Специфика подобных задач состоит в отсутствии у лица, принимающего решение, разумного противника. В таких случаях, когда в роли противника лица, принимающего решение, выступает природа, по большому счету, нет оснований предполагать, что она целенаправленно стремится принести вред лицу, принимающему решение.
Информация, необходимая для принятия решений в условиях неопределенности, обычно представляется в форме матрицы, i-тая строка которой соответствует некоторому конкретному решению
из множества допустимых решение
, а j-тый столбец соответствует некоторому состоянию
рассматриваемой системы
с множеством возможных состояний
. Каждому допустимому решению
из множества допустимых решений и каждому возможному состоянию
изучаемой системы
соответствует некоторый результат принятия решения
в ситуации
:
определяющий выигрыш или потери при принятии лицом, принимающим решение, данного решения и реализации данного состояния системы. Так, если множество допустимых решений состоит из n элементов, а исследуемая система может находиться в одном из возможных m состояний, то матрица
является матрицей исходных данных для процедуры принятия решений в условиях неопределенности.
Если величина
определяет выигрыш, получаемый при принятии решения
и реализации состояния
рассматриваемой системы
, то матрицу
принято называть матрицей дохода. Если же величина
определяет проигрыш, получаемый при принятии решения
и реализации состояния
рассматриваемой системы
, то матрицу
принято называть матрицей потерь или матрицей затрат.
Перейдем теперь непосредственно к рассмотрению наиболее широко используемых при принятии решений в условиях неопределенности критериев.
Критерий Лапласа
Для обоснования критерия Лапласа в задачах принятия решений в условиях неопределенности воспользуемся следующими соображениями, отражающими основную суть принципа недостаточного обоснования.
Так нам не известны вероятности пребывания рассматриваемой системы в каждом из ее m вероятных состояний, то мы не имеет достаточно оснований сделать утверждение о различии этих вероятностей. В противном случае имела бы место ситуация принятия решения в условиях риска. Скорее, мы можем предположить равенство вероятностей реализации любых возможных состояний изучаемой системы. Таким образом, исходную задачу можно рассматривать как задачу принятия решений в условиях риска, когда выбирают решение, обеспечивающее наибольший ожидаемый результат, то есть:
Здесь предполагается, что вероятности пребывания рассматриваемой системы во всех возможных состояниях одинаковы и равны 1/m. Данный критерий называют критерием Лапласа.














