Лекции в печатном виде (990087), страница 5
Текст из файла (страница 5)
В – жена.
А1 В1 – пойти на футбол.
А2 В2 – пойти в театр.
В данном случае получаем две ситуации равновесия
(2,1) – А1 В1 и (1,2) – А2 В2
, но они неравноценны.
Эти игры неразрешимы в смысле Нэша.
Рефлексивные игры.
В данном классе игр противники строят модели поведения друг друга.
Аi\Bj | В1 | В2 |
А1 | (5,5) | (2,7) |
А2 | (7,2) | (3,3) |
Игрок А начинает рассуждать за В.
Матрица принимает следующий вид:
Аi\Bj | В1 | В2 | В3+ | В4- |
А1 | (5,5) | (2,7) | (5,5) | (2,7) |
А2 | (7,2) | (3,3) | (3,3) | (7,2) |
В рефлексивной игре выигрывает тот игрок, у которого ранг рефлексии больше на единицу. Если ранг рефлексии больше более чем на единицу, то исход не ясен.
Пример:
В фирме есть два отдела: П – производственный
Т – транспортный.
Доход П от выпуска 1 машины = a.
Затраты Т на перевоз 1 машины = c.
Если продукт не вывозится, то затраты на хранение = b , и они делятся пополам между П и Т.
В общем виде матрица игры имеет вид:
Пi\Тj | Т1(4) | Т2(7) | Т3(8) | Т4(11) |
П1 (5 машин) | (4a – b/2, -4c – b/2) | (-5a, -7c) | (5a, -8c) | (5a, -11c) |
П2 (10 машин) | (4a – 3b, -4c – 3b) | (7a – 1,5b, -7c – 1,5b) | (8a - b, -8c - b) | (10a, -11c) |
Необходимо выяснить, что рекомендовать Производственному отделу.
П
Пi\Тj | Т1(4) | Т2(7) | Т3(8) | Т4(11) | min |
П1 (5 машин) | 37, -11 | 50, -14 | 50, -16 | 50, -22 | 37 |
П2 (10 машин) | 22, -26 | 61, -23 | 74, -22 | 100, -22 | 22 |
Воспользуемся методом maxmin.
Если П и Т – враги, то рекомендуется стратегия П1, так как 37 –гарантированный выигрыш больше чем 22.
Но поскольку П и Т это отделы одной фирмы, П рекомендуется выбрать стратегию П2. В этом случае Т выберет Т3 или лучше Т4, и выигрыш П будет 74 или 100.
Основы теории стохастических решений
(игры с “природой”)
В этих играх существует некая объективная реальность, которая может влиять на процесс принятия решения.
Рассмотрим игру в матричной форме G(m,n).
П1 | … | Пj | … | Пn | |
A1 | а11 | … | а1j | … | а1n |
… | … | … | … | … | … |
Ai | аi1 | … | аij | … | аin |
… | … | … | … | … | … |
Am | аm1 | … | аmj | … | аmn |
аij – выигрыш игрока А при выборе
им стратегии Аi в состоянии
природы ПJ.
Использование методов теории антагонистических игр невозможно, т.к. нет сознательного противодействия противника (за исключением метода максимина).
В играх с природой вводят понятие риска:
Риск:
Т.о риск – это разность между выигрышем, который игрок получил бы,
зная, в каких условиях Пj он принимает решение, и выигрышем,
который он получает, не зная условий, когда он выбирает
стратегию Ai.
Пример:
П1 | П2 | П3 | П4 | |
A1 | 1 | 4 | 5 | 9 |
A2 | 3 | 8 | 4 | 3 |
A3 | 4 | 6 | 6 | 2 |
Матрица выигрышей
П1 | П2 | П3 | П4 | |
A1 | 3 | 4 | 1 | 0 |
A2 | 1 | 0 | 2 | 6 |
A3 | 0 | 2 | 0 | 7 |
Матрица рисков
Возможны различные ситуации:
-
Ситуация 1 .Стохастическая неопределенность
Известны вероятности состояний «природы»:
Пj qj, j=1,…,n
Тогда для поиска оптимального решения применяется критерий
Лапласа: оптимальной является та стратегия, которая максимизирует
средний выигрыш (матожидание выигрыша):
Эта же стратегия будет минимизировать средний риск:
Пример:
q1=0.1; q2=0.5; q3=q4=0.2.
a1 = 1*0.1+4*0.5+14*0.2=4.9
a2 = 3*0.1+8*0.5+7*0.2=5.7 А2 - оптимальная стратегия
a3 = 4*0.1+6*0.5+8*0.2=5
r1 = 3*0.1+4*0.5+1*0.2=2.5
r2 = 1*0.1+0*0.5+8*0.2=1.7 А2 - оптимальная стратегия
r3 = 0*0.1+2*0.5+7*0.2=2.4
-
Ситуация 2 . Вероятности qj неизвестны или их не существует.
В этом случае может использоваться ряд критериев поиска оптимального решения:
-
Критерий Вальда (крайнего пессимизма) – стратегия
максимизирующая минимальный выигрыш.
-
Критерий Сэвиджа – стратегия, минимизирующая максимальный риск
3. Компромиссный критерий Гурвица
В качестве оптимальной выбирается стратегия, зависящая от
параметра пессимизма (оптимизма).
k - критерий осторожности или пессимизма 0k1
k=0 – максимизировать максимально возможный выигрыш
k=1 – критерий Вальда
Если нет дополнительной информации, то рекомендуется брать k 0.6
При выборе оптимальной стратегии брать надо ту, которую советуют
большинство критериев.
Замечание:
В играх с природой не используются смешанные стратегии по следующим причинам:
-
в антагонистических играх смешанные стратегии
применяютсячасто для того, чтобы обмануть, запутать
противника, что в играх с природой не имеет смысла.
- аппарат смешанных стратегий ориентирован на получение
максимального среднего выигрыша - того выигрыша,
который будет получен при многократном повторении
игры, но этом накапливается вероятность qi, которая может дать
информацию в чистых стратегиях.
Пример:
П1 | П2 | П3 | П4 | i | Wi | hi | |
A1 | 19 | 30 | 41 | 49 | 19 | 49 | 31 |
A2 | 51 | 38 | 10 | 20 | 10 | 51 | 26.4 |
A3 | 73 | 18 | 81 | 11 | 11 | 81 | 39 |
Матрица выигрышей
П1 | П2 | П3 | П4 | Si | |
A1 | 54 | 8 | 0 | 0 | 54 |
A2 | 22 | 0 | 71 | 29 | 71 |
A3 | 0 | 30 | 40 | 38 | 40 |
Матрица рисков
-
Критерий Вальда - A1
-
Критерий Сэвиджа – A3
3. Критерий Гурвица - A3
Выбираем стратегию A3.
Игры с упорядоченными исходами.
Игры при наличии нескольких критериев.
Пример:
Ожидается нашествие вирусов В1, В2, В3 .
В1, В2, В3 – типы вирусов.
V1, …, V7 – типы вакцин.
Эффективность вакцины Vi - i {1,2,3,4}
Стоимость(дешевизна) - обратная индексу вакцины величина , т. е. вакцина с меньшим номером дороже всех.
i {1,2,3,4,5,6,7}