82199 (574511), страница 2
Текст из файла (страница 2)
Все расчеты удобно проводить в таблице, к которой, кроме матрицы Р, введены столбец и строка
(табл.1). Анализируя строки матрицы (стратегии игрока А), заполняем столбец
: а1 = 1; а2 = 1; а3 = 2 - минимальные числа в строках 1, 2,3. Аналогично
= 5;
= 8;
= 9;
= 3 - максимальные числа в столбцах 1, 2, 3 соответственно. Нижняя цена игры
,
(1; 1;
2) = 2 (наибольшее число в столбце ) и верхняя цена игры
,
(5; 8; 9;
3) = 3 (наименьшее число в строке ). Эти значения не равны, т.е.
, и, так как они достигаются ни на одной и той же паре стратегий, то игра седловой точки не имеет. И, так как игра седловой точки не имеет, то применение чистых стратегий не дает оптимального решения игры. В таком случае можно получить оптимальное решение случайным образом чередуя чистые стратегии. Пусть игра задана платежной матрицей
Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию
,
а игрок В чистую стратегию В1 (это соответствует первому столбцу платежной матрицы Р), равен цене игры v:
Тот же средний выигрыш получает игрок А, если 2-й игрок применяет стратегию В2, т.е.
.
Учитывая, что получаем систему уравнений для определения оптимальной стратегии S*A и цены игры v:
Решая эту систему, получим оптимальную стратегию
и цену игры
Применяя теорему об активных стратегиях при отыскании - оптимальной стратегии игрока В, получаем, что при любой чистой стратегии игрока А (А1 или А2) средний проигрыш игрока В равен цене игры v, т.е.
Тогда оптимальная стратегия (
) определяется формулами:
Применим полученные результаты для отыскания оптимальных стратегий для игры, рассмотренной выше. Игра задана платежной матрицей без седловой точки:
Поэтому ищем решение в смешанных стратегиях: для игрока А средний выигрыш равен цене игры v (при В1 и В2) для игрока В средний проигрыш равен цене игры v (при А1 и А2). Системы уравнений приведенные выше в данном случае имеют вид:
Решая эти системы, получаем v = 0.
Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью -3 и 4 при этом средний выигрыш равен 0.
Оптимальное решение игры двух лиц с нулевой суммой.
Определите оптимальные стратегии и цену игры. Для 1) - в чистых стратегиях, для 2) - в смешанных.
1) 2)
Таблица 5
B1 | B2 | B3 | B4 |
| |
A1 | 2 | 3 | 4 | 2 | 2 |
A2 | 3 | 5 | 2 | 4 | 2 |
A3 | 2 | 5 | 4 | 6 | 2 |
| 3 | 5 | 4 | 6 |
|
Решение.
Все расчеты удобно проводить в таблице, к которой, кроме матрицы Р, введены столбец и строка
(табл.1). Анализируя строки матрицы (стратегии игрока А), заполняем столбец
: а1 = 2; а2 = 2; а3 = 2 - минимальные числа в строках 1, 2,3. Аналогично
= 3;
= 5;
= 4;
= 6 - максимальные числа в столбцах 1, 2, 3 соответственно. Нижняя цена игры
,
(2; 2;
2) = 2 (наибольшее число в столбце ) и верхняя цена игры
,
(3; 5; 4;
6) = 3 (наименьшее число в строке ). Эти значения не равны, т.е.
, и, так как они достигаются ни на одной и той же паре стратегий, то игра седловой точки не имеет.
И, так как игра седловой точки не имеет, то применение чистых стратегий не дает оптимального решения игры. В таком случае можно получить оптимальное решение случайным образом чередуя чистые стратегии.
Пусть игра задана платежной матрицей
Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию
,
а игрок В чистую стратегию В1 (это соответствует первому столбцу платежной матрицы Р), равен цене игры v:
Тот же средний выигрыш получает игрок А, если 2-й игрок применяет стратегию В2, т.е.
.
Учитывая, что получаем систему уравнений для определения оптимальной стратегии S*A и цены игры v:
Решая эту систему, получим оптимальную стратегию
и цену игры
Применяя теорему об активных стратегиях при отыскании - оптимальной стратегии игрока В, получаем, что при любой чистой стратегии игрока А (А1 или А2) средний проигрыш игрока В равен цене игры v, т.е.
Тогда оптимальная стратегия (
) определяется формулами:
Применим полученные результаты для отыскания оптимальных стратегий для игры, рассмотренной выше.
Игра задана платежной матрицей без седловой точки:
Поэтому ищем решение в смешанных стратегиях: для игрока А средний выигрыш равен цене игры v (при В1 и В2) для игрока В средний проигрыш равен цене игры v (при А1 и А2). Системы уравнений приведенные выше в данном случае имеют вид:
Решая эти системы, получаем v = 0.
Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью -1 и 2 при этом средний выигрыш равен 0.