Модели теории игр
Модели теории игр. Матричные игры
Матричная игра – это конечная игра двух игроков с нулевой суммой, в которой задается выигрыш игрока 1 в виде матрицы (строка матрицы соответствует номеру применяемой стратегии игрока 1, столбец – номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применяемым стратегиям). Первый игрок имеет m стратегий i = 1,2,…,m, второй – n стратегий j = 1,2,…,n. Каждой паре стратегий поставлено в соответствие число , выражающее выигрыш игрока 1 за счёт игрока 2, если первый игрок примет свою i-ю стратегию, а 2 – свою j-ю стратегию.
Каждый из игроков делает один ход: игрок 1 выбирает свою i-ю стратегию , 2 – свою j-ю стратегию , после чего игрок 1 получает выигрыш за счет игрока 2 (если , то это значит, что первый игрок платит второму сумму ). На этом игра заканчивается.
Каждая стратегия игрока ; часто называется чистой стратегией.
Если рассмотреть матрицу
,
то проведение каждой партии матричной игры с матрицей А сводится к выбору игроком 1 i-й строки, а игроком 2 – j-го столбца и получения игроком 1 (за счёт игрока 2) выигрыша .
Главным в исследовании игр является понятие оптимальных стратегий игроков. В это понятие интуитивно вкладывается такой смысл: стратегия игрока является оптимальной, если применение этой стратегии обеспечивает ему наибольший гарантированный выигрыш при всевозможных стратегиях другого игрока. Исходя из этих позиций, игрок 1 исследует матрицу выигрышей А следующим образом: для каждого значения i определяется минимальное значение выигрыша в зависимости от применяемых стратегий игрока 2
,
Рекомендуемые материалы
т.е. определяется минимальный выигрыш для игрока 1 при условии, что он примет свою i-ю чистую стратегию. Затем из этих минимальных выигрышей отыскивается такая стратегия i=i0, при которой этот минимальный выигрыш будет максимальным, т.е. находится
.
Число называется нижней чистой ценой игры и показывает, какой минимальный выигрыш может гарантировать себе игрок 1, применяя свои чистые стратегии при всевозможных действиях игрока 2.
Игрок 2 при оптимальном поведении должен стремиться за счёт своих стратегий максимально уменьшить выигрыш 1 игрока. Поэтому для игрока 2 отыскивается
,
т.е. определяется максимальный выигрыш игрока 1 при условии, что игрок 2 применит свою j-ю чистую стратегию; затем игрок 2 отыскивает такую свою j=j1 стратегию, при которой игрок 1 получит минимальный выигрыш, т.е. находит
.
Число называется чистой верхней ценой игры и показывает, какой максимальный выигрыш за счёт своих стратегий может себе гарантировать игрок 1.
Другими словами, применяя свои чистые стратегии, игрок 1 может обеспечить себе выигрыш не меньше , а игрок 2 за счёт применения своих чистых стратегий может не допустить выигрыш игрока 1 больше, чем .
Если в игре с матрицей А = , то говорят, что эта игра имеет седловую точку в чистых стратегиях и чистую цену игры . Седловая точка – это пара чистых стратегий соответственно игроков 1 и 2, при которых достигается равенство = . В это понятие вложен следующий смысл: если один из игроков придерживается стратегии, соответствующей седловой точке, то другой игрок не сможет поступить лучше, чем придерживаться стратегии, соответствующей седловой точке.
Математически это можно записать и иначе:
,
где i, j – любые чистые стратегии соответственно игроков 1 и 2; – стратегии, образующие седловую точку.
Таким образом, cедловой элемент является минимальным в i0-й строке и максимальным в j0-м столбце в матрице А. Отыскание седловой точки матрицы А происходит следующим образом: в матрице А последовательно в каждой строке находят минимальный элемент и проверяют, является ли этот элемент максимальным в своём столбце. Если да, то он и есть седловой элемент, а пара стратегий, ему соответствующая, образует седловую точку. Пара чистых стратегий игроков 1 и 2, образующая седловую точку и седловой элемент , называется решением игры. При этом i0 и j0 называются оптимальными чистыми стратегиями соответственно игроков 1 и 2.
Пример 7.
Решение. Седловой точкой является пара чисел , при которой . Заметим, что хотя выигрыш для точки (3;3) также равен , она не является седловой точкой, т.к. этот выигрыш не является максимальным среди выигрышей третьего столбца.
Пример 8.
Решение. Из анализа матрицы выигрышей видно, что , т.е. данная матрица не имеет седловой точки. Если игрок 1 выбирает свою чистую максиминную стратегию i = 2, то игрок 2, выбрав свою минимаксную j = 2, проиграет только 20. В этом случае игроку 1 выгодно выбрать стратегию i = 1, т.е. отклониться от своей чистой максиминной стратегии и выиграть 30. Тогда игроку 2 будет выгодно выбрать стратегию j = 1, т.е. отклониться от своей чистой минимаксной стратегии и проиграть 10. В свою очередь, игрок 1 должен выбрать свою 2-ю стратегию, чтобы выиграть 40, а игрок 2 ответит выбором 2-й стратегии и т.д. Таким образом, в игре без седловой точки игроки вынуждены применять так называемые смешанные стратегии, заключающиеся в том, что игроки применяют не одну стратегию и выбирают среди них случайным образом.
Графический метод решения матричных игр
Пример 9. Найти решение игры, заданной платежной матрицей:
а) .
Решение. Наиболее простым методом решения игр является графический метод, но он применим только для игр, в которых хотя бы у одного из двух участников имеется не более двух стратегий. Данная платежная матрица имеет размерность .
На плоскости хOу введём систему координат (рис. 7) и на оси Oх отложим отрезок единичной длины А1А2, каждой точке которого поставим в соответствие некоторую смешанную стратегию первого игрока – (х, 1–х). В частности, точке А1(0;0) отвечает стратегия А1, точке А2(1;0) – стратегия А2.
В точках А1 и А2 восстановим перпендикуляр и на полученных прямых будем откладывать выигрыш игроков. На первом перпендикуляре (в данном случае он совпадает с осью Оу) отложим выигрыш игрока 1 при стратегии А1, а на втором – при стратегии А2. Если игрок 1 применит стратегию А1, то его выигрыш при стратегии второго игрока В1 составляет 2, при стратегии В2 – 3, а при стратегии В3 – 11. Числам 2, 3, 11 на оси Ох соответствуют точки В1, В2 и В3.
Если же игрок 1 применит стратегию А2, то его выигрыш при стратегии второго игрока В1 равен 7, при В2 – 5, а при В3 – 2. Эти числа определяют точки В'1, В2', В3' на перпендикуляре, восстановленном в точке А2. Соединяя между собой точки В1 и В'1, В2 и В2', В3 и В'3, получим три прямые, расстояние до которых от оси Ох определяет средний выигрыш при любом сочетании соответствующих стратегий. Например, расстояние от любой точки отрезка В2В'2 до оси Ох определяет средний выигрыш при любом сочетании стратегий А1, А2 (с частотами х и 1 – х) и стратегией В2 игрока 2. Это расстояние равно
(вспомните планиметрию и рассмотрите трапецию ).
Ординаты точек, принадлежащих ломаной , определяют минимальный выигрыш игрока 1 при применении им любых смешанных стратегий. Эта минимальная величина является максимальной в точке N. Следовательно, этой точке соответствует оптимальная смешанная стратегия , а ее ордината равна цене игры . Координаты точки N находим как точку пересечения прямых В2В'2 и В3В'3. Соответствующие два уравнения имеют вид
( при стратегии В2)
( при стратегии В3)
Таким образом, , при цене игры . Из рис. 7 видно, что стратегия В1 не входит в оптимальную стратегию, и мы можем найти оптимальную смешанную стратегию при помощи матрицы .
Оптимальную смешанную стратегию для игрока 2 можно найти из системы
( при стратегии А1)
( при стратегии А2)
Следовательно, .
б) Найти решение игры, заданной платежной матрицей:
.
Решение. Матрица имеет размерность . Строим прямые (рис. 8), соответствующие стратегиям игрока 1 в системе координат yOx. Ломаная отвечает верхней границе выигрыша игрока 2, а отрезок KL – цене игры .
Активными стратегиями для 1 игрока являются А1 и А4. Стратегии А2 и А3 входят в оптимальную смешанную стратегию с частотами, равными нулю. Решение игры сводится к нахождению оптимальных стратегий игры, заданной матрицей .
Оптимальную смешанную стратегию для игрока 2 найдем из системы уравнений
(при стратегии А1)
(при стратегии А4)
а для 1 игрока
(при стратегии В1)
(при стратегии В2)
Решение игры таково:
Люди также интересуются этой лекцией: Основные группы методов диагностики.
Таким образом, имеем следующую схему графического метода решения простейших матричных игр ( или ):
1. Строят прямые, соответствующие стратегиям второго (первого) игрока.
2. Строят нижнюю (верхнюю) границу выигрыша.
3. Определяют по чертежу пару «полезных» стратегий из числа построенных для второго (первого) игрока.
4. Выбирают на границе выигрыша точку с максимальной (минимальной) ординатой.
5. Находят решение игры.