Теоретико-игровые методы принятия решений (Еремеев А. П.) (545581), страница 3
Текст из файла (страница 3)
Таблица 3.3
Для случая, когда игроку B известно о выборе игрока A (т.е. игра с полной информацией), получаем игру G(24), матричная форма которой представлена табл. 3.3.
Таблица 3.4
У игрока B добавились еще две стратегии: B3 – отвечать стратегией с тем же номером, что выбрал игрок A (т.е. B1 на A1 и B2 на A2) и B4 – отвечать стратегией с номером, отличным от выбора игрока A (т.е. B2 на A1 и B1 на A2).
3.2.Наличие седловой точки
Определение 3.1.
Нижней оценкой цены игры называется величина ; верхней оценкой цены игры называется величина
.
Лемма 3.1. Справедливо соотношение ≤ .
Для доказательства леммы представим игру G(mn) в матричной форме в виде табл. 3.4.
Таблица 3.5
B Ai | B1 | … | Bj | … | Bk | … | Bn |
A1 | a11 | … | a1j | … | a1k | … | a1n |
… | … | … | … | … | … | … | … |
Ai | ai1 | … | aij | … | aik | … | ain |
… | … | … | … | … | … | … | … |
Al | a11 | … | alj | … | alk | … | ain |
… | … | … | … | … | … | ||
Am | am1 | … | amj | … | amk | … | amn |
Пусть = ajk, = alj . Из определения верхней и нижней границ следует, что элемент ajk является минимальным в i-й строке, т.е. = ajk ≤ ajj, а элемент alj является максимальным в j-м столбце, т.е. ajj ≤ alj = . Лемма доказана.
Определение 3.2. Если = = V, то игра имеет седловую точку, стратегии Ai, Bj, при которых достигается выигрыш V, называются оптимальными чистыми стратегиями, а пара стратегий (Ai, Bj) называется решением игры G(mn).
Решение игры обладает свойством устойчивости (равновесия), т.е. если один из игроков придерживается своей оптимальной стратегии, то другому игроку не выгодно отходить от своей, так как его положение при этом может только ухудшиться. Из леммы 3.1 непосредственно следует, что признаком наличия седловой точки является нахождение в матрице игры такого элемента aij, который является одновременно минимальным в i-й строке и максимальным в j-м столбце. Если такой элемент не единственный, то игра имеет не единственное решение, но все решения равнозначны, т.е. дают выигрыш, равный цене игры V.
Теорема 3.1 [6]. Антагонистическая игра с полной информацией имеет седловую точку.
Таким образом, для любой антагонистической игры с полной информацией существует решение – пара чистых стратегий , дающих игроку А устойчивый выигрыш aij = V. Наличие нескольких седловых точек означает существование нескольких решений, но все они дают один и тот же выигрыш, равный цене игры V.
Рассмотрим в качестве примера матричную игру G(24) с полной информацией, представленную табл. 3.3. Дополним данную таблицу новыми строкой и столбцом, получив табл. 3.5.
Таблица 3.6
Имеем две седловые точки a14 и a24 , соответствующие решениям (A1, B4) и (A2, B4) с ценой игры V = –5.
Вернемся теперь к матричной игре G(22) с неполной информацией, представленной в табл. 3.2. Аналогично предыдущему примеру дополним табл. 3.2 до табл. 3.6.
Таблица 3.7
Для данной таблицы ,
, т.е. . Седловая точка, а, следовательно, и решение в чистых стратегиях, отсутствуют.
3.3.Методы решения матричных игр
при отсутствии седловой точки
3.3.1.Смешанные стратегии
В случае отсутствия седловой точки, в качестве решения игры используются так называемые смешанные стратегии
где pi и qj – вероятности выбора стратегий Ai и Bj игроками A и B соответственно. Решением игры в данном случае является пара оптимальных смешанных стратегий (SA*, SB*), максимизирующих математическое ожидание цены игры (средний выигрыш).
Теорема 3.2 [6]. Любая антагонистическая игра имеет хотя бы одно оптимальное решение, т.е., пару в общем случае смешанных стратегий (SA*, SB*), дающих игроку А устойчивый выигрыш, равный цене игры V, α ≤ V ≤ β.
Чистую стратегию можно рассматривать как частный случай смешанной стратегии, когда одна вероятность имеет единичное значение, а все остальные – нулевое.
Рассмотрим матричную игру G(mn), не имеющую седловой точки, для которой необходимо найти решение – пару оптимальных смешанных стратегий SA = (p1, p2, …, pm) и SB = (q1, q2, …, qn) и соответствующую цену игры V.
Предварительно следует попытаться упростить матрицу игры. Для этого вводятся отношения предпочтения (доминирования) и безразличия (дублирования) на множестве стратегий.
Определение 3.3:
-
стратегия Ai предпочтительнее стратегии Ak (доминирует Ak) (обозначается
), если все выигрыши, указанные в i-й строке матрицы игры, не меньше соответствующих выигрышей k-й строки, или формально
;
-
стратегии Ai и Ak находятся в отношении безразличия (дублирования) (обозначается AiAk), если все выигрыши, указанные в i-й строке матрицы игры, совпадают с соответствующими выигрышами k-й строки, или формально
;
-
стратегия Bj предпочтительнее стратегии Br (доминирует Br) (обозначается
), если все выигрыши, указанные в j-м столбце матрицы игры, не меньше соответствующих выигрышей r-го столбца, или формально
;
-
отношение безразличия для стратегий игрока B вводится аналогично игроку A, т.е.
.
Можно доказать следующую лемму [5].
Лемма 3.2. Для игры G(mn) число активных стратегий игроков равно min{m,n}. Другими словами, если, например, m>n, то в оптимальной стратегии SA = (p1, p2, …, pm) игрока A будет не более n отличных от нуля вероятностей pi.
Таким образом, предварительным этапом решения матричной игры является ее упрощение, т.е. удаление из матрицы доминируемых и дублируемых стратегий.
Рассмотрим данный этап на примере матричной игры G(55), представленной табл. 3.7.
Таблица 3.8
B Ai | B1 | B2 | B3 | B4 | B5 |
A1 | 4 | 7 | 2 | 3 | 4 |
A2 | 3 | 5 | 6 | 8 | 9 |
A3 | 4 | 4 | 2 | 2 | 8 |
A4 | 3 | 6 | 1 | 2 | 4 |
A5 | 3 | 5 | 6 | 8 | 9 |
Т ак как справедливы соотношения
,
,
,
,
, то удалим доминируемые и дублируемые стратегии A4, A5, B2, B4, B5.