Теоретико-игровые методы принятия решений (Еремеев А. П.) (545581), страница 6
Текст из файла (страница 6)
Полученный результат означает, что КБ1 рекомендуется использовать равновероятно стратегии A2 или A4, т.е. распределить отделы между проектами в соотношении 3 к 1 или 1 к 3 с ожидаемым финансированием 5a / 4, а КБ2 – стратегии B1 или B4, т.е. направить все усилия (отделы) на выполнение одного из проектов с ожидаемым финансированием 3a / 4.
3.5.Контрольные вопросы к разделу 3
-
Приведите общий вид матричного представления антагонистической игры.
-
Дайте определения нижней и верхней оценки цены игры.
-
Сформулируйте лемму 3.1.
-
Дайте доказательство леммы 3.1.
-
Дайте определения седловой точки, оптимальных чистых стратегий игроков, решения игры.
-
Сформулируйте теорему 3.1.
-
Дайте определение смешанной стратегии.
-
Сформулируйте теорему 3.2.
-
Сформулируйте отношения предпочтения и безразличия на множестве стратегий.
-
Сформулируйте лемму 3.2.
-
Поясните метод Лагранжа.
-
Найдите решение игры G(33) в общем виде, используя метод Лагранжа.
-
Решите методом Лагранжа игру G(33), представленную следующей матрицей:
B
j
Ai
B1
B2
B3
A1
7
2
9
A2
2
9
0
A3
9
0
11
-
Поясните метод линейного программирования.
-
Назовите основной недостаток точных методов поиска решения.
-
Поясните приближенный (итерационный) метод Брауна-Робинсона.
-
Рассмотрите задачу о конкурсе на реализацию проектов для случаев а = 2b и а = b / 2.
4.ИГРА ДВУХ ЛИЦ С ПРОИЗВОЛЬНОЙ СУММОЙ
4.1.Определение игры двух лиц с произвольной суммой
В отличие от игры двух лиц с нулевой суммой (антагонистической игры) игра двух лиц с произвольной суммой, или биматричная игра, не носит антагонистического характера – в соответствующей конфликтной ситуации интересы сторон не строго противоположны, а просто различны, причем успех одной стороны обычно означает неудачу другой. Реальные конфликты не часто сводятся к моделям антагонистических игр, разве что при обычных играх (шахматы, шашки и т.д.) или при военных операциях малого масштаба, например, когда одна (нападающая) сторона пытается максимизировать вероятность уничтожения некоторого объекта, а другая (обороняющаяся) сторона – минимизировать эту вероятность.
Теория биматричных игр не так хорошо развита, как теория антагонистических игр, и не дает общих рекомендаций по их решению. Исследование таких игр усложняется тем, что игрокам может быть выгодно вступать в коалиции.
Биматричная игра G(mn) с множествами {Ai}, i = 1, …, m, и {Bj}, j = 1, … ,n, игроков A и B соответственно, задается двумя матрицами выигрышей A = ||aij||, B = ||bij||, i = 1, …, m, j = 1, …, n, где элемент aij (bij) – выигрыш игрока A (B) в ситуации, когда игрок A выбирает стратегию Ai, а игрок B – стратегию Bj. Обычно две матрицы заменяются одной ||(aij, bij)||, i = 1, …, m, j = 1, …, n, каждый элемент которой представляет собой пару (aij, bij) соответствующих выигрышей (табл. 4.1).
Таблица 4.18
B An | В1 | … | Вj | … | Вn |
А1 | |||||
… | |||||
Аi | (aij, bij) | ||||
… | |||||
Аm |
4.2.Теория Нэша для некооперативных игр
В качестве решения биматричной игры Дж. Нэшем (J. Nash) [2, 5] предложено считать ситуацию равновесия (SA*, SB*), которая определяется следующим образом.
Определение 4.1. Пара смешанных стратегий (SA*, SB*), где SA* = (pi*), i = 1, …, m, SB* = (qj*), j = 1, …, n, является ситуацией равновесия, если для любых других двух смешанных стратегиях SA = (pi), i = 1, …, m, SB = (qj), j = 1, …, n, игроков A и B выполняются следующие условия:
Согласно определению ситуация равновесия обладает свойством устойчивости, т.е. игрокам не выгодно от нее отступать. Нэш доказал следующую теорему [5].
Теорема 4.1. Каждая некооперативная биматричная игра имеет по крайней мере одну ситуацию равновесия.
Решением биматричной игры является ситуация равновесия, причем, если таких ситуаций несколько, то они должны быть взаимозаменяемы (равноценны). Нэш доказал, что для любой биматричной игры существует ситуация равновесия, но не дал общего метода её поиска.
Рассмотрим примеры биматричных игр, к которым плохо применима теория Нэша.
-
«Дилемма заключенного»
Данная биматричная игра G(22) представлена табл. 4.2.
Таблица 4.19
B An | В1 | В2 |
А1 | (–1; –1) | (–10; 0) |
А2 | (0; –10) | (–6; –6) |
Интерпретация игры следующая.
Два заключенных находятся в разных камерах и подозреваются в совершении одного и того же преступления. Каждый из них располагает двумя стратегиями поведения: кооперативными (молчать и не давать показания) А1 и В1, и некооперативными (давать показания на другого) А2 и В2.
Нетрудно заметить, что вторые стратегии игроков предпочтительнее (доминируют) первых, и, следовательно, ситуацией равновесия будет пара (А2, В2) с выигрышем (–6; –6), но, очевидно, что ситуация (А1, В1), дающая выигрыш (–1; –1) более выгодна сразу для обоих игроков (правда, для ее достижения игрокам необходимо договориться между собой, т.е. вступить в коалицию, иначе можно попасть на невыгодные стратегии (А1, В2) и (А2, В1)).
-
«Конкурирующие фирмы»
Эта биматричная игра G(22) представлена табл. 4.3.
Таблица 4.20
B An | В1 | В2 |
А1 | (5; 5) | (2; 7) |
А2 | (7; 2) | (3; 3) |
Здесь также у игроков (конкурирующих фирм) по две стратегии: стратегии сохранения цен на продаваемый ими товар А1, В1 и стратегии снижения цен А2, В2. Аналогично предыдущей игре вторые стратегии предпочтительнее первых и ситуацией равновесия является пара (А2, В2) с выигрышем (3; 3), но и в этой игре ситуация (А1, В1) с выигрышем (5; 5) более выгодна сразу для обоих игроков (правда, и здесь для ее достижения фирмам необходимо договориться не снижать цены, что может противоречить их интересам).
-
«Семейный спор»
Рассмотри еще одну биматричную игру G(22), представленную табл. 4.4.
Таблица 4.21
B An | В1 | В2 |
А1 | (2; 1) | (–1; –1) |
А2 | (–5; –5) | (1; 2) |
У игроков А – мужа и В – жены имеются по две стратегии: А1 и В1 – пойти на футбол; А2 и В2 – пойти в театр. В данном случае получаем две ситуации равновесия – (А1, В1) с выигрышем (2; 1) и (А2, В2) с выигрышем (1; 2), но так как ситуации равновесия не являются равноценными, то данная игра считается неразрешимой по Нэшу.
4.3.Рефлексивная игра
Для поиска решения биматричной игры может быть использована игровая модель в виде так называемой рефлексивной игры, т.е. игры, в которой игрок моделирует поведение соперника.
Рассмотрим рефлексивную игру на примере приведенной выше игры «конкурирующие фирмы» (см. табл. 4.3) в предположении, что игрок А моделирует поведение (выбор) игрока В. Соответствующая матрица игры G(24) представлена табл. 4.5.
Таблица 4.22
B Ai | В1 | В2 | В3+ | В4– |
А1 | (5; 5) | (2; 7) | (5; 5) | (2; 7) |
А2 | (7; 2) | (3; 3) | (3; 3) | (7; 2) |
У игрока В (в отличие от табл. 4.3) добавились еще две «предполагаемые» стратегии – В3+ – отвечать той же по номеру стратегией, что выбрал игрок А, и В4– – отвечать противоположной стратегией.
Доказано, что в рефлексивной игре выигрывает тот игрок, у которого ранг рефлексии на единицу больше, чем у соперника. Если ранг рефлексии отличается больше, чем на единицу, то исход игры не ясен.
4.4.Практический пример
Пусть имеется фирма, состоящая из двух отделов – производственного (П), в задачу которого входит производство некоторого товара, и транспортного (Т), который должен доставить произведенный товар потребителю. Известно, что доход отдела П от выпуска продукции в объеме одной машины равен a денежных единиц, затраты отдела Т на отправку потребителю одной машины с грузом равен c денежных единиц, а затраты на хранение на складе невывезенной продукции в объеме одной машины составляют b денежных единиц и делятся поровну между отделами П и Т.