Лекции в печатном виде (990087), страница 4
Текст из файла (страница 4)
Для того, чтобы произвольная матрица удовлетворяла этому требованию ищется M=мах(|аij||aij0) и прибавляется ко всем элементам, получаем aij+M>0.
Пусть А выбирает смешанную(оптимальную) стратегию, а В чистую:
Тогда:
Получаем задачу линейного программирования:
при системе ограничений (*).
Решив ее, найдем (x1, x2,…, xm) и
Зная V, найдем pi=xi*V.
Итерационный метод Брауна-Робинсона
Этот метод ориентирован на произвольную игру G(m,n).
Не требует условия aij>0.
Рассмотрим метод на примере игры G(3,3).
B1 | B2 | B3 | |
A1 | 7 | 2 | 9 |
A2 | 2 | 9 | 0 |
A3 | 9 | 0 | 11 |
SA=(p1,p2,p3)
SB=(q1,q2,q3)
Строится следующая матрица:
| i | B1 | B2 | B3 | j | A1 | A2 | A3 | V | V | V* |
1 | 3 | 9 | 0 | 11 | 2 | 2 | 9 | 0 | 0 | 9 | 4.5 |
| 2 | 11 | 9 | 11 | 2 | 4 | 18 | 0 | 4.5 | 9 | 6.75 |
| 2 | 13 | 18 | 11 | 3 | 13 | 18 | 11 | 3.67 | 6 | 4.84 |
4 | … | … | … | … | … | … | … | … | … | … | … |
где:
k – номер партии
i – номер стратегии, выбираемой игроком A
j – номер стратегии, выбираемой игроком В
Bi – накопленный игроком А выигрыш за k партий, при условии,
что в данной партии B выбирает стратегию Bi
Аj – накопленный игроком В проигрыш за k партий,
при условии, что в данной партии A выбирает стратегию Аj.
V – нижняя оценка игры = min (накопленный выигрыш)/k
V – верхняя оценка игры = max (накопленный проигрыш)/k
Доказано, что
V *=(V+V)/2, V* V при k и
- cколько раз выбирается Аi стратегия
- cколько раз выбирается Bj стратегия
Пример. Задача о двух КБ
Объявлен конкурс на выполнение 2-х проектов.
На проект 1 выделено а денежных единиц.
На проект 2 выделено b денежных единиц.
В конкурсе участвуют 2 КБ:
КБ1(А) – 4 отдела,
КБ2(В) – 3 отдела.
Практика показывает, что если КБ выделяет больше отделов на проект, то оно и получает этот проект, если же они выделяют одинаковое количество отделов, то получения проекта КБ1 и КБ2 равновероятны.
Стратегии:
(,) - - количество отделов, выделяемых под первый проект
- количество отделов, выделяемых под второй проект
КБ1(А):
А1=(4,0); А2=(3,1); А3=(2,2); А4=(1,3); А5=(0,4).
КБ2(В):
В1=(3,0); В2=(2,1); В3=(1,2); В4=(0,3);
Для того, чтобы свести парную игру к антагонистической, вычисляем средний выигрыш – (a+b)/2 и вычитаем его из V.
G(5,4):
В1 | В2 | В3 | В4 | |
А1 | а/2 | (a-b)/2 | (a-b)/2 | (a-b)/2 |
А2 | b/2 | a/2 | (a-b)/2 | (a-b)/2 |
А3 | (b-a)/2 | b/2 | a/2 | (a-b)/2 |
А4 | (b-a)/2 | (b-a)/2 | b/2 | a/2 |
А5 | (b-a)/2 | (b-a)/2 | (b-a)/2 | b/2 |
Пусть а=b.
В1 | В2 | В3 | В4 | |
| a/2 | 0 | 0 | 0 |
А2 | a/2 | a/2 | 0 | 0 |
| 0 | a/2 | a/2 | 0 |
А4 | 0 | 0 | a/2 | a/2 |
| 0 | 0 | 0 | a/2 |
В1 | В4 | |
А2 | a/2 | 0 |
А4 | 0 | a/2 |
SA=(0,1/2,0,1/2,0)
SB=(1/2,0,0,1/2)
p1=p2=1/2
q1=q2=1/2
V=( a11*p1+a21*p2)*q1+( a12*p1+a22*p2)*q2=a/4
VКБ1=a/4+a=5a/4
VКБ2=3a/4
Парная игра с произвольной суммой.
(биматричная игра).
И
Аm \Bn | В1 | … | Вn |
А1 | |||
… | || aij|| | ||
Аm |
Аm \Bn | В1 | … | Вn |
А1 | |||
… | || bij|| | ||
Аm |
Выигрыши игрока А Выигрыши игрока В
Д
Аm \Bn | В1 | … | Вn |
А1 | |||
… | ( aij ,bij ) | ||
Аm |
Нет общей теории решения биматричных игр.
В данном классе игр могут быть коалиции, договорённости.
Теория некооперативных игр Нэша.
Аm \Bn | В1 | … | Вn |
А1 | |||
… | ( aij ,bij ) | ||
Аm |
Необходимо найти решение в виде:
SA =( p1, p2…, pN)
SB =( q1, q2…, qN)
Вводится понятие – ситуация равновесия:
SA*=( pi*) i=1..m
SB*=( qj*) j=1..n
Определение.
SA* и SB* является ситуацией равновесия, если онаудовлетворяет следующим условиям:
По Нэшу, решением биматричной игры является ситуация равновесия при условии, что они взаимозаменяемы.
Нэш доказал, что для любой биматричной игры существует ситуация равновесия, но нет общего метода её поиска.
Модели биматричных игр, к которым плохо применима теория Нэша.
Аm\Bn | В1 | В2 |
А1 | (-1,-1) | (-10,0) |
А2 | (0,-10) | (-6,-6) |
-
Проблема узника.
Игра 2х2.
Два узника находятся в разных камерах,
Обвиняются в одном преступлении.
Интерпретация стратегий:
А1 В1 – кооперативная стратегия – молчать.
А2 В2 – некооперативная стратегия – давать показания на другого.
А2 А1 и В2
В1 вторые стратегии доминируют , и ситуацией равновесия будет А2 В2 = ( -6 , -6 ), но точка ( -1 , -1 ) более выгодна.
Аm\Bn | В1 | В2 |
А1 | (5,5) | (2,7) |
А2 | (7,2) | (3,3) |
-
Конкурирующие фирмы.
А1 В1 – сохранение уровня цен.
А2 В2 – снижение цен.
По теории Нэша:
А2 А1 и В2
В1 , следовательно ситуацией равновесия будет
А2 В2 = ( 3 , 3 ), но лучше точка А1 В1 = ( 5 , 5 ).
Аm\Bn | В1 | В2 |
А1 | (2,1) | (-1,-1) |
А2 | (-5,-5) | (1,2) |
-
Семейный спор.
А – муж.