Лекции в печатном виде (990087), страница 3
Текст из файла (страница 3)
-
Ситуация с полной информацией.
Ai \Bj | B1(3) | B2(4) | B3(+) | B4(-) | B2(4) | ||
A1(1) | 4 | -5 | 4 | -5 | -5 | ||
A2(2) | -5 | 6 | 6 | -5 | 6 |
B3(+) - игрок В действует также, как и игрок А.
Вводятся две величины:
max min aij = нижняя оценка цены игры
i j
min max aij = верхняя оценка цены игры
i j
Докажем, что <=
Ai \Bj | B1 | … | Bj’ | … | Bj | … | Bn |
A1 | a11 | … | a1j | … | a1j | … | a1n |
… | … | … | … | … | … | … | … |
Ai’ | ai1 | … | ai’j’ | … | ai’j | … | ain |
… | … | … | … | … | … | … | … |
Ai | ai1 | … | aij’ | … | aij | … | ain |
… | … | … | … | … | … | ||
Am | am1 | … | amj | … | amj | … | amn |
aij’ = <=aij<= ai’j’
Если = = V, то говорят, что игра имеет седловую точку, а решением игры является пара чистых стратегий Ai*,Bj* , дающая максимальный выигрыш и минимальный проигрыш равный V равный цене игры.
Теорема 1.
Всякая парная антагонистическая игра с полной информацией решается в чистых стратегиях, причём это решение обладает свойством устойчивости.
Пример:
Ai \Bj | B1(3) | B2(4) | minj |
A1(1) | 4 | -5 | -5 |
A2(2) | -5 | 6 | -5 |
maxi | 4 | 6 |
Ai \Bj | B1(3) | B2(4) | B3(+) | B4(-) | minj |
A1(1) | 4 | -5 | 4 | -5 | -5 |
A2(2) | -5 | 6 | 6 | -5 | -5 |
maxi | 4 | 6 | 6 | -5 |
max min aij = max min aij =
i j i j
min max aij = min max aij =
i j i j
Седловой точки нет (A1 ,B4) = (A2 ,B4) = V = 5
Если нет седловой точки:
-
Однократно, следовательно, необходимо использовать наиболее осторожный метод maxmin.
-
Многократно – используются смешанные стратегии.
то есть каждой стратегии соответствует вероятноть:
Решением будет смешанная стратегия
SA =( p1, p2…, pN)
SB =( q1, q2…, qN)
Теорема 2. (Основная теорема теории игр)
Всякая парная антагонистическая игра имеет хотя бы одно решение, то есть пару стратегий SA*, SB* в общем случае смешанных, дающих устойчивый выигрыш равный цене игры V. И в этом случае можно доказать, что:
<=V<=
SA - чистая стратегия, следовательно SA = (0, …, 0, 1, 0, …. ,0)
Методы решения матричных игр.
Ai \Bj | B1 | … | BN |
A1(1) | |||
… | ||aij|| | ||
AN |
-
Проверить на наличии седловой точки.
-
Если нет седловой точки, то матрицу игры упрощают.
Из матрицы игры исключают доминируемые и дублируемые стратегии.
Задача: найти стратегии SA =( p1, p2…, pN) и SB =( q1, q2…, qN), дающие максимальный средний выигрыш.
Игра mxn, число активных стратегий будет равняться min(m,n)
Определение.
Стратегия Ai доминирует ( ) Ak, то есть Ai
Ak, значит:
Определение.
Стратегия Ai дублирует (=) Ak, то есть Ai = Ak, значит:
Стратегия Bj = Br, i aij = arj
Ai \Bj | B1 | B2 | B3 | B4 | B5 |
A1 | 4 | 7 | 2 | 3 | 4 |
A2 | 3 | 5 | 6 | 8 | 9 |
A3 | 4 | 4 | 2 | 2 | 8 |
A4 | 3 | 6 | 1 | 2 | 4 |
A5 | 3 | 5 | 6 | 8 | 9 |
Пример: игра (5x5)
A2 = A5
Ai \Bj | B1 | B2 | B3 | B4 | B5 |
A1 | 4 | 7 | 2 | 3 | 4 |
A2 | 3 | 5 | 6 | 8 | 9 |
A3 | 4 | 4 | 2 | 2 | 8 |
Ai \Bj | B1 | B3 |
A1 | 4 | 2 |
A2 | 3 | 6 |
A21 = A5
Получим SA = (p1, p2, 0, 0, 0)
SB = (q1, 0, q2, 0, 0)
Метод Лагранжа
Этот метод используется в играх с квадратной матрицей игры G(m,m).
B1 | B2 | |
A1 | а11 | а12 |
A2 | а21 | а22 |
SA=(p1,p2) - вектор вероятностей выбора стратегий игроком А.
SB=(q1,q2) - вектор вероятностей выбора стратегий игроком В.
Пусть игрок А использует смешанные стратегии, а В чистые, тогда выигрыш составит:
V1=a11*p1+a21*p2
V2=a12*p1+a22*p2
если же В также использует смешанные стратегии, то выигрыш составит:
V=( a11*p1+a21*p2)*q1+( a12*p1+a22*p2)*q2
Строится функция Лагранжа:
L=(a11*p1+a21*p2)*q1+(a12*p1+a22*p2)*q2+1*(p1+p2-1)+ 2*(q1+q2-1)
Получим
Пример.
G(2,2)
B1 | B2 | |
A1 | 4 | 2 |
A2 | 3 | 6 |
Метод линейного программирования
Этот метод используется в играх с произвольной матрицей игры G(m,n).
B1 | B2 | … | Bj | … | Bn | |
A1 | а11 | а12 | … | а1j | … | а1n |
A2 | а21 | а22 | … | а2j | … | а2n |
… | … | … | … | … | … | … |
Ai | аi1 | аi2 | … | аij | … | аin |
… | … | … | … | … | … | … |
Am | аm1 | аm2 | … | аmj | … | аmn |
SA=(p1,p2,…, pi,…, pn) - вектор вероятностей выбора стратегий игроком А.
SB=(q1,q2,…, qj,…, qn) - вектор вероятностей выбора стратегий игроком B.
Требование, накладываемое на матрицу - i , j aij>0