Популярные услуги

Любая задача по линалу
КМ-3 Важнейшие аспекты теории графов - любой вариант за 3 суток!
Любая задача по математическому анализу и по интегралам и дифференциальным уравнениям
Решу любую задачу
Любая задача по Линейной алгебре и аналитической геометрии
НОМОТЕХ
Предельные теоремы и математическая статистика
Повышение уникальности твоей работе
Сдам любой тест по дискретке в течение суток на положительную оценку!
Любой реферат по дискретной математике
Главная » Лекции » Математика » Теория игр » Решение игр в смешанных стратегиях

Решение игр в смешанных стратегиях

2021-03-09СтудИзба

Лекция 5.

Тема: «Решение игр в смешанных стратегиях»

Если игра не имеет седловой точки, то применение чистых стратегий не дает оптимального решения игры. В таком случае можно полу­чить оптимальное решение, случайным образом чередуя чистые стратегии.

Смешанной стратегией  игрока А называется применение чистых стратегий  с вероятностями  , причем сумма вероятностей равна 1: = 1. Смешанные стратегии игрока А записываются в виде матрицы:

или в виде строки  Аналогично смешанные стратегии игрока В обозначаются:

или , где сумма вероятностей появления стратегий равна 1: .

Рекомендуемые материалы

Чистые стратегии можно считать частным случаем смешанных и задавать строкой, в которой 1 соответствует чистой стратегии. На основании принципа минимакса определяется оптимальное решение (или решение) игры: это пара оптимальных стратегий в общем случае смешанных, обладающих следующим свойством: если один из игроков придерживается своей опти­мальной стратегии, то другому не может быть выгодно отступать от своей. Выигрыш, соответствующий оптимальному решению, называется ценой игры v. Цена игры удовлетворяет неравенству:

,

где  и - нижняя и верхняя цены игры.

Справедлива следующая основная теорема теории игр — тео­рема Неймана. Каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий.

Пусть  и - пара опти­мальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.

Справедлива теорема об активных стратегиях: если один из игро­ков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры v, если второй игрок не выходит за пределы своих активных стратегий.

Эта теорема имеет большое практическое значение — она дает конкретные модели нахождения оптимальных стратегий при от­сутствии седловой точки.

Рассмотрим игру размера 2х2, которая является простейшим случаем конечной игры. Если такая игра имеет седловую точку, то оптимальное решение — это пара чистых стратегий, соответст­вующих этой точке.

Игра, в которой отсутствует седловая точка, в соответствии с основной теоремой теории игр оптимальное решение существует и определяется парой смешанных стратегий   и .

Для того чтобы их найти, воспользуемся теоремой об активных стратегиях. Если игрок А придерживается своей оптимальной стратегии , то его средний выигрыш будет равен цене игры v, какой бы активной стратегией ни пользовался игрок В. Для игры 2х2 любая чистая стратегия противника является активной, если отсутствует седловая точка. Выигрыш игрока А (проигрыш игрока В) — случайная величина, математическое ожидание (среднее значение) которой является ценой игры. Поэтому средний выиг­рыш игрока А (оптимальная стратегия) будет равен v и для 1-й, и для 2-й стратегии противника.

Пусть игра задана платежной матрицей:

.

Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию , а игрок B – чистую стратегию(это соответствует 1-му столбцу платежной матрицы Р), равен цене игры v:   .

Тот же средний выигрыш получает игрок А, если 2-й игрок применяет стратегию , т.е. . Учитывая, что , получаем систему уравнений для определения опти­мальной стратегии   и цены игры v:

                                        (1)

Решая эту систему, получим оптимальную стратегию

                              (2)   

,                            (3)

и цену игры

.                              (4)

Применяя теорему об активных стратегиях при отыскании оптимальной стратегии игрока В, получаем, что при любой чистой стратегии игрока А (или ) средний проигрыш игрока В равен цене игры v, т.е.

                                         (5)

Тогда оптимальная стратегия определяется формулами:

                               (6)

                               (7)

Применим полученные результаты для отыскания оптималь­ных стратегий для игры «Поиск», рассмотренной в предыдущей лекции. Найти оптимальные стратегии игры «Поиск».

Решение. Игра "Поиск" задана платежной матрицей без седловой точки:

Поэтому ищем решение в смешанных стратегиях; для игрока А средний выигрыш равен цене игры v (при  и ), для игрока В средний проигрыш равен цене игры v (при и ). Системы уравнений в данном случае имеют вид:

                                    

Решая эти системы, получаем

Это означает, что оптимальная стратегия каждого игрока со­стоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью 1/2, при этом средний выигрыш равен 0.

Геометрическая интерпретация игры 2х2

Решение игры 2х2 допускает наглядную геометрическую ин­терпретацию. Пусть игра задана платежной матрицей  По оси абсцисс отложим единичный отрезок ; точка (x=0) изображает стратегию , а все промежуточ­ные точки этого отрезка — смешанные стратегии  первого иг­рока, причем расстояние от  до правого конца отрезка — это вероятность стратегии , расстояние до левого конца — веро­ятность стратегии. На перпендикулярных осях 1—1 и II—II откладываем выигрыши при стратегиях  и соответственно. Если 2-й игрок примет стратегию , то она дает выигрыши  и  на осях 1—1 и II—II, соответствующие стратегиям  и . Обозначим эти точки на осях 1—1 и II—II буквой . Средний выигрыш , соответствующий смешанной стратегии , опреде­ляется по формуле математического ожидания и равен ординате точки , которая лежит на отрезке и имеет абсциссу (рис.1).

рис.1.                                                                                            рис.2.

Аналогично строим отрезок  , соответствующий примене­нию вторым игроком стратегии (рис.2). При этом средний выигрыш  - ордината точки .

В соответствии с принципом минимакса оптимальная страте­гия  такова, что минимальный выигрыш игрока А (при наи­худшем поведении игрока В) обращается в максимум. Ординаты точек, лежащих на ломаной (рис.3), показывают минимальный выигрыш игрока А при использовании им любой смешанной стратегии (на участке против стратегии на участке  — против стратегии ). Оптимальную стратегию

определяет точка N, в которой минимальный выигрыш достигает максимума; ее ордината равна цене игры v. На рис3 обозначе­ны также верхняя и нижняя цены игры и.

Пример 2.

Применим геометрический метод для решения следующей за­дачи. Решить графически игру, заданную платежной матрицей:

Рис.3                                                                                   Рис.4

Решение. Откладываем по оси абсцисс (рис.4) единичный отрезок  . На вертикальной оси 1—1 откладываем отрезки: = 1,5, соответствующий стратегии и = 3, соответствующий стратегии . На вертикальной оси II—II отрезок  = 2 соответ­ствует стратегии , отрезок  = 1 соответствует стратегии ( рис.4). Нижняя цена игры . Верхняя цена игры , седловая точка отсутствует. Из рис.4 видно, что абсцисса точки N определяет оптимальную стратегию , а орди­ната — цену игры v. Точка  N является точкой пересечения прямых  и . Уравнение прямой , проходящей через точ­ки (0; 1,5) и (1; 2):

 или

Уравнение прямой , проходящей через точки (0; 3) и (1;1):

 или

Точка пересечения прямых является решением системы:

или х = 0,6; у == 1,8, т.е. N (0,6; 1,8).

                        Рис.5

Таким образом, ;оптимальная страте­гия=(0,6;0,4), цена игры v=1,8

Геометрически мо­жно также определить оптимальную  страте­гию игрока В, если поменять местами иг­роков А и В и вместо максимума    нижней границы  в соот­ветствии с принципом минимакса (рис.5) рассмотреть минимум верхней границы.

Абсцисса точки М определяет в оптимальной стратегии игрока В, ордината этой точки -цена игры. Прямая проходящая через точки (0; 1,5) и (1; 3), удовлетворяет уравнению

Прямая , проходящая через точки (0; 2) и (1; 1), удовле­творяет уравнению у = -х +2.

Координаты их точки пересечения М - это решение системы уравнений:

откуда х = 0,2; у = 1,8, т.е. =0,8,

Оптимальное решение игры найдено.

Вместе с этой лекцией читают "Протокол межсетевого взаимодействия IP".

Рис. 6                                                                                  Рис. 7

Из решения задачи следует, что геометрически можно оп­ределять оптимальную стратегию как игрока А, так и игрока B, в обоих случаях используется принцип минимакса, но во втором случае строится не нижняя, а верхняя граница выигрыша и на ней определяется не максимум, а минимум. Если платежная мат­рица содержит отрицательные числа, то для графического реше­ния задачи лучше перейти к новой матрице с неотрицательными элементами; для этого к элементам исходной матрицы достаточно добавить соответствующее положительное число. Решение игры при этом не изменится, а цена игры увеличится на это число. В задаче платежная матрица не имела седловой точки ().

При наличии седловой точки графическое решение дают вариан­ты, изображенные на рис.6 и рис.7. На рис.6 наибольшей орди­натой на ломаной  обладает точка , поэтому оптимальной является чистая стратегия  для игрока А ( -  для игрока В), т.е. оптимальное решение: = (0; 1),   = (0; 1). Игра имеет седловую точку  = v.

Чистая стратегия  (рис.7) не выгодна для игрока В, поскольку при любой стратегии игрока А она дает последнему больший выигрыш, чем чистая стратегия . На основании принципа минимакса выделим прямую  и на ней точку  с наибольшей ординатой на оси I-I. Чистая стратегия является оптимальной для игрока А, а чистая стратегия - для игрока В. Оптимальное решение:  цена игры , т.е. имеется седловая точка.

Графический метод можно применить также при решении игры 2 и m 

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5160
Авторов
на СтудИзбе
439
Средний доход
с одного платного файла
Обучение Подробнее