МС лекции (1086519), страница 9
Текст из файла (страница 9)
К поиску решения игры в смешанных стратегиях, так же как и в п. 4.3., могут быть применены критерии максимина-минимакса. В соответствии с ними игрок I будет выбирать свою смешанную стратегию x = (x1, x2 … xm).
Таким образом, чтобы максимизировать наименьший средний выигрыш:
который, как можно доказать, равен
а игрок II – свою смешанную стратегию так, чтобы минимизировать наибольший средний проигрыш:
также равный
По аналогии с (3) для любых
и
справедливо неравенство
Стратегии
и
называют оптимальными смешанными стратегиями, если для любых
и
справедливо равенство
v =
(x*, y*) называют ценой игры, и если x* и y* существуют, то говорят, что игра имеет решение в смешанных стратегиях (x*, y*, v*).
Справедлива фундаментальная теорема Дж.Неймана, которую мы приведем без доказательства.
Теорема (основная теорема матричных игр):
Любая матричная игра имеет решение в смешанных стратегиях.
Значение и нетривиальность теоремы обусловлены прежде всего тем, что, как было показано в п. 4.3, в общем случае матричные игры в чистых стратегиях решения не имеют.
3.5. Решение матричных игр методами линейного программирования. Рассмотрим некоторые способы решения матричных игр. Задача, решаемая первым игроком, (6.10) была сформулирована как максимизация наименьшей из сумм
, но если определить некоторое xm+1, для которого выполняется
то она может быть сведена к задаче линейного программирования:
при ограничениях
Проведя аналогичные рассуждения, приходим к тому, что задача минимизации наибольшего ожидаемого проигрыша, решаемая игроком П (12), сводится к задаче линейного программирования
Таким образом, мы получаем возможность применять все возможности аппарата линейного программирования для поиска оптимальных стратегий
обоих игроков.
Достаточно легко проверить, что задачи (16)-(17) и (18)-(19) образуют двойственную пару. Здесь в определнном смысле мы вернулись к проблемам, уже рассматривавшимся во второй главе, а именно к взаимосвязи между наличием решения у некоторой оптимизационной задачи и существованием седловой точки у соответствующей функции Лагранжа. В данном случае аналогичная связь прослеживается между седловой точкой игры и решением пары задач оптимизации.
3. ЗАДАНИЯ НА КОНТРОЛЬНЫЕ РАБОТЫ
3.1. Методические указания.
Контрольная работа выполняется в отдельной тетради или на листах формата А4 в соответствии с требованиями данной контрольной работы. Каждая работа должна иметь титульный лист (Приложение 1).
В начале каждой работы указывается номер варианта, который определяется студентом, как остаток от деления на 9 числа из двух последних цифр зачетной книжки. Например, номер зачетки - 98144, тогда 44 делится на 9 и номер варианта - 8. Если остаток от деления равен нулю, то номер варианта принимается равным 10.
После проверки контрольной работы она возвращается студенту с отметкой “зачет”, если же работа не зачтена, она дорабатывается студентом и сдается на повторную проверку. Все исправления и добавления помещаются в той же тетради, что и основная работа, но не в тексте основной работы, а в конце.
3.2. Контрольная работа № 1 (часть 1)
Содержание контрольной работы
1. Определить номер варианта контрольной работы и привести полный текст задания.
2. Решить первую и вторую задачу варианта. Комментировать шаги решения. Выделить результат, полученный по данному алгоритму.
3. Во второй задаче варианта рассматривается одноканальная СМО с отказами. В данную СМО поступает пуассоновский поток заявок. Время между моментами поступления двух последовательных заявок распределено закону f(x). Время обслуживания заявок случайное и распределено по закону f1(t). Найти методом Монте-Карло за время Т: а) среднее число обслуженных заявок, б) среднее время обслуживания одной заявки, г) вероятность отказа. Произвести шесть испытаний.
Пример выполнения контрольной работы дан в приложении 2.
Задания для контрольной работы № 1
Вариант 1.
1. Смоделировать восемь возможных значений дискретной случайной величины Х, закон распределения которой задан в виде таблицы:
Х | 3 | 8 | 12 | 23 |
| р | 0.2 | 0.12 | 0.43 | .023 |
2. f(x) = 0,1exp(-0,1x), f1(t) = exp(-t), T = 10 мин
Вариант 2.
1. Смоделировать шесть опытов по схеме Бернулли: опыт состоит из четырех испытаний, в каждом из которых вероятность появления события А равна 0.5.
2. f(x) = 0,2exp(-0,2x), f1(t) =1,1 exp(-1,1t), T = 15 мин
Вариант 3.
1. Смоделировать пять опытов по схеме Бернулли: опыт состоит из трех независимых испытаний, в каждом из которых вероятность появления события А равна 0.4.
2. f(x) = 0,2exp(-0,2x), f1(t) = 1,2exp(-1,2t), T = 20 мин
Вариант 4.
1. Найти явную формулу для моделирования непрерывной случайной величины Х, распределенной равномерно в интервале (а, в), зная ее функцию распределения F(x) = (x-a)/(b-a), а <x< в.
2. f(x) = 0,3exp(-0,3x), f1(t) = 1,4exp(-1,4t), T = 25 мин
Вариант 5.
1. Смоделировать четыре возможных значения непрерывной случайной величины Х, распределенной равномерно в интервале (4, 14).
2. f(x) = 0,4exp(-0,4x), f1(t) = 1,5exp(-1,5t), T = 30 мин
Вариант 6.
1. Найти явную формулу для моделирования непрерывной случайной величины Х, распределенной по показательному закону, заданному функцией распределения F(x) = 1- exp(-ax).
2. f(x) = 0,5 exp(-0,5x), f1(t) = 1,2exp(-1,2t), T = 15 мин
Вариант 7.
1. Найти явную формулу для моделирования непрерывной случайной величины Х, заданной плотностью вероятности f(x) = b/(1+ax)2 в интервале [0, 1/(b- а)], вне этого интервала f(x) =0.
2. f(x) = 0,6exp(-0,6x), f1(t) = 1,3exp(-1,3t), T = 20 мин
Вариант 8.
1. Смоделировать пять возможных значений непрерывной случайной величины Х, заданной плотностью вероятности f(x) = 10/(1 + 2x)2 в интервале [0. 1/8], вне этого интервала f(x) =0.
2. f(x) = 0,7 exp(-0,7x), f1(t) = 1,4exp(-1,4t), T = 25 мин
Вариант 9.
1. Найти явную формулу для моделирования непрерывной случайной величины Х, заданной плотностью вероятности f(x) = 2 в интервале (0, 0,5), вне этого интервала f(x) =0.
2. f(x) = 0,2exp(-0,2x), f1(t) = 2exp(-2t), T = 10 минt
Вариант 10.
1. Разыграть пять возможных значений непрерывной случайной величины Х, распределенной по показательному закону, заданному плотностью вероятности F(x) = 0,1 exp(-0,1x) в интервале (0, ~), вне этого интервала f(x) =0.
2. f(x) = 0,8exp(-0,8x), f1(t) =2,5 exp(-2,5t), T = 30 мин
3.3. Контрольная работа № 1 (часть 2)
Содержание контрольной работы
1. Определить номер варианта и привести полный текст задания.
2. В первой задаче варианта необходимо определить, потоком Эрланга какого порядка можно заменить рассматриваемый поток, для которого известны математическое ожидание и среднеквадратическое отклонение.
3. Во второй задаче определите тип СМО, нарисуйте граф переходов для данной СМО, проверьте стационарность СМО, рассчитайте требуемые характеристики СМО.
4. В третьей задаче построить граф передач для описанной сети СМО, построить матрицу передач, рассчитать интенсивности потоков для каждой СМО, проверить стационарность сети, и если сеть не стационарна, подобрать необходимое количество каналов в соответствующих СМО и добиться не стационарности сети.
Пример выполнения контрольной работы дан в приложении 2.
Вариант 1
1. mt = 4 мин, tмин
2. Интенсивность прихода заявок в одноканальную СМО равна 5, интенсивность обслуживания - 6, Очередь в СМО не ограничена. Найти:
а) вероятность того, что в системе находится ровно три заявки,
б) вероятность занятости системы,
в) вероятность отказа,
г) вероятность того, что есть требования в очереди,
д) среднее время ожидания в очереди.
3. Партии комплектующих деталей поступают в цех сборки в среднем каждую минуту. В этом цеху изделие собирается целиком и отправляется в отдел технического контроля для проверки. При проверке изделий признаются годными только 40%, остальные требуют доработки, Причем часть негодных изделий имеют мелкие недоработки и отправляются в цех наладки, после которого снова попадают в ОТК, а часть негодных изделий имеют серьезные неполадки, допущенные при сборке и отправляются снова в цех сборки. Соотношение этих изделий составляет 5:1 соответственно. На сборку одного изделия затрачивается в среднем 3 мин. На проверку качества - 30 сек. и на наладку - 2 мин.
Вариант 2
1. mt = 5,5 мин, tмин
2.Два рабочих обслуживают группу из шести станков. Остановки каждого работающего станка происходят в среднем каждые полчаса. Процесс наладки занимает в среднем 10 мин.
Определить:
а) среднее число занятых рабочих,














