85895 (589892), страница 3

Файл №589892 85895 (Методы приближённого решения матричных игр) 3 страница85895 (589892) страница 32016-07-292016-07-29СтудИзба

Методы приближённого решения матричных игр

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 3)

Такой итеративный процесс ведёт игроков к цели медленно. Часто для получения оптимальных стратегий, дающих игрокам выигрыш, приходится проделывать сотни итераций. При этом скорость сходимости заметно ухудшается с ростом размерности матрицы и ростом числа стратегий игроков. Это также является следствием не монотонности последовательностей и . Поэтому, практическая ценность этого метода имеет место, когда вычисления проводятся на достаточно быстродействующих вычислительных машинах. Но наряду с таким недостатком можно выделить и достоинства метода итераций:

Этот метод даёт возможность найти ориентировочное значение цены игры и приближённо вычислить оптимальные стратегии игроков.
Сложность и объём вычислений сравнительно слабо возрастают по мере увеличения числа стратегий игроков (m и n).

Для рассмотренного алгоритма приведена реализация на языке Pascal (см. приложение).

§3. Монотонный итеративный алгоритм решения матричных игр

Предлагаемый для рассмотрения алгоритм реализуется только для одного игрока в отличие от первого, который работает для двух игроков. Алгоритм позволяет находить точно и приближенно оптимальную стратегию игрока 1 и значение цены игры . С помощью алгоритма можно получить заданную точность решения, причём число шагов, необходимых для достижения результатов, слабо зависит от размерности матрицы выигрышей.

Особенность этого алгоритма в способности генерировать строго монотонно возрастающую последовательность оценок цены игры, что не свойственно ранее предлагаемому алгоритму.

Рассмотрим смешанное расширение =(X,Y,K) матричной игры Г_А с матрицей А размера (mn). Процесс разыгрывания игры состоит из нескольких шагов. Пусть каждый из игроков имеет конечное число стратегий.

Введём следующие обозначения:

а_i – i-я строка матрицы выигрышей;

x^N=(₁^N,₂^N,…,_m^N) X – m-мерный вектор, приближение оптимальной стратеги первого игрока на N-шаге (N-номер шага);

c^N=( ) –n-мерный вектор, определяющий средний накопленный выигрыш на N-шаге.

Зададим начальные условия. Пусть на 0-шаге с⁰= , x⁰=(0,…, 1,…, 0), где 1 занимает i₀-ю позицию.

Определим итеративный процесс следующим образом: по известным векторам x^N^-1, c^N^-1 находим векторы x^N и c^N , которые вычисляются по следующим формулам:

г де параметр 0_N1, а векторы вводятся далее.

Как отмечалось, вектор с^N определяет средний накопленный выигрыш игрока 1 на N шаге. Компоненты этого вектора – это числа. В худшем случае игрок 1 может получить минимальное из этих чисел. Примем его за нижнюю оценку цену игры, которую обозначим:

. (4)

Запомним множество индексов J^N^-1=( ), (k

Далее рассмотрим подыгру Г^N игрыГ_А с матрицей выигрышей А^N={ }, i=1,…,m, j^N^-1J^N^-1. Матрица выигрышей состоит из столбцов данной матрицы, номера которых определяются множеством индексов J^N^-1. В этой подыгре Г^N находим одну из оптимальных смешанных стратегий игрока 1: .

После нахождения , находим вектор по правилу:

И рассмотрим игру (2n), в которой у игрока 1 две чистые стратегии, а у игрока 2 – n чистых стратегий. Эта игра задаётся матрицей , решая которую, находим вероятность использования игроком 1 своей стратегии. Это даёт нам коэффициент _N.

Далее вычисляем x^N, с^N и переходим к следующему шагу. Процесс продолжаем до тех пор, пока не выполнится равенство _N=0, потому что по теореме о минимаксе , а их равенство (что и нужно) достигается в этом случае, или пока не будет достигнута требуемая точность вычислений.

Сходимость алгоритма гарантируется теоремой.

Теорема. Пусть {x^N}, {^N} – последовательности, определяемые равенствами (3), (4) . Тогда справедливы следующие утверждения:

т. е. последовательность {^N^-1} строго монотонно возрастает.

3. , где x^*X* – оптимальная стратегия игрока 1.

Доказательства этой теоремы достаточно рутинно. Его можно посмотреть в [15].

Рассмотрим применение этого алгоритма к решению конкретной задачи.

Пример. Решить игру с матрицей А= .

Итерация 0. 1. Пусть игрок 1 выбрал свою 1-ю стратегию, т. е. А⁰=[0, 1, 2]. Тогда за начальные условия примем следующие: x⁰=(1, 0, 0) – приближение оптимальной стратегии игрока 1; c⁰=a₁=(0, 1, 2) – возможный выигрыш игрока 1.

Найдём множество индексов , на которых игрок 1 может получить, в худшем случае, наименьший выигрыш: , значит множество индексов J⁰={1}. Для этого индекса выигрыш равен 0. Это есть значение нижней оценки цены игры, т. е. .

2. На этом шаге определим, пользуясь начальными значениями, компоненты векторов . Для этого рассмотрим подыгру . Для этой подыгры оптимальной стратегией игрока 1 будет его 2-ая стратегия, так как она принесёт ему наибольший выигрыш.

Обозначим её через : =(0, 1, 0). Зная , можем вычислить =0а₁+1а₂+0а₃=а₂=(4, 2, 1).

3. Найдём ₁. Для этого рассмотрим подыгру (23) с матрицей . Решая матрицу графическим способом, получаем, что ₁=1/2.

4. Проведённые вычисления позволяют найти значения векторов x¹, c¹:

x¹=1/2x⁰+1/2 =1/2(1, 0, 0)+1/2(0, 1, 0)=(1/2, 1/2, 0);

c¹=1/2c⁰+1/2 =1/2(0, 1, 2)+1/2(4, 2, 1)=(2, 3/2, 3/2).

Итерация 1. Так как ₁не равно 0, то процесс продолжается дальше. Теперь за начальные условия примем найденные значения векторов x¹, c¹. С их помощью вычисляем , которые с большей точностью будут близки к истинным оптимальным стратегиям игрока 1.

1. Итак, пусть x¹=(1/2, 1/2, 0), c¹=(2, 3/2, 3/2).

Найдём множество индексов , на которых игрок 1 может получить наименьший выигрыш: , значит, J¹={2,3}. Для этих индексов выигрыш равен 3/2. Это есть значение нижней оценки цены игры, т. е. . Заметим, что .

2. Далее найдём компоненты векторов . Для этого рассмотрим подыгру . В силу симметричности матрицы ее решением будет вектор (1/2, 1/2), т. е. 1/2a₁+1/2a₂+0a₃=

=(4/2, 3/2, 3/2).

3. Вычислим коэффициент ₂. Для этого решим подыгру (23): . Стратегии игроков совпадают, поэтому ₂=0. В этом случае цена игры совпадает со своим нижним значением, т. е. . Возвращаемся к предыдущему шагу.

Итак, оптимальной стратегией игрока 1 является x^*=x¹=(1/2, 1/2, 0) и .Задача решена.

На первый взгляд алгоритм практически трудно реализовать, так как не известно, какого размера будет получена матрица для подыгры Г^N. Но на самом деле с вероятностью 1 на каждом шаге придётся решать подыгру размера не больше чем m2.[9]

Инженерами-программистами алгоритм был реализован на языке программирования Фортран-IV. Вычислительные эксперименты, проведённые на ЭЦВМ ЕС-1030, показали, что для игр размерности от 2525 до 100100, элементы, матрицы выигрышей которых были заполнены случайными числами, алгоритм позволяет найти искомое приближение за 100-1000 итераций, причём их число слабо зависит от размера матрицы. Для решения одной задачи машина затрачивает не дольше 8 минут. Ими же были разработаны различные модификации алгоритма. [9]

Приложение

В приложении приведена реализация итеративного метода Брауна-Робинсона решения матричных игр на языке программирования Turbo Pascal 7.0.

Пользователь вводит матрицу выигрышей размера m×n, где m≥3, n≥3.

Далее машина запрашивает информацию о том, кто из игроков начинает игру, какую стратегию он выбирает и количество итераций.

На дисплее выводится таблица разыгрываний игры за определённое число итераций.

program br;

uses crt;

const matr1:array[1..3,1..3] of byte=((0,4,2),

(3,1,0),

(1,2,3)); {Начальная матрица}

var

matr:array [1..10,1..10] of integer; {Матрица, введенная пользователем}

win_one:array[0..150,1..10] of word; {Массив для выигрышей игр.1}

win_two:array[0..150,1..10] of word; {Массив для выигрышей игр.2}

max,min:integer;

a,i,j,m,n,pl,st,st1,st2,kl:byte;

nol,otr:boolean;

function igr_one:byte; {Функция определения следующего}

var a1,a2,max:integer; {хода для игрока 1}

begin

max:=win_one[a,1];

igr_one:=1;

if pl=1 then a2:=m else a2:=n;

for a1:=1 to a2 do if win_one[a,a1]>max then begin

max:=win_one[a,a1];

igr_one:=a1;

end;

function igr_two:byte; {Функция определения следующего}

var a1,a2,min:integer; {хода для игрока 2}

begin

min:=win_two[a,1];

igr_two:=1;

if pl=1 then a2:=n else a2:=m;

for a1:=1 to a2 do if win_two[a,a1]

min:=win_two[a,a1];

igr_two:=a1;

end;

begin

clrscr;

writeln ('Итеративный метод Брауна-Робинсона.');

writeln('Матрица пользователя? (y/n)');

if (readkey='y')or(readkey='Y') then begin {Матрица из памяти или вводит пользователь}

write ('Введите размеры матрицы:');

readln(n,m); {Ввод количества строк и столбцов}

writeln('Введите ',n,' строки по ',m,' элементов:');

nol:=true;

otr:=false;

min:=0;

for j:=1 to n do for i:=1 to m do begin {Ввод элементов матрицы}

read(matr[i,j]);

if matr[i,j]<>0 then nol:=false; {Установка флага, что не все элементы равны 0}

if matr[i,j]<0 then otr:=true; {Установка флага наличия отрицательных элементов}

if matr[i,j]<min then min:=matr[i,j];{Определение минимального элемента}

end

end else begin {Иначе берем матрицу из константы}

n:=3;m:=3;

for i:=1 to m do for j:=1 to n do matr[i,j]:=matr1[i,j];

end;

clrscr;

writeln ('Итеративный метод Брауна-Робинсона.');

if nol then writeln('Все элементы матрицы равны 0!') else begin {если установлен флаг нуля, то алгоритм не работает}

if otr then for j:=1 to n do for i:=1 to m do matr[i,j]:=matr[i,j]-min;{если есть отрицательные элементы,}

writeln('Начальная матрица:'); {Вывод окончательной матрицы}

for j:=1 to n do begin

for i:=1 to m do write(matr[i,j]:4);

writeln;

end;

write('Какой игрок начнет игру? '); {Вод стартовых значений}

readln(pl);

write('Какую стратегию выберет ',pl,' игрок? ');

readln(st);

write('Количество итераций? ');

readln(kl);

a:=1; {заглавие таблицы}

writeln(' № стр. выигрыш 1-го игр. стр. выигрыш 2-го игр. V W Y');

repeat

write(a:2,st:6,' '); {формирование таблицы: номер итерации, стратегия 1игр.}

if pl=2 then begin

for i:=1 to n do begin

win_one[a,i]:=matr[st,i]+win_one[a-1,i];{формирование матрицы выигрышей 1 игр.}

write(win_one[a,i]:4); {вывод на экран}

end;

st1:=igr_one; {определение ответной стратегии 2 игр.}

gotoxy(32,wherey);

write(st1:10,' '); {вывод на экран}

for i:=1 to m do begin

win_two[a,i]:=matr[i,st1]+win_two[a-1,i]; {формирование матрицы выигрышей 2 игр.}

write(win_two[a,i]:4); {вывод на экран}

end;

gotoxy(64,wherey);

write(win_one[a,st1]:4); {вывод наибольшего суммарного выигрыша 1 игр.}

st:=igr_two; {определение ответной стратегии 1 игр.}

write(win_two[a,st]:4); {вывод наибольшего суммарного выигрыша 2 игр.}

write((win_one[a,st1]+win_two[a,st])/(a*2):6:2);{приближенное значение цены игры}

end

else

begin

for i:=1 to m do begin

win_one[a,i]:=matr[i,st]+win_one[a-1,i];{формирование матрицы выигрышей 1 игр.}

write(win_one[a,i]:4);

end;

st1:=igr_one; {определение ответной стратегии 2 игр.}

gotoxy(32,wherey);

write(st1:10,' ');

for i:=1 to n do begin

win_two[a,i]:=matr[st1,i]+win_two[a-1,i];{формирование матрицы выигрышей 2 игр.}

write(win_two[a,i]:4);

end;

gotoxy(64,wherey);

write(win_one[a,st1]:4); {вывод наибольшего суммарного выигрыша 1 игр.}

st:=igr_two; {определение ответной стратегии 1 игр.}

write(win_two[a,st]:4); {вывод наибольшего суммарного выигрыша 2 игр.}

write((win_one[a,st1]+win_two[a,st])/(a*2):6:2);{приближенное значение цены игры}

end;

a:=a+1; {увеличение счетчика итераций}

writeln;

until a=kl+1;

end;

readln;

end.

Список литературы

Беленький В.З. Итеративные методы в теории игр и программировании. М.: «Наука», 1977

Блекуэлл Д.А. Теория игр и статистических решений. М., Изд. иностранной литературы, 1958

Вентцель Е.С. Элементы теории игр. М., Физматгиз, 1961

Вилкас Э.И. Оптимальность в играх и решениях. М.: «Наука», 1986

Воробьёв И.Н. Математическая теория игр. М.: «Знание», 1976

Давыдов Э.Г. Методы и модели теории антагонистических игр. М.: «Высшая школа», 1990

Дрешер М. Стратегические игры. Теория и приложения. М., 1964

Исследование операций в экономике / Н.Ш. Кремер, Б.А. Путко, И.М. Тришин, М.Н. Фридман. М.: «Банки и биржи», Юнити, 1997

Итеративный алгоритм решения матричных игр// Доклады Академии наук СССР, том 238, №3, 1978

Карлин С. Математические методы в теории игр, программировании и экономике. М.: «Мир», 1964

Крапивин В.Ф. Теоретико-игровые методы синтеза сложных систем в конфликтных ситуациях. М.: «Советское радио», 1972

Крушевский А.В. Теория игр: [Учебное пособие для вузов]. Киев: «Вища школа», 1977

Льюис Р., Райфа Х. Игры и решения. М.,1961

Морозов В.В., Старёв А.Г., Фёдоров В.В. Исследование операций в задачах и упражнениях. М.: «Высшая школа», 1996

Матричные игры. [Сборник переводов]. Под ред. Воробьёва И.Н. М., Физматгиз, 1961

Оуэн Г. Теория игр. [Учебное пособие]. М.: «Мир», 1973

Петросян Л.А., Зенкевич Н.А., Семен Е.А. Теория игр. М., 1989

Школьная энциклопедия математика. Ред. С. М. Никольский, М.: 1996, с. 380

Характеристики

Тип файла

Документ

Размер

1,09 Mb

Материал

Методы приближённого решения матричных игр

Тип материала

Выпускная квалификационная работа (ВКР)

Предмет

Математика

Учебное заведение

Неизвестно

Список файлов ВКР

metody-priblizhennogo-resheniya-matrichnyh-igr-1469825428-85895.zip

85895.rtf

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.