Лекции в печатном виде (990087), страница 6

Файл №990087 Лекции в печатном виде (Лекции в печатном виде) 6 страницаЛекции в печатном виде (990087) страница 62015-08-222015-08-22СтудИзба

Лекции в печатном виде

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 6)

V_i(B_j)=(_i, _j)  (max, max)

	B₁	B₂	B₃	min(_i,_i)
V₁	(1,4)	(1,3)	(1,3)	(1,3)
V₂	(2,3)	(2,3)	(2,4)	(2,3)
V₃	(3,4)	(3,3)	(3,2)	(3,2)
V₄	(4,3)	(4,2)	(4,3)	(4,2)
V₅	(5,2)	(5,3)	(5,2)	(5,2)
V₆	(6,3)	(6,2)	(6,1)	(6,1)
V₇	(7,1)	(7,2)	(7,3)	(7,1)

V₂ V₁

V₅ V₃, V₄

V₇ V₆

Получили множество Парето {V₂, V₅, V₇}

а) вирус тяжелый, но не массовый - V₂

б) вирус не очень сильный, но массовый - V₇

в) средний случай - V₅

Общие выводы по теоретико-игровым моделям.

Игровая модель является математическим упрощением реального конфликта, и при этом вводятся следующие основные предположения:

Предполагается, что противник также разумен как и сам игрок.
Теория игр ориентирует ЛПР на наиболее осторожное поведение, на

исключение риска (определенный риск в играх с “природой”)

Предполагается, что игроку известны все стратегии противника,

неизвестно лишь то, какую он выберет в процессе игры.

Пример.

Нужно перевести груз по морю из начального пункта А в конечный пункт В

S_K

S_Н

А₃

А₁

А₂

П₁ – шторм;

П₂ – туман;

П₃ – ясно.

	П₁	П₂	П₃	_i	w_i	h_i
А₁	0	10	20	0	20	8
А₂	-100	0	200	-100	200	20
А₃	10	10	10	10	10	10

	П₁	П₂	П₃	S_i
А₁	10	0	180	180
А₂	110	10	0	110
А₃	0	0	190	190

Вальд - А₃

Сэвидж - А₂

Гурвиц - А₂

Если все события равновероятны

q₁ =q₂=q₃=1/3

a₁=10

a₂=100/3  А₂

a₃=10

r₁=190/3=63

r₂=120/3=40  А₂

r₃=63

то и Лаплас дает вторую стратегию. Но путь А₂в 2/3 случаев опасен.

Пример 2. Случай в Ново-Гвинейском море

о.Н.Британия

юг

север

Японцы: Американцы:

Я₁ – юг А₁ – послать самолеты на юг

Я₂ - север (есть три дня на бомбежку)

А₂ – послать самолеты на север

(1день – поиск,2 – бомбежка)

	Я₁	Я₂	min
А₁	3	1	1
А₂	2	2	2
max	3	2

2 – седловая точка

Рациональное и иррациональное поведение ЛПР.

Теория рационального поведения. (Теория ожидаемой полезности).

Фон Нейман, О Моренштерн.

6 аксиом.

Функция ожидаемой полезности.

Лотерея:

А – множество исходов: x, y, z, …

Известны вероятности исходов: p, q, r, …

(x, p, y) – вектор с двумя возможными исходами:

x => p

y => 1-p

p X

1-p Y

Лотерея обозначается следующим образом:

Средняя цена лотереи (x, p, y): xp + y(1-p)

Аксиомы рационального выбора:

А1: Все возможные исходы должны принадлежать А.

x (x A)

А2: На множестве исходов должно быть задано отношение строго предпочтения P(>), нестрогого R( ), безразличия I( ), причём P R, I R и они удовлетворяют двум условиям:

Связности, то есть либо справедливо xRy, либо yRx.
Транзитивности, то есть из xRy & yRz => xRz.

А3: Две лотереи ((x, p, y), q, y) и (x, pq, y), находятся в состоянии безразличия, то есть справедливо: ((x, p, y), q, y) I (x, pq, y)

p X

1-p Y

1-q Y

pq X

1-pq Y

А4: Если xIy, то (x, p, z) I (y, p, z).

А5: Если xPy, то xP(x, p, y)Py.

А6: Если xPyPz, то существует вероятность p, такая, что yI(x, p, z).

Теорема:

Если выполняются аксиомы А1-А6, то существует информация полезности, определяемая на множестве исходов А, для которых выполняются следующие условия:

xRy  U(x) U(y).
U(x,p,y) = pU(x) + (1-p)U(y)

U(x) U(y), aU(x) aU(y) При a>0

Пример.

Есть два типа урн.

I тип

6 красных

4 чёрных

I I тип

3 красных

7 чёрных

700 штук 300 штук

Решение ЛПР:

d1 +350 (если угадано верно)

- 50 (если не верно)

d2 +500 (если угадано верно)

- 100 (если не верно)

Тип урны	Вероятность выбора урны	Выигрыш при выборе
Тип урны	Вероятность выбора урны	d1	d2
1	0.7	350	-100
2	0.3	-50	500

U(d1) = 0.7*350 – 0.3*50 = 230

U(d2) = -0.7*100 + 0.3*500 = 80

d1 – предпочтительнее.

Процесс выбора в ЛПР или ДР.

- личный ход. – случайных ход.

350

0.7

230

d1 0.3

-50

-100

d2 0.7

0.3

500

P(y1|к)

0.82 350

278

0.18 -50

P(y2|к)

230 d1

0 0.18

P(y1|к) 500

0.51 278 d2 8

-60 к 0.82

P(y2|к) -100

ч 178 350

0.49 d1 178 P(y1|ч)

P(y2|ч) -50

500

P(y1|ч)

158

P(y2|ч)

-100

P к(y1) = P(к|н1) = 0.6

Вероятность вытянуть красный шар из

у рны 1

Pк(y2) = 0.3

Pч(y1) = 0.4

P ч(y2) = 0.7

P к = P(к) = Pк(y1)*P(y1) + Pк(y2)*P(y2) =

= 0.6*0.7 + 0.3*0.3 = 0.51

Pч = 0.49

P(y1|к) = 0.6*0.7/0.6*0.7 + 0.3*0.3 = 0.82

P(y2|к) = 0,18

P(y1|ч) = 0,57

P(y2|ч) = 0,43

P(y_i|к) = (Pк(y_i)* P(y_i)) /

/ (Pк(y1)*P(y1) + Pк(y2)*P(y2))

Парадоксальные поведения ЛПР.

Парадокс Алле:

Л1

d1 1 мин

5 мин

d2 0.1

0.85

1 мин

0.01

Л2

0.1

d1 0.9

d2 0.11

0.85

U(5) = 1 U > 0.1*1 + 0.85*U U > 10/11 U < 10/11

U(2) = U

U(0) = 0

Теория субъективной ожидаемой полезности

Позволяет формализовать иррациональное поведение ЛПР.

Пример. Парадокс генерала.

Генерал проиграл сражение. Чтобы спасти остатки армии, у него есть 2 пути отступления:

Ситуация Л1:

2000 спасены

1/3 6000 спасены

d2 2/3 0 спасены

Большинство ЛПР выбирают d1.

Ситуация Л2:

4000 погибает

1/3 никто не погибает

d2 2/3 6000(все) погибают

Большинство ЛПР выбирают d2

В зависимости от того, в терминах выигрышей или потерь сформулирована задача, выбираютс различные решения.

Для того чтобы учесть поведение человека, был исследован ряд эвристик, которые побуждают ЛПР действовать нерационально:

1. Суждение по представительности.

Принимая решение, ЛПР сравнивает ситуацию a c типовой ситуацией из

класса K и принимает такое же решение.

Пример

Пусть есть 2 группы специалистов

Г1: 70 инженеров + 30 юристов

Г2: 30 инженеров + 70 юристов

Дается типовое описание представителя класса инженеров и юристов.

Предъявляется субъект, и определяется, с какой вероятностью он является

инженером и юристом. При этом ЛПР принимает решение, не учитывая

вероятности.

2. Суждение по встречаемости.

Принимая решение, ЛПР ориентируется на частоту встречаемости данного

явления в своей повседневной жизни.

3. Суждение по точке отсчета.

Начальная информация может существенно влиять на принятие решения.

4. Сверхдоверие ЛПР к собственному опыту.

5. Стремление к исключению риска.

ЛПР, скорее всего, выберет не самое лучшее решение, чтобы избежать риска

больших потерь.

Причины нерационального поведения ЛПР

Недостаток информации у ЛПР в процессе принятия решения.
Недостаток опыта.
Поиск относительно множества критериев.
Временные ограничения.

Основные постулаты теории субъективной ожидаемой полезности

(Теории проспектов)

1). Эффект определенности

ЛПР, как правило, предпочитает детерминированный исход

недетерминированному.

Характеристики

Тип файла

Документ

Размер

1,2 Mb

Материал

Лекции в печатном виде

Тип материала

Лекции

Предмет

Теория игр и исследование операций

Высшее учебное заведение

НИУ «МЭИ»

Список файлов лекций

lekcii-v-pechatnom-vide-377133764-1440253403.rar

Лекции в печатном виде.doc

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.