Тема 5. Принятие решений в условиях риска (Лекции и семинары (материалы к занятиям))
Описание файла
Файл "Тема 5. Принятие решений в условиях риска" внутри архива находится в папке "Лекции и семинары (материалы к занятиям)". PDF-файл из архива "Лекции и семинары (материалы к занятиям)", который расположен в категории "". Всё это находится в предмете "управленческие решения" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. Архив можно найти в разделе "лекции и семинары", в предмете "управленческие решения" в общих файлах.
Просмотр PDF-файла онлайн
Текст из PDF
Тема 5. Принятие решений в условиях риска.Рассмотрим случай, когда в модели проблемной ситуации имеютсяслучайные факторы λ∈Λ с известными законами распределения вероятностей.В таких задачах связь между реализацией определенной стратегии s∈S инаступлением некоторого исхода g∈G неоднозначна: в зависимости от значенияпараметра λ, может наступить тот или иной исход, т.о. g=ψ(s,λ).Пусть G = {g1,…,gn} – множество исходов, pi(s) – вероятность исхода gi прииспользовании стратегии s∈S.Пусть исходы оцениваются по единственному критерию K(g) (предполагаем,что чем больше K(g), тем лучше), тогда K’(s)=K(ψ(s,λ)) – значение критерия привыборе стратегии s – является случайной величиной с законом распределениявероятностей: F(x,s) = P(K’(s)<x).Теоретически мы можем построить R’ – отношение стохастическогодоминирования:R’ = { <s,t> | F(x,s) ≤ F(x,t) ∀x).Такимобразом,sR’t ⇔ ∀x [ P(K’(s)<x) ≤ P(K’(t)<x)], т.е.
стратегия s доминирует над стратегией t,если вероятность P того, что значение критерия K’ при её выборе будет меньшенекоторого произвольно заданного числа x, не превосходит такой вероятности вслучае выбора t.ПоR’можнопостроитьP’–отношениестрогогостохастическогодоминирования и I’ – отношение стохастического безразличия, а дальше задачабудет сводиться к нахождению множества S* максимальных по P’ стратегий –т.н. недоминируемых стратегий.Однако, на практике отношение R’ (и тем более P’) содержит, как правило,очень малое число пар, поэтому такой принцип оптимальности будет оченьслабым (будет давать мало или вообще 0 вариантов).Поэтому применяют другие принципы оптимальности, основанные напреобразованиистатистики),сK’(s)впомощьючисловуюкоторойфункциювсе(методамистратегииматематическойсравниваютсяпопредпочтительности и из них выбирается оптимальная.
Например:1)принцип гарантированного результата (выбираем стратегии,дающие наилучшие значения К’ при наихудшем λ);2)принцип среднего результата (выбираем стратегии, которые, всреднем, дают лучшее значение K’): M[K’(s)] → max;3)принцип кучности результата (выбираем стратегии, при которыхдисперсия значений K’ при разных λ минимальна): D[K’(s)] → min.На практике закон распределения K’(s) и его характеристики (M[K’(s)] –математическое ожидание и D[K’(s)] – дисперсия) определяются опытным путем(методом статистических испытаний).Существуют и другие методы принятия решений в условиях риска.
Ониоснованы на построении функции полезности по фон Нейману и Моргенштерну.Отношение ЛПР к риску и ожидаемая полезностьПри наличии случайных факторов в задаче принятия решений необходимоучитывать не только предпочтения ЛПР по отношению к различным исходам, но иего отношение (склонность) к риску.Фактически, решение поставленной нами исходной задачи принятиярешений в условиях риска, сводится к выбору среди набора альтернативныхлотерей l, в которых различные исходы g1,…,gn, называемые выигрышами,наступают с соответствующими вероятностями p1l,…,pnl , причем p1l+…+pnl = 1.Пример 1:У ЛПР имеется возможность принять участие в одной из двух лотерей: l1,участвуя в которой, он выиграет 200 р.
с вероятностью 0.9 или проиграет 800 р.с вероятностью 0.1; и l2, участвуя в которой, с вероятностью 0.9 он ничего невыиграет и не проиграет, а с вероятностью 0.1 выиграет 1000 р. В какой из нихему выгоднее участвовать?Итак, g11 = 200, p1(g11) = 0.9, g12 = –800, p1(g12) = 0.1 – в лотерее l1,g21 = 0, p2(g21) = 0.9, g22 = 1000, p2(g22) = 0.1.m1 = p1(g11)⋅g11+p1(g12)⋅g12 = 200⋅0.9 + (–800)⋅0.1 = 100.m2 = p2(g21)⋅g21+p2(g22)⋅g22 = 0⋅0.9 + 1000⋅0.1 = 100.Таким образом, математические ожидания выигрышей (средние величины)m1 = m2, т.е. эти лотереи одинаковы по принципу среднего результата.Δ1 = |g12 – g11| = |–800–200| = 1000, Δ2 = |g22 – g21| = |1000–0| = 1000, т.е.разброс выигрышей в этих лотереях одинаковый.D1 = (g11 – m1)2⋅p1(g11) + (g12 – m1)2⋅p1(g12) = (200–100)2⋅0.9+(–800–100)2⋅0.1 = 90000,D2 = (g21 – m2)2⋅p2(g21) + (g22 – m2)2⋅p2(g22) = (0–100)2⋅0.9++(1000–100)2⋅0.1 = 90000, таким образом, дисперсии совпадают, т.е. эти лотереиодинаковы и по принципу кучности.Однако по содержательному смыслу эти лотереи совершенно различны:лотерея l2 беспроигрышная, но выигрывают в ней редко, зато приличную сумму, ав лотерее l1 ЛПР скорее всего выиграет небольшую сумму, но можете и програть,причем не мало.
Таким образом, на первый план встает задача выявлениясклонности ЛПР к риску.По фон Нейману и Моргенштерну, при выполнении некоторых достаточнообщихусловийсуществуетфункцияполезностиf:G→Rтакая,что:ξRη ⇔ Mξ[f(⋅)] ≥ Mη[f(⋅)], где R – отношение, выражающее склонность ЛПР к риску,ξ и η – сравниваемые стратегии (лотереи).ВнашемслучаемножествоисходовG = {g1,…,gn}конечное,т.о.распределения ξ и η задаются векторами вероятностей (p1ξ,…,pnξ) и (p1η,…,pnη)соответственно, а математические ожидания функции полезности вычисляются поформулам: Mξ[f] = f(g1)⋅p1ξ +…+ f(gn)⋅pnξ, Mη[f] = f(g1)⋅p1η +…+ f(gn)⋅pnη.Итак, при наличии функции полезности, каждый исход g характеризуетсянекоторой полезностью f(g), каждая стратегия s – ожидаемой полезностью Ms[f], арешение задачи принятия решений следует искать в виде: Ms[f] → max.Замечание.
Лотерею можно изобразить в виде графа. Если исходыокончательные, то он выглядит так:lp1…png1g2g3Возможны случаи, когда исходом является другая лотерея, например:p1g1l1p21-p1l21-p1-p2g21g22Необходимо узнать отношение ЛПР к риску, т.е. построить отношение R намножестве распределений вероятностей на G.Человеку трудно разобраться влотерее с большим числом исходов. ЛПР гораздо проще ответить на вопрос типа:при каком значении вероятности p ему безразлично: а) участвовать в лотерее l свыигрышами g’∼p, g’’∼(1-p), где g’ предпочтительнее, чем g’’, или б) сразуполучить (без лотереи) выигрыш g’’’ такой, что g’ предпочтительнее, чем g’’’, но g’’’предпочтительнее, чем g’’.Наосновеответовнавопросытакоготипаможносравнитьпопредпочтению любые две лотереи, а значит практически построить отношение R исоответствующую ему функцию полезности f при условии, что ЛПР допускаетприменение правил фон Неймана – Моргенштерна: 1) правило замены: если висходнойлотерееодинизвыигрышейзаменитьнадругой,равныйпопредпочтительности выигрыш, то получим лотерею, равнопредпочтительнуюисходной;2)правилосвертывания:лотереиl1иl2одинаковыпопредпочтительности, если p=p1⋅π1+p2⋅π2+…+pn⋅πn:l1p1…pnπ11-π1…πn1-πng1g2g1g2pl21-pg1g2Пусть g*, g* ∈ G, g* - наилучший исход, g* - наихудший исход.
Примемf(g*)=0 (начало отсчета), f(g*)=1 (масштаб измерений).Базовая лотерея – лотерея lp с исходами g*∼p, g*∼(1-p):plp1-pg*g*∀g∈G можно указать вероятность p, при которой получение выигрыша g безлотереи эквивалентно участию в базовой лотерее lp. Так что, примем f(g)=p(ожидаемая полезность от участия в lp равна p).Тогда по правилу замены произвольную лотереюlp1…png1g2g3можно представить в виде равнопредпочтительной ей лотереиlp1…pnf(g1)1-f(g1)…f(gn)1-f(gn)g*g*g*g*,которая, в свою очередь, по правилу свертывания (p=p1⋅f(g1)+…+pn⋅f(gn))представляется в виде равнопредпочтительной ей базовой лотереиplp1-pg*g*Таким образом, для любой лотереи l можно найти равнопредпочтительнуюей базовую лотерею lp, при этом Ml[f]=p1⋅f(g1)+…+pn⋅f(gn)=p.Построенная таким образом функция полезности f позволяет сравнить попредпочтительности любые две лотереи. Действительно, ∀ l’ и l’’ можно построитьравнопредпочтительные им лотереи lp’ и lp’’ соответственно, и тогда (l’ R l’’) ⇔(Ml’[f] ≥ Ml’’[f]) ⇔ (p’ ≥ p’’), то есть из двух лотерей предпочтительнее та, длякоторой вероятность получения наилучшего исхода g* в базовой лотерее больше.Характеристика отношения ЛПР к риску и свойства функцииполезностиПусть исходы G={g1,…,gn} оцениваются единственным количественнымкритерием K(gi)=xi, K:G→R.
Тогда X=[ , ] – непрерывная шкала критерияэффективности K, а функция полезности f, построенная на ней, являетсямонотонно возрастающей функцией.Достоверным эквивалентом лотереи l называется величина l^ такая, чтоf(l^)=Ml[f] (полезность l^ равна ожидаемой полезности l). Т.е. для ЛПРбезразлично, получить l^ наверняка или участвовать в лотерее l.Достоверный эквивалент единственен, т.к.
f монотонная.Средним результатом лотереи l называется величина=p1⋅x1+…+pn⋅xn.Характеристику отношения ЛПР к риску можно получить путем анализа еговыбора среди альтернатив: принять участие в лотерее l с исходами g*∼1/2, g*∼1/2,K(g*)=a, K(g*)=b или получить наверняка=(a+b)/2.ЛПР не склонен к риску, если ∀l f( )>f(l^) (или>l^, т.к. f - монотонна).f10.50a l^bXЛПР безразличен к риску, если ∀l f( )=f(l^) (или=l^, т.к. f - монотонна).f10.50al^bXЛПР склонен к риску, если ∀l f( )<f(l^) (или<l^, т.к.
f - монотонна).f10.50al^ bXДля ЛПР безразличного к риску функция полезности линейна, значит можнообоснованно применять принцип среднего результата. Однако, большинстволюдей не склонны к риску.Для выявления отношения ЛПР к риску на практике строят функциюполезности по методу 5-ти точек (Кини и Райфа).Пусть K(g)∈[ , ].1.
Для x0= , x1=положим f(x0)=0, f(x1)=1.2. ЛПР просим указать достоверный эквивалент x0.5 лотереи с исходамиg*∼1/2, g*∼1/2, K(g*)=x0, K(g*)=x1.3. ЛПР просим указать достоверный эквивалент x0.25 лотереи с исходамиg*∼1/2, g*∼1/2, K(g*)=x0, K(g*)=x0.5.4. ЛПР просим указать достоверный эквивалент x0.75 лотереи с исходамиg*∼1/2, g*∼1/2, K(g*)=x0.5, K(g*)=x0.75.5. Проверяем, что x0.5 является достоверным эквивалентом лотереи сисходами g*∼1/2, g*∼1/2, K(g*)=x0.25, K(g*)=x0.75.6.
Строим график f(x) интерполяцией по полученным точкам..