Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 216
Текст из файла (страница 216)
Оценка полезностей промежуточных результатов осуществляется путем опроса агента, который должен обозначить свое предло ггение между заданным результирующим состоянием я и 'а. стандартной лотереей (р, ц„; (1-р), цх]. Вероятность р корректируется до тех пор, пока агент не становится безразличным к выбору между Б и этой стандартной лотереей.
Это означает, что при наличии нормализованных полезностей полезность Я определяется вероятностью р. В задачах принятия решений, касающихся медицинского обслуживания, транспорта и охраны окружающей среды, кроме всего прочего, ставками становятся жизни людей. В таких случаях цх представляет собой значение, присвоенное немедленной смерти (или, возможно, многим смертям). ое- Хотя все испытывают смущение, когда назначается цена человеческой жизни, истина состоит в том, что во всех кригпичееких ситуациях приходится применять компромиссы с учетом этой цепы. Самолеты проходят полный цикл технического обслуживания через интервалы, определяемые количеством полетов и длиной пробега в километрах, а не после каждого полета.
Корпуса автомобилей изготавливаются из относительно тонкого листового металла для уменьшения расходов, несмотря на то, что это приводит к уменьшению относительного количества людей, выживших после аварии. Этилированное топливо продолжает широко использоваться, даже несмотря на то, что всем известно, какой вред оно наносит здоровью. Как ни парадоксально, отказ "назначить цену жизни в деньгах" означает, что жизнь часто недооценивается. Росс Шахтер рассказывал о своем опыте общения с одним правительственным агентством, которое заказало исследование по вопросу целесообразности удаления асбестовых изделий из школ. Шахтер провел исследование, в котором было принято предположение, что цена жизни ребенка школьного возраста имеет конкретное долларовое выражение, и доказал, что при таком предположении рациональным выбором должно стать удаление асбестовых изделий.
Правительственное агентство, ссьшаясь на соображения морали, даже не стало рассматривать отчет по результатам этого исследования, после чего было принято решение о том, что не следует заниматься удалением асбестовых изделий. Было сделано несколько попыток определить, какую цену назначают люди за свои собственные жизни. Двумя "валютами", широко используемыми в медицинских и страховых исследованиях, являются Ж микрошанс смерти (пцсгогпоП вЂ” один 790 Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности из миллиона шансов смерти) и Ъ. ОА1Х 1Оца!йу-Аг))цзгег) ЫГе Хеаг), или год жизни с поправкой на качество жизни (который эквивалентен году, прожитому в добром здравии, без каких-либо заболеваний).
Целый ряд исследований, проведенных с охватом самых разных слоев населения, показал, что микрошанс смерти стоит примерно 20 долларов (в долларах по курсу за 1980 год). Как уже было показано, функции полезности не обязательно должны быть линейными, поэтому из полученных результатов не следует, что некое лицо, принимающее решение, согласилось бы подвергнуться смерти за 20 миллионов долларов. К тому же локальная линейность любой кривой полезности означает, что показатели микрошанса смерти и ОА1Х являются наиболее приемлемыми для анализа небольших инкрементных рисков и вознаграждений. 16.4. МНОГОАТРИБУТНЫЕ ФУНКЦИИ ПОЛЕЗНОСТИ Принятие решений в области общественной политики, с одной стороны, связано с затратами в миллионы долларов, а с другой стороны, часто касается вопросов жизни и смерти.
Например, принимая решение о том, какие уровни канцерогенного вещества являются допустимыми в окружающей среде, лица, устанавливающие нормы допустимых загрязнений, вынуждены искать компромисс между требованиями по предотвращению преждевременных смертей и экономическими трудностями, которые могут возникнуть из-за отказа от некоторых промышленных продуктов и процессов. При поиске строительной площадки для нового аэропорта приходится учитывать, какой вред окружающей среде будет нанесен этим строительством, стоимость земельного участка, расстояние от центров сосредоточения большого количества населения, шум, связанный с деятельностью аэропорта, проблемы безопасности, обусловленные местной топографией и погодными условиями и т.д.
Задачи, подобные этим, в которых результаты характеризуются двумя или несколькими атрибутами, рассматриваются в ж теории многоатрибутиой полезности. Обозначим эти атрибуты как х=х„..., х„; полный вектор присваиваний принимает вид х=«х„..., х,>. Вообще говоря, предполагается, что каждый атрибут имеет дискретные или непрерывные скалярные значения. Для упрощения принимается допущение, будто каждый атрибут определен таким образом, что при всех прочих равных условиях более высокие значения атрибута соответствуют большим полезностям. Например, если в качестве одного из атрибутов в задаче с аэропортом будет выбрано отсутствие шума лбвепсеО~вгоуэе, то решение будет тем лучше, чем выше значение этого атрибута.
В некоторых случаях может потребоваться подразделить диапазон значений так, чтобы значение полезности изменялось монотонно в каждом поддиапазоне. Начнем с анализа случаев, в которых решения могут быть приняты без комбинирования значений атрибутов в одно значение полезности.
Затем рассмотрим случаи, в которых полезности комбинаций атрибутов могут быть определены очень кратко. Доминирование Предположим, что площадка для аэропорта Я, стоит меньше, способствует выработке меньшего шумового загрязнения и характеризуется большей безопасностью, 792 Часть У. Неопределенные знания и рассуждения в условиях неопределенности что стоимость варианта ~т точно равна 3,8 миллиарда долларов, то мы не смогли бы принять решение без дополнительной информации о полезности денег'.
0,6 !,2 0,5 0,В Ы 0,6 к 0,4 О,4 Ь Е О,3 ю 02 0,1 од 0 -6 -5,5 -5 -4,5 -4 -3,5 -3 -2,5 -2 Отрицатеаьнаа стоимость а) 0 -6 -5,5 -5 -4,5 -4 -3,5 -3 -2,5 -2 Отрицательная стоимость б) Рис. !б.4. Стахастическае доминирование: вариант Яг стахастически доминирует над вариан- там ва па стоимости (а); кумулятивные распределения для атрииательяай стоимости вариантов Яг и ба (б) Точные соотношения между распределениями стоимостей атрибутов, необходимые для определения стохастического доминирования, можно проще всего оценить, исследуя кумулятивные распределения, показанные на рис.
16.4, б. В кумулятивном распределении измеряется вероятность того, что стоимость меньше или равна какой-либо заданной сумме, т.е. в этом распределении интегрируется первоначальное распределение. Если кумулятивное распределение для Яг всегда находится справа от кумулятивного распределения для Ям то с точки зрения стохастической оценки ваРнаит Яг ДЕШЕВЛЕ, ЧЕМ Я,. С фОРМаЛЬНОй ТОЧКИ ЗРЕНИЯ, ЕСЛИ ДВа ДЕйСтВИЯ, А, И А„ приводят к созданию распределений вероятностей р, (х) и р,(х) по атрибуту х, то действие А, стохастически доминирует над действием А, по атрибуту Х, если справедливо следующее соотношение: Чх рг[х' ) с)х' < рг (х' ) г(х' 3 На первый взгляд может показаться странным, что увеличение объема информации о стоимости варианта з может уменьшить способность агента к принятию решений. Этот парадокс можно разрешить, отметив, что решение, достигнутое в отсутствии сочной информации о стоимости, с меньшей вероятностью будет иметь максимальную отдачу с точки зрения полезности.
Возможность применения этого определения для выбора оптимальных решений вытекает из следующего свойства: сег- Если действие А, стахастически доминирует пад действием Аз, та для любой не убываюи(ей монотонно функции полезности (2(х) ожидаемая полезность действия А, является, па меньшей мере, столь хсе высокой, как и ахсидаемая полезность действия А,. Если какое-то действие стохастически доминирует над другим действием по всем атрибутам, то последнее действие должно быть отброшено.
Глава 16. Принятие простых решений 793 На первый взгляд может показаться, что условие стохастического доминирования является довольно формальным и, возможно, не позволяющим проводить вычисления без трудоемких вероятностных расчетов. Но в действительности оно во многих случаях позволяет легко принимать решения. Предположим, например, что стоимость строительства зависит от расстояний до центров сосредоточения населения. Сама стоимость остается неопределенной, но чем больше указанные расстояния, тем выше стоимость.
Если площадка 8, менее удалена, чем Я„то вариант Я, будет доминировать над д, по стоимости. Хотя в данной книге эта тема не рассматривается, существуют точные алгоритмы распространения качественной информации такого рода среди неопределенных переменных в Ъ. качественных вероятностных сетях, которые позволяют системе вырабатывать рациональные решения на основе отношений стохастического доминирования, без использования каких-либо числовых значений. Структура предпочтений н многоатрнбутная полезность Предположим, что имеются п атрибутов, каждый из которых имеет с) различных возможных значений. Чтобы определить полную функцию полезности ()(х,, ...,х„), в худшем случае требуется сГ значений.
Итак, наихудший случай соответствует ситуации, в которой предпочтения агента вообще не отличаются какой-либо регулярностью. Теория многоатрибугной полезности основана на гипотезе о том, что предпочтения типичных агентов более структурированы по сравнению с указанной ситуацией. Основной подход состоит в том, что следует выявлять регулярные структуры в том поведении а~сита по отношению к предпочтениям, которое, по всей вероятности, будет наблюдаться в действительности, и использовать так называемые Ж теоремы представления для обоснования того, что агент со структурой предпочтений определенного рода имеет следующую функцию полезности; где Е, в соответствии с оптимистическим предположением, представляет собой простую функцию, такую как сложение. Обратите внимание на то, что попытка определить структуру предпочтений аналогична использованию байесовских сетей для декомпозиции совместного распределения вероятностей нескольких случайных переменных.