Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 217
Текст из файла (страница 217)
Предпочтение без неопределенности Начнем с детерминированного случая. Напомним, что для детерминированных вариантов среды у агента имеется функция значений у(х,, ...,х„); цель состоит атом, чтобы представить эту функцию в более краткой форме. Основное свойство регулярности, которое наблюдается в детерминированных структурах предпочтений, называется 'ек независимостью предпочтений.
Два атрибута, х„и х,, являются независимыми по предпочтениям от третьего атрибута, х,, если предпочтение между результатами (х,, х,, хз) и (х, ', х, ', х,) не зависит от конкретного значения х, для атрибута х,. Возвращаясь к примеру с аэропортом, в котором нужно было рассмотреть (кроме других атрибутов) атрибуты дгоз яе (Шум), соя с (Стоимость) и веа сйя (Количество смертных случаев), можно предположить, что атрибуты д)озяе и соя с независимы 794 Часть Ч, Неопределенные знания и рассуждения в условиях неопределенности по предпочтениям от атрибута пеасЛы. Например, если мы предпочтем состояние с 20000 людей, проживающих в районах, над которыми выполняются полеты, и стоимостью строительства 4 миллиарда долларов, состоянию с 70 000 людей, проживающих в районах полетов, и стоимостью 3,7 миллиарда долларов, притом что уровень безопасности в обоих случаях равен 0,06 смертей в расчете на миллионный пассажирооборот, то будем иметь одни и те же предпочтения, когда уровень безопасности равен 0,13 и когда он равен 0,0!.
Такие же отношения независимости имеют место для предпочтений между любыми другими парами значений атрибутов дгобые и сов с. Очевидно также, что атрибуты сов с и (зеа сЛы независимы по предпочтениям от ггодые, а тгодые и (зеаслы независимы по предпочтениям от сова. В этих случаях принято считать, что множество атрибутов !д(одне, СоыС, ПеаСЛы) обнаруживает свойство Ъ. взаимной независимости по предпочтениям !Мцша1 РгеГегепба! 1пдерепдепсе — МР!). Согласно свойству МР1, вне зависимости от того, насколько важен каждый атрибут, он не влияет на отношения, в которых другие атрибуты сопоставляются друг с другом.
Свойство взаимной независимости по предпочтениям в определенной степени представляет собой идеализацию, но благодаря замечательной теореме, предложенной экономистом Дебре )365), на его основе можно вывести очень простую форму для функции стоимости агента: пг если атрибуты х,, ..., х„являются взаимно независимыми па предпочтениям, та поведение агента в отногаении его предпочтений можно описать как максимизацию следующеи функции: (г(хы,х„! = ~ (г,(к,) 1 где каждое слагаемое (', представляет собой функцию значения, ссылающуюся талька на атрибут х,.
Например, вполне допустима такая возможность, что решение по размещению аэропорта может быть принято на основе следующей функции значения: (г(подые, сове, деаепы! = -полые х 10 — сове — с(еаСЛы х 10 Функция значения такого типа называется 'а. аддитивной фушшией значения. Аддитивные функции представляют собой исключительно естественный способ описания любой функции значения агента и действительно правильно описывают многие реальные ситуации. И даже если свойство МР1, строго говоря, не соблюдается, что может иметь место при крайних значениях атрибутов, аддитивная функция значения все еще может предоставлять хорошую аппроксимацию для предпочтений агента.
Такое утверждение особенно полно оправдывается, когда нарушения свойства МР1 возникают в тех частях диапазонов атрибутов, которые редко встречаются на практике. Предпочтения е неопределенностью Если в рассматриваемой проблемной области присутствует неопределенность, то необходимо также рассмотреть структуру предпочтений между лотереями н понять результирующие свойства функций полезности, а не просто функций значения. Математические основы решения этой проблемы могут оказаться весьма сложными, поэтому здесь мы представим только один из основных результатов, чтобы дать понять, как может быть решена эта проблема. Для ознакомления с исчерпывающим обзором работ в этой области рекомендуем читателю обратиться к [788].
795 Глава 16. Принятие простых решений Основное понятие 'в. независимости полезностей позволяет расширить понятие независимости предпочтений так, чтобы оно охватывало лотереи: множество атрибутов х является независимым по полезности от множества атрибутов т, если предпочтения между лотереями по атрибутам х независимы от конкретных значений атрибутов т. Множество атрибутов является 'в. взаимно независимым по полезностям !Мцшайу Ог!1!Гу-1пг!ерепг!еп! — М!71), если каждое из его подмножеств яшиется независимым по полезностям от остальных атрибутов.
Опять-таки предположение о том, что атрибуты задачи с аэропортом обладают свойством М!71, кажется вполне резонным. Из свойства М!Л следует, что поведение агента может быть описано с помогцью 'в. мультипликативиой функции полезности [787]. С общей формой мультнпликативной функции полезности можно проще всего ознакомиться, рассмотрев случай с тремя атрибутами.
В целях сокращения мы будем использовать запись ггз для обозначения Ггз(х,): ц = Лзуз ь Агуг ь Лзуз з- Лздгузуг з. ягАзгггуз з йзязузуз з зсзлгзгзггзюггз Хотя это соотношение на первый взгляд не кажется очень простым, оно содержит лишь три одноатрибутных функции полезности и три константы. Вообще говоря, любую и-атрибутную задачу, характеризуюшуюся наличием свойства М!71, можно промоделировать с использованием и одноатрибутных полезностей и и констант. Каждая из одноатрибутных функций полезности может быть разработана независимо от других атрибутов, а применение комбинации этих функций гарантирует формирование правильных обших предпочтений. Для получения чисто аддитивной функции полезности необходимо ввести некоторые дополнительные предположения.
16.5. СЕТИ ПРИНЯТИЯ РЕШЕНИЙ В этом разделе рассматривается общий механизм принятия рациональных решений. Описанную здесь систему обозначений часто называют Ж диаграммами влияния !6951, но мы будем использовать более описательный термин 'ж сети принятия решений. В сетях принятия решений байесовские сети комбинируются с узлами дополнительных типов, которые обозначают действия и полезности. В качестве примера будет рассматриваться задача выбора плозцадки для строительства аэропорта. Способы представления задачи принятия решений с помощью сети принятия решений В своей наиболее обшей форме любая сеть принятия решений представляет информацию о текущем состоянии агента, его возможных действиях, о состоянии, которое станет результатом данного действия агента, и о полезности этого состояния. Таким образом, данная сеть может служить основой для реализации агентов, действуюших с учетом полезности, такого типа, который был впервые представлен в разделе 2.4.
На рис. 16.5 показана сеть принятия решений в задаче выбора плошадки для строительства аэропорта. Этот рисунок может служить иллюстрацией того, как используются узлы трех описанных ниже типов. 796 Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности Рис. 16.5. Простая сеть принятия решении в задаче выбора площадки для строительспгва аэропорта ° Ж Узлы жеребьевки (овалы) представляют собой случайные переменные, как и в байесовских сетях. Агент может не иметь определенной информации о стоимости строительства, интенсивности воздушного трафика и о потенциальных возможностях урегулирования формальностей, связанных с получением разрешения на строительство, а также о значениях переменных Реа с)те, иод ее и суммарной стоимости сове, поскольку каждое из этих значений зависит от особенностей выбранной площадки.
Каждый узел жеребьевки имеет связанное с ним распределение условных вероятностей, которое проиндексировано по состояниям его родительских узлов. В сетях принятия решений родительские узлы могут включать узлы принятия решений, а также узлы жеребьевки. Обратите внимание на то, что каждый из узлов жеребьевки в текущем состоянии может войти в состав более крупной байесовской сети, применяемой для оценки затрат на строительство, интенсивностей воздушного графика или потенциальных возможностей формального урегулирования.
° 'ск Узлы принятия решений (прямоугольники) представляют собой точки, в которых лицу, принимающему решение, предоставляется выбор вариантов действий. В этом случае действие Ад~рохсодсе может принимать различное значение для каждой площадки, подлежащей рассмотрению. Этот выбор влияет на стоимость, безопасность и шум, т.е.
на те параметры, которые станут следствием строительства аэропорта. В данной главе предполагается, что нам придется иметь дело только с единственным узлом принятия решений, а в главе 17 рассматриваются случаи, в которых необходимо принимать больше одного решения. ° ск Узлы полезности (ромбы) представляют функцию полезности агента4.
Родительскими переменными узла полезности являются все переменные, описывающие результат, который непосредственно влияет на полезность. С узлом 4 Такие узлы в литературе часто называют узлами значения, но авторы предпочитают подчеркивать различие мсягду функпиями полезности и функциями значения, как было описано выше, на- -стьку р~ г ",тируюшсс состояние мс 'сг прсдставлять собой лотсрсю.