Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 219
Текст из файла (страница 219)
Распределения вероятностей для исходных ожиданий показаны на рис. 16.7, а. Очевидно, что в этом случае нет смысла оплачивать получение данных со спутника, поскольку маловероятно, что полученная с их помощью информация приведет к изменению плана. Если получение новой информации не приводит к каким-лнбо изменением, то она не имеет реальной стоимости. г<и)к) г< и) г)и)к) и, и, и, и, и, а) б) в) Рис. )б. 7. Гри наиболее общих случая, касающихся определения стоимости информаиии: действие л, почти со всей определенностью будет оставаться лучшим по сравнению с действием лп поэтому дополнительная информация не нужна (а); выбор неясен, поэтому информация крайне важна (б); выбор неясен, но поскольку разница между полезностями действий невелика, информация не имеет такой уж большой ценности (в) А теперь предположим, что необхолимо выбрать одну из двух извилистых грунтовых дорог, имеющих немного разную длину, для того чтобы вывезти за перевал пациента с серьезной травмой.
В таком случае, даже если полезности и, и и, достаточно близки, распределения вероятностей и, ' и иэ ' являются очень широкими. Существует значительная вероятность того, что второй маршрут окажется свободным, а первый — заблокированным, и в этом случае разность между полезностями будет очень большой. Формула ЧР! показывает, что в данном случае вполне оправдано получение отчета со спутника. Подобная ситуация показана парис. 16.7, б. Далее, предположим, что осуществляется выбор между двумя грунтовыми дорогами летом, когда их блокировка из-за лавин является маловероятной. В этом случае отчеты со спутника могут показать, что одна дорога является более живописной, чем другая, из-за того, что вдоль нее расположены цветущие альпийские луга, нли, возможно, немного более влажной из-за блуждающих потоков.
Поэтому весьма вероятно, что турист, путешествующий через горы, изменил бы свой план, если бы имел подобную информацию. Но и в таком случае разница в значениях между двумя маршрутами все еще, по-видимому, остается очень небольшой, поэтому нет смысла тратить лишние усилия на получение отчетов со спутника. Такая ситуация показана на рис.!6.7, в. 802 Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности Подводя итог, можно сказать, что бг- стоимость информации определяется той степенью, в которой она может вызвать изменение плана, а также той степенью, в какой новый план окажется значительно лучше по сравнению со старым.
Свойства показателей стоимости информации Напрашивается очевидный вопрос — возможно ли, чтобы информация была вредной, иными словами, может ли она фактически иметь отрицательную ожидаемую стоимость? Интуитивно ясно, что такая ситуация невозможна. В конечном итоге в наихудшем случае можно просто проигнорировать ненужную информацию и сделать вид, как будто она так и не была получена. Данное интуитивное представление подтверждается приведенной ниже теоремой, которая относится к любому агенту, действующему на основе теории принятия решений.
Зе Стоимость информации является неотрицательной: УУ,Е (?Р?е(Е))> О Эта теорема следует непосредственно из определения свойства УР1, и мы оставляем доказательство этой теоремы читателю в качестве упражнения (упр. 16.12). Важно помнить, что свойство УР1 зависит от текущего состояния информации, именно поэтому в формулировке данной теоремы это свойство обозначено подстрочным индексом. Значение к)Р! по мере получения дополнительной информации может изменяться. В крайнем случае оно может стать равным нулю, если рассматриваемая переменная уже имеет известное значение.
Таким образом, свойство к)Р! не аддитивно. Это означает, что справедливо следующее соотношение: (?Р?е(Е) ° Ек) Ф (КР?е(Е)) + 'кР?е(Ек) (В Сбщви СЛУЧаа) Но свойство ЪР! не зависит от порядка рассматриваемых в нем переменных, что должно быть интуитивно ясно. Это означает, что справедливо такое соотношение: (еР?е (Е(, Ек) = (кР?е (Ее) к (кР?е,е (Ек) = (еР?е (Ек) ь (еР?е,ек (ЕЬ) В силу того, что действия по восприятию не зависят от последовательности их выполнения, они отличаются от обычных действий, а задача вычисления значения последовательности действий по восприятию упрощается.
Реализация агента, действующего иа основе сбора информации Успешно действующий агент должен задавать вопросы пользователю в приемлемом порядке, не требовать ответов на вопросы, не относящиеся к делу, учитывать важность каждого фрагмента информации применительно к стоимости его получения и прекращать задавать вопросы, когда сложившаяся обстановка требует перехода к другим действиям. Все эти возможности можно воплотить в проекте агента, используя в качестве критерия стоимость информации. В листинге 16.1 показан общий проект агента, который способен осуществлять интеллектуальный сбор информации, прежде чем приступать к действиям.
На данный момент мы будем предполагать, что с каждой наблюдаемой переменной свидетельства е, связана соответствующая стоимость сове (е, ), которая отражает стоимость получения этого свидетельства с помощью проведения тестов, организации консультаций, получения ответов на дополнительные вопросы или других подобных Глава 16. Принятие простых решений 803 действий. Агент запрашивает фрагменты информации, которые представляются для него наиболее ценными по сравнению с их стоимостью. Предполагается, что результатом действия по осуществлению запроса нес(пеяс (е; ) является то, что следующий результат восприятия предоставляет значение е,.
А если ни одно наблюдение не оправдывает его стоимость, агент выбирает "реальное" действие. Листинг 16.1. Проект простого агента, действующего на основе сбора информации. Этот агент функционирует, снова н снова выбирая наблюдение с наивысшим информационным значением, до тех пор, пока стоимость следующего наблюдения не станет выше по сравнению е ожидаемой от него пользой Еипсвцоп 1пгогюасгоп-Оае)ьЕгвпд-Лдепп(регсерс) гевигпн действие асехоп явавас: П, сеть принятия реыений включить данные о восприятии рессоре в сеть Р ь — значение, максимизирующее выражение УР1(Е,)-Сояс(Е,) ее пР1(е,) > сояс(е;) Ецеп гевал Пецпеяе(Е,) е1не геспгп наилучшее действие из Р Описанный здесь алгоритм агента реализует один из подходов к сбору информации, называемый Ж близоруким. Это связано с тем, что в данном подходе формула ЧР1 используется без дальновидных расчетов и значение информации определяется так, как будто было бы достаточно получить значение единственной переменной свилетельства.
А если нет ни одной переменной свидетельства, которая оказала бы значительную помощь, близорукий агент может преждевременно приступить к действиям, тогда как было бы лучше вначале запросить значения еше двух или нескольких переменных и только после этого начинать действовать. Близорукие методы управления основаны на той же эвристической идее, что и жадный поиск, и часто хорошо работают на практике (например, было показано, что подобные системы управления превосходят по своей производительности опытных врачей, когда речь идет о подборе необходимых диагностических тестов). Но агент, действующий на основе сбора информации, который является идеально рациональным, должен рассматривать все возможные последовательности информационных запросов, приводящие к внешнему действию, а также все возможные результаты этих запросов.
Поскольку содержание второго запроса зависит от результатов первого запроса, агент должен исследовать пространство условных планов, как было описано в главе 12. 16.7. ЭКСПЕРТНЫЕ СИСТЕМЫ, ОСНОВАННЫЕ НА ИСПОЛЪЗОВАНИИ ТЕОРИИ ПРИНЯТИЯ РЕШЕНИЙ В научной области )э.анализа проблемы принятия решений, которая бурно развивалась в 1950 †19-х годах, изучалось применение теории принятия решений к реальным задачам принятия решений.
Результаты, полученные в этой сфере, использовались для упрощения задачи принятия рациональных решений во многих важных проблемных областях, где ставки достаточно высоки, таких как бизнес, государственное управление, юриспруденция, военная стратегия, медицинская ди- 804 Часть У. Неопределенные знания и рассуждения в условиях неопределенности агностика и здравоохранение, техническое проектирование и управление ресурсами.