Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 172
Текст из файла (страница 172)
Проект агента, действующего в соответствии с теорией решений Набросок структуры агента, который использует теорию решений для выбора действий, приведен в листинге 13.1. На некотором уровне абстракции этот агент идентичен логическому агенту, описанному в главе 7. Основное различие состоит в том, что знания о текущем состоянии агента, действующего в соответствии с теорией решений, являются неопределенными; Ж доверитедьное состояние этого агента является представлением вероятностей всех возможных фактических состояний мира. Со временем агент накапливает больше свидетельств и его доверительное состояние изменяется.
На основании своего доверительного состояния агент может делать вероятностные предсказания результатов действий и поэтому выбирать действие с наивысшей ожидаемой полезностью. В настоящей и следующей главах изложение в основном сосредоточивается на задаче представления и вычисления с учетом вероятностной информации в целом. Глава 15 посвящена описанию методов решения конкретных задач представления и обновления доверительного состояния, а также задач предсказания обстановки в среде.
В главе !6 более подробно рассматривается теория полезности, а в главе 17 разрабатываются алгоритмы, применяемые для принятия сложных решений. Листинг 13.1. Агент, действующий на основании теории решений, который выбирает рапнональ- ные действия. Этапы работы этого алгоритма подробно описываются в следующих пяти главах Снпссаоп РТ-Адедс(регсере) тевсхпв действие асетоп вваЕАс: ЬезтеЮ веаее, доверительное состояние — вероятностные убеждения, касающиеся текущего состояния мира асстоп, действие агента 628 Часть Ч. Неопределенные знания н рассуждения в условиях неопределенности обновить доверительное состояние ЬезхеЕ зеаее с учетом действия асехоп и восприятия регсерг вычислить резупьтируюшие вероятности для действий ассуопз на основании описаний действий ассуоп и текущего доверительного состояния Ъе1хеЕ зеаее выбрать действие ассхоп с наивысшей ожидаемой полезностью с учетом вероятностей результатов и информации о полезности юееивю ассзоп 13.2.
ОСНОВНАЯ ВЕРОЯТНОСТНАЯ СИСТЕМА ОБОЗНАЧЕНИЙ Теперь, после определения обшей инфраструктуры для рационаяьного агента, нам потребуется формальный язык для представления и формирования рассуждений с неопределенными знаниями. Любая система обозначений, применяемая для описания степеней уверенности, должна предоставлять возможность решать две основные проблемы: отражать характер высказываний, которым присваиваются оценки степени уверенности, и показывать зависимость степени уверенности от опыта агента.
В представленной здесь версии теории вероятностей используется одно из расширений пропозициональной логики, которое распространяется на высказывания в этой логике. Зависимость от опыта отражается в синтаксическом различии между априорными вероятностными утверждениями, которые применяются до получения каких-либо свидетельств, и условными вероятностными утверждениями, которые явно включают соответствующие свидетельства. Высказывания Оценки степеней уверенности всегда применяются к высказываниям — утверждениям о том, что имеет место ао-то и ео-гло. До сих пор в этой книге рассматривались два формальных языка, применяемых для составления высказываний, — пропозициональная логика и логика первого порядка.
В теории вероятностей, как правило, используется язык, немного более выразительный, чем пропозициональная логика. Этот язык описан в данном разделе. (В разделе !4.6 обсуждаются способы, позволяющие предписывать оценки степеней уверенности утверждениям в логике первого порядка.) Основным элементом этого языка является 'в.случайная переменная, которая может рассматриваться как ссылающаяся на некоторую "часть" мира, "состояние" которого первоначально неизвестно.
Например, утверждение сауусуможет касаться того, имеется ли у пациента дупло в нижнем левом зубе мудрости. Случайные переменные играют роль, аналогичную той, которую выполняют переменные С8Р в задачах удовлетворения ограничений и пропознцнональные символы в пропозициональной логике. Мы будем всегда записывать имена случайных переменных с прописной буквы.
(Тем не менее для представления любой неизвестной случайной переменной все еше используются однобуквенные имена в виде строчных букв, например Р(а) =1-Р( — а) .) Каждая случайная переменная имеет 'оь область определения значений, которые она может принимать. Например, область определения переменной Саут су может 629 Глава 13. Неопределенность представлять собой' < спие, са1яеь. (Для имен значений используются прописные буквы.) В этом высказывании простейшего вида утверждается, что случайная переменная имеет конкретное значение, взятое из ее области определения.
Например, Саит су = спие может представлять высказывание, что у пациента действительно имеется дупло в левом нижнем зубе мудрости. Как и в случае переменных СЯР, случайные переменные обычно подразделяются на три описанных ниже вида, в зависимости от типа области определения. ° 'а.
Булевы случайные переменные, такие как сат 1 су, имеют область определения < спие, са1яеь. Мы часто будем сокращенно записывать высказывание, подобное сеЫ су= сгие, в виде имени этой переменной, записанного со строчной буквы, саи1 су, Аналогичным образом, высказывание саи1 су=га1яе будет сокращеннозаписываться как- саит су. ° сь Дискретные случайные переменные, которые включают булевы случайные переменные как частный случай и принимают значения из счетной области определения.
Например, областью определения погоды йгеа СЛеп может быть <яиппу, падпу, с1оисУу, япогг>. Значения в области определения должны быть взаимно исключительными и исчерпывающими. Если не возникает путаница, мы будем, например, использовать япсьг как сокращение длл высказывания веа слет= яп ем ° 'ах Непрерывные случайные переменные принимают свои значения из области действительных чисел.
Эта область определения может представлять собой всю ось действительных чисел или некоторое ее подмножество, такое как интервал (О, 1) . Например, в высказывании х=4. 02 утверждается, что случайная переменная Х имеет точное значение 4. 02. Высказывания, касающиеся непрерывных случайных переменных, могут также представлять собой неравенства,такие какх < 4.02. За небольшими исключениями, мы будем в основном сосредоточиваться на лискретном случае.
Элементарные высказывания, такие как саггу су= спие и тоосласле=са1яе, могут комбинироваться для формирования сложных высказываний с использованием всех стандартных логических связок. Например, Саидсу =сгие д тосСЛасЛе=1а1яе представляет собой высказывание, которому может быть предписана определенная степень уверенности (неуверенности). Как было указано в предыдущем абзаце, это высказывание может быть также записано как сат усу ж — соосЛасЛе. Атомарные события Для понимания основ теории вероятностей полезно ознакомиться с понятием 'ах атомарного события. Атомарное событие представляет собой полную спецификацию состояния мира, в отношении которого знания агента являются неопределенными. Оно может рассматриваться как некоторое присваивание конкретных значе- -' Читатель мог бы предположить, что эту область определения следует записывать квк множество: ~ сгие, Газяе>.
Но авторы записывают ее в виде кортежа, поскольку в дальнейшем это позволит упросппь наложение упорядоченности нв значения. 630 Часть У. Неопределенные знания и рассуждения в условиях неопределенности ний всем переменным, из которых состоит этот мир. Например, если мир пациента состоит только из булевых переменных саууеу и тосе)час)зе, то суШествует всеГо лишь четыре разных атомарных события'; одним из таких событий является высказывание СаНсу=Еа1ае д тоос)зас)зе=сдце. Атомарные события имеют некоторые важные свойства, описанные ниже.
° Они являются взаимно исключаюшими — фактически может иметь место, самое болыпее, одно такое событие. Например, не могут одновременно происходить такие события, как саНсу л соос)лассе и саНсу л — сооспас)зе. ° Множество всех возможных атомарных событий является исчерпываюшим— должно иметь место по меньшей мере одно из этих событий. Это означает, что дизъюнкция всех атомарных событий логически эквивалентна сдие.
° Из любого конкретного атомарного события следует истинность или ложность каждого высказывания, либо простого, либо сложного. В этом можно убедиться, используя стандартные определения семантики для логических связок (см. главу 7). Например, из атомарного события саН су ж ~сесе)засйе следует истинность высказывания сауй су и ложность высказывания саН су =э соос)зас)зе. ° Любое высказывание логически эквивалентно дизъюнкции всех атомарных событий, из которых следует истинность этого высказывания.