Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 197
Текст из файла (страница 197)
Мы будем использовать х, для обозначения множества ненаблюдаемых переменных состояния во время с и н, для обозначения множества наблюдаемых переменных свидетельства. Результаты наблюдения во время с представляют собой множество е,=е„соогветствуюшее некоторому множеству значений е,. Рассмотрим следующий крайне упрошенный пример. Предположим, что на каком-то секретном подземном объекте служит охранник, который никогда не выходит наружу. Он хочет знать, идет ли сегодня дождь, но единственный доступ к информации из внешнего мира охранник получает только по утрам, когда видит директора, пришедшего с зонтиком или без зонтика.
Таким образом, в каждые сутки с 720 Часть 'хг. Неопределенные знания и рассуждения в условиях неопределенности множество н, включает единственную переменную свидетельства гг, (которая показывает, несет ли директор зонтик), а множество х, содержит единственную переменную состояния д, (которая показывает, идет ли дождь). Другие задачи могут быть связаны с использованием более крупных множеств переменных. В частности, в примере с больным диабетом могут использоваться такие переменные свидетельства, как результаты измерения уровня сахара в крови меавикес)в1оос)яидсгь и частоты пульса Ри1зедп сом а также переменные состояния~, такие как фактический уровень сахара В КРОВИ Н1 О ОС) Видах, И СОдЕржИ МОЕ жЕЛудКа БСОтаОПСОП С ЕП Сам Интервал между временными срезами также зависит от задачи.
При контроле состояния больного диабетом подходящим интервалом может оказаться час, а не сутки. В этой главе в основном предполагается использование фиксированных конечных интервалов; это означает, что точки во времени, соответствующие временным срезам, могут быть обозначены целыми числами. Кроме того, предполагается, что последовательность состояний начинается в момент времени с=О; к тому же по некоторым причинам, не имеющим особого значения, предполагается, что свидетельства начинают появляться в момент времени с=1, а не с=О. Таким образом, мир задачи с зонтиком может быть представлен переменными состояния дшдмд,,... и переменными свидетельства гг,,ггм....
Для обозначения последовательности целых чисел от а до Ь (включительно) будет использоваться запись а: Ь, а для обозначения соответствующего ряда переменных от х, до х. — запись х,.ь Например, ум, соответствует переменным ггм ум Ггэ. Стационарные процессы и марковское предположение После того как выбраны множества переменных состояния и переменных свидетельства для данной конкретной задачи, на следующем этапе необходимо определить зависимости между этими переменными. Мы будем следовать процедуре, описанной в главе 14, размещая переменные в некотором порядке и отвечая на вопросы об условной независимости переменных-преемников, если дано некоторое множество родительских переменных. Одним из очевидных вариантов является упорядочение переменных в их естественной временной последовательности, поскольку причина обычно предшествует результату, а мы предпочитаем вводить переменные в причинной послеловательности.
Однако при таком подходе сразу же возникает одно препятствие: множество переменных является неограниченным, поскольку включает переменные состояния и переменные свидетельства для каждого временного среза. Такая ситуация фактически порождает две проблемы; во-первых, нам может потребоваться задать неограниченное количество таблиц условных вероятностей, по одной для каждой переменной в каждом срезе, во-вторых, каждая переменная может быть связана с неограниченным количеством родительских переменных. Первая проблема разрешима на основании предположения, что изменения в состоянии мира вызваны Ъ.
стационарным процессом, т.е. процессом изменения, подчиняющимся таким законам, которые сами не изменяются во времени. (Не следует ' Обратите внимание па то, что взподзипаг, и непэихепвзоо хзпрат.„представляют собой разные переменные; это позволяет отличить зашумленные результаты измерений от Фактических данных. 721 Глава 15. Вероятностные рассуждения во времени путать стиг(ионарньге процессы со статическими — в статическом процессе не изменяется само состояние.) Поэтому в мире задачи с зонтиком условная вероятность ТОГО, Чтс ДИРЕКТОР ПРИДЕТ С ЗОНТИКОМ, Р((7, ~ РаКЕПЕВ((ге) ), ЯВЛЯЕТСЯ ОДИНаКОВОй для всех значений с.
Таким образом, если принято предположение о стационарности, то необходимо задавать условные распределения только для переменных, относящихся к некоторому "репрезентативному" временному срезу. Вторая проблема, касающаяся того, что приходится иметь дело с таким количеством родительских переменных, которое в принципе может стать бесконечным, решается благодаря принятию так называемого 7к марковского предположения, или предположения а маркавасти, которое заключается в том, что текущее состояние зависит лишь от конечной истории предыдущих состояний.
Процессы, соответствующие этому предположению, были впервые глубоко исследованы российским ученым-статистиком Андреем Марковым и называются ск марковскими процессами, или марковскими цепями. Существует несколько разновидностей таких процессов; простейшим из них является Ъ. марковский процесс первого порядка, в котором текущее состояние зависит только от предыдущего состояния н не зависит от каких- либо более ранних состояний. Иными словами, состояние — это информация, которая требуется для того, чтобы сделать прогноз о будущем независимым от прошлого, если дано это состояние.
С использованием принятой в этой главе системы обозначений соответствующее угверждение об условной независимости позволяет сформулировать для всех с следующее соотношение: в(х,)х...) = в(х.(х, г) (15.1) Таким образом, в марковском процессе первого порядка законы, описывающие, как состояние развивается во времени, полностью представлены в условном распределении в (х, ~ х,,), которое мы будем называть моделью перехода для процессов первого порядка'. Моделью перехода для марковского процесса второго порялка является условное распределение в (х, ~ хе,, хе,) . Структуры байесовских сетей, соответствующие марковским процессам первого и второго порядка, приведены на рис.
15.1. Хг 2 Хг 1 Хг Хг„.) ХМ2 а) б) Рис. 15.1. Структуры байесовских сетейг байесовская сеть, соответствуюи(ая марковскому проиессу первого порядка с состоянием, определяемым переменными х, (а); марковский проиесс второго порядка (б) Кроме ограничения количества родительских переменных, относящихся к переменным состояния х„необходимо ограничить количество родительских переменных, относящихся к переменным свилетельства е,.
Как правило, в данной главе г Модель перехода представляет собой вероятностный аналог булевых схем обновления, описанных в главе 7, и аксиом состояния-преемника, представленных в главе 10. 722 Часть Ч. Неопределенные знания и рассуждения в условиях неопределенности предполагается, что переменные свидетельства во время с зависят только от текущего состояния: Р(Е,(Х,.„Еь ..) = Р(Е,(Х,) (1Г.Е) Условное распределение Р(е,!х,) называется 'ъ.моделью восприятия (или иногда моделью наблюдения), поскольку оно показывает, как фактическое состояние мира влияет на "результаты восприятия", т.е. на переменные свидетельства. Обратите внимание на то, каково направление зависимости: "стрелки" идут от состояния к значениям результатов восприятия, поскольку именно состояние мира вынуждает результаты восприятия приобретать данные конкретные значения.
Например, в мире задачи с зонтиком дождь вынуждает дирекюра прийти с зонтиком. (Разумеется, процесс вероятностного вывода проходит в другом направлении; одним из преимуществ байесовских сетей является то, что они позволяют провести различие между направлением моделируемых зависимостей и направлением вероятностного вывода.) Кроме модели перехода и модели восприятия, необходимо определить Р(Х,)— распределение априорных вероятностей состояний во время О.
Эти три распределения, в сочетании с предположениями об условной независимости, приведенными в уравнениях 15.1 и 15.2, позволяют получить спецификацию полного совместного распределения по всем переменным. Для любого конечного значения с получаем следующее; Р(Хь Хс .. ° Хс ° Ес ". ° Ес) = Р(Хь) П Р(Х,)хь с) Р(Е,)Хс) с=1 Предположения о независимости соответствуют очень простой структуре байесовской сети, описывающей всю систему.
На рис. 15.2 показана структура сети для примера с зонтиком, включая условные распределения для модели перехода и модели восприятия. л р(лй ! 0,7 Рис. 15.2. Структура байесовской сети и распределения условных вероятностей, которые описывают мир задачи с зонтиком. Моделью перехода служит Р(да1п,/Патп, с), а моделью восприятия является Р (ПюЬке11ас/Паьпь) В структуре, показанной на атом рисунке, предполагается использование марковского процесса первого порядка, поскольку считается, что вероятность дождя зависит только от того, был ли дождь в предыдущие сутки.