Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 122
Текст из файла (страница 122)
Ситуации представляют собой логические термы, состоящие из начальной ситуации (обычно называемой ~,) и всех ситуаций, которые создаются в результате применения некоторого действия в некоторой ситуации. Функция пев ц2 с ( а, э) (иногда называемая )зо) обозначает ситуацию, возникающую в результате выполнения действия а в ситуации э. Эта идея иллюстрируется на рис. 10.2. 452 Часть 111. Знания и рассуждения ези!г1 Тига(В!гй!), Вези!г1рогчеаед Вь)) Рис.
10.2. Иллюстрация к понятию ситуации. В ситуационном исчислении каясдая ситуация (кроме во) представляет собой результат некоторого действия ь Ж Флюеитвыми называются функции и предикаты, которые изменяются от одной ситуации к другой, такие как местонахождение агента или наличие живого вампуса. Этот термин происходит от английского слова))иепг, о котором в словаре сказано, что оно обозначает нечто текучее, как жидкость. В данном контексте термином "флюентный" обозначается все, что перетекает, или изменяется от одной ситуации к другой.
В соответствии с общепринятым соглашением ситуация — зто всегда последний параметр флюентного высказывания. Например, во флюентном высказывании но1Жпд(а,, В,) сообщается о том, что агент не владеет золотом й, в начальной ситуации В„а в высказывании Аде ! кцтрця, яр) обозначается возраст вампуса в ситуации яо. ° Допускается также использовать вневременные, или неизменные предикаты и функции. В качестве соответствующих примеров можно указать предикат Со1с) ! 0,) и функцию ЬебгьепОЕ! йгцтрцз) . Кроме единственных действий, имеет также смысл рассуждать о последовательностях действий. Мы можем определять результаты последовательностей действий в терминах результатов отдельных действий. Прежде всего необходимо отметить, что выполнение пустой последовательности оставляет ситуацию неизменной: Леяи1С( 1), а) = а Выполнение непустой последовательности равносильно выполнению первого действия, а затем выполнению остальной ее части в результирующей ситуации: Яеяи1СНа)яеп], я) = Леви1С(яеп, Яеяи1С(о, я)) 453 Глава 10.
Представление знаний Агент, действующий на основе ситуационного исчисления, должен быть способен определять итог некоторой конкретной последовательности действий посредством логического вывода; в этом состоит задача Ъ. проектирования (нахождения л)юекции действий на будущее). Прп наличии подходящего конструктивного алгоритма логического вывода он лолжен также обладать способностью находить последовательность действий, позволяющую достичь желаемого эффекта; в этом состоит зада- ча Ъ. планирования.
Мы будем использовать пример из модифицированной версии мира вампуса, в которой можно не задумываться об ориентации агента и в которой агент может переходить с помощью действия ~о из одного места в соседнее. Предположим, что агент находится в квадрате [1, 1], а золото — в квадрате [1, 2]. Задача состоит в том, чтобы перенести золото в квадрат [1, 1]. Флюентными предикатами являются Лг (о, х, е) и Гто1Жпсг(о, э) . В таком случае первоначальная база знаний может включать следующее описание: ЛС(дяепе, [1,1],з,) е ЛЕ(О,, [1,2],Л,) Но этого описания совершенно недостаточно, поскольку в нем не сказано о том, какие предикаты не являются истинными в состоянии Я,. (Дальнейшее обсуждение этой темы продолжается на с. 484.) Полное описание состоит в следующем: ае(охи) ~ [(о = Леепс их= [1 1)) е (о = Сг их= [1 2))] — Ие1еНпн(о, Яс) Необходимо также указать, что б, — золото и что квадраты [1, 1] и [1, 2 ] являются соседними: аезе(а,) х Лай епс([1,1], [1,2]) х Лойе пе([1,2], [1,11) Неплохо было бы иметь возможность доказать, что агент достигнет цели, перейдя в квадрат [1, 2], схватив золото и возвратившись в квадрат [1, 1], следующим образом: ЛС(О~ ° [1 1] Леее1С( [Се( [1, 1], (1,2] ), СхаЬ(О~), Ое( [1,2], [1, 1] ) ] Яо) ) Но гораздо интереснее составить план приобретения агентом золота и решать эту задачу, получая ответ на показанный ниже запрос, который словесно формулируется таким образом: "Какая последовательность действий вел приведет к тому, что золото окажется в квадрате [1, 11?" Зеен ЛЕ(пг, (1, 1], Яееи1Е(еец.
Яю) ) Рассмотрим, что должно войти в базу знаний, с помощью которой можно было бы получать ответы на такие запросы. Описание действий в ситуационном исчислении В простейшей версии ситуационного исчисления каждое действие описывается с помощью двух аксиом: Ъ. аксиомы возможности, которая указывает, существует или не существует возможность выполнить действие, и Ж аксиомы результата, которая указывает, что произойдет после выполнения возможного действия.
Мы будем использовать высказывание Розе ( а, е) для обозначения того, что возможно выполнить действие а в ситуации е. Эти аксиомы имеют показанную ниже форму. 454 Часть П|, Знания и рассуждения Аксиома возможности: предусловия => Рояя(а,я) Аксиома результата: Рояя(а,я) ~ Изменения, представляюв)ие собой результат выполнения действия Представим эти аксиомы для модифицированного мира вампуса. Чтобы можно было сократить соответствующие высказывания, мы будем исключать кванторы всеобщности, область действия которых распространяется на все высказывание.
Предполагается, что переменная я пробегает по всем ситуациям, а — по действиям, о — по объектам (включая агентов), у — по состояниям владения и не владения золотом, а х и у — по местонахождениям. Приведенные ниже аксиомы возможности для этого состояния мира указывают, что агент может переходить из одного местонахождения в другое, соседнее местонахождение, хватать кучу золота в текущем местонахождении и отпускать золото, которое он держит. Ас(Адепс, х, я) л Адзасепс(х, у) .=> Рояя(бо(х, у), я) Бо1д(д) л Ас(лдепс, х, я) а Ас(д, х, я) ~ Рояя(улаь(у), я) Но1д1пд(д, я) => Рояя(ле1еаяе(д), я) А в приведенных ниже аксиомах результата утверждается, что если действие возможно, то некоторые (флюентные) свойства будут иметь место в ситуации, возникающей в итоге выполнения данного действия.
Переход из квадрата х в квадрат у приводит к пребыванию агента в квадрате у, схватывание золота приводит к владению золотом, а отпускание золота приводит к тому, что агент им больше не владеет. Рояя(уо(х, у), я) ~ АС(Ауепе, у, Неяп1С(до(х, у), я) ) Рояя(алаь(д), я) ~ но1ддпд(у, кеяи1с(спаЬ(д), я)) Роля(ле1еаяе(д), я) => Но1ддпу(д, Неяо1С(ле1еаяе(у), я)) Сможем ли мы теперь доказать, что наш маленький план позволяет достичь цели, сформулировав все эти аксиомы? К сожалению, нет! Вначале все идет прекрасно; действие оо( [1, 1], [1, 2] ) действительно возможно в ситуации Я, и аксиома результата для Со позволяет заключить, что агент достиг квадрата [1, 2 ]: АС(Ауепе, (1,2), Неяд1С(уо( [1,1), [1,2] ),Нв) ) Теперь рассмотрим действие акаЬ (а,) . Необходимо показать, что оно возможно в новой ситуации, т.е.
возможно следующее: АС(уг, (1,2], Яеяп1С(уо( (1, 1], (1, 2] ), Яо) ) К сожалению, в базе знаний нет ничего, что позволило бы обосновать такое заключение. Интуитивно можно понять, что действие агента Со не должно оказывать влияния на местонахождение золота, поэтому золото должно было все время находиться в квадрате [1, 2], даже когда агент был в ситуации Яе св- Проблема состоит в том, что аксиомы результата указывают, что изменилась, но не указывают, что осталось неизменным. Проблема представления всего того, что остается неизменным, называется 'ох проблемой окружения (агате ргоЫеш). Мы должны найти эффективное решение проблемы окружения, поскольку в реальном мире почти все и почти всегда остается 455 Глава !О. Представление знаний неизменным.
В каждом действии затрагивается лишь крошечная часть всех флюентных высказываний. Один из подходов состоит в том, что должны быть записаны явные ск аксиомы окружения, которые указывают, что остается неизменным. Например, после перемещения агента все другие объекты остаются на месте, если только он не берет эти объекты: ЛС(о,х, з) л (о Ф Адепе) л Ло1Н1пд(о, з) ~ АС(о,х,лези1С(оо(у, к), в) ) Если имеется р флюентных предикатов и А действий, то потребуется 0(ЛР) аксиом окружения. С другой стороны, если бы каждое действие имело самое большее к результатов, где д, как правило, намного меньше, чем р, то необходимо было бы иметь возможность представлять, что происходит, с помошью гораздо меньшей базы знаний, с размером 0(лк).
В этом и состоит 'а. проблема представительного окружения (гергезеп(а(юпа! Ггате ргоЫегп). Тесно связанная с ней ск проблема выводимого окружения (гоГегепйа! Ггаше ргоЫегп) заключается в том, что нужно проектировать результаты г-шаговой последовательности действий за время 0(яс), а не за время 0(РС) или 0(ЛДС), чтОбы действовать успешно. Мы будем решать каждую из этих проблем по очереди. Но даже после этого останется еше одна проблема, связанная с тем, что должны быль обеспечены все необходимые условия для успешного выполнения любого действия. Например, действие 0о окончится неудачей, если в ходе его выполнения агент погибнет.
В этом состоит 'в. проблема спецификации (г)цайГгса()оп ргоЫеш), полное решение которой еше не найдено. Решение проблемы представительного окружения Для решения проблемы представительного окружения достаточно лишь немного изменить точку зрения на то, как следует записывать аксиомы. Вместо регистрации результатов каждого действия мы будем рассматривать, как каждый флюентный предикат развивается во времени-'. Применяемые при этом аксиомы называются э.
аксиомами состояния-преемника, Они имеют следуюшую форму: АксиОма состояния-преемника: действие возможно =ь (Олюентное высказывание является истинным в результируюжем состоянии ьь Оно стало истинным в результате действия ж оно было истинным и прежде, а действие оставило епо неизменным) Пояснив, что мы не рассматриваем невозможные действия, хотим обратить внимание читателя на то, что в приведенном выше определении используется логическая связка со, а не =ь.
Таким образом, в этой аксиоме указано, что данное флюентное высказывание будет истинным тогда и только тогда, когда выполняется его правая часть. Иными словами, истинностное значение каждого флюентного высказывания в следуюшем состоянии определено как функция действия и истин- з По сути именно этот подход быя принят при создании агента на основе логической схемы в главе 7 И действительно, такие аксиомы, как уравнения 7 4 и 7.5, могут рассматриваться как аксиомы состояния-преемника.