Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 158
Текст из файла (страница 158)
Планирование стоимости неиерархического решения, если значения Ь и с1 являются сопоставимыми. С другой стороны, составление библиотеки планов, которая включает небольшое количество длинных декомпозиций, но тем не менее позволяет решить любую задачу, не всегда возможно. В другой формулировке эту мысль можно выразить так, что длинные декомпозиционные макроподстановки, применимые для решения широкого ряда задач, являются чрезвычайно пенными. Еше одной и, возможно, более важной причиной, позволяющей убедиться в том, что планирование НТ1ч' эффективно, является то, что эти методы хорошо зарекомендовали себя на практике. Почти все планировщики для крупномасштабных приложений являются планировщиками НТ1х1, поскольку планирование НТ1Ч позволяет людям-экспертам применять свои крайне важные знания о том, как следует выполнять сложные задания, чтобы можно было формировать большие планы с малыми вычислительными издержками. Например, система О-Р1ап [93], в которой планирование НТ1х1 сочетается с составлением расписаний, использовалась для разработки производственных планов в компании Н1гасЛ1.
При этом типичная задача охватывала произволственную линию с 350 различными изделиями, 35 сборочными агрегатами и с более чем 2000 различных операций. Планировщик О-Р!ап вырабатывает тридцатисуточные расписания с тремя восьмичасовыми сменами в сутки, включающие миллионы операций. Таким образом, ключом к планированию НТХ является составление библиотеки планов, в которой зашифрованы известные методы осуществления сложных, высокоуровневых действий.
Одним из способов составления такой библиотеки является изучение требуемых методов на опыте решения задач. Накопив тяжелым трудом опыт планирования в ходе разработки какого-то плана с нуля, агент может сохранить этот план в библиотеке как метод осуществления высокоуровневого действия, определяемого данным конкретным заданием. Таким образом, агент может становиться со временем все более и более компетентным по мере того, как будет находить новые методы на основе старых.
Одной из важных характеристик такого процесса обучения является способность обобщать созданные методы, устраняя детали, характерные для данного экземпляра задачи (например, в задаче строительства дома таковыми являются имя подрядчика или адрес земельного участка), и сохраняя в плане только ключевую информацию. Методы осуществления такого рода обобщения описаны в главе 19. Авторы не могут себе даже представить, что человечество смогло бы достичь современного уровня компетентности без какого-то подобного механизма. 12.3. ПЛАНИРОВАНИЕ И ОСУЩЕСТВЛЕНИЕ ДЕЙСТВИЙ В НЕДЕТЕРМИНИРОВАННЫХ ПРОБЛЕМНЪ|Х ОБЛАСТЯХ До сих пор в этой главе рассматривались только проблемные области классического планирования, которые являются полностью наблюдаемыми, статическими и детерминированными.
Кроме того, предполагалось, что описания действий являются правильными и полными. В таких обстоятельствах любой агент получает возможность вначале составлять план, а затем выполнять этот план буквально "с закрытыми глазами". С другой стороны, в неопределенной среде агент должен использовать результаты своих восприятий для обнаружения того, что происходит в процессе вы- Глава 12.
Планирование и осуществление действий в реальном мире 58! полнения плана, а также, возможно, модифицировать или заменять этот план, если случается что-то непредвиденное. Агентам приходится также иметь дело и с неполной, и с неправильной информацией.
Неполнота возникает из-за того, что мир является частично наблюдаемым, или недетерминированным, или обладающим и тем и другим свойством. Например, дверца шкафа с канцелярскими принадлежностями может быть либо закрыта, либо не закрыта на замок; один из моих ключей может открыть или не открыть дверцу, если она на замке, а я могу знать или не знать, в чем имеющаяся у меня информация об этой ситуации является неполной. Поэтому моя модель мира является слабой, но правильной. С другой стороны, неправильность часто возникает, поскольку мир не всегда соответствует моей модели мира; например, я могу быть уверенным в том, что мой ключ откроет шкаф с канцелярскими принадлежностями, но окажусь неправ, если в нем сменили замок. Не обладая способностью справляться с неправильной информацией, агент становится таким же неинтеллектуальным, как и навозный жук (с.
81), который пытается заткнуть свою норку несуществующим шариком навоза даже после того, как шарик вынули из его лапок. Возможность получения полной или правильной информации зависит от того, какой степенью недетерминированности характеризуется мир. При ек ограниченной иедетерминироваиности действия могут иметь непредсказуемые результаты, но все возможные результаты можно перечислить в аксиомах описания действия.
Например, при подбрасывании монеты вполне резонно считать, что результатом будет Неас)э (Орел) или таз2э (Решка). Агент получает способность справляться с ограниченной недетерминированностью, составляя планы, применимые во всех возможных обстоятельствах. При 'в. неограниченной недетерминированности, с другой стороны, множество возможных предусловий или результатов либо неизвестно, либо слишком велико для того, чтобы в нем можно было выполнить полный поиск. Такие ситуации могут возникать в случае очень сложных или динамичных проблемных областей, таких как вождение автомобиля, экономическое планирование и разработка военной стратегии.
Агенту удастся справиться с неограниченной недетерминированностью, только если он способен пересматривать свои планы и/или свою базу знаний. Неограниченная недетерминированность тесно связана с проблемой спецификации (г(ца1)йсаг(оп ргоЫегп), описанной в главе 1О, — с проблемой, определяемой невозможностью перечислить все предусловия, требуемые для того, чтобы какое-то действие в реальном мире имело свой намеченный результат.
Существуют четыре описанных ниже метода планирования для осуществления действий в условиях недетерминированности. Первые два из них применимы для ограниченной недетерминированности, а последние два — для неограниченной не- детерминированности. ° Ъ. Планирование без использования датчиков. Этот метод, называемый также совместимым планированием, предусматривает создание стандартных, последовательных планов, которые должны выполняться без учета результатов восприятия. Алгоритм планирования без использования датчиков должен обеспечивать, чтобы цель достигалась в плане при всех возможных обстоятельствах, независимо от истинного начального состояния и фактических результатов действий. Планирование без использования датчиков основано на идее принуждения, согласно которой мир может быть принудительно переве- 582 Часть !У, Планирование ден в данное конкретное состояние, даже если агент обладает лишь частичной информацией о текущем состоянии.
Принуждение не всегда возможно, поэтому планирование без использования датчиков часто является неприменимым. Методы решения задач без использования датчиков, предусматривающие поиск в пространстве доверительных состояний, были описаны в главе 3. ° 'а. Условное планирование. В этом подходе, называемом также планированием с учетом непредвиденных ситуаций, действия в условиях ограниченной недетерминированности осуществляются путем создания условного плана с различными ответвлениями для самых разных непредвиденных ситуаций, какие только могут возникнуть. Так же как и в классическом планировании, агент вначале составляет план, а затем выполняет подготовленный план. Агент определяет, какая часть плана должна быть выполнена, включив в план 'з.
действия по восприятию для проверки соответствующих условий. Например, в проблемной области воздушных перевозок могут быть предусмотрены планы, в которых указано "проверить, работает ли аэропорт Яг0 (СанФранциско); в случае положительного ответа полететь в этот аэропорт, в противном случае полететь в Окленд". Условное планирование рассматривается в разделе 12.4. ° 'з. Контроль выполнения и перепланирование. При этом подходе агент может использовать любой из описанных выше методов планирования (классический, без использования датчиков или условный) для формирования плана, но использует также контроль выполнения для оценки того, предусмотрена ли в плане фактически сложившаяся текущая ситуация, или план должен быть пересмотрен.
Перепланирование осуществляется, если что-то происходит не так, как надо. Благодаря этому агент приобретает способность справляться с неограниченной недетерминированностью. Например, даже если агент, способный к перепланированию, не предвидел возможность закрытия аэропорта ЯЕ'О, то может обнаружить эту ситуацию после ее возникновения и снова вызвать планировщик для поиска нового пути к цели. Перепланируюшие агенты рассматриваются в разделе 12.5. ° Ъ.