Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 28
Текст из файла (страница 28)
В этом упражнении исследуется рациональность различных функций агента для пылесоса. а) Покажите, что простая функция агента — пылесоса, описанная в табл. 2.1, действительно рациональна, согласно предположениям, перечисленным нас. 79. б) Опишите рациональную функцию агента для модифицированного показателя производительности, который предусматривает штраф в один пункт за каждое движение. Требуется ли поддержка внутреннего состояния для соответствующей программы агента? Глава 2.
Интеллектуальные агенты 167 2.5. 2.6. 2.7. 2.8. 2.9. 2.10. в) Обсудите возможные проекты агентов для случаев, в которых чистые квадраты могут стать грязными, а география среды неизвестна. Имеет ли смысл в таких случаях для агента обучаться на своем опыте? Если да, то что он должен изучать? Для каждого из следующих агентов разработайте описание РЕАБ среды задачи: а) робот-футболист; б) агент, совершающий покупки книг в!пгегпег; в) автономный марсианский вездеход; г) ассистент математика, занимающийся доказательством теорем. Для каждого из типов агентов, перечисленных в упр. 2.5, охарактеризуйте среду в соответствии со свойствами, приведенными в разделе 2.3, и выберите подходящий проект агента.
Йв Все приведенные ниже упражнения касаются реализации вариантов среды и агентов для мира пылесоса. Реализуйте имитатор среды измерения производительности для мира пылесоса, который изображен на рис. 2.2 и определен на с. 79. Предложенная реализация должна быть модульной, для того чтобы можно было заменять датчики и исполнительные механизмы, а также модифицировать характеристики среды (размер, форму, размещение мусора и т.д.). (Примечание.
Для некоторых сочетаний языка программирования и операционной системы в оперативном репозитарии кода уже имеются реализации.) Реализуйте простого рефлексного агента для среды пылесоса, которая рассматривается в упр. 2.7. Вызовите на выполнение имитатор среды с этим агентом для всех возможных начальных конфигураций мусора и местоположений агента. Зарегистрируйте оценки производительности работы агента для каждой конфигурации и определите его общую среднюю оценку. Рассмотрите модифицированную версию среды пылесоса из упр.
2.7, в которой агенту назначается штраф в один пункт за каждое движение. а) Может ли быть полностью рациональным простой рефлексный агент для этой среды? Обоснуйте свой ответ. б) А что можно сказать о рефлексном агенте с внутренним состоянием? Спроектируйте такого агента. в) Как изменятся приведенные вами ответы на вопросы а) и б), если акты восприятия агента позволяют ему иметь информацию о том, является ли чистым или грязным каждый квадрат в этой среде? Рассмотрите модифицированную версию среды пылесоса из упр.
2.7, в которой неизвестны география среды (ее протяженность, границы и препятствия), а также начальная конфигурация расположения мусора. (Агент может совершать движения гесс и Жд)з с, а также ггр и 1эоыпь) а) Может ли быть полностью рациональным простой рефлексный агент для этой среды? Обоснуйте свой ответ. б) Может ли простой рефлексный агент с рандомизированной функцией агента превзойти по своей производительности простого рефлексного 10З Часть 1. Искусственный интеллект агента? Спроектируйте такого агента и измерьте его производительность в нескольких вариантах среды. в) Можете ли вы спроектировать среду, в которой предложенный вами рандомизированный агент будет показывать очень низкую производительность? Продемонстрируйте полученные вами результаты.
г) Может ли рефлексный агент с поддержкой состояния превзойти по своей производительности простого рефлексного агента? Спроектируйте такого агента и измерьте его производительность в нескольких вариантах среды. Сумеете ли вы спроектировать рационального агента этого типа? 2.11. Повторите упр. 2.10 для такого случая, в котором датчик местоположения заменен датчиком удара, позволяющим обнаруживать попытки агента пройти сквозь препятствие или пересечь границы среды.
Предположим, что датчик удара перестал работать; как должен действовать агент? 2.12. Все варианты среды пылесоса, рассматриваемые в предыдущих упражнениях, были детерминированными. Обсудите возможные программы агента для каждого из следующих стохастических вариантов. а) Закон Мэрфи: в течение 25% времени применение действия Яис1е не позволяет очистить пол, если пол грязный, и приводит к появлению мусора на полу, если пол чистый. Как эти обстоятельства отразятся на предложенной вами программе агента, если датчик мусора дает неправильный ответ в течение 10% времени? б) Маленькие дети: в каждом интервале времени каждый чистый квадрат имеет 10%-ную вероятность стать грязным.
Можете ли вы предложить проект рационального агента для этого случая? Часть |1 По РЕШЕНИЕ ПРОБЛЕМ Решение проблем посредством поиска Информированный поиск и исследование пространства состояний Задачи удовлетворения ограничений Поиск в условиях противодействия 153 209 240 В этой главе показано, каким образом агент может найти последовательность действий, позволяюигую достичь его целей в тех условиях, когда единственного действия для этого недостаточно. Простейшими агентами, которые рассматривались в главе 2, были рефлексные агенты, функционирование которых основано на непосредственном отображении состояний в действия. Подобные агенты не могут успешно действовать в тех вариантах среды, где такие отображения были бы слишком большими, чтобы можно было обеспечить их хранение, а изучение отображений потребовало бы слишком много времени. Агенты на основе цели, с другой стороны, способны достичь успеха, рассматривая будущие действия и оценивая желательность их результатов.
Данная глава посвящена описанию одной разновидности агента на основе цели, называемой ск агентом, решающим задачи. Агенты, решающие задачи, определяют, что делать, находя последовательности действий, которые велут к желаемым состояниям. Начнем изложение этой темы с точного определения элементов, из которых состоит задача" и ее "решение", и приведем несколько примеров для иллюстрации этих определений. Затем представим несколько алгоритмов поиска общего назначения, которые могут использоваться для решения подобных задач, и проведем сравнение преимуществ и недостатков каждого алгоритма.
Эти алгоритмы являются не- информированными в том смысле, что в них не используется какая-либо информация о рассматриваемой задаче, кроме ее определения. В главе 4 речь идет об информированных алгоритмах поиска, в которых используются определенные сведения о том, где следует искать решения. В данной главе применяются понятия из области анализа алгоритмов. Читатели, незнакомые с понятиями асимптотической сложности (т.е. с системой обозначений О ( ) ) и ХР-полноты, должны обратиться к приложению А. 3.1.
АГЕНТЪ|, РЕШАЮЩИЕ ЗАДАЧИ Предполагается, что интеллектуальные агенты обладают способностью максимизировать свои показатели производительности. Как уже упоминалось в главе 2, реа- Глава 3. Решение проблем посредством поиска лизация указанного свойства в определенной степени упрощается, если агент способен принять на себя обязанность достичь цели и стремиться к ее удовлетворению. Вначале рассмотрим, как и почему агент может приобрести такую способность.
Представьте себе, что некоторый агент находится в городе Арап, Румыния, и проводит свой отпуск в качестве туриста. Показатели производительности агента включают много компонентов: он хочет улучшить свой загар, усовершенствовать знание румынского языка, осмотреть достопримечательности, насладиться ночной жизнью (со всеми ее привлекательными сторонами), избежать неприятностей и т.д. Эта задача принятия решения является сложной; для ее выполнения необходимо учитывать множество компромиссов и внимательно читать путеводители. Кроме того, предположим, что у агента имеется не подлежаший возмещению билет для вылета из Бухареста на следующий день. В данном случае для агента имеет смысл стремиться к достижению цели попасть в Бухарест. Способы действий, не позволяющие вовремя попасть в Бухарест, могут быть отвергнуты без дальнейшего рассмотрения и поэтому задача принятия решения агентом значительно упрошается.
Цели позволяют организовать поведение, ограничивая выбор промежуточных этапов, которые пытается осуществить агент. Первым шагом в решении задачи является Ж формулировка цели с учетом текушей ситуации и показателей производительности агента. Мы будем рассматривать цель как множество состояний мира, а именно тех состояний, в которых достигается такая цель. Задача агента состоит в том, чтобы определить, какая последовательность действий приведет его в целевое состояние. Прежде чем это сделать, агент должен определить, какого рода действия и состояния ему необходимо рассмотреть.
Но если бы агент пытался рассматривать действия на уровне "перемещения леной ноги вперед на один сантиметр" или "поворота рулевого колеса на один градус влево", то, по-видимому, так и не смог бы выехать с автомобильной стоянки, не говоря уже о своевременном прибытии в Бухарест, поскольку на таком уровне детализации мир обладает слишком большой неопределенностью, а решение должно состоять из слишком многих этапов. ок Формулировка задачи представляет собой процесс определения того, какие действия и состояния следует рассматривать с учетом некоторой цели.