Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 21
Текст из файла (страница 21)
° Единственными доступными действиями являются ьеГс, 772д)зс, Бис)г (всосать мусор) и МоОр (ничего не делать). ° Агент правильно определяет свое местонахождение и воспринимает показания датчика, позволяющие узнать, имеется ли мусор в этом местонахождении. Авторы утверждают, что в этих обстоятельствах агент действительно является рациональным; его ожидаемая производительность, по меньшей мере, не ниже, чем у любых других агентов. В упр.
2.4 предложено доказать это утверждение. Можно легко обнаружить, что в других обстоятельствах тот же самый агент может стать нерациональным. Например, после того как весь мусор будет очищен, агент станет совершать ненужные периодические перемещения вперед и назад; если показатели производительности предусматривают штраф в одно очко за каждое передвижение в том или ином направлении, то агент не сможет хорошо зарабатывать. В таком случае лучший агент должен был бы ничего не делать до тех пор, пока он уверен в том, что все квадраты остаются чистыми. Если же чистые квадраты могут снова стать грязными, то агент обязан время от времени проводить проверку и снова очищать их по мере необходимости.
А если география среды неизвестна, то агенту может потребоваться исследовать ее, а не ограничиваться квадратами д и и. В упр. 2.4 предложено спроектировать агентов для подобных случаев. Всезнанне, обучение н автономность Необходимо тщательно проводить различие между рациональностью и ев всезнанием. Всезнающий агент знает фактический результат своих действий и может действовать соответствующим образом; но всезнание в действительности невозможно.
Рассмотрим следующий пример: некий господин однажды гуляет в Париже по Елисейским Полям и видит на другой стороне улицы старого приятеля. Вблизи нет никаких машин, а наш господин никуда не спешит, поэтому, будучи рациональным агентом, он начинает переходить через дорогу. Между тем на высоте!ОООО метров у пролетающего самолета отваливается дверь грузового отсека', и прежде чем несчастный успевает достичь другой стороны улицы, расплющивает его в лепешку. Было ли нерациональным именно то, что этот господин решил перейти на другую сторону улицы? Весьма маловероятно, что в его некрологе написали бы: "Жертва идиотской попытки перейти улицу".
з См. заметку Н. Гендерсонв "Хем доог 1а~сЬев вгвед 1ог Воевзв 747 )шпьо зезз" (На дверях азрабусов Вае1пя 747 неабходимо срочно установить новые замки). — Ьуввп1пвюп Ром, 24 ад~уста 1989 года. Глава 2. Интеллектуальные агенты 81 Этот пример показывает, что рациональность нельзя рассматривать как равнозначную совершенству. Рациональность — это максимизация ожидаемой производительности, а совершенство — максимизация фактической производительности. Отказываясь от стремления к совершенству, мы не только применяем к агентам справедливые критерии, но и учитываем реальность. Дело в том, что если от агента требуют, чтобы он выполнял действия, которые оказываются наилучшими после их совершения, то задача проектирования агента, отвечающего этой спецификации, становится невыполнимой (по крайней мере, до тех пор, пока мы не сможем повысить эффективность машин времени или хрустальных шаров, применяемых гадалками). Поэтому наше определение рациональности не требует всезнания, ведь рациональный выбор зависит только от последовательности актов восприятия, сформированной к данному моменту.
Необходимо также следить за тем, чтобы мы непреднамеренно не позволили бы агенту участвовать в действиях, которые, безусловно, не являются интеллектуальными. Например, если агент не оглядывается влево и вправо, прежде чем пересечь дорогу с интенсивным движением, то полученная им до сих пор последовательность актов восприятия не сможет подсказать, что к нему на большой скорости приближается огромный грузовик. Указывает ли наше определение рациональности, что теперь агент может перейти через дорогу? Отнюдь нет! Вопервых, агент не был бы рациональным, если бы попытался перейти на другую сторону, получив такую неинформативную последовательность актов восприятия: риск несчастного случая при подобной попытке перейти автомагистраль, не оглянувшись, слишком велик.
Во-вторых, рациональный агент должен выбрать действие "оглянуться", прежде чем ступить на дорогу, поскольку такой осмотр позволяет максимизировать ожидаемую производительность. Выполнение в целях модификации будущих восприятий определенных действий (иногда называемых ъ сбором информации) составляет важную часть рациональности и подробно рассматривается в главе 16. Второй пример сбора информации выражается в том 'ох исследовании ситуации, которое должно быть предпринято агентом-пылесосом в среде, которая первоначально была для него неизвестной.
Наше определение требует, чтобы рациональный агент не только собирал информацию, но также 'в. обучался в максимально возможной степени на тех данных, которые он воспринимает. Начальная конфигурация агента может отражать некоторые предварительные знания о среде, но по мере приобретения агентом опыта эти знания могут модифицироваться и пополняться. Существуют крайние случаи, в которых среда полностью известна заранее.
В подобных случаях агенту не требуется воспринимать информацию или обучаться; он просто сразу действует правильно. Безусловно, такие агенты являются весьма уязвимыми. Рассмотрим скромного навозного жука. Выкопав гнездо и отложив яйца, он скатывает шарик навоза, набрав его из ближайшей навозной кучи, чтобы заткнуть вход в гнездо. Если шарик навоза будет удален непосредственно перед тем, как жук его схватит, жук продолжает манипулировать им и изображает такую пантомиму, как будто он затыкает гнездо несуществующим шариком навоза, даже не замечая, что этот шарик отсутствует.
В результате эволюции поведение этого жука было сформировано на основании определенного предположения, а если это предположение нарушается, то за этим следует безуспешное поведение. Немного более интеллектуальными являются осы-сфексы. Самка сфекса выкапывает норку, выходит из нее, жалит гусеницу и затаскивает ее в норку, затем снова выходит из норки, чтобы проверить, все ли в порядке, вытаски- Часть Е Искусственный интеллект вает гусеницу наружу и откладывает в нее яйца. Гусеница служит в качестве источника питания во время развития яиц.
До сих пор все идет хорошо, но если энтомолог переместит ~усеницу на несколько дюймов в сторону, пока сфекс выполняет свою проверку, это насекомое снова возврагцается к этапу "перетаскивания" своего плана и продолжает выполнять план без изменений, даже после десятков вмешательств в процедуру перемешения гусеницы. Оса-сфекс не способна обучиться действовать в такой ситуации, когда ее врожденный план нарушается, и поэтому не может его изменить. В успешно действуюших агентах задача вычисления функции агента разбивается на три отдельных периода: при проектирования агента некоторые вычисления осушествляются его проектировшиками; дополнительные вычисления агент производит, выбирая одно из своих очередных действии; а по мере того как агент учится на основании опыта, он осуШествляет другие вспомогательные вычисления для принятия решения о том, как модифицировать свое поведение.
Если степень, в которой агент полагается на априорные знания своего проектировшика, а не на свои восприятия, слишком высока, то такой агент рассматривается как обладающий недостаточной 'в.автономностью. Рациональный агент должен быть автономным — он должен обучаться всему, что может освоить, для компенсации неполных или неправильных априорных знаний. Например, агент-пылесос, который обучается прогнозированию того, где и когда появится дополнительный мусор, безусловно, будет работать лучше, чем тот агент, который на это не способен.
Сточки зрения практики агенту редко предъявляется требование, чтобы он был полностью автономным с самого начала: если агент имеет мало опыта или вообше не имеет опыта, то вынужден действовать случайным образом, если проектировшик не оказал ему определенную помощь. Поэтому, как и эволюция предоставила животным достаточное количество врожденных рефлексов, позволяюШих им прожить после рождения настолько долго, чтобы успеть обучиться самостоятельно, так и искусственному интеллектуальному агенту было бы разумно предоставить некоторые начальные знания, а не только наделить его способностью обучаться.
После достаточного опыта существования в своей среде поведение рационального агента может по сути стать независимым от его априорных знаний. Поэтому включение в проект способности к обучению позволяет проектировать простых рациональных агентов, которые могут действовать успешно в исключительно разнообразных вариантах среды. 2.3. ОПРЕДЕЛЕНИЕ ХАРАКТЕРА СРЕДЫ Теперь, после разработки определения рациональности, мы почти готовы приступить к созданию рациональных агентов.
Но вначале необходимо определить, чем является Ъ. проблемная среда, по сути представляющая собой "проблему", для которой рациональный агент служит "решением". Начнем с демонстрации того, как определить проблемную среду, и проиллюстрируем этот процесс на ряде примеров. Затем в этом разделе будет показано, что проблемная среда может иметь целый ряд разновидностей.
Выбор проекта, наиболее подходящего для программы конкретного агента, непосредственно зависит от рассматриваемой разновидности проблемной среды. Глава 2. Интеллектуальные агенты 83 Определение проблемной среды Таблица 2.2. Описание РЕАБ цроблемцой среды ддя автоматизированного водителя такси Исцолннтезьцые ме- Дззчмкд ханизмы Тнд агента Пвкззазелн произво- дитедьноств Среда Видеокамеры, ультразвуковой дальномер, спидометр,глобазьншз система навигации и определения положения, одометр, акселерометр, датчики двигателя, клавиатура Водитель Безопасная, быстрая, Дороги, другие Рулевое управление, такси ком4юргвая езда в транспортные акселератор, тормоз, рамках правил дорож- средства, пе- световые сигналы, ного движения, мзк- шеходы, кди- клаксон, дисплей симцзацмя прибыли енты Прежде всего необходимо определить показатели производительности, которыми мы могли бы стимулировать деятельность нашего автоматизированного водителя.