Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 25
Текст из файла (страница 25)
Несмотря на все сказанное, программа ТаЫе-1згйуеп-Адепс выполняет именно то, что от нее требуется: она реализует желаемую функцию агента. Основная сложность, стоящая перед искусственным интеллектом как научным направлением, состоит в том, чтобы узнать, как создавать программы, которые в рамках возможного вырабатывают рациональное поведение с использованием небольшого объема кода, а не большо~о количества записей таблицы. Сушествует множество примеров, показывающих, что такая задача может быть выполнена успешно в других областях; например, огромные таблицы квадратных корней, использовавшиеся инженерами и 93 Глава 2.
Интеллектуальные агенты школьниками до 1970-х годов, теперь заменены работающей в электронных калькуляторах программой из пяти строк, в которой применяется метод Ньютона. Вопрос заключается в том, может ли искусственный интеллект сделать для интеллектуального поведения в целом то, что Ньютон сделал для упрощения вычисления квадратных корней? Авторы данной книги полагают, что ответ на этот вопрос является положительным. В остальной части этого раздела рассматриваются четыре основных вида программ агентов, которые воплощают принципы, лежа)цие в основе почти всех интеллектуальных систем: ° простые рефлексные агенты; ° рефлексные агенты, основанные на модели; ° агенты, действующие на основе цели; ° агенты, действующие на основе полезности. Затем приведено описание в общих терминах того, как преобразовать агентов всех этих типов в обучающихся агентов.
Простые рефлексные агенты Простейшим видом агента является Ж простой рефлексный агент. Подобные агенты выбирают действия на основе текушего акта восприятия, игнорируя всю остальную историю актов восприятия. Например, агент-пылесос, для которого результаты табуляции функции агента приведены в табл. 2.1, представляет собой простой рефлексный агент, поскольку его решения основаны только на информации о текущем местонахождении и о том, содержит ли оно мусор.
Программа для данного агента приведена в листинге 2.2. Листинг 2.2. Программа простою рефлексного агента в среде пылесоса с двумя состояниями. Эта программа реализует фупкппю агента, которая табулпровапа в табл. 2.1 яипосхоп яе11ех-паспорт-лдедс([1осас1оп,ясасия)) косикпя действие ассдоп Ья яеаеия = Р1яеу Сноп коеикп Бося о1яо Ья 1осаетоп = А С[топ кпеикп Яддье е1яо Ья 1осаедоп = В Сйпп кпеикп Ъеуе Обратите внимание на то, что эта программа агента-пылесоса действительно очень мала по сравнению с соответствующей таблицей. Наиболее очевидное сокращение обусловлено тем, что в ней игнорируется история актов восприятия, в результате чего количество возможных вариантов сокращается от 4тпросто до 4. дополнительное небольшое сокращение обусловлено тем фактом, что если в текущем квадрате имеется мусор, то выполняемое при этом действие не зависит от местонахождения пылесоса.
Представьте себя на месте водителя автоматизированного такси. Если движущийся впереди автомобиль тормозит и загораются его тормозные огни, то вы должны заметить это и тоже начать торможение. Иными словами, над визуальными входными данными выполняется определенная обработка для выявления условия, 94 Часть!. Искусственный интеллект которое обозначается как "саг-зп-Егопс-йя-Ьга]сйпд" (движущийся впереди автомобиль тормозит).
Затем это условие активизирует некоторую связь с действием "Епзсзасе-ьга]сзпд" (начать торможение), установленную в программе агента. Такая связь называется Ъ. правилом условие — действие' и записывается следующим образом: ЕЕ саг-зп-Егопг-зя-Ьганйпд СЬеп зп1гзаге-Ьга)гзпд Люди также используют большое количество таких связей, причем некоторые из них представляют собой сложные отклики, освоенные в результате обучения (как при вождении автомобиля), а другие являются врожденными рефлексами (такими как моргание, которое происходит при приближении к глазу постороннего предмета). В разных главах данной книги будет показано несколько различных способов, с помошью которых можно организовать обучение агента и реализацию таких связей.
Программа, приведенная в листинге 2.2, специализирована для одной конкретной среды пылесоса. Более об(ций и гибкий подход состоит в том, чтобы вначале создать интерпретатор общего назначения для правил условие — действие, а затем определить наборы правил для конкретной проблемной среды. На рис. 2.3 приведена структура такой обшей программы в схематической форме и показано, каким образом правила условие — действие позволяют агенту создать связь от восприятия к действию. (Не следует беспокоиться, если такой способ покажется тривиальным; вскоре он обнаружит намного более интересные возможности.) В подобных схемах для обозначения текущего внутреннего состояния процесса принятия решения агентом используются прямоугольники, а для представления фоновой информации, применяемой в этом процессе, служат овалы.
Программа этого агента, которая также является очень простой, приведена в листинге 2.3. Функция 1пвегргет-1прие вырабатывает абстрагированное описание текущего состояния по результатам восприятия, а функция Пи1е-Мавс]з возвращает первое правило во множестве правил, котОроЕ соответствует заданному описанию состояния. Следует отметить, что приведенное здесь изложение в терминах "правил" и "соответствия" является чисто концептуальным; фактические реализации могут быть настолько простыми, как совокупность логических элементов, реализующих логическую схему. Листинг 2З. Программа простогв рефлексного агента, который действует согласно правилу, ус- ловне которого соатвстствует текущему состоянию, определяемому результатом восприятия Еипсейои Ятмр1е-ПеЕ1ех-Адепг (рессоре) гвеигпв действие асезоп всасзо: ги1ея, множество правил условие-действие ясасе з- 1псегргес-1прис(рессоре) ги1е < — пи1е-масс)г(ясасе, ги1ея) ассзоп < — ки1е-Ассьоп[гите] гесиги асезоп Простые рефлексные агенты характеризуются той замечательной особенностью, что они чрезвычайно просты, но зато обладают весьма ограниченным интеллектом.
Агент, программа которого приведена в листинге 2.3, работает, с)р только если правильное решение может быть принято на основе исключительно текущего восприятия, з Эти связи называются также правилами свтувпна-действне, продуаннамп нли правнаамн и"-(йсн. 96 Часть 1.
Искусственный интеллект Поэтому рандомизированный простой рефлексный агент может превзойти по своей производительности детерминированного простого рефлексного агента. В разделе 2.3 уже упоминалось, что в некоторых мультиагентных вариантах среды может оказаться рациональным рандомизированное поведение правильного типа. А в одноагентных вариантах среды рандомизация обычно не является рациональной. Это лишь полезный трюк, который помогает простому рефлексному агенту в некоторых ситуациях, но в большинстве случаев можно добиться гораздо большего с помощью более сложных детерминированных агентов. Рефлексные агенты, основанные на модели Наиболее эффективный способ организации работы в условиях частичной наблюдаемости состоит в том, чтобы агент отслеживал ту часть мира, которая воспринимается им в текущий момент.
Это означает, что агент должен поддерживать своего рода 'сь внутреннее состояние, которое зависит от истории актов восприятия и поэтому отражает по крайней мере некоторые из ненаблюдаемых аспектов текущего состояния. Для решения задачи торможения поддержка внутреннего состояния не требует слишком больших затрат — для этого достаточно сохранить предыдущий кадр, снятый видеокамерой, чтобы агент мог определить тот момент, когда два красных световых сигнала с обеих сторон задней части идущего впереди автомобиля загораются или гаснут одновременно. Для решения других задач вождения, таких как переход с одной полосы движения на другую, агент должен следить за тем, где находятся другие автомобили, если он не может видеть все эти автомобили одновременно.
Для обеспечения возможности обновления этой внутренней информации о состоянии в течение времени необходимо, чтобы в программе агента были закодированы знания двух видов. Во-первых, нужна определенная информация о том, как мир изменяется независимо от агента, например, о том, что автомобиль, идущий на обгон, обычно становится ближе, чем в какой-то предыдущий момент. Во-вторых, требуется определенная информация о том, как влияют на мир собственные действия агента, например, что при повороте агентом рулевого колеса по часовой стрелке автомобиль поворачивает вправо или что после проезда по автомагистрали в течение пяти минут на север автомобиль находится на пять миль севернее от того места, где он был пять минут назад.
Эти знания о том, "как работает мир" 1которые могут быть вопло~цены в простых логических схемах или в сложных научных теориях) называются моделью мира. Агент, в котором используется такая модель, называется 'в. агентом, основанным на модели. На рис. 2.4 приведена структура рефлексного агента, действующего с учетом внутреннего состояния, и показано, как текущее восприятие комбинируется с прежним внутренним состоянием для выработки обновленного описания текущего состояния. Программа такого агента приведена в листинге 2.4. В этом листинге интерес представляет функция 17рдасе-ясасе, которая отвечает за создание нового описания внутреннего состояния. Эта функция не только интерпретирует результаты нового восприятия в свете су|цествующих знаний о состоянии, но и использует информацию о том, как изменяется мир, для слежения за невидимыми частями мира, поэтому должна учитывать информацию о том, как действия агента влияют на состояние мира. Более подробные примеры приведены в главах 1О и 17.