Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 332
Текст из файла (страница 332)
В течение последнего десятилетия общим стимулом для проведения исследований по мобильным роботам служат два важных соревнования. Ежегодное соревнование мобильных роботов общества ААА! впервые было проведено в 1992 году. Первым победителем соревнования стал робот Саппе! [287]. Наблюдаемый прогресс остается стабильным и весьма впечатляющим: в одном из последних соревнований (2002 год) перед роботами стояла задача войти в комплекс зданий, где проводилась конференция, найти путь к бюро регистрации, зарегистрироваться на конференции и произнести речь.
В соревновании 'гк Войосвр, инициатором проведения которого в 1995 году стал 1'итано со своими коллегами [802), провозглашена цель — к 2050 году Глава 25. Робототехника 1239 "разработать команду полностью автономных роботов-гуманоидов, которые смогут победить команду чемпионов мира по футболу среди людей*'. Игры происходят в лигах для роботов, имитирующих людей, колесных роботов различных размеров и четырехногих роботов А[Ьо компании Вопу.
В 2002 году это соревнование привлекло команды почти из 30 различных стран и на нем присутствовало больше 100 тысяч зрителей. Исследования по созданию роботов-манипуляторов, которые первоначально именовались 'в. машинами "рука — глаз", развиваются в нескольких весьма различных направлениях. Первой важной работой по созданию машины "рука — глаз" был проект Генриха Эрнста под названием МН-1, описанный в тезисах его докторской диссертации, которые были опубликованы в Массачусетсском технологическом институте )441). Проект Мас)бпе 1пге!!18епсе, разработанный в Эдинбурге, также стал одной из первых демонстраций впечатляющей сборочной системы, основанной на использовании средств машинного зрения, которая получила название Ргедг[у [1044). После того как был сделан этот решаюший начальный вклад, основные усилия были сосредоточены на создании геометрических алгоритмов для решения задач планирования движения в детерминированной и полностью наблюдаемой среде.
В оригинальной работе Рейфа [1274) было показано, что задача планирования движения робота является РБРАСЕ-трудной. Представление на основе пространства конфигураций было предложено Лозано-Пересом [956]. Важное влияние оказал ряд статей Шварца и Шарира, посвяшенных задачам, которые были ими названы задачами для 'в. грузчиков-тяжеловесов (р[апо тогег) [1371). Метод рекурсивной декомпозиции ячеек для планирования в пространстве конфигураций был впервые предложен в [! 93) и существенно доработан в ]1646].
Самые первые алгоритмы скелетирования были основаны на диаграммах Вороного [1313] и 'в. графах видимости [158! ]. В [603) приведены результаты разработки эффективных методов инкрементного вычисления диаграмм Вороного, а в [253] диаграммы Вороного были распространены на гораздо более широкий класс задач планирования движения. В тезисах докторской диссертации Джона Капни [219] предложен первый полностью экспоненциальный алгоритм планирования движения с использованием егце одного метода скелетирования, называемого алгоритмом 'гь силуэта. В книге Жан-Клода Латомба [891) рассматривается целый ряд подходов к решению задачи планирования движения. В )780) описаны методы разработки вероятностных дорожных карт, которые в настояшее время относятся к числу наиболее эффективных методов. Планирование тонких движений с ограниченными сенсорными данными исследовалось в [217) и [957] на основе идеи интервальной неопределенности, а не вероятностной неопределенности.
В навигации на основе отметок [902] используются во многом такие же идеи, как и в других областях исследования мобильных роботов. Управлению роботами как динамическими системами (для решения задач манипулирования или навигации) посвящен огромный объем литературы, поэтому в данной главе лишь кратко рассматриваются сведения, касаюшиеся этой области. К числу важнейших работ относятся трехтомник по импедансному управлению Хогана [668) и обшее исследование по динамике роботов Физерстоуна [456). Дин и Уэллман [363) были в числе первых, кто попытался связать воедино теорию управления и системы планирования на основе искусственного интеллекта.
Тремя классическими учебниками по математическим основам робототехнического манипулирования являются )305], [1!84] и [1634). Важное значение в робототехнике имеет также область проблем 'а. схватывания, поскольку тема определения стабильных ус- 1240 Часть У! 1. Общение, восприятие и осуществление действий ловий приложения захвата является весьма сложной [998]. Для того чтобы иметь возможность создать успешно действуюшее средство схватывания, необходимо обеспечить восприятие данных о прикосновении, или 'з. тактильную обратную связь, для определения усилия контакта и обнаружения проскальзывания [455]. Понятие управления на основе поля потенциалов, с помошью которого предпринимаются попытки одновременно решать задачи планирования движения и управления, было введено в сферу робототехники Хатибом [793].
В технологии мобильных роботов эта идея стала рассматриваться как практический способ решения залачи предотврашения столкновений, а в дальнейшем была дополнена и легла в основу алгоритма 'в. гистограмм векторного поля ]154]. Функции навигации, представляющие собой робототехническую версию политики управления для детерминированных задач МОР, были предложены в [8! 2]. Вокруг проблемы создания архитектур программного обеспечения для роботов ведутся оживленные дискуссии.
Истоками трехуровневой архитектуры стали исследования, проводившиеся еше в эпоху так называемого "старого доброго искусственного интеллекта", в том числе исследования по созданию проекта 8]за1еу; общий обзор на эту тему приведен в [525]. Обобшаюшая архитектура была предложена Родни Бруксом [189], хотя аналогичные идеи были разработаны независимо Ьрейтенбергом [172], в книге которого, РеЫс[ез, описан ряд простых роботов, основанных на поведенческом подходе. Вслед за успешным созданием Бруксом шестиногого шагаюгцего робота был разработан целый ряд других проектов.
Коннелл описал в своих тезисах докторской диссертации [288] результаты разработки мобильного робота, способного находить объекты, проект которого был полностью реактивным. Описания попыток распространить поведенческий принцип на системы, состояшие из нескольких роботов, можно найти в [999] и [1176]. Результатом обобщения идей робототехники, основанной на параллельно организуемом поведении, стало создание универсальных языков управления роботами ОК[.
[681] и Со!Ьегг [832]. В [38] приведен обзор состояния дел в этой области. Для управления мобильными роботами, выполняюшими задания по разведке местности и доставке материалов, использовались также ситуационные автоматы [760], [1308], описанные в главе 7. Проекты ситуационных автоматов тесно связаны с проектами, основанными на организации поведения, поскольку они состоят из конечных автоматов, отслеживаюших различные аспекты состояния среды с использованием простых комбинаторных схем. Тем не менее в подходе, основанном на организации поведения, подчеркивается отсутствие явного представления, а ситуационные автоматы конструируются алгоритмически из декларативных моделей среды таким образом, что представительное содержание каждого регистра состояния является полностью определенным.
В настояшее время имеется несколько хороших современных учебников по мобильной робототехнике. Кроме учебников, указанных выше, можно назвать сборник Кортенкампа и др. [846], в котором приведен исчерпывающий обзор современных архитектур систем мобильных роботов. В недавно изданных учебниках [423] и [1107] рассматриваются более обшие вопросы робототехники. Рц!е в одной недавно изданной книге по робототехническому манипулированию рассматриваются такие сложные темы, как согласующее движение [997].
Основной конференцией по робототехнике является ! ЕЕЕ!шегпшгопа1 Соп~егепсе оп Яо6ог~сз ая0 Аяготайол. В число робо- Глава 25. Робототехника 1241 УПРАЖНЕНИЯ При любом конечном размере выборки результаты применения алгоритма локализации Монте-Карло являются смещенными (т.е, ожидаемое значение данных о местонахождении, вычисленные с помощью алгоритма, отличаются от истинного ожидаемого значения), поскольку именно так действуют алгоритм фильтрации частиц. В данном упражнении предлагается оценить это смешение.
25.1. Для упрощения рассмотрим мир с четырьмя возможными местонахождениями робота: к= (х,, х,, х,, х4) . Первоначально осуществим равномерную выборку)у>1 образцов среди этих местонахождений. Как обычно, вполне приемлемо, если для любого из местонахождений х будет сформировано больше одной выборки. Допустим, что г — булева сенсорная переменная, характеризующаяся следующими условными вероятностями: Р(е)х~) = 0.8 Р( е(х~) = 0.2 Р(е(х2) = 0.4 Р( е(хг) = 0.6 Р(е(хз) = 0.1 Р( е(хз) = 0.9 Р(е)х4) = 0.1 Р( ~е)х4) = 0.9 В алгоритме МОЕ эти вероятности используются лля формирования весов частиц, которые в дальнейшем нормализуются и используются в процессе повторной выборки.
Для упрощения предположим, что при повторной выборке вырабатывается только один новый образец, независимо от д). Этот образец может соответствовать любому из четырех местонахождений х. Таким образом, процесс выборки определяет распределение вероятностей по х. а) Каково результирующее распределение вероятностей по х для этого нового образца? Ответьте на этот вопрос отдельно для дм1, ..., 10 и для )у= б) Разница между двумя распределениями вероятностей Р и О может быть измерена с помощью дивергенции кь, которая определяется следующим образом: КЬ(Р,д) = ХУ Р(х;)1сд —,— Р(х,) 1 Каковы значения дивергенции ке между распределениями в упр. 25.1, а и истинным распределением апостериорных вероятностей? в) Какая модификация формулировки задачи (а не алгоритма!) гарантировала бы, чтобы конкретное приведенное выше выражение для оценки оставалось несмещенным даже при конечных значений ЬЯ Предложите по меньшей мере две такие модификации (но каждая из них должна соответствовать предложенному заданию).