Рассел С., Норвиг П. Искусственный интеллект. Современный подход (2-е изд., 2006) (1245267), страница 326
Текст из файла (страница 326)
Такую цепочку преобразований координат принято называть кинематикой; этот термин уже встречался при обсуждении мобильных роботов. Обратная задача вычисления конфигурации робота, для которого задано местонахождение исполнительного механизма в координатах рабочего пространства, называется 'еа обратной кинематикой.
Проблема вычисления обратной кинематики, как правило, является трудной, особенно для роботов со многими степенями свободы. В частности, это решение редко является уникальным. Для рассматриваемого в качестве примера манипулятора робота сушествуют две различные конфигурации, при которых захват занимает одни и те же координаты рабочего пространства (см. рис. 25.11). Вообще говоря, для любого множества координат рабочего пространства этого манипулятора робота с двумя сочленениями количество обратных кинематических решений изменяется в пределах от нуля до двух. А для большинства промышленных роботов количество решений бесконечно велико. Чтобы понять, почему это возможно, достаточно представить себе, что в роботе, рассматриваемом в качестве примера, будет установлен третий, дополнительный шарнир, ось вращения которого параллельна оси сушествующего шарнира.
В таком случае можно будет поддерживать фиксированное местонахождение (но не ориентацию!) захвата и вместе с тем свободно вращать его внутренние шарниры в большинстве конфигураций робота. Добавив еше несколько шарниров (определите, сколько именно?), можно добиться того же эффекта, поддерживая также постоянную ориентацию.
Пример аналогичной ситуации уже рассматривался в данной книге, когда читателю было предложено провести "эксперимент", положив ладонь на стол и двигая локтем. В таком случае кинематическое ограничение на позицию ладони не позволяет однозначно определить конфигурацию локтя. Иными словами, задача определения обратной кинема- Часть |г11. Общение, восприятие и осуществление действий 1210 тики для сочленения "плечо — предплечье" руки с ладонью, лежащей на столе, имеет бесконечное количество решений. Вторая проблема, возникаюшая при исполыовании представлений пространства конфигураций, связана с наличием препятствий, которые могут сушествовать в рабочем пространстве робота. В примере, приведенном на рис.
25.11, а, показано несколько таких препятствий, включая свободно свисаюшую с потолка полосу, которая проникает в самый центр рабочего пространства робота. В рабочем пространстве такие препятствия рассматриваются как простые геометрические формы, особенно в большинстве учебников по робототехнике, которые в основном посвяшены описанию многоугольных препятствий. Но как эти препятствия выглядят в пространстве конфигураций? На рис. 25.11, б показано пространство конфигураций робота, рассматриваемого в качестве примера, при той конкретной конфигурации препятствий, которая приведена на рис. 25.11, а. Это пространство конфигураций можно подразделить на два подпространства: пространство всех конфигураций, достижимых для робота, которое принято называть Ж свободным пространством, и пространство недостижимых конфигураций, называемое ж занятым пространством.
Обозначенный белым цветом участок на рис. 25.11, б соответствует свободному пространству. Все другие участки соответствуют занятому пространству. Различные затенения в занятом пространстве соответствуют разным объектам в рабочем пространстве робота; участки, выделенные черным цветом и окружающие все свободное пространство, соответствуют конфигурациям, в которых робот сталкивается сам с собой. Можно легко обнаружить, что подобные нарушения в работе возникают при крайних значениях углов поворота шарниров плеча или локтя. Два участка овальной формы по обе стороны от робота соответствуют столу, на котором смонтирован робот.
Аналогичным образом, третий овальный участок соответствует левой стене. Наконец, наиболее интересным объектом в пространстве конфигураций является простое вертикальное препятствие, проникаюшее в рабочее пространство робота. Этот объект имеет любопытную форму: он чрезвычайно нелинеен, а в некоторых местах является даже вогнутым.
Приложив немного воображения, читатель легко узнает форму захвата на верхнем левом конце манипулятора. Рекомендуем читателю на минуту задержаться и изучить эту важную схему. Форма рассматриваемого препятствия не так уж очевидна! Точка внутри рис. 25.11, б обозначает конфигурацию робота, как показано на рис. 25.11, а. На рис. 25.12 изображены три дополнительные конфигурации как в рабочем пространстве, так и в пространстве конфигураций. В конфигурации "сопг-1" захват окружает вертикальное препятствие.
Вообще говоря, даже если рабочее пространство робота представлено с помошью плоских многоугольников, форма свободного пространства может оказаться очень сложной. Поэтому на практике обычно применяется ошупывание пространства конфигураций вместо явного его построения. Планировщик может вырабатывать конфигурацию, а затем проверять ее для определения того, находится ли она в свободном пространстве, применяя кинематику робота и определяя наличие столкновений в различных координатах рабочего пространства.
Методы декомпозиции ячеек В указанном выше первом подходе к планированию пути используется 'ж декомпозиция ячеек; иными словами, в этом методе осугцествляется разложение !'!4 'Ьс~ь~1!. Ойшение, воспРия~не и (к:~що.~въ ниг ъ й ~ви~~ 1215 Глава 25. Робототехника их использовании приходится совершать слишком большие обходные маневры, если пространство конфигураций характеризуется широким размахом. К тому же может оказаться сложным вычисление линии Вороного, особенно в пространстве конфигураций, характеризующемся сложной формой препятствий.
Альтернативным по отношению к методу на основе линии Вороного является метод с использованием Ъ. вероятностной дорожной карты. Он представляет собой такой подход к скелетированию, который позволяет определить больше возможных маршрутов и поэтому лучше подходит для пространств с широким размахом. Пример вероятностной дорожной карты показан на рис. 25.15, б. Линия, приведенная на этом рисунке, создана путем формирования случайным образом большого количества конфигураций и удаления тех из них, которые не укладываются в свободное пространство.
После этого любые два узла соединяются какой-то линией, если одного из них можно "легко" достичь из другого; например, если в свободном пространстве можно перейти из одного узла в другой по прямой. Конечным итогом выполнения всех этих операций становится создание рандомизированного графа в свободном пространстве робота. Если к этому графу будут добавлены позиции начальной и целевой конфигураций робота, то задача планирования пути сведется к поиску в дискретном графе. Теоретически этот подход является неполным, поскольку при неудачном выборе случайно заданных точек может оказаться, что нельзя найти ни одного пути от начального узла до целевого. Но вероятность такой неудачи можно ограничить за счет регламентации количества формируемых точек и с учетом определенных геометрических свойств пространства конфигураций.
Возможно также направить процесс выработки опорных точек в те области, где частично выполненный поиск показывает хорошие перспективы поиска приемлемого пути, действуя одновременно в двух направлениях, от начальной и от целевой позиций. После внесения всех этих усовершенствований метод планирования с помощью вероятностной дорожной карты показывает лучшую масштабируемость в условиях многомерных пространств конфигураций по сравнению с большинством других альтернативных методов планирования путей.
25.5. ПЛАНИРОВАНИЕ ДВИЖЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Ни в одном из алгоритмов планирования движения робота, рассмотренных выше, не шла речь о наиболее важной характерной особенности робототехнических задач — об их неопределенности. В робототехнике неопределенность возникает из-за частичной наблюдаемости среды, а также под влиянием стохастических (или не предусмотренных моделью) результатов действий робота. Кроме того, могут возникать погрешности, обусловленные использованием приближенных алгоритмов, таких как фильтрация частиц, в результате чего робот не будет получать точных данных о текущем доверительном состоянии, даже несмотря на то, что для описания стохастического характера среды применяется идеальная модель.
В большинстве современных роботов для принятия решений используются детерминированные алгоритмы, такие как различные алгоритмы планирования пути, рассматривавшиеся до сих пор. Для этой цели обычно принято извлекать данные 1216 Часть ЧИ. Общение, восприятие и осуществление действий о Ъ. наиболее вероятном состоянии из распределения состояний, сформированного с помощью алгоритма локализации. Преимушество этого подхода состоит лишь в том, что он способствует уменьшению объема вычислений. Трудной является даже сама задача планирования путей через пространство конфигураций, а если бы нам пришлось работать с полным распределением вероятностей по состояниям, то задача стала бы еще труднее.
Поэтому игнорировать неопределенность в этих обстоятельствах можно, только если неопределенность мала. К сожалению, игнорировать неопределенность не всегда возможно. Дело в том, что при решении некоторых задач возникает такая ситуация, что неопределенность, в условиях которой действует робот, становится слишком большой. Например, как можно использовать детерминированный планировщик пути для управления мобильным роботом, не имеющим информации о том, где он находится? Вообще говоря, если истинное состояние робота не является таковым, на которое указывает правило максимального правдоподобия, то в итоге управляющие воздействия будут далеки от оптимальных.
В зависимости от величины погрешности они могут приводить ко всякого рода нежелательным эффектам, таким как столкновения с препятствиями. В этой области робототехники нашел свое применение целый ряд методов организации работы в условиях неопределенности. Некоторые из этих методов основаны на приведенных в главе 17 алгоритмах принятия решений в условиях неопределенности. Если робот сталкивается с неопределенностью только при переходах из одного состояния в другое, но само состояние является полностью наблюдаемым, то эту задачу лучше всего можно промоделировать в виде марковского процесса принятия решения, или МОР (Маг)соч Пес)з)оп Ргосезз). Решением задачи МРР является оптимальная политика, с помощью которой робот может определить, что делать в каждом возможном состоянии.