Диссертация (1149252), страница 3
Текст из файла (страница 3)
Некоторыеподходы, которые традиционно относят к рассматриваемой группе (например,метод виртуальной силы [34], определенные варианты метода искусственногопотенциала и навигационных функций [35–37], метод гистограммы векторногополя [38], решетки степени неопределенности [39], диаграммы близости [40]),комбинируют реактивное управление с элементами синтеза глобальноймодели среды и/или предполагают осведомленность выше уровня текущихсенсорных данных.
Полностью реактивные алгоритмы навигации и управлениядвижением на данный момент представлены относительно немногочисленнойгруппой, подробно рассмотренной, например, в [10; 11]. Эту группу можноподразделить на механико-математически [41–46] и биологически [47–57]мотивированные методы.12Общая проблема текущего состояния дел в исследованиях по реактивнымметодам навигации и управлении движением в теоретической мобильнойробототехнике — дефицит доказательных гарантий достижения цели в сложныхи нетрадиционных сценах и динамических сценариях, а также в условиях«скудной» (сенсорной и априорной) информации о среде и цели [58].Вместе с тем в «динамическом» случае, ввиду необозримого разнообразиявозможных сценариев, теоретическое разграничение между сценариямис возможностью алгоритмического тупика, сомнительными сценариямии сценариями с гарантиями успеха приобретает особое значение.Таким образом, имеется открытое поле дальнейших исследованийпо развитию алгоритмов реактивной навигации и управления движениеммобильных роботов со строго математически гарантированнымисвойстваминелокальнойсходимостиипреодолениемтипичныхдля теоретических исследований в этой области упрощающихпредположений в части механики робота, доступных сенсорных,энергетических и других ресурсов, свойств, структуры и априорныхзнаний о среде, а также систематическое исследование относительноновых и перспективных задач, связанных с многоагентной робототехникойи взаимодействием робота с естественными полями.
Фокус на реактивныхалгоритмах мотивирован их применением как в качестве окончательногорешения, так и в качестве компонент иерархических алгоритмов.Указанная общая характеристика касается в том числе двух конкретныхнаправлений, исследуемых в диссертации. Рассмотрим подробнее касающиесяих детали.Новые возможности, обусловленные технологическими сдвигамипоследних десятилетий в области мехатроники и практической робототехники,мотивировали систематическое и возрастающее внимание к нетрадиционнымсценариям, где элементом сцены является априори неизвестное скалярноеполе; см., например, [59–74].
К числу вызывающих растущий интерес задачтакого рода относится автономное отслеживание линии, где поле принимаетконкретное значение, с помощью мобильных робототехнических платформ.Цель управления заключается в том, чтобы робот обнаружил, достиги затем отследил в процессе непрерывного «заметающего» перемещенияизолинию, на которой поле принимает конкретное значение.
Тем самым робот13экспонирует область (внутри этой изолинии), где поле принимает еще большиезначения. Например, если само поле характеризует уровень радиацииили концентрации загрязняющего вещества, этой областью может бытьзона критического загрязнения. В общем случае скалярное поле понимаетсякак физический объект, описываемый функцией точки; среди примеров —термическое, электрическое, магнитное или оптическое поле, концентрациябиологического, химического или физического агента, интенсивностьакустического или электромагнитного сигнала. Задачи рассматриваемоготипа возникают при обнаружении нефтяных и химических разливов [66],областей радиоактивного [66], химического, биологического [65] заражения,при мониторинге вредоносных цветений водорослей [75], при отслеживаниилесных пожаров [62] или загрязняющих облаков [61], областей турбулентностии зон потенциальной опасности, при исследовании температуры водыи солености моря, в геологических исследованиях и т.д.
При этом, помимообнаружения и экспозиции границы упомянутой области, цель управленияможет включать охрану периметра, мониторинг изменений, обработкуи подавление содержимого области в рамках разумной тактики «начинатьс края» и другие миссии.Значимость задач такого типа подчеркнули экологические катастрофы,связанные с разливом нефти в Мексиканском заливе в 2010 г.
и с авариейна атомной станции Фукусима в 2011 г. Эти примеры также удачноподчеркивают ряд характерных черт подобных задач. Например, с однойстороны, более чем желательно минимизировать участие человекав определении границы области опасного для жизни и здоровья радиоактивногозаражения.
С другой стороны, для определения уровня радиации, как правило,требуется поместить датчик в исследуемую потенциально опасную точку.Непосредственное измерение пространственного градиента уровня радиацииявляется сложной технической проблемой, в то время как само значениеуровня доступно измерению стандартными датчиками. За счет перемещенияробота (например, воздушного) вдоль подлежащей обнаружению границыувеличивается информационная отдача и тем самым — эффективностьиспользования оборудования. Задачи рассматриваемого типа интересныкак на плоскости, так и в трехмерном пространстве.
В диссертациирассматривается первый вариант, который и имеется в виду далее.14Иногда искомая область может быть обнаружена средствами глобальногонаблюдения, например, аэрокосмического. Однако такой подход можетбыть затруднен (как например, в городской среде или внутри помещений),недостаточно точен или оперативен (например, при мониторинге лесныхпожаров [62]) или просто невозможен, поскольку наблюдение требуетнепосредственного контакта датчика с полеобразующим агентом (например,радиацией или бесцветным газом). Соответственно, в диссертациирассматривается ситуация, когда доступны лишь контактные измерениязначения поля в точке расположения датчика.
В этом контексте возможноприменение распределенных в пространстве сетей статичных датчиков.Однако для достижения приемлемой точности требуется высокая плотностьсети и значительные вычислительные мощности [76; 77]. В результатенамного более эффективно применение мобильных датчиков благодаря ихспособности к исследованию не одной, а многих локаций.
Это особо ценно,когда интерес сконцентрирован не на двумерной области, а на связаннойс полем одномерной структуре — изолинии, поскольку в этом случаемобильные датчики имеют возможность сконцентрироваться в окрестностиэтой структуры, в то время как статичные датчики вынужденно организуютсяв двумерный массив, в котором многие элементы оказываются вдалекеот предмета основного интереса. Однако для реализации этих преимуществмобильный датчик должен быть снабжен системой автономной навигации,а при использовании группы датчиков — алгоритмом эффективногодецентрализованного самораспределения группы вдоль одномерной структуры.Поскольку неизвестное поле и точечные измерения ограничивают возможностиглобального планирования, привлекательной опцией является реактивныйалгоритм.Авторы многих работ по данной теме предполагают возможность доступак значению градиента поля; см., например, [65; 78–81].
Однако, в отличиеот значения поля в точке текущей локации робота, пространственныепроизводные зачастую недоступны измерению, а их оценка требуетодновременного доступа к значению поля в нескольких соседних локациях,распределенных в обоих измерениях. При использовании группы роботовэтот подход выливается в необходимость их неэффективной (с точки зренияосновной задачи отслеживания изолинии) кластеризации и может быть15существенно затруднен ограничениями в коммуникации между роботами.При использовании единичного робота требуется монтаж несколькихдостаточно удаленных друг от друга датчиков на его корпусе, что такжеможет оказаться проблематичным, особенно для малогабаритных роботов.В любом случае обсуждаемый подход требует комплексного и потому —дорогостоящего оборудования.
Наконец, достоверная оценка градиентапо зашумленным значениям поля по-прежнему остается сложной техническойпроблемой [82–84], что несет потенциал к ухудшению качества работы системыи усложняет настройку регулятора [82].Изложенные обстоятельства мотивировали исследования, посвященныеразвитию«безградиентных»методов.Иххарактерныечерты:1) рассматривается единичный мобильный робот с единственным датчиком,2) датчик предоставляет доступ только к текущему значению поля в точкеположения робота, 3) градиент поля не измеряется и не оценивается;см., например, [62; 63; 85; 86] и приведенный там литературный обзор.В работах [67; 85; 87] предлагается переключаться между несколькимиаприори заданными направлениями движения в зависимости от интервала,в который попадает значение поля (в простейшем случае выделют дванаправления, каждое из которых применяется в зависимости от того,больше или меньше значение поля конкретного порога).
Такой подход,однако, приводит к зигзагообразной траектории и вызывает серьезныеопасения насчет неэкономного расхода ресурсов ввиду систематическихи взаимно аннулирующих друг друга боковых смешений. В [88] представленметод, основанный на предварительной сегментации изображения лесногопожара методами теории распознавания образов. В целом перечисленныеработы (в большей или меньшей степени) носят эвристический характери не предоставляют ни строгого завершенного обоснования предложенныхзаконов управления, ни гарантий достижения цели.