Диссертация (1149252), страница 25
Текст из файла (страница 25)
Рисунок 3.6 имеет дело с аналогичным рисунку 3.4 сценарием,за исключением «ложной» цели, которая со временем отклоняется от основнойгруппы и кружит вокруг нее с целью отвлечь преследователя. Как следуетиз рисунков 3.5 и 3.6, в обоих случаях внимание робота остается сосредоточенона основной группе, и желаемое окружение продолжается.144а)б)в)г)д)е)Рисунок 3.5 — Отклонение одной цели от хаотичной группыа)б)в)г)д)е)Рисунок 3.6 — Отклонение одной цели от группы с жесткой формацией145Глава 4. Алгоритм близкого окружения группы движущихся целейметодом отслеживания динамических границВ данной главе продолжим рассматривать задачу локализации,окружения и сопровождения группы движущихся целей единичным мобильнымроботом.
Главное отличие от главы 3 заключается, во-первых, в необходимостиокружения всех участников целевой группы, и во-вторых, в требованииблизкого окружения. Прилагательное «близкое» означает, что робот долженподдерживать заданное (номинально малое) расстояние до ближайшейв текущий момент цели. При этом имеем дело с полноприводным (числоприводов равно числу степеней свободы) мобильным роботом, управляемымограниченным по норме вектором скорости.
Приветствуется быстрота маневра,что делает большие скорости движения более привлекательными. Так же,как и в главе 3, рассматриваем случай, когда сенсорная система снабжаетробота только неупорядоченным набором расстояний от него до целей,а угловая информация о целях недоступна.В силу сформулированных требований идеальное сопровождениесводится к движению робота по геометрическому месту точек, расстояниеот которых до ближайшего участника целевой группы равно заданномузначению. Однако здесь возникает как минимум две проблемы.
Во-первых,ввиду отсутствия угловых сенсорных данных робот не способен вычислитьдаже направление касательной к этому геометрическому месту точек,что принципиально важно для определения текущего направленияскорости робота. Во-вторых, это геометрическое место представляет собойобъединение окружностей с центрами на «перифирийных» участниках группыи, как правило, содержит изломы. Вместе с тем на практике реальные роботыне способны с ненулевой скоростью точно отследить кривую в месте ее излома.В связи с этим аппроксимируем данную ломаную кривую гладкими изолиниямискалярного поля, искусственно формируемого исходя из доступных измеренийрасстояний.Глава 4 состоит из двух частей.
В первой части предложени математически строго обоснован принципиально новый, не использующийоценивание не только градиента поля, но вообще каких-либо его производных,146закон управления для локализации и отслеживания изолиний скалярныхнестационарных полей. Во второй части главы предложенный законуправления используется для решения задачи окружения подвижной группыцелей посредством его применения к упомянутому выше исскуственномуполю, его эффективность подтверждается также интенсивным компьютерныммоделированием.4.1 Локализация и отслеживание изолиниинеизвестного динамического скалярного поля4.1.1Постановка задачи и закон управленияРассмотрим стандартную кинематическую модель полноприводногомобильного робота на плоскости, управляемого вектором скорости :˙ = ∈ R2 , := (, )⊤ ,‖‖ ≤ , = (),где() := (cos , sin )⊤ .(4.1)Здесь , — абсолютные декартовы координаты центра робота, и —его линейная скорость и угол ориентации вектора скорости соответственно, > 0 — заданная верхняя граница скорости.На плоскости задано неизвестное скалярное динамическое поле (, ).Необходимо вывести робота на линию уровня { : (, ) = 0 )}, где полепринимает заданное значение 0 , и обеспечить последующее движение роботавдоль этой кривой.
Робот имеет доступ только к значению поля () := (, )в своей текущей локации = (). В частности, данные о градиенте поля ˙ по времени от показаний датчика () недоступны.и о производной ()Глава 4 предлагает и исследует следующий закон управления:[︀]︀() = () − * () ,˙* = −( − 0 ),(︁ [︀]︀)︁или кратко: () = () − * () . ≡ ,(4.2)147Здесь (·) — линейная функция с насыщением:() :=⎧⎨,если || ≤ , := ,(4.3)⎩sgn (), иначе,а , , > 0 — параметры регулятора. Два из них — , — используютсядля формирования эталонного сигнала * , имеющего смысл значения поля.Для этого с течением времени суммируется невязка ∆ = −0 между реальными целевым значением поля, при этом она предварительно масштабируетсяумножением на коэффициент и подвергается насыщению на уровне .Коэффициент усиления обcлуживает ключевую идею закона управления:при движении робота с максимальной скоростью угол его ориентации меняетсяпропорционально разности между фактическим и эталонным значениемполя.
Изложенная идея представляет собой новую парадигму управлениядля отслеживания изолиний, которая отлична от классической парадигмыразворота вектора скорости перпендикулярно градиенту и не требует доступак производным поля. Эта идея подразумевает, что равенство фактическогои эталонного сигналов было бы идеальной опцией, которая в свою очередьреалистична только, если скорость изменения эталонного сигнала ограничена,так как ввиду ограниченной скорости робота (и скорости изменения поля)скорость изменения фактического сигнала ограничена. Для ограниченияскорости изменения эталонного сигнала используется насыщение невязки ∆,присутствующее в функции (·).
Ситуация, когда реализуется идеальная опция ≡ * , частично поясняет используемый предложенным законом управления«механизм» достижения требуемого значения поля: дифференцированием ≡ * получаем ˙ = −(−0 ), все решения которого стремятся к 0 при →+∞, поскольку (0) = 0 и () > 0 ∀ ̸= 0. Вместе с тем это пояснениене исчерпывает всех аспектов проблемы.
Во-первых, идеальная опция на самомделе реализуется лишь приближенно ≈ * ∀ ≈ +∞, а во-вторых, остаетсяоткрытым вопрос, почему рекомендованный закон поворота вектора скорости[︀]︀робота () = () − * () приводит к этому. Указанные моменты будутподробно рассмотрены при доказательстве теорем 4.1.1 и 4.1.2.Закон управления (4.2) сформулирован в терминах угла ориентации вектора скорости робота в абсолютной системе отсчета. Роботы, скорость148которых ориентирована вдоль их осевой линии, могут получить доступ к такомууглу, используя компас.
Вместе с тем абсолютная ориентация использованав (4.2) в основном ради простоты изложения, и доступ к ней не являетсяпринципиальным моментом. Дело в том, что асимптотическое поведениезамкнутой системы не зависит от начального значения эталонного сигнала * .Отсюда следует, что это поведение принципиально не меняется, если в (4.2)[︀]︀[︀]︀уравнение [︁() = (︁ () − * ()изменитьна()−(0)=()−()⇔*)︁]︁. Это соображение подчеркивает, что важна() = () − * () − (0)не абсолютная ориентация, а изменение ориентации; его в свою очередь можноимплементировать и контролировать в относительной системе отсчета.Например, в квантованной (по времени с периодом > 0) версии законауправления (4.2) рассматриваемое правило формирования ориентации скорости( ) = [( ) − * ( )], := , ≥ 0можно переписать следующим образом:( ) − (−1 ) = [( ) − (−1 ) − * ( ) + * (−1 )], ≥ 1,(0) = [(0) − * (0)].Здесь первая часть имеет дело с инкрементальной (и поэтому относительной)ориентацией, а вторую часть можно интерпретировать как определение * (0)по заданному (0) и опустить.Поскольку и ± 2 задают одно и то же направление, модификацияэталонного сигнала добавлением 2 −1 (), где () — произвольнаяцелочисленная функция, фактически не меняет закон управления (4.2).Данным фактом можно воспользоваться с целью ограничить во временивеличину (), чтобы избежать больших чисел в вычислительном модуле.4.1.2Предположения и необходимые условияГлавное предположение о поле гарантирует отсутствие особенностейу его изолиний.
А именно, предполагаем, что рассматриваемое поле гладкое,149а его градиент на целевой изолинии не обращается в ноль. Данное требованиераспространим на всю рабочую зону op робота, содержащую его начальноеположение и зону переходного процесса.
Для удобства охарактеризуем рабочуюзону op крайними значениями − < + , которые может принимать в ней поле:op = {(, ) : − ≤ (, ) ≤ + }.(4.4)При этом целевая изолиния, разумеется, должна попадать в рабочую зону:− < 0 < + .(4.5)В результате приходим к следующему предположению.Предположение 4.1.1. В рабочей зоне (4.4) поле 2 -гладкое, а егопространственный градиент ∇(, ) не обращается в ноль. Более того, онне приближается к нулю с течением времени и/или при уходе в бесконечноудаленную часть op (если она есть): ‖∇(, )‖ ≥ ∇ > 0 ∀(, ) ∈ op .Как правило, в реальном мире физические величины ограничены, поэтомуобычно выполнено следующее предположение.Предположение 4.1.2.
В рабочей зоне (4.4) первая и вторая производныеполя ограничены.На пути к целевой 0 -изолинии, робот должен пересекать встречныеизолинии (,) := { : (, ) = }. Для этого он должен обладатьдостаточным запасом скорости, поскольку изолинии перемещаются. А именно,робот должен быть как минимум быстрее изолиний. Для точной формулировкиэтого предположения используем следующую формулу для фронтальнойскорости изолинии (скорость в направлении, перпендикулярном ей самой):−′,=‖∇‖которая будет обоснована далее в лемме 4.1.1. Максимальная скорость робота должна превышать эту фронтальную скорость всюду в рабочей зоне.Как и прежде, считаем, что это строгое неравенство не деградирует в нестрогоес течением времени и/или при уходе в бесконечно удаленную часть op150(если такая существует).