Диссертация (1149252), страница 24
Текст из файла (страница 24)
Также известнаоценка (3.8) среднего разброса положений целей. Требуется приблизитьсяк группе на заданное среднеквадратичное расстояние 0 , удовлетворяющее(3.9), и обеспечить дальнейшее сопровождение группы на этом расстоянии 0 .В данной ситуации среднеквадратичный разброс целей — константа,которая определяется неизвестной геометрией формации.
В силу (3.5)рассматриваемая задача сводится к сопровождению центра группы √0 − 2 . Тем не менее этим фактом нельзяна расстоянии 0 :=руководствоваться напрямую, так как ни 0 , ни роботу не известны.Кроме того, поскольку датчики обеспечивают только информацию о расстояниидо целей, а геометрия формации неизвестна, то вычисление 0 и на основедоступных данных является весьма сложной задачей, особенно в связи с тем,что подобное вычисление требует постоянного обновления данных в реальномвремени.
Покажем, что предлагаемый закон управления (3.6) обеспечиваетвычислительно эффективный способ обработки такого потока данных.Рисунок 3.2 — Окружение жесткой формации подвижных целей138Утверждение 3.4.2.i) Предположим, что робот способен поддерживать требуемое значение√среднеквадратичного расстояния до целей ≡ 0 всякий раз, когда движениеформации удовлетворяет вышеуказанным ограничениям, и положим Δ :=√︀ 2 − 2 . Тогда(︁ ≤ ,max ∈ [ 0, ])︁2√︀22 + Δ + + 0 √︀≤ .2 + 20 Δ(3.38)ii) Пусть движение целей удовлетворяет изложенным в данном разделеограничениям, и пусть (3.38) выполнено со знаком < вместо ≤.
Тогдасправедливы следующие утверждения:а)Роботспособенподдерживатьтребуемоезначение√ ≡ 0 . Более того,среднеквадратичного расстояния до формациикорректная настройка регулятора (3.6) не только обеспечивает это,но и делает соответствующее решение дифференциального уравнениядвижения замкнутой системы устойчивым по Ляпунову и локальноасимптотически устойчивым.б) Пусть − ∈ ( , 0 ) выбрано так, что предположение 3.2.4верно при + := +∞, а (3.38) выполнено со знаком < вместо ≤ и для0 := − .
Тогда корректной настройкой регулятора (3.6) достигается цельуправления (3.2).в) Для справедливости заключения б) при настройке регуляторадостаточно вычислить разности ∆ и ∆ левой и правой частей√︀соответствующих неравенств из (3.38), обозначить −, := 2− − 2 , найтикорень + ∈ := ( 0, 2 −, ( − ) ) уравнения2−, ∆ + √︃=(︂)︂2Δ224 −+ 2 −,(3.39)и выбрать и в соответствии с (3.28), где вместо ∆ (+ ) берется Δ2 .Чтобы выполнялось a), достаточно провести эту процедуру настройкидля − := 0 .Доказательство:139i) В данном случае = 0, = 0, а ∈ [− , ] принимаеттолько одно значение = 0.
Таким образом, необходимое условие (3.11)представляет собой первое неравенство в (3.38), а функция (·) из (3.17)принимает следующий вид:| (, * , ) ||⟨; Φ ⟩|+ √︂ (, , * , ) = 2 √︀ 2(︁)︁2 ,√︀0 − 2 2 (20 − 2 ) − * + 20 − 2 ⟨; ⟩[︃]︃√︁*+ ⟨; ⟩ .(, * , ) = − 20 − 2 ⟨; ⟩ + 2 + ‖ ‖2 − 2 ⟨; ⟩ √︀ 20 − 2Значит, необходимое условие (3.18) записывается следующим образом:⃒⃒ √︀⃒2⃒2222|⟨; Φ ⟩| ⃒ − 0 − ⟨; ⟩ + + ‖ ‖ − 2 ⟨; ⟩ ⃒√︁≤ .2 √︀ 2+√︀20 − 22220 − − ⟨; ⟩Данное неравенство должно выполняться для всех ∈ [ 0, ], ‖ ‖ ≤ ,‖ ‖ ≤ .
Максимизируем его левую часть по всем рассматриваемым и √︀и положим 0,[︁ :=20 − 2 , такжезаметим, что 2 + ‖ ‖2 − 2 ⟨; ⟩2 =]︁ 2 − ‖ ‖2 + 2 ‖ ‖2 − ⟨; ⟩2 ≥ 0. В результате имеем:2√︁‖ ‖2 − ⟨; ⟩200 + 2 + ‖ ‖2 − 2 ⟨; ⟩2√︁+≤ .20 2 − ⟨; ⟩Для фиксированного := |⟨; ⟩| ∈ [ 0, ] величина ‖ ‖ может приниматьзначения в диапазоне от до . Максимизируя по всем таким ‖ ‖, получим:≥2√︀√ 2 − 2 2 − 2 + 0 + 2 + 2 − 2 2√=0 2 − 2(︁√︀)︁2√2222 − + − + 0 √.=0 2 − 2Тем самым убеждаемся, что второе неравенство в (3.38) также выполнено.ii.а) Следует непосредственно из вышеизложенного и теоремы 3.3.3.140ii.б) Повторяем соответствующую часть доказательства пункта ii.б)в утверждении 3.4.2, замечая, что всякий раз, когда |* −| ≤ 2+ (где в данномслучае = 0), невязка | (, 0, * , ) − (, 0, * , )| не превосходит левойчасти уравнения (3.39).
Следовательно, + — допустимое * -приращение, и∆ (+ ) = Δ2 . Теорема 3.3.3 завершает доказательство. В пункте ii.в) утверждения 3.4.2 + существует и единственно, посколькукогда возрастает на интервале от 0 до его правого конца, левая частьуравнения (3.39) монотонно возрастает от 0 до +∞. При заданных численныхзначениях − , , , , , скалярное уравнение (3.39) может бытьрешено численно относительно = + , тогда рекомендации (3.28) (где∆ (+ ) := Δ2 ) по выбору параметров регулятора принимают замкнутуюформу.
Как и в разделе 3.4.1, более узкий диапазон параметров может бытьнайден в аналитической форме путем замены + в (3.28) любой его оценкойснизу. Эту оценку можно найти как решение уравнения, которое получаетсяпри замене левой части (3.39) на некоторую возрастающую мажоранту.√︀Например, использование неравенства 2 − 2 ≥ − ∀ ∈ [ 0, ] для оценкизнаменателя второй дроби в (3.39) приведет к замене квадратным уравнением2 + (︂Δ4 − −2−,)︂ =−, ∆.2Нетрудно заметить, что как и в разделе 3.4.1, модификация предлагаемойстратегии путем добавления предварительного маневра обеспечиваетглобальную сходимость при выполнении «почти необходимых» условий.3.5Результаты компьютерного моделированияВ таблице 5 представлены численные значения параметров, которыеиспользовались при компьютерном моделировании1 , где — частотаобновления управляющего сигнала, а и = были выбраны в соответствиис рекомендациями теоремы 3.3.2. Для устранения возможного четтеринга1Наглядные результаты в виде анимации доступны по ссылке http://goo.gl/khmBHa141управляющего сигнала, сигнум-функция в (3.6) была аппроксимированалинейной функцией с насыщением, наклон линейной части которойсоставил ≈ 70∘ .Таблица 5 — Параметры моделирования = 0,5 м/с = 0,4 м2 /с = 0,5 рад/с = 0,08 с−10 = 10 м = 0,1 сЧтобы исследовать робастность закона управления (3.6) относительнопогрешностей численного дифференцирования и датчиков, измерениярасстояний := ‖ − ‖ были искажены аддитивным белым гауссовскимшумом.
Несмотря на то, что многие современные датчики работаютна расстояниях нескольких километров с точностью до десятков сантиметров,при моделировании рассматривались несравнимо более серьезные помехи:дисперсия шума составила = 0,1 м при желаемом расстоянии 0 = 10 м.Интерес к исследованию работоспособности алгоритма в неблагоприятныхусловиях мотивировал использование в законе управления (3.6) одногоиз простейших методов аппроксимации ˙ (обратный метод Эйлера):˙ ≈ () − ( − ) .()Этот выбор не является обязательным: оценка производных по зашумленнымданным — широко развитая дисциплина, предлагающая целый наборметодов, которые часто оказываются более эффективными. Среди них— аппроксимация передаточной функции идеального дифференциатора,наблюдатели со скользящим режимом, различные разностные методы,регуляризация Тихонова; их обзор доступен в [82; 84].
Подчеркнем,что при формировании сигнала управления производная по времениот среднеквадратичного расстояния вычислялась на основе зашумленныхданных.На рисунке 3.3 восемь синих целей комбинируют движениевдоль синусоидальной кривой более-менее как единое целое с внутригрупповымхаотическим перемешиванием. Расстояние между целями может достигать6 м, что соответствует ≈ 60% желаемого значения расстояния 10 м до группы.Преследователь изображен красной точкой и начинает свое движение142на расстоянии ≈ 30 м от группы, как показано на рисунке 3.3 а). Синейштрихованной линий изображено геометрическое место точек желаемогоположения робота по отношению к целевой группе в текущий момент.На рисунке 3.3 б) робот достигает требуемого значения среднеквадратичного√расстояния = 0 ; рисунок 3.3 в) демонстрирует типичный результатнепосредственно «окружения»; полностью пройденный путь робота и группы√показан на рисунке 3.3 г); на рисунке 3.3 д) представлен график .
Такимобразом, робот успешно настигает целевую группу и окружает ее на заданномрасстоянии.а)б)г)в)д)Рисунок 3.3 — Окружение хаотичной группы целейНа рисунке 3.4 семь целей, сохраняя жесткую групповую формациюв виде стрелки, движутся вдоль окружности радиусом ≈ 45 м так, что«стрелка» всегда направлена по касательной к этой окружности; начальноерасстояние робота от группы составило ≈ 65 м. Не обладая информациейо форме группы и даже не зная того, что она жесткая, на основе тольконеупорядоченного набора расстояний до отдельных целей, робот успешноприближается к группе и окружает ее.
На рисунках 3.3 д) и 3.4 д)(как и в остальных экспериментах), несмотря на относительно большуюзашумленность датчиков, трудно обнаружить погрешность «окружения», чтоподтверждает репутацию регуляторов со скользящим режимом как робастныхк помехам.143а)б)г)в)д)Рисунок 3.4 — Окружение группы целей с жесткой формациейВ двух следующих экспериментах один из целевых объектов отклоняется,чтобы отвлечь преследователя от основной группы таким образом, чтобыв итоге окружение происходило по менее эффективному пути, за большийпериод времени и на большем среднем расстоянии, а в идеале — чтобыв целом нарушился охват основной группы. Именно такой результатможно наблюдать, если вместо среднего значения расстояния преследовательиспользует расстояние до ближайшей цели: если беглец в момент своегоотклонения является ближайшим по отношению к преследователю, то он можетувлечь его за собой так, что в итоге робот будет окружать только одну цель,далеко от основной группы.Конкретно на рисунке 3.5 рассмотрен случай восьми целейс внутригрупповым хаотическим перемещением вокруг стационарной точки,при котором одна из целей отклоняется от основной группы на расстояние≈ 40 м.