Автореферат (1149251), страница 3
Текст из файла (страница 3)
Наряду с базовым закономуправления линейной скоростью (3), рассматривается модифицированныйзакон, отличающийся только способом вычисления ( ):1. через точку ∈ проводится эквидистанта EC и измеряетсядлина ее дуги между и множеством Z ∪ R1 ∪ R2 (см. рис. 1 б));2. ( ) := , если ≤ − , где − < — параметр регулятора;3. если > − , то робот игнорирует компаньона в вычислениях.Для базового закона результаты аналогичны результатам главы 1.
Если вдалиот применяется базовый закон, а его модифицикация включается вблизи, результаты аналогичны случаю «чистого» модифицированного закона.Рассматривается область с гладкой и компактной границей.Рабочая зона { : ∈ [− , + ]}, [− , + ] ∋ 0 определена в терминахрасстояния до области . На наложены условия, при которых (как функция точки) в этой зоне обладает свойствами, аналогичнымипредположениям 1 и 2; параметры регулятора (2) подчиняются требованиям,аналогичным по смыслу (4).
Для базового и модифицированного законовуправления и сценариев C.1), C.2) в случае связной эквидистанты E(0 )установлены аналоги теорем 1 и 2, дополненные утверждением об отсутствиистолкновений с . Основной результат главы 2 констатирует достижениеравномерного распределения вдоль E(0 ) в случае модифицированногозакона и опирается на следующее требование по настройке этого закона.Предположение 4. Пусть роботы распределены вдоль E(0 ) так, чтокаждый из них ориентирован по касательной к E(0 ), область при этом находится слева от роботов, а расстояния между соседнимироботами, вычисленные вдоль E(0 ), равны друг другу. Для любого такогораспределения первый сосед спереди любого робота не закрыт от негообластью в случае С.1), а если евклидово расстояние от робота до точки ∈ E(0 ) из его основной зоны учета не превышает ,то расстояние от до вдоль E(0 ) не превышает per −1 , где per —периметр кривой E(0 ). Кроме того, − > per −1 .Теорема 4.
Пусть выполнены сделанные предположения, включаяпредположения 4 и 3, где 0 ↦→ E(0 ). При применении модифицированного12закона роботы стремятся к равномерному распределению вдоль целевойэквидистанты E(0 ). Этот вывод верен для обоих сценариев С.1) и С.2).Здесь эпитет «равномерный» подразумевает равенство измеренныхвдоль эквидистанты расстояний между соседними роботами. Оно достигаетсяв процессе непрерывного перемещения роботов со скоростями не ниже > 0.Доказательства теорем 2—4 используют метод -предельныхточек3 для исследования траектории группы () := [ 1 (), . . .
, () ].Для традиционных примеров его применения не характерно «расчленение»состояния на части из общего пространства с фокусом последующегоанализа на геометрических отношениях между этими частями «в -пределе».Однако именно такой метод разработан и применен в первых двух главах.Третья глава посвящена многоагентному сценарию, в которомгруппа из маневренных непредсказуемых целей перемещаетсяпо плоскости. Робот-преследователь движется с постоянной скоростью() ≡ и подчиняется уравнениям (1); как следствие, радиус егоповорота ограничен снизу ≥ −1 > 0. Робот измеряет толькорасстояния ‖ − ‖ до целей, неспособен их различать, ему неизвестнагеометрическая организация группы и закономерности ее маневрирования.Требуется приблизиться к целям и далее сопровождать их на заданномсреднеквадратичном расстоянии 0 :1 ∑︁() :=‖() − ()‖2 → 20 при → ∞.
=1(5)Исследованы два закона управления, одинаковые с точностью до знака(который, как показано, отвечает за направление обхода группы):˙ + [ () − 2 ] } ,() = ± sgn { ()0(6)где (·) — линейная функция с насыщением, определенная в (2).Термин «группа целей» опирается на следующее предположение.Предположение 5. Среднеквадратичныйограниченным с течением времени:3разбросцелейостаетсяПонтрягин Л.М. Обыкновенные дифференциальные уравнения. — М.: Наука, 1974.
— 331 с.13⎯⎸ ⎸ 1 ∑︁ := ⎷‖ − ‖2 ≤ < 0 < +∞ ∀ , =11 ∑︁ :=. =1В главе 3 найдены условия, необходимые, чтобы робот с ограниченнойманевренностью был способен поддерживать требуемое среднеквадратичноерасстояние до целей независимо от их положения. Показано, что эти условиякасаются усредненных параметров движения целей, а именно:∑︀1˙ — средней скорости группы, где = ˙ ;– := √︁=1 = ∑︀– := 1 =1 ‖ − ‖2 — среднего разброса скоростей;∑︀1¨ — среднего ускорения группы, где := ¨ ;– := √︁=1 = ∑︀– := 1 =1 ‖ − ‖2 — среднего разброса ускорений;∑︀– := 1 =1 ⟨ − ; − ⟩ — «ковариации» между и .(︀)︀Обсуждаемые условия также используют матрицу Φ := 01 −10 вращенияна 90∘ и следующие функции:(,,,* ) = (,,,* | , , , , ) :=[︃]︃√︀22√︀:= + ‖ ‖ − 2 ⟨; ⟩+ ⟨; ⟩ − 2* − 2 ⟨; ⟩ + 2 ,22* − (,,* ,,* ) = (,,* ,,* | , , , , ) :=⃒⃒√︁√︁2⃒⃒222 − 2 − 2 + ⃒ (,* ,,* ) − 2 ⃒| ⟨; Φ ⟩ |:= 2 √︀+ √︂(︁)︁2 .22√︀* − 2 (2* − 2 ) − * + 2* − 2 ⟨; ⟩Нелокальная сходимость замкнутой системы обоснована при следующемнезначительном и до известной степени неизбежном усилении упомянутыхнеобходимых условий, где нестрогие неравенства усилены до строгихс неисчезающим во времени «запасом», и условия распространены на всюрабочую зону { : ∈ [ 2− , 2+ ]}, где [− , + ] ∋ 0 , − > .Предположение 6.
Существуют константы ∆ > 0 и ∆ > 0 такие,что в любой момент времени для любых ∈ [ 0, ], || ≤ , * ∈ [− , + ],* = и единичного вектора ∈ R2 выполнены следующие неравенства:‖ ‖ + √︀≤ − ∆ ,2* − 2 (,,* ,,* | , , , , ) ≤ − ∆ .14При применении регулятора (6) робот, как правило, вначале движетсяс ≡ ± по окружности ±in , определяемой его начальным состоянием.Предположение 7. В течение первых 3 −1 единиц времени обеокружности ±in и центр группы разделены стационарной прямой,причем эти окружности остаются в рабочей зоне робота 2− ≤ ≤ 2+ .Теорема 5. Пусть выполнены предположения 5—7. Тогда параметры и закона управления (6) (с функцией (·) из (2)) могут быть выбранытак, что цель управления (5) достигается, и робот не покидает рабочейзоны 2− ≤ ≤ 2+ . При этом по истечении некоторого временивектор от центроида целевой группы к роботу постоянно вращаетсяпротив/по часовой стрелке, если в (6) взят знак +/−.Рекомендации по выбору и отталкиваются от наблюдения, чтоввиду непрерывности предположение 6 остается в силе (с ∆ = ∆ (+ ))при замене * = на |* − | ≤ 2+ с достаточно малым + > 0.Теорема 6.
Теорема 5 остается в силе, если выбор и конкретизироватьследующим образом:{︂0 < < min + ; 2 ∆√︁2− − 2}︂, √︀ 2< ∆ (+ ).2 − − 2 ∆ − Также в главе 3 доказано, что если при усилении необходимыхусловий ограничиться их преобразованием из нестрогих неравенств в строгие,опустив распространение с заданного среднеквадратичного расстояния 0на все расстояния, наблюдаемые в рабочей зоне, предложенный регуляторобеспечивает устойчивость по Ляпунову и локальную асимптотическую√устойчивость требуемого режима ≡ 0 движения замкнутой системыпри условии адекватной настройки регулятора.
Даны конструктивныерекомендации по такой настройке.Четвертая глава остоит из двух частей. В первой части разработанзакон управления для отслеживания изолиний скалярных нестационарныхполей, не использующий измерение или оценивание не только градиента поля,но и любых производных поля. Во второй части этот закон использовандля решения задачи динамического окружения подвижной группы целей.15Мобильный робот на плоскости управляется вектором скорости :˙ = ∈ R2 ,‖‖ ≤ ,где > 0 задано.(7)На плоскости определено неизвестное скалярное динамическое поле (, ).Требуется вывести робота на 0 -изолинию поля и обеспечить последующеедвижение робота вдоль нее.
Робот измеряет только значение поля () :=˙ недоступны.[, ()], данные о градиенте поля и о производной ()Предложен следующий закон управления:(︁ [︀]︀)︁() = () − * () ,() := (cos , sin )⊤ ,˙* = −( − 0 ), (8)где линейная функция с насыщением (·) определена в (2).
Коэффициентусиления > 0 обcлуживает ключевую идею: двигаться с максимальнойскоростью и разворачивать вектор скорости на угол, пропорциональныйразности между эталонным * и фактическим значением поля.Рабочая зона робота определена как op = {(, ) : − ≤ (, ) ≤ + },где − < 0 < + .Предположение 8. В рабочей зоне op поле 2 -гладкое, его первыеи вторые производные ограничены, а пространственный градиент ∇(, )не обращается в ноль, и более того, inf (, ) ∈ op ‖∇(, )‖ > 0.Далее — фронтальная скорость пространственной изолинии(скорость в направлении, перпендикулярном ей самой), = − ′ ‖∇‖−1 .Теорема 7. Пусть выполнено предположение 8 и − < (0, in ) < + ,|| ≤ − ∆ в op , где in — начальное положение робота, а ∆ > 0— некоторая (возможно, малая) константа. Тогда для любого > 0существуют такие параметры регулятора (8), что под его действиемробот достигает целевой изолинии и далее отслеживает ее с точностью :lim |() − 0 | ≤ .→+∞Рекомендации по выбору параметров , , используют следующиехарактеристики поля: — фронтальное ускорение изолинии, — скоростьее вращения, = ‖∇‖ — «плотность» изолиний, — скоростьизменения ln с течением времени, и — эта же величина16при инфинитеземальном тангенциальном и нормальном (относительноизолинии) смещении в заданный момент, ∇ — скорость вращенияградиента ∇.
Кроме того, использованы их оценки: ≤ , || ≤ ,|κ| ≤ κ , | | ≤ , |∇ | ≤ ∇ . Неравенство 4 между заданными на opфункциями и означает, что inf op ( − ) > 0.Предварительно (за счет уменьшения ) обеспечивается неравенство < min{+ − 0 , 0 − − }, выбирается ∈ (0, 1) и константа{︁}︁0 < ∆ ≤ min (0, in ) − − ; + − (0, in ); min {0 − − ; + − 0 } − .Начальное значение * (0) произвольно. Выбор , , подчинен условиям∆,> ,+4 ,(9)0<41+⃒⃒2 ⃒⃒ΔΔ⃒,где := ⃒⃒ 2 + κ − 2 Δ − 2 +− ⃒√︁−1Δ := (± − ) , := 2 − [ + Δ ]2 ;{︃]︂ [︂[︂]︂ }︃√︀ + 11>min max 2 ( + 1); ∇2κ + 2+1.
(10) +2 =1,2,...∆Теорема 8. Теорема 7 остаетсяконкретизировать согласно (9), (10).всиле,есливыбор, , Во второй части главы 4 рассматривается следующая модификациязадачи из главы 3: 1) требуется обеспечить динамическое окружение всехцелей с поддержанием заданного значения 0 расстояния := min ‖ − ‖до ближайшей цели (а не среднеквадратичного расстояния до всех целей),2) робот описывается соотношениями (7).
Идеальное решение выглядит какдвижение по границе D∪0 объединения D∪0 0 -дисков с центрами на целях.Это решение однако невозможно, если группа распадается на несколькоудаленных подгрупп. Предполагается, что этот случай не имеет места.Предположение 9. В любой момент времени объединение дисков D∪0 —односвязно, даже если уменьшить 0 до некоторого меньшего значения − .Для устранения изломов граница D∪0 аппроксимируется кривой,описываемой следующим уравнением (с параметром > 0):17 := −1ln[︃∑︁]︃− ‖ −‖ = 0 .(11)=1После этого применяется регулятор (8) c 0 := 0 , на вход которогоподается сигнал из (11).
Установлена оценка − −1 ln ≤ ≤ ,согласно которой отслеживание с точностью значения 0 сигналом влечетотслеживание изолинии ≡ 0 с точностью act := + −1 ln .Для формулировки условий сходимости замкнутой системы введенарабочая зона Zop := {(, ) : − ≤ ≤ + }, где + > 0 > − . Для заданных(︀)︀∆ ≥ 0 и ∈ 0, 2 говорится, что точка удовлетворяет (∆ , )-условию,если цели можно так распределить на две подгруппы Δ и , что всеблизкие цели находятся в (т.е.