Диссертация (1149252), страница 28
Текст из файла (страница 28)
Рассмотрим случай, когда поворачивается по часовой стрелке(поворот против часовой стрелки рассматривается аналогично). Тогда ˙ ≤166− < 0, и в качестве новой независимой переменной можно взять := −= (−),[︂]︂ := − ∈ 0,.˙Среднеквадратичное отклонение не превышает максимального значенияфункционала качества ℐ в следующей задаче оптимизации:ℐ := ‖()‖2 → max= (−) ∈ [0, ],[︂]︂() ∈ 0,.при условии(0) = 0,Ее решение 0 (·), 0 (·) существует и подчиняется принципу максимумаПонтрягина [163]: существует гладкая функция () ∈ R2 переменной ∈ [0, ]такая, что⎧⎪,если ⊤ (−) > 0,⎪⎪⎨ ⊤0]︀[︀ (−) = 0 , () = arg maxесли ⊤ (−) < 0,∈ 0, ⎪⎪⎪⎩не определено , если ⊤ (−) = 0,где 0 ⊤= − (−) = 0 ⇒ ≡ const, = () = 2 0 ().Если 0 () = 0, (4.44) очевидно.
Пусть 0 () ̸= 0. Тогда ̸= 0, и с ростом 0 () сменяет значения с 0 на и обрптно, причем каждое значениеподдерживается на интервале длины , возможно, за исключением крайнихинтервалов, чья длина не превосходит . Неравенство (4.44) — результатвычисления ‖()‖ для таких (·) и выбора соответствующего максимума. Рассмотрим односвязную область D, в окрестности которой поле (·)дважды непрерывно дифференцируемо и ∇(, ) ̸= 0. Тогда угол вращения векторного поля ∇ вдоль любой кривой, лежащей в D,однозначно определяется упорядоченной парой концов этой кривой. Обозначимчерез ∇ (D) максимум || по всем парам из D.167Лемма 4.1.6. Пусть поле (·) дважды непрерывно дифференцируемои ∇(, ) ̸= 0 в окрестности D := ∆ × , где — интервал оси времени,а ⊂ R2 — выпуклое множество.
Тогда√︁∇ (D) ≤ sup |∇ ()| × | | + sup κ 2 + 2 × diam ,∈D∈Dгде | | — длина интервала, diam — диаметр множества, т.е. супремумрасстояний между двумя его элементами, а ∇ , κ и — параметры поляиз раздела 4.1.5.Доказательство: Пусть = ( , ) ∈ D := ∆ × , = 0, 1 и0 ≤ 1 для определенности. Зададим в D две параметрические кривые () :=[, 0 ], ∈ [0 , 1 ] и () := [ 1 , (1 − ) 0 + 1 ], ∈ [0, 1], соединяющие точки[0 , 0 ] и [0 , 1 ] с [0 , 1 ] и [1 , 1 ] соответственно. Конкатенация этих кривыхсоединяет 1 с 2 и лежит в D. Таким образом, угол вращения градиентапри смещении от 1 к 2 внутри D — это угол поворота ^ при движениивдоль (·) плюс угол поворота ^ при движении вдоль (·). Обозначимчерез [, ] угол ориентации ∇[, ] в абсолютной системе координат.
Тогда⟨∇′ [()]; [()]⟩ (4.15)[()] = −== ∇ [()] Z⇒‖ ∇[()] ‖⃒∫︁ 1⃒⃒⃒Z⇒ |^ | = ⃒⃒∇ [()] ⃒⃒ ≤ sup |∇ ()| (1 − 0 );∈D0⟨′′ [()][ 1 − 0 ]; [()]⟩[()] = −=‖ ∇[()] ‖⟨′′ [()] [()]; [()]⟩⟨ 1 − 0 ; [()]⟩ −=−‖ ∇[()] ‖⟨′′ [()] [()]; [()]⟩(4.15)−⟨ 1 − 0 ; [()]⟩ ==‖ ∇[()] ‖(4.15)== +κ ⟨ 1 − 0 ; [()]⟩ − ⟨ 1 − 0 ; [()]⟩ Z⇒⃒⃒√︁⃒ ⃒Z⇒ ⃒⃒ [()] ⃒⃒ ≤ ‖ 1 − 0 ‖ κ 2 + 2 Z⇒⃒∫︁ 1 ⃒√︁⃒ ⃒⃒ [()] ⃒ ≤ ‖ 1 − 0 ‖ sup κ 2 + 2 .Z⇒ |^ | ≤⃒ ⃒∈D0168Для завершения доказательства остается взять супремум по 0 , 1 ∈ D.
Положим 0 := { ∈ R2 : ‖ − 0 ‖ ≤ }.Лемма 4.1.7. Пусть − + ∆ ≤ (0 , 0 ) ≤ + − ∆ при некотором∆ > 0. Тогда [0 , 0 + ∆] × 0 ⊂ op всякий раз, когда [ ∆ + ] ≤ ∆,где константы и взяты из (4.17).Доказательство: Для начала отметим, что = 0 лежит во внутренностиI := { ∈ [0, 1] : ( ) := [ 0 + ∆, (1 − ) 0 + ] ∈ op }.Пусть [0, * ] — наибольший подынтервал I, содержащий 0; достаточно показать,что * = 1. Предположим обратное, т.е. что * < 1; в этом случаелибо [(* )] = + , либо [(* )] = − . Сосредоточимся на первом варианте(второй рассматривается аналогично).
Имеем:∫︁0*[(* )] = [0 , ] +(4.6)0∫︁0{︀ ′⟨︀⟩︀}︀ (4.6) [( )] ∆ + ∇[( )]; − 0 =*= [0 , ] +{︀⟨︀⟩︀}︀ (4.17) − ∆ + ; − 0 ≤0(4.17)[︀]︀≤ + − ∆ + ∆ + ‖ − 0 ‖ * ≤ + − (1 − * ) ∆ < + ,что нарушает [(* )] = + . Это противоречие завершает доказательство. Доказательство теоремы 4.1.2.1) Если || ≤ ∀ ≥ 0, то утверждение теоремы следует из леммы 4.1.3,следствия 4.1.1 и (4.18), (4.29), (4.40), (4.43). Пусть ∃ * ≥ 0 : |(* )| > .2) Рассмотрим случай, когда существует такое > 0, что робот находитсяв op при ∈ [0, ] и в момент времени = значение |()| достигает из области больших значений |()| > , < , ≈ . В силу (4.41) ( ) < 0и |()| < при > , ≈ ; следствие 4.1.1 также гарантирует, что при таких робот находится в op .
Пусть max = [, max ) — наибольший интервал, в течениекоторого |()| < , а робот лежит в op при ∈ (, max ). Предположим,˙ max ) =что max < +∞. Согласно (4.40) (max ) < 0 и в силу (4.41) sgn (− sgn (max ). Следовательно, |(max )| < и |()| < ∀ ∈ [max , max + * ),где * > 0, * ≈ 0. Тогда следствие 4.1.1 гарантирует, что робот остается в opпри ∈ [max , max + * ), что противоречит определению max . Таким образом,169max = +∞. Доказательство завершается аналогичным пункту 1) рассуждениемпо отношению к [, +∞).3) Пусть |(0)| > . В силу пункта 2) достаточно показать, что не покидаяop , робот попадает в ситуацию, когда || ≤ .
Предположим обратное.Тогда существует такое > 0, что [, ()] ∈ op , |()| > при всех ∈ [0, ),где либо = +∞, либо < +∞ и робот не остается в op при > , ≈ . Согласно (4.39) при ∈ [0, ) вектор () поворачивается в постоянномнаправлении с угловой скоростью ≥ . Пусть + := sup ∈ [0, ) |() − (0)| —предельное значение угла поворота. Поворот () на угол ∈ [0, + ] занимаетединиц времени и по лемме 4.1.5 сопровождается отклонением робота () ≤ ⌈︀ ⌉︀от (0) на расстояние ∆dev () ≤ 2 2. Применяя лемму 4.1.7 к 0 := 0, 0 := (0) и константе ∆ из (4.19), убеждаемся, что [ 0 , 0 + ∆ ] × (0)⊂ op ,если [ ∆ + ] ≤ ∆, где ∆ взято из (4.19). Положим ∆ := 2 +1 , = 2 +1 + † , † > 0, † ≈ 0, где — минимизант в (4.31). Если + < 2(+1),то (+ ) < ∆ и ∆dev (+ ) ≤ 2 ( + 1) < .
Таким образом, робот остаетсяв op при > , ≈ , что противоречит определению . Следовательно,+ ≥ 2( + 1) и можно принять := 2( + 1).По лемме 4.1.6 и согласно ограничениям (4.17) пока поворачиваетсяна угол , градиент ∇[, ()] и коллинеарный с ним вектор √︀()+22κ + 2 ∆dev (),поворачиваются на угол, который не превосходит ∇√︀2(+1)где последнее выражение меньше, чем ∇2κ + 2 +4( + 1) < 2в силу (4.31). Следовательно, существуют такие моменты времени ± ∈ [0, ),что векторы [± , (± )] и ± [(± )] сонаправлены. Тогда(4.3)˙ + ) + ( − 0 ) ≥ (˙ + ) − (4.42)(+ ) = (=(4.42)= [ ⟨ ; ⟩ − ] − = [ − ] − (4.6), (4.29)>.Аналогично (− ) < −.
Таким образом, существует корень непрерывнойфункции между − и + , что нарушает неравенство |()| > ∀ ∈ [0, ).Полученное противоречие завершает доказательство.4) Остается рассмотреть случай, когда |(0)| ≤ . На протяжениинекоторого начального временного интервала робот находится в op , посколькустартует оттуда; и по следствию 4.1.1 остается там, пока || ≤ .
Следовательно,существует такое , что робот лежит в op при ∈ [0, ] и |( )| = , тогда как170|()| > при > , ≈ . Нетрудно заметить, что по лемме 4.1.3 ( ) ∈[− , + ], а расстояние от ( ) до любого конца этого интервала не меньше ∆из (4.19). С учетом этого доказательство завершается аналогичным пункту 3)рассуждением, в котором в качестве начального момента времени берем = .Доказательство теоремы 4.1.1: Эта теорема немедленно вытекаетиз теоремы 4.1.2. Замечание 4.1.1.
Теоремы 4.1.1 и 4.1.2 остаются в силе, еслизаменить предположение 4.1.2 следующим требованием: параметры поля, , κ, , ∇ , , , , ограничены в рабочей зоне op , а само поле определенои дважды непрерывно дифференцируемо в окрестности рабочей зоны op .Доказательство: Достаточно проверить доказательства теорем 4.1.1и 4.1.2 и заметить, что в них используются только оценки указанных величин.Замечание4.1.2. Предположим, что вычисление * происходит∫︀ с погрешностью * () = − 0 ( − 0 ) + (). Доказательство теорем 4.1.1и 4.1.2 основано на представлении (4.39) замкнутой системы, котороев данном случае имеет вид ˙ = (), ˙ = − ,˙ ˙ = [ ⟨ ; ⟩ − ],при этом в записи используется производная ,˙ а само значение игнорируется.
Отсюда следует, что погрешность управления зависитот скорости ˙ и ускорения ¨ ошибки интегрирования и не зависитот накопленного значения .4.1.8Пример отслеживания динамической изолинии:локализация и окружение мобильной целипо измерениям расстояния до нееПрименим полученные результаты к специальному сценарию.По плоскости перемещается мобильная цель 0 (), закон ее движения171неизвестен. Робот должен приблизиться к ней на заданное расстояние 0и далее сопровождать на этом расстоянии; в течение всего маневра он должендвигаться на максимальной скорости и не сокращать дистанцию до цели более,чем на заданное «безопасное» расстояние () ≥ safe ∈ [0, 0 ) ∀ . При этомизмеряется только текущее расстояние до цели () = ‖() − 0 ()‖, угловыеданные недоступны.Априорная информация о цели сводится к следующим оценкамначального положения, скорости и ускорения:⃦⃦−safe < in≤ ⃦ in − 0 (0)⃦ ,‖˙ 0 ()‖ ≤ 0 ,‖¨ 0 ()‖ ≤ 0 ∀ ≥ 0.В данном случае (, ) = ‖ − 0 ()‖, а изолинии представляют собойокружности с центром в 0 ().