Синтез управлений при двойных и разнотипных ограничениях (1104822), страница 3
Текст из файла (страница 3)
Класс отображений R → conv R n ,обладающих свойствами 1)–4), обозначим через M. Часть результатов будет приведенадля более узкого класса множеств M0 , получаемого заменой свойства 4) на более сильное:4’) множество M является выпуклым.В разделе 2.2 ставится основная задача второй главы:Задача 2.1.
Указать множество разрешимости W[t0 ] ⊆ Rn+1 , а также позиционнуюстратегию управления U (t, x, k) ∈ UCL , такие, что все траектории дифференциальноговключения B(t)uẋ(t) u ∈ U (t, x, k) + Q(t) × {0},(10)∈ conv−kuk2R(t) k̇(t)начинающиеся в точке (t, x(t), k(t)), t0 6 t 6 t1 , (x(t), k(t)) ∈ W[t], в конечный моментудовлетворяют включению x(t1 ) ∈ M(k(t1 )).Взятие выпуклой оболочки в (10) не увеличивает возможностей управлению, поскольку оно добавляет исключительно точки, неэффективные с точки зрения управления(в них расходуется большее количество ресурсов).
Отметим, что, в отличие от исходной системы (9), дифференциальное включение (10) нелинейно из-за наличия функцииU (t, x, k). Таким образом, рассматривается задача нелинейного синтеза для системы сисходно линейной структурой.9Раздел 2.3 показывает, как в случае выпуклого множества M можно получить одноиз возможных решений задачи 2.1, вообще не учитывая интегрального ограничения. Всамом деле, если конечная точка траектории принадлежит целевому множеству M ∈ M,то ограничение k(t) > 0 выполнено автоматически в силу свойства 2) класса M. Этопозволяет рассматривать задачу 2.1 как задачу о синтезе управлений в условиях неопределенности при геометрических ограничениях [29, 9]. Если U 0 (t, x, k) — синтез управлений,построенный таким способом, то управлениеU (t, x, k) =U 0 (t, x, k), k > 0;{0},k < 0.является решением задачи 2.1.Однако у такого подхода есть существенные недостатки. В частности, если синтез0U (t, x, k) обладает экстремальными свойствами, например, минимизирует расстояние доцелевого множества, то синтез U (t, x, k) уже не будет экстремальным в таком смысле.Кроме того, при этом предполагается выпуклость целевого множества M, а не только егосечений M(k).
Поэтому последующие разделы посвящены решению задачи 2.1 с учетомее специфики, то есть наличия интегрального ограничения.Раздел 2.4 посвящен построению аналога альтернированного интеграла Л. С. Понтрягина для данной задачи. Для этой цели вначале определяются множества программнойразрешимости — максиминное W + и минимаксное W − . Эти множества представляют собой грубые оценки множества разрешимости W решаемой задачи сверху и снизу соответственно, поскольку они состоят из тех состояний систему, из которых целевое множестводостижимо при заранее известной или, соответственно, неизвестной помехе.Лемма 2.3 дает явные выражения для множеств программной разрешимости черезсечения целевого множества и множество достижимости при двойном ограничении, изученное, в разделе 1.2.
Используя эти формулы, строятся альтернированные интегральныесуммы. Для этого на отрезке [t, t1 ] вводится разбиение T = {τi }mi=0 . Точки этого разбиения можно интерпретировать как моменты коррекции. В конечный момент интегральныесуммы совпадают с целевым множеством. На каждом шаге выбирается ближайший слевамомент коррекции и строятся для него программные множества разрешимости. Затемкаждое из этих множеств принимается за новое целевое множество, выбирается предыдущий момент коррекции, снова строятся программные множества разрешимости, и такпродолжается до тех пор, пока мы не оказываемся в самой левой точке разбиения со множествами, обозначаемыми IT+ [k, t] и IT− [k, t] — это интегральные суммы, соответствующиеразбиению T . (Отметим, что это подмножества Rn , то есть их можно рассматривать каксечения множеств IT+ [t] и IT− [t]).Если при стремлении диаметра разбиения T к нулю существуют хаусдорфовы пределыинтегральных сумм I + [k, t] и I − [k, t], то последние называются соответственно верхними нижним альтернированным интегралом.
Если они к тому же совпадают между собойи равны I[k, t], то это множество называется альтернированным интегралом и совпадаетсо множеством разрешимости.В случае выпуклого целевого множества (пункт 2.4.3) классические теоремы о существовании альтернированного интеграла гарантируют существование I[k, t] при определенных предположениях о непустоте внутренности сечений интегральных сумм (теорема2.6).В разделе 2.5 рассматривается задача синтеза гарантирующих управлений. Вначалеисследуется вопрос о построении такого управления, которое минимизировало бы в конечный момент расстояние от конца траектории до сечения целевого множества, то есть10d(x(t1 ), M(k(t1 ))). В связи с этим вводится соответствующая функция цены, которая является вязкостным решением уравнения Гамильтона–Якоби–Беллмана–Айзекса∂V∂V∂V2+ min max, B(t)u + v −kukR(t) = 0,u∈P(t) v∈Q(t)∂t∂x∂kt0 6 t < t1 , k > 0, x ∈ RnКак и в первой главе, помимо начального условия V (t1 , x, k) = d(x, M(k)) у этого уравнения имеется также и краевое условие∂V∂V+ max, v = 0, t0 6 t 6 t1 , x ∈ Rn ,v∈Q(t)∂t∂xk=0означающее невозможность для управления принимать какие-либо действия при исчерпании резерва.
Если найдена функция цены, то управление может быть найдено как множество элементов, на которых достигается минимум в уравнении HJBI. Однако в отличиеот задачи без неопределенности, здесь функция цены не обязательно равна расстояниюдо сечения множества разрешимости, а только лишь не превосходит последнее (теорема2.7).Чтобы избежать необходимости вычислять функцию цены, применена модифицированная экстремальная конструкция. В теореме 2.9 доказано, что множество достижимости при двойном ограничении отличается от пересечения множеств достижимости приинтегральном и при геометрическом ограничениях на величину второго порядка малостиотносительно длины отрезка времени, поэтому многозначное отображение Z[k, t], слабо инвариантное относительно дифференциального включения (10), будет удовлетворятьуравнению эволюционного типа [25, 10]![lim σ −1 h+ Z[k, t] + σQ(t),Z[γ, t + σ] − σP(t) ∩ E 0, (k − γ)σR−1 (t)= 0,σ↓006γ6kв которое не входит операция вычисления множества достижимости при двойном ограничении.Теорема 2.12 утверждает, что если слабо инвариантное отображение достаточно гладкое, то квадрат расстояния до него удовлетворяет дифференциальному неравенствуdd2 (x(t), Z[k(t), t])6 0.u∈P(t) v∈Q(t)dtmin max(11)Стратегией UZ (t, x, k), экстремальной к Z[k, t], называется позиционная стратегия, состоящая из элементов, на которых здесь достигается минимум.
Из (11) следует, что еслиначальная точка принадлежит Z[k, t0 ], то и все траектории системы останутся в этомслабо инвариантном множестве. Поскольку множество разрешимости является слабо инвариантным, то стратегия UW (t, x, k) представляет собой решение задачи 2.1.Третья глава диссертации посвящена задаче об управлении системой с неоднотипными ограничениями: управление здесь стеснено геометрическим, а помеха — интегральнымограничением.Рассматривается линейная управляемая система вида(ẋ(t) = A(t)x(t) + B(t)u + C(t)v(t),t ∈ T = [t0 , t1 ].(12)k̇(t) = −kv(t)k2S(t) ,11На управление наложено только геометрическое ограничение u ∈ P(t), а помеха должнаобеспечивать выполнение фазового ограничения k(t) > 0, эквивалентного интегральномуограничениюZt1t0kv(t)k2S(t) dt 6 k0 .(13)В разделе 3.1 показывается, что, если управлению недоступна информация о текущемзначении k(t), то система может быть преобразована так, что ее вид аналогичен (12), нопри этом уже известно значения k(t), а матрица C(t) ≡ I.
Кроме того, как и в предыдущихглавах, матрицу A(t) можно считать нулевой.В разделе 3.2 приводится постановка основной задачи:Задача 3.1. Для данного целевого множества M ⊆ Rn × R+ найти множество разрешимости W[t] и позиционную стратегию управления U (t, x, k) ∈ UCL , такую, что всеего траектории дифференциального включенияv(t)ẋ(t)= U (t, x, k) × {0} +,(14)−kv(t)k2S(t)k̇(t)выпущенные из любой начальной позиции (t, x, k), t ∈ T , (x, k) ∈ W[t], достигали быцелевое множество M в момент времени t1 , какова бы ни была измеримая помеха v(t),удовлетворяющая ограничению (13).Поскольку множество разрешимости здесь как правило является невыпуклым, то каки в предыдущей главе мы будем работать с его сечениями, обозначаемыми W[k, t], исечениями целевого множества M(k).Решение задачи 3.1 ведется по той же схеме, что и во второй главе.












