Решение задач терминального управления для плоских и лиувиллевых систем с учетом ограничений (1024957), страница 7
Текст из файла (страница 7)
. . , ν ∗ (ys ), ν ∗ (v1 ), . . . , ν ∗ (vr ).421.6.3. Геометрическая интерпретацияплоскостности и динамической обратной связиРассмотрим плоскую систему видаẋ = f (t, x, u),x ∈ Rn ,u ∈ Rm ,(1.37)ym = hm (t, x, u, u̇, . . . , u(l) ).(1.38)с плоким выходомy1 = h1 (t, x, u, u̇, . . . , u(l) ),...,По определению плоского выхода переменные x и u выражаются как(n1 −1)x = X(t, y1 , ẏ1 , . . . , y1(nm −1), y2 , . . . , ym),(n )(nm )u = U (t, y1 , ẏ1 , . .
. , y1 1 , y2 , . . . , ym).(1.39)(1.40)Соотношения (1.38) определяют C–диффеоморфизм F из области O, гдеопределен плокий выход, в открытое подмножество пространства бесконечных джетов с зависимыми переменными y1 , . . . , ym , а соотношения (1.39)и (1.40) задают обратное отображение.Теорема 1.7.[19] Система дифференциально плоская в области Oдиффеотопа системы тогда и только тогда, когда существует такой C–диффеоморфизм F из O в открытое подмножество U пространства бесконечных джетов, который сохраняет независимую переменную, т.е. F ∗ (tU ) = tO ,где tU и tO — независимые переменные на U и O соответственно.Систему (1.37) называют (орбитально) плоской [19] в области O, если существует C–диффеоморфизм из O в некоторое открытое подмножество пространства бесконечных джетов.Предположим теперь, что определена динамическая обратная связьξ˙ = a(t, x, ξ, v),u = b(t, x, ξ, v),ξ ∈ Rd , v ∈ Rm ,(1.41)системы (1.37).
Рассмотрим системуẋ = f t, x, b(t, x, ξ, v) ,ξ˙ = a(t, x, ξ, v)(1.42)43с состоянием (x, ξ) ∈ Rn+d и управлением v, в которую преобразует динамическая обратная связь (1.41) систему (1.37). Второе равенство в (1.41)определяет отображение из множества решений системы (1.42) в множестворешений системы (1.37).Обозначим через E1∞ диффеотоп системы (1.42), а через Ek — F(E1 )–модуль, порожденный 1–формамиdt, dxi , dξs , dbj , dDE1 (bj ), . . . , dDEk1 (bj ),где i = 1, . . . , n, s = 1, . .
. , d, j = 1, . . . , m, а bj (t, x, ξ, v) — функции из (1.41),понимаемые как функции на E1∞ . Отметим, что модуль Ek состоит из всех линейных комбинаций указанных 1–форм, коэффициенты которых есть функциииз F(E1 ). Напомним, что через dimE мы обозначаем целочисленную функциюна E1∞ , значение которой в точке θ есть размерность пространства ковекторов {ωθ | ω ∈ E}. Динамическая обратная связь (1.41) системы (1.37) называется регулярной в окрестности точки θ ∈ E1∞ , если в этой окрестностиdimEd − dimEd−1 = m (здесь d — количество ξs ).Для прояснения понятия регулярности динамической обратной связи введем следующее понятие.
Говорят, что динамическая обратная связь (1.41)системы (1.37) удовлетворяет условию соответствия решений, если для любого решения x(t), u(t) системы (1.37) существуют векторные функции ξ(t)и v(t), которые вместе с функциями x(t) и u(t) тождественно удовлетворяютуравнениям (1.41).Из условия соответствия решений следует, что набор функцийx(t), ξ(t), v(t) образует решение системы (1.42). Поэтому в случае выполнения этого условия отображение из множества решений системы (1.42) вмножество решений системы (1.37) сюръективно.Теорема 1.8.
[99] Пусть в окрестности точки диффеотопа (E1∞ , DE1 )системы (1.42) модуль Ed−1 имеет постоянную размерность. Тогда в окрестности этой точки эквивалентны следующие утверждения:44(a) динамическая обратная связь (1.41) удовлетворяет условию соответствия решений;(b) динамическая обратная связь (1.41) регулярна;(c) любой конечный набор функций, составленный изt, x1 , . . . , xn , b1 , . . .
, bm , DE1 (b1 ), . . . , DE1 (bm ), DE21 (b1 ), . . . ,функционально независим на E1∞ .Можно показать, что множество точек диффеотопа E1∞ , в окрестности которых модуль Ed−1 имеют постоянную размерность, открыто и всюду плотнов E1∞ . В дальнейшем мы будем рассматривать только такие точки диффеотопа E1∞ .Теорема 1.9. [99] Регулярная динамическая обратная связьξ˙ = a(t, x, ξ, v),u = b(t, x, ξ, v),ξ ∈ Rd , v ∈ Rm ,(1.43)системыẋ = f (t, x, u),x ∈ Rn , u ∈ Rm ,(1.44)определяет конечномерное накрытие этой системы системой (1.42). Обратно,пусть E ∞ — диффеотоп системы (1.44), ν : S ∞ −→ E ∞ — конечномерное накрытие, θ ∈ S ∞ .
Тогда в некоторой окрестности точки ν(θ) ∈ E ∞ существуеттакая регулярная динамическая обратная связь вида (1.43), что конечномерное накрытие определенное ею есть ограничение ν на некоторую окрестностьточки θ.Теорема 1.10. [19] Пусть в области O регулярная система (1.37) плоскаяс плоским выходом (1.38) и имеет место равенство (1.39). Тогда в окрестностилюбой точки ϑl ∈ O существует динамическая обратная связь размерностиd = n1 + . . . + nm − n, которая линеаризует систему (1.37).Алгоритм построения динамической обратной связи, линеаризующей плоскую систему.Пусть функции (1.38) образуют плоский выход системы (1.37) и выполняются соотношения (1.39).1. Выберем такие функции ξ1 , . .
. , ξd переменныхt,(n1 −1)ỹ = (y1 , ẏ1 , . . . , y1(nm −1), y2 , . . . , ym),45что матрица Якоби ∂(ξ, x)/∂ ỹ квадратная и невырожденная.2. Выразим производные ξ˙1 , . . . , ξ˙d этих функций в силу системы (1.37) и(n )функции u1 , . . . , um через t, ỹ и v = (v1 , . . . , vm ), где vi = yi i , i = 1, m.3. В полученных выражениях для ξ˙1 , . . . , ξ˙d и u1 , . . . , um перейдем от переменных t, ỹ, v к переменным t, ξ, x, v. Получим линеаризующую динамическую обратную связь.Теорема 1.11. [99] Регулярная система динамически линеаризуема в окрестности точки θ тогда и только тогда, когда существует накрытие из некоторого открытого подмножества пространства бесконечных джетов в окрестность точки θ.1.6.4. Интегрируемые симметрии системВысшей(инфинитезимальной)симметриейсистемыEназывают(см. [83]) вертикальное поле X на E ∞ , удовлетворяющее условию[X, D] = 0.(1.45)Мотивировка этого определения следующая.
Если векторное поле Y на E ∞обладает фазовым потоком, и преобразования этого потока отображают графики решений системы E в графики решений этой системы, то[Y, D] = aD,a ∈ F(E).(1.46)Ввиду бесконечномерности E ∞ векторные поля на E ∞ , как правило, не обладают фазовым потоком. Будем искать произвольные векторные поля на E ∞ ,удовлетворяющие условию (1.46). Такие поля называют C–полями. Всякоевекторное поле Y на E ∞ можно однозначно представить в виде суммы вертикального поля X и поля вида hD, h ∈ F(E), т. е.
Y = X + hD. При этомусловие (1.46) означает, что вертикальная составляющая X удовлетворяетусловию (1.45), т. е. является высшей симметрией, а функция h произвольна. Таким образом, найдя все высшие симметрии E ∞ , мы найдем все поля,удовлетворяющие условию (1.46).46Векторное поле Y на E ∞ называют интегрируемым в окрестности U ∞ ⊂E ∞ , если существует такое множество диффеоморфизмов At : U ∞ → E ∞ ,t ∈ I, что1) I – открытый интервал прямой R, содержащий нуль;2) A0 – тождественное отображение U ∞ ;3) At ◦ As = At+s , если t, s и t + s принадлежат I;d4) (At )∗ (f )(ϑ) = Y (f )(ϑ) для любой точки ϑ ∈ U ∞ и гладкой функdt t=0ции f на U ∞ .При этом множество диффеоморфизмов {At : t ∈ I} называют фазовымпотоком поля Y.Пример 3.Рассмотрим векторное поле Y в пространстве E рассло-ения π.
Его фазовый поток {Bt : t ∈ I} продолжается до фазового потока(∞){Bt: t ∈ I} интегрируемого поля Y (∞) в J ∞ π. Если E – система диффе-ренциальных уравнений на сечения расслоения π, а поле Y (∞) касается диффеотопа E ∞ ⊂ J ∞ π, то ограничение Y (∞) на E ∞ есть интегрируемое поле надиффеотопе E ∞ , которое называют классической (инфинитезимальной) симметрией системы E. Координатное представление классических симметрийможно найти в [4, гл. 3, теорема 3.4].Теорема 1.12.
[11] C–Поле Y на диффеотопе E ∞ интегрируемо в окрестности U ∞ точки ϑ ∈ E ∞ тогда и только тогда, когда для любой функцииf ∈ F0 (U) существует такое число l, что для любого k > 0 k-я степень Y k (f )производной Ли функции f вдоль Y лежит в Fl (U).Теорема 1.12 каждой функции f ∈ F0 (U) и интегрируемому C–полю Y наU ∞ ставит в соответствие целое число l(f, Y ). С интегрируемым C–полем Yассоциируется кольцо K, порождённое функциями Y k (f ), f ∈ F0 (U), k ≥ 0.Так как для построения кольца K достаточно рассмотреть только координатные функции f из F0 (U), которых конечное число, то K ⊂ Fl (U) для некоторого l.
А именно l – максимальное из чисел l(f, Y ), где f – координатныефункции из F0 (U).47Пусть K — такое кольцо функций на диффеотопе E ∞ системы с управлением, что F0 (E) ⊂ K ⊂ Fl (E) для некоторого l ≥ 0. Для s > 0 обозначим черезDs K кольцо, порожденное функциями Dj (f ), где f ∈ K, j ≤ s. Точку θ ∈ E ∞называют [11] точкой общего положения кольца K, если подпространства{df |θ0 ∈ Tθ∗0 : f ∈ K} и {df |θ0 ∈ Tθ∗0 : f ∈ Dl K} имеют постоянную размерностьв некоторой окрестности этой точки.Можно показать [11], что множества таких точек являются открытымвсюду плотным подмножеством диффеотопа.Теорема 1.13. [11] Пусть K – такое кольцо функций на диффеотопе E ∞системы (1), что F0 (E) ⊂ K ⊂ Fl (E) для некоторого l ∈ N.
Тогда существуеттакой C-диффеоморфизм F из некоторой окрестности U ∞ ⊂ E ∞ точки общегоположения кольца K в диффеотоп S ∞ некоторой другой системы, что K ⊂F ∗ (F0 (S)) и любой элемент F ∗ (F0 (S)) представляет собой функцию конечногочисла элементов K.1.7. Решение задач терминальногоуправления предварительным выбором путиИзложим подход к решению задач терминального управления, описанныйв работе [16] и используемый в работах [17, 41, 49].Рассмотрим плоскую стационарную систему видаẋ = f (x, u),x ∈ X ⊂ Rn ,u ∈ U ⊂ Rm ,(1.47)и задачу терминального управления для нее в случае, когда начальное положение (x0 , u0 ) ∈ X ×U в момент t = 0 и конечное положение (xT , uT ) ∈ X ×U вмомент t = T являются положениями равновесия системы.