Решение задач терминального управления для плоских и лиувиллевых систем с учетом ограничений (1024957), страница 9
Текст из файла (страница 9)
. . , u1 1(k −1)u2 (t0 ), . . . , umm(t0 ),(t0 ).5. Решая задачу Коши для системы (2.6)–(2.7) с начальными значениями(k −1)t0 , x1,0 , . . . , xn,0 , u1 (t0 ), u̇1 (t0 ), . . . , u1 1m −1)(t0 ), u2 (t0 ), . . . , u(k(t0 ),m(2.10)находим решение x(t), u(t) системы (2.4).Найденное таким образом решение есть решение задачи (2.4), (2.5), таккак функция x(t) удовлетворяет начальным условиям (2.5) по построению, аконечным условиям (2.5) — из условия (B).Изложенный алгоритм решения задачи терминального управления основан на построении таких функций U1 , .
. . , Um , для которых соответствующаясистема (2.6)–(2.7) накрывает систему вида (2.8). Условие (B) устанавливаетсвязь этого накрытия с конечными условиями поставленной задачи терминального управления, а условие (C) — с начальными условиями этой задачи.Систему вида (2.6)–(2.7), удовлетворяющую условиям (A), (B) и (C) длянекоторых функций ϕj , j = 1, n, будем называть r–замыканием задачи терминального управления (2.4), (2.5).
Как показано выше, r–замыкание позволяетрешать задачу (2.4), (2.5).В случае, когда есть ограничения на x, u и производные u, необходимоподбирать r–замыкание так, чтобы соответствующее решение задачи терминального управления удовлетворяло этим ограничениям. Для построения та-56кого r–замыкания мы предлагаем использовать понятие инвариантного множества динамической системы. Напомним, что подмножество U расширенного фазового пространства динамической системы называют инвариантным,если для любой точки из U траектория системы, проходящая через эту точку,целиком содержится в U.
Пердположим, что r–замыкание (2.6)–(2.7) обладаетинвариантным множеством U, все точки которого удовлетворяют ограничениям задачи. Тогда если точка (2.10) принадлежит U, то решение задачиКоши для системы (2.6)–(2.7) с начальными условиями (2.10) (а это и естьрешение задачи терминального управления (2.4), (2.5)) лежит в U, а значит,удовлетворяет ограничениям задачи.Отметим также, что понятие r–замыкания инвариантно относительнопреобразований систем, т.е. если две системы эквивалентны, а для одной из них поставлена задача терминального управления и построено r–замыкание, то используя соответствующее преобразование эквивалентности,получаем задачу терминального управления и r–замыкание для второй системы. Например, любая плоская система эквивалентна системе вида (1.18)(см.
[19, 47, 100]), поэтому при терминальном управлении плоской системойдостаточно построить r–замыкание для системы (1.18). Кроме того, если система (2.4) регулярная, то из нее переменные управления u можно выразитьчерез t, x и удалить u из системы (2.6)–(2.7). r–Замыкания такого вида мы ибудем рассматривать далее.2.3. Метод накрытий для плоских системПокажем, что для плоской системы в качестве r–замыкания можно взятьлюбую определенную динамическую систему, порядок которой определяется количеством граничных условий задачи терминального управления. Дляпостроения соответствующего накрытия будем предполагать, что известнообщее решение этой системы. Рассмотрим сначала случай m = 1.57Известно [9, 19], что при m = 1 любая плоская система приводится к каноническому виду:y (n) = v,(2.11)Количество граничных условий (1.17) равно 2n.
Следовательно, r–замыканиедолжно быть дифференциальным уравнением на y = y1 порядка 2n. Система(1.18) в данном случае имеет вид (2.11), а граничные условия (1.17) — видỹ(t0 ) = ỹ0 , ỹ(tf ) = ỹf , ỹ = (y, ẏ, . . . , y (n) ). Из свойства инвариантности r–замыкания следует, что достаточно построить r–замыкание для этой задачитерминального управления.Пусть y = χ(t, z1 , . . .
, z2n ) — такая функция независимых переменныхt, z1 , . . . , z2n , что матрица(aij ) =∂ iχ∂ti−1 ∂zj,i = 1, 2n,j = 1, 2n,(2.12)невырождена в точке (tf , z̄0 ), z̄0 = (z1,0 , . . . , z2n,0 ). Построим такое дифференциальное уравнение порядка 2n, чтобы функция y = χ(t, z1 , . . .
, z2n ) была егообщим решением. По теореме о неявной функции в некоторой окрестноститочки (tf , z̄0 ) переменные z1 , . . . , z2n представляют собой функции от t, y, y (1) ,. . ., y (2n−1) :zi = Zi (t, y, y (1) , . . . , y (2n−1) ),i = 1, 2n.(2.13)Рассмотрим дифференциальное уравнение порядка 2n:y(2n)∂ 2n χ (1)(2n−1)(1)(2n−1)= 2n t, Z1 (t, y, y , . . . , y), . . . , Z2n (t, y, y , . . . , y) , (2.14)∂tопределенное в окрестности точкиtf , y0 = χ(tf , z̄0 ),(1)y0∂χ∂ 2n−1 χ(2n−1)=(tf , z̄0 ), . . . , y0= 2n−1 (tf , z̄0 ) .∂t∂t(2.15)По построению, для любого набора значений z1 , .
. . , z2n из окрестности точкиz̄0 функция y = χ(t, z1 , . . . , z2n ) есть решение уравнения (2.14), а функции58(2.13) — первые интегралы этого уравнения. Поэтому функцииp1p2pn= χ tf , Z1 (t, y, . . . , y), . . . , Z2n (t, y, . . . , y) ,∂χ (2n−1)(2n−1)=tf , Z1 (t, y, . . . , y), . . . , Z2n (t, y, . . . , y) ,(2.16)∂t...∂ n−1 χ (2n−1)(2n−1)=tf , Z1 (t, y, . . . , y), . . . , Z2n (t, y, . . . , y) ,∂tn−1(2n−1)(2n−1)как функции первых интегралов (здесь tf — константа) также есть первыеинтегралы уравнения (2.14). Следовательно, их производные в силу этогоуравнения равны нулю:ṗi = 0,i = 1, n.(2.17)Функции (2.13) как первые интегралы уравнения (2.14) не зависят от t наего решениях.
Поэтомуy(i−1)∂ i−1 χ(tf ) = i−1 (tf , z1 , . . . , z2n ) = pi (tf ),∂ti = 1, n.(2.18)Теорема 2.2. Пусть y = χ(t, z1 , . . . , z2n ) — такая функция, что матрица(2.12) невырождена в точке (tf , z̄0 ), z̄0 = (z1,0 , . . . , z2n,0 ). Тогда существуеттакое δ > 0, что при t0 ∈ (tf − δ, tf ) существует такая окрестность V ⊂ Rnточки∂χ∂ n−1 χχ(t0 , z̄0 ),(t0 , z̄0 ), . .
. ,(t0 , z̄0 ) ,∂t∂tn−1(1)(n−1)что для любой точки (y0 , y0 , . . . , y0) из V уравнение (2.14) есть r–замыкание задачи терминального управления для уравнения (2.11) с граничными условиямиy(t0 ) = y0 ,y (1) (t0 ) = y0 ,(1)...,y (n−1) (t0 ) = y0y(tf ) = y0 ,y (1) (tf ) = y0 ,(1)...,y (n−1) (tf ) = y0(1)(n−1)где числа y0 , y0 , .
. . , y0(n−1),(n−1),определяются соотношениями (2.15).J В качестве функций ϕ1 , . . . , ϕn возьмем функции (2.16). Эти функции определяют накрытие из уравнения (2.14) в систему (2.17), а значит, условие (A)выполняется.59Из равенств (2.18) следует, что условие (B) также выполняется.Для проверки условия (C) используем параметрическое представлениефункций (2.16):∂ i−1 χpi = i−1 (tf , z1 , . . .
, z2n ), i = 1, n,∂t∂ j−1 χ(j−1)y= j−1 (t, z1 , . . . , z2n ), j = 1, 2n,∂tгде переменные z1 , . . . , z2n понимаются как параметры. Учитывая то, чтоz1 , . . . , z2n постоянны на решениях уравнения (2.11), находимpi,0∂ i−1 χ= pi (t0 ) = i−1 (tf , z1 , . . . , z2n ),∂ti = 1, n,∂ i−1 χ(t0 , z1 , . .
. , z2n ), i = 1, n,∂ti−1∂ j−1 χy (j−1) (t0 ) = j−1 (t0 , z1 , . . . , z2n ), j = n, 2n.∂t(i−1)y0=(2.19)(2.20)(2.21)Заметим, что если система (2.19), (2.20) разрешима относительно z1 , . . . , z2n ,то, подставляя ее решение (z1 , . . . , z2n ) в уравнения (2.21), получаем значенияv (i−1) (t0 ) = y (i+n−1) (t0 ), i = 1, n, т.е. условие (C) выполняется.Для доказательства разрешимости системы (2.19), (2.20) используем теорему об обратной функции. Рассмотрим функцию∂ n−1 χ∂ n−1 χG : z̄ 7→ χ(t0 , z̄), . . . , n−1 (t0 , z̄), χ(t0 , z̄), . . .
, n−1 (t0 , z̄) ,∂t∂tгде z̄ = (z1 , . . . , z2n ). Покажем, что якобиан этой функции в точке z̄0 отличенот нуля. Первые n строк матрицы Якоби функции G в точке z̄0 состоят изчисел∂ iχ(t0 , z̄0 ),∂ti−1 ∂zji = 1, n,j = 1, 2n,i = 1, n,j = 1, 2n.а последние – из чисел∂ iχ(t0 , z̄0 ),∂ti−1 ∂zj(2.22)Таким образом, первые n строк совпадают с соответствующими строкамиматрицы (aij (t0 , z̄0 )) (см. (2.12)).60Используя формулу Тейлора и обозначение ∆ = t0 − tf , преобразуем элементы (2.22) к виду∂ iχ∂ i+1 χ∂ iχ(t0 , z̄0 ) = i−1(tf , z̄0 ) + ∆ i(tf , z̄0 )+∂ti−1 ∂zj∂t ∂zj∂t ∂zj∆n ∂ i+n χ+... +(tf , z̄0 ) + o(∆n ).i+n−1n! ∂t∂zjДобавляя линейные комбинации первых n строк якобиана функции G в точке(tf , z̄0 ) к последним n строкам, преобразуем их элементы к виду∆n−i+1 ∂ n+1 χ∆n ∂ i+n χ(tf , z̄0 ) + . .
. +(tf , z̄0 ) + o(∆n ).ni+n−1(n − i + 1)! ∂t ∂zjn! ∂t∂zj(2.23)Добавляя линейные комбинации строк (2.23) с меньшими номерами i к строкам (2.23) с большими номерами i, преобразуем элементы (2.23) к виду∆n ∂ i+n χ(tf , z̄0 ) + o(∆n ).i+n−1n! ∂t∂zjЗаметим, что после указанных преобразований последние n строк якобиана Gпропорциональны с точностью до o(∆n ) соответствующим строкам матрицы(aij (tf , z̄0 )) с коэффициентом пропорциональности ∆n /n!, поэтому n n∂Gi∆2det(tf , z̄0 ) =det(aij (tf , z̄0 )) + o(∆n ).∂zjn!По условию матрица (aij ) невырождена в точке (tf , z̄0 ).
Поэтому существует такое число δ > 0, что при t0 ∈ (tf − δ, t0 ) якобиан функции G в точке z̄0отличен от нуля. Согласно теореме об обратной функции, существует такаяокрестность U точки∂ n−1 χ∂ n−1 χG(z̄0 ) = χ(tf , z̄0 ), .
. . , n−1 (tf , z̄0 ), χ(t0 , z̄0 ), . . . , n−1 (t0 , z̄0 ) ,∂t∂tв которой определена обратная функция G−1 . Заметим, чтоχ(tf , z̄0 ) = y0 ,∂χ(1)(tf , z̄0 ) = y0 , . . . ,∂t∂ n−1 χ(n−1)(tf , z̄0 ) = y0.n−1∂t(2.24)61Обозначим через V пересечение окрестности U с n-мерным подпространством,у точек которого первые n координат равны (2.24) соответственно. Тогда V –окрестность точки∂χ∂ n−1 χχ(t0 , z̄0 ),(t0 , z̄0 ), . . . , n−1 (t0 , z̄0 ) .∂t∂t(1)(n−1)Если точка (y0 , y0 , .
. . , y0) лежит в V, то система (2.19), (2.20) имеет ре-шение(1)(n−1)(z1 , . . . , z2n ) = G−1 (y0 , y0 , . . . , y0(1)(n−1), y0 , y0 , . . . , y0),а значит, условие (C) выполняется. IВ случае m > 1 формулы (2.12)–(2.18) можно обобщить следующим образом. Заметим, что на функцию yj (1 ≤ j ≤ m) налагается 2kj граничныхусловий (1.17). Поэтому r–замыкание должно иметь порядок 2kj по переменной yj , j = 1, m. Общее решение такой системы представляет собой такуювекторную функцию yj = χj (t, z1 , . . .
, z2N ), j = 1, m, N = k1 + . . . + km , котораяопределяет обратимую замену от переменных z̄ = (z1 , . . . , z2N ) к переменным(2k1 −1)ỹ = (y1 , ẏ1 , . . . , y1(2km −1), y2 , . . . , ym). Матрица (aij ) представляет собой ма-трицу Якоби этой замены. По аналогии с уравнением (2.14) r–замыкание длямногомерного случая есть система(2k )yj j∂ 2kj χj=(t, z̄),∂t2kjj = 1, m,где z̄ следует выразить через t, ỹ, используя обратную замену переменных.Функции p1 , . .
., pN , которые определяют накрытие из этой системы в систему(2.17), по аналогии с (2.16) есть функцииχ1 (tf , z̄),∂χ1(tf , z̄), . . . ,∂t∂ k1 χ 1(tf , z̄),∂tk1χ2 (tf , z̄), . . . ,∂ km χm(tf , z̄).∂tkm622.4. Орбитальная декомпозиция систем с управлениемНапомним, что декомпозицией системы с управлением мы называем преобразование системы в систему видаż = g1 (t, z, v),z ∈ Rn 1 ,v ∈ Rm1 ,ζ̇ = g2 (t, ζ, z, v, v̇, . . . , v (l) , ξ),ζ ∈ Rn 2 ,(2.25)ξ ∈ Rm2 ,(2.26)с состоянием (z, ζ) и управлением (v, ξ).Декомпозицию различают по типу используемого преобразования.
Например, декомпозиции по статической обратной связи афинных систем былиисследованы в [11] (см. п.1.4 выше). Мы используем преобразование орбитальной эквивалентности (см. [19] или п.1.6.3 выше) и называем соответствующуюдекомпозицию орбитальной декомпозицией.Замечание. Система декомпозируемого вида (2.25)–(2.26) накрывает систему (2.25). Это накрытие конечномерно, если считать переменные ξ переменными системы (2.25), от которых не зависят уравнения этой системы.А именно, каноническими координатами на диффеотопе E ∞ системы (2.25)–(2.26) являются функцииt, ζ, z, v, ξ, v̇, . . . , v (s) , ξ (s) , . .