Решение задач терминального управления для плоских и лиувиллевых систем с учетом ограничений (1024957), страница 17
Текст из файла (страница 17)
3.38.123Рис. 3.38. Второй этап выполненияманевра при T2 = 10(c)3.3. Управление автомобилем3.3.1. Реализация маневров поворота и разворотаРассмотрим системуẋ = u cos θ,ż = u sin θ,θ̇ =utg ϕ,l(3.52)которая описывает движение автомобиля при отсутствия проскальзывания(см. [47]). Здесь x, z — декартовы координаты середины задней оси автомобиля, u — скорость автомобиля, θ — угол между осью абсцисс и прямой,проходящей через середины двух осей, ϕ — угол поворота колес передней осиотносительно указанной прямой, а l — расстояние между серединами двухосей.
Вектор (x, z, θ) является состоянием системы, вектор (u, ϕ) — ее управлением.На переменные состояния и управления налагаются естественные ограничения на скорость (|u| ≤ u0 ), на угол поворота передних колес (|ϕ| ≤ ϕ0 ), наускорение (|u̇| ≤ a) и др.Докажем, что система (3.52) плоская в области {u 6= 0} с плоским выходомy1 = x, y2 = z. В самом деле, переменные состояния x, z, θ и управления u иϕ выражаются через плоские выходы и их производные в силу системы:x = y1 ,z = y2 ,θ = arctgẏ2ẏ1при ẏ1 6= 0 и θ = arcctgẏ1ẏ2при ẏ2 6= 0,124qu = ẏ12 + ẏ22 ,ϕ = arctgl(ÿ2 ẏ1 − ÿ1 ẏ2 ).(ẏ12 + ẏ22 )3/2Ограничение {u 6= 0} также необходимо учитывать.Рассмотрим следующую задачу терминального управления для системы (3.52) с граничными условиямиx(t0 ) = x0 ,z(t0 ) = z0 ,θ(t0 ) = θ0 ,x(tf ) = xf ,z(tf ) = zf ,θ(tf ) = θf ,(3.53)где момент t0 начала движения задан, а момент tf окончания движения можетбыть выбран произвольно с учетом очевидного требования tf > t0 .Предположим, что данная задача имеет решение в области, где u > 0, θ̇ <0.
Будем искать решение в этой области с учетом упомянутых ограничений.В указанной области ограничения на угол поворота передних колес переписывается в виде u/θ̇ = l/tg ϕ ≤ −l/tg ϕ0 . Ограничения на величину скоростии ускорения учтем выбором времени движения: чем больше время tf − t0 , темменьше скорость и ускорение.Для построения r–замыкания рассмотрим дифференциальное уравнениеy 00 − α2 y = 0, α > 0. Положение равновесия y = 0, y 0 = 0 является седлом,а множество {|y 0 | < −αy} — инвариантным. При этом для любой точкиполуплоскости y < 0 существует такое α, что указанное инваринтное множество содержит эту точку.
Используем r–замыканиеd2− α12 (θ̇) = 0,dt2lv0 =,tg ϕ02(D −α22 )u/θ̇ + v0 = 0,1dD=,θ̇ dt(3.54)где α1 , α2 — положительные параметры, а оператор D интерпретируется какполная производная по θ в силу системы (3.52). Будем искать решение, лежащее в инвариантном множестве|θ̈| < −α1 θ̇, D u/θ̇ + v0 < −α2 u/θ̇ + v0 .(3.55)125На таком решении ограничения θ̇ < 0, u/θ̇ < −v0 , а значит, u > 0 будутвыполняться.Перепишем систему уравнений (3.52), (3.54) следующим образом. Обозначим ξ = x sin θ − z cos θ.
Тогда, учитывая (3.52), получаемDξ = x cos θ + z sin θ,u= D2 ξ + ξ.θ̇Система уравнений (3.52), (3.54) эквивалентна системеθ(3) − α12 θ̇ = 0,(D2 − α22 )(D2 ξ + ξ + v0 ) = 0,(3.56)неравенства (3.55) переписываются в виде|θ̈| < −α1 θ̇,|D(D2 ξ + ξ + v0 )| < −α2 (D2 ξ + ξ + v0 ).(3.57)а граничные условия (3.53) в переменных θ, ξ, Dξ имеют видθ(t0 ) = θ0 ,ξ(t0 ) = x0 sin θ0 − z0 cos θ0 ,(3.58)(Dξ)(t0 ) = x0 cos θ0 + z0 sin θ0 ,θ(tf ) = θf ,ξ(tf ) = xf sin θf − zf cos θf ,(3.59)(Dξ)(tf ) = xf cos θf + zf sin θf .Таким образом, на решения определенной системы дифференциальных уравнений (3.56) порядка 7 налагаются 6 условий (3.58)–(3.59). Добавим еще одноначальное условиеθ̇(t0 ) = θ̇0 ,(3.60)где θ̇0 — некоторое отрицательное число.Так как конечных условий (3.59) три, а начальных условий (3.58), (3.60)четыре, то искомое накрытие должно иметь четырехмерные слои, а системауравнений базы должна быть третьего порядка.
Первое уравнение в (3.56) —линейное дифференциальное уравнение с независимой переменной t, а второеуравнение в (3.56) не является линейным, если считать t независмой переменной, но оно становится таким, если в качестве независимой переменной126рассмотреть θ. Находя общее решение и того, и другого уравнения, а значит,и системы (3.56), и используя формулы (2.16), получаем следующие функции,определяющие накрытие:p0 = θ − ζ̇ θ̇ + ζ θ̈,00020002p1 = ϕ − ψ + (1 − α2 )ψ ξ + ψ + (1 − α2 )ψ Dξ−p2 =−α22 v0 ψ− ψ IV−ψ 0 D2 ξ + ψD3 ξ,20000020+ (1 − α2 )ψ ξ + ψ + (1 − α2 )ψ Dξ−− ψ 00 D2 ξ + ψ 0 D3 ξ.где ζ — функция от t, а ϕ, ψ — функции от θ следующего вида:1ζ = 2 ch(α1 t − α1 tf ) − 1 ,α1v0 2ϕ=α cos(θ − θf ) + ch(α2 θ − α2 θf ) − v0 ,1 + α22 21ψ = − 2 ϕ0 .α2 v0Используя прямые выкладки, вид функций ζ, ϕ, ψ, а также равенства (3.56),получаем уравнения ṗi = 0, i = 0, 1, 2, которые образуют систему уравненийбазы накрытия.Задача терминального управления для системы (3.52) с граничными условиями (3.53) решается следующим образом.1.
Из конечных условий (3.59) вычисляем значенияp0 (tf ) = θf ,p2 (tf ) = −(Dξ)(tf ).p1 (tf ) = ξ(tf ),2. Так как функции p0 , p1 , p2 постоянны на решениях системы (3.56), тоp0 (t0 ) = p0 (tf ),p1 (t0 ) = p1 (tf ),p2 (t0 ) = p2 (tf ).(3.61)3. Из соотношений (3.58), (3.60)–(3.61) находим значения θ̈(t0 ), (D2 ξ)(t0 ),(D3 ξ)(t0 ).4. Проверяем условие (3.57) в начальной точкеt0 ,θ0 ,θ̇0 ,θ̈(t0 ),ξ(t0 ),(Dξ)(t0 ),(D2 ξ)(t0 ),(D3 ξ)(t0 ).(3.62)127Если условие выполняется, то переходим на шаг 5, иначе уменьшаем θ̇0 , увеличиваем α1 , α2 и повторяем шаги 3, 4.
Если условие (3.57) не выполняетсяв точке (3.62) и для новых значений параметров θ̇0 , α1 , α2 , то делаем вывод,что решить поставленную задачу указанным методом нельзя.5. Решая задачу Коши для системы (3.56) с начальными условиями (3.62),находим решение θ(t), ξ(t) , удовлетворяющее граничным условиям (3.58)–(3.60).6.
Переходя от переменных θ, ξ, Dξ к переменным x, z, θ, получаем решение x(t), z(t), θ(t) задачи терминального управления (3.52), (3.53).Данный алгоритм был использован для решения задач поворота и разворота автомобиля (см. Рис. 3.39, Рис. 3.40). При этом для обоих маневровиспользовались следующие параметры: θ̇0 = −0.1(1/сек), α1 = 5(1/сек), α2 =5, ϕ0 = π/5, tf − t0 = 2(сек).3.3.2. Реализация маневра змейкаРассмотрим задачу объезда автомобилем трех столбиков (маневр змейка).Введем такую систему координат на плоскости, что столбики расположеныв точках (−x0 , 0), (0, 0) и (x0 , 0).
Обозначим через r0 радиус столбиков, ачерез d —максимальное расстояние от середины задней оси автомобиля доточки корпуса автомобиля. Тогда r = r0 + d — минимально допустимоерасстояние от середины задней оси до центров столбиков. Таким образом,область допустимых значений переменных плоского выхода x, z ограниченанеравенствами(x − x0 )2 + z 2 > r2 ,x2 + z 2 > r2 ,(x + x0 )2 + z 2 > r2 .Используем декомпозицию, описанную в примере 6. Для построения траектории автомобиля выбираем на желаемом пути массив точек (xi , zi ), i =1, . . . , n, причем (x1 = x0 , z1 = 0) — начальная, а (xn = −x0 , zn = 0) — конечные точки. Параметризуем кривую так, чтобы значения параметра τ в точках128Рис. 3.39. ПоворотРис.
3.40. Разворот(xi , zi ) были целыми числами от 0 до n−1. На переменную z наложим условиеzτ0 (0) = 0. Таким образом, мы имеем n условий на функцию x(τ ) и n+1 условиена функцию z(τ ). Находим многочлены x(τ ) и z(τ ) порядка n − 1 и n соответственно, удовлетворяющие условиям x(i − 1) = xi , z(i − 1) = zi , i = 1, . . . , n.Если кривая (x(τ ), z(τ )) выходит за пределы допустимой области или ее кривизна превышает допустимое значение, то добавляем дополнительные точки(xi , zi ) на желаемом пути так, чтобы эти условия выполнялись, и повторяемвычисления. Полученная нами кривая приведена на Рис.
3.41.Для решения второй задачи декомпозиции (вычисления функции τ (t), t ∈[t0 , tf ]) определяем сначала зависимость скорости u от пройденного пути s.129Рис. 3.41. Желаемая траектория x(z)Рис. 3.42. Желаемая траектория u(s)Для этого, используя результаты предыдущего этапа, вычисляем зависимость пройденного пути s и угла ϕ от параметра τ и длину Sa всего пути.Требуем, чтобы автомобиль сначала набирал скорость, потом ехал с постоянной скоростью u1 = 5 м/с, а затем плавно тормозил и останавливался.Отметим, что вопрос об изменении скорости автомобиля не тривиален и невходит в задачи данной работы. Мы выбираем функцию u(s) так (см. рис.3.42), чтобы выполнялось ограничение на ускорение.Для вычисления функции τ (t) вспоминаем, что скорость u равна произ-130водной пути s по времени t: u = ṡ(t) = s0 (τ )τ̇ (t), где s0 (τ ) — производная sпо τ.
Поэтому τ (t) есть решение задачи Коши τ̇ (t) = u(s(τ ))/s0 (τ ), τ (t0 ) = 0.Найдя τ (t), получаем u = u(s(τ (t))) и ϕ = ϕ(τ (t)), где ϕ(τ ) — зависимость,полученная на первом этапе. Результаты моделирования показали, что приполученной зависимости управлений u и ϕ от t автомобиль движется по траектории, приведенной на Рис. 3.41.3.4.
Решение задачи терминального управленияметодом накрытий для маятника Капицы3.4.1. Математическая модель маятника КапицыМаятник Капицы описывается системой (см., например, [20])uα̇ = p + sin α,lug u2ṗ = ( − 2 cos α) sin α − p sin α,lllż = u,(3.63)где z — вертикальная координата точки подвешивания, u — вертикальнаяскорость, p — параметр, пропорциональный обобщенному импульсу, α —угол между осью маятника и осью Oz, l — длина маятника, g — ускорениесвободного падения.
Схематически маятник изображен на Рис. 3.43.Рис. 3.43. Схематичноеизображение маятника Капицы1313.4.2. Метод накрытий для управления маятником КапицыСчитая α новой независимой переменной, t, p, z — переменными состояния, а u — управлением, переписываем систему (3.63) в видеdp(gl − u2 cos α) sin α − lup cos α=,dαl(lp + u sin α)dtl=,dα lp + u sin αdzlu=.dα lp + u sin α(3.64)Система (3.64), а значит, и система (3.63) лиувиллева с одной лиувиллевойпеременной p и интегральными переменными t, z.В области, где α(t) и t(α) — строго монотонные функции, системы (3.63) и(3.64) эквивалентны. Рассмотрим случай, когда эти функции возрастающие,т.е.lp + u sin α > 0.(3.65)Функцию u(α) будем определять по функции p(α), решая первое уравнениесистемы (3.64) относительно u.