Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения (1155776), страница 11
Текст из файла (страница 11)
На основании формулы Коши⎛⎞t∗x(t) = e(t−t0 )A ⎝x(t0 ) + e−(s−t0 )A u(s) ds⎠, ψ(t) = e−(t−t0 )A ψ(t0 ).t0Тогда скалярное произведение фазовой и сопряжённой переменныхдопускает следующее преобразование:⎛⎞t∗(x(t), ψ(t)) = ⎝e(t−t0 )A x(t0 ) + e−(s−t0 )A u(s) ds , e−(t−t0 )A ψ(t0 )⎠=⎛= ⎝x(t0 ) +t0t⎞e−(s−t0 )A u(s) ds, ψ(t0 )⎠ =t0t= (x(t0 ), ψ(t0 )) +∗(u(s), e−(s−t0 )A ψ(t0 )) ds =t0t= (x(t0 ), ψ(t0 )) +(u(s), ψ(s)) ds.t0Формула (7) доказана.Проверим формулу (8). На основании формулы Коши⎛⎞t∗x(t) = e(t−t1 )A ⎝x(t1 ) + e−(s−t1 )A u(s) ds⎠, ψ(t) = e−(t−t1 )A ψ(t1 ).t193Тогда(x(t), −ψ(t)) =⎛⎛= ⎝e(t−t1 )A ⎝x(t1 ) +t⎞⎞∗e−(s−t1 )A u(s) ds⎠ , −e−(t−t1 )A ψ(t1 )⎠ =t1t1∗= (x(t1 ), −ψ(t1 )) + (u(s), e−(s−t1 )A ψ(t1 )) ds =t= (x(t1 ), −ψ(t1 )) +t1(u(s), ψ(s)) ds.tФормула (8) доказана.Проверим теперь формулу (5).
Используя формулы (5) раздела 3.8,и (3) раздела 3.9, имеемc(X(t), ψ(t)) = c(X(t), ψ)tψ=ψ(t)= c(M0 , ψ(t0 )) +c(U, ψ(s) ds.t0Для доказательства формулы (6) следует воспользоваться формулами (6) раздела 3.8 и (4) раздела 3.9. Лемма о сопряжённой переменной доказана.Замечание 9.1. Опорная функция множества достижимости X(t)на сопряжённой переменной ψ(t), т.е. функцияtf (t) ≡ c(X(t), ψ(t)) = c(M0 , ψ(t0 )) +c(U, ψ(s) ds,t0непрерывна по аргументу t вместе со своей производнойf˙(t) = c(U, ψ(t)).Опорная функция множества управляемости Z(t) на сопряжённой переменной ψ(t), т.е.
функцияt1ϕ(t) ≡ c(Z(t), −ψ(t)) = c(M1 , −ψ(t1 )) +c(U, ψ(s) ds,t94непрерывна по аргументу t вместе со своей производнойϕ̇(t) = −c(U, ψ(t)).3.10Управляемость. Критерий управляемости. Основная леммаВ разделе 3.10 вводится понятие управляемости, рассматриваетсякритерий управляемости. С помощью критерия управляемости доказывается так называемая основная лемма, которая будет использована при выводе необходимых условий оптимальности в форме принципамаксимума Понтрягина (раздел 3.11).Рассматривается управляемый объект, описываемый уравнениемẋ = Ax + u.Задан класс допустимых управлений У = УU , множества M0 , M1 ,U, M0 , M1 ∈ Ω(E n )и два числа t0 , t1 ;t 0 < t1 .Поставим вопрос: можно ли при помощи какого-нибудь допустимого управления u(·) ∈ У, определённого на отрезке времени [t0 , t1 ],перевести объект из множества M0 на множество M1 :x(t0 ) ∈ M0 , x(t1 ) ∈ M1 ?При положительном ответе на этот вопрос говорят об управляемости объекта.
Исследование управляемости не связано с каким-либокритерием качества процесса управления (например, со временем перехода). Отрезок времени [t0 , t1 ] считается заданным.Определение 10.1. Объект называется управляемым на заданном отрезке времени [t0 , t1 ] из множества M0 в множество M1 ,если существует допустимое управление u(·) ∈ У и отвечающая этому управлению траектория x(·) (т.е. ẋ(t) = Ax(t)+u(t) для почти всехt ∈ [t0 , t1 ]) с начальным условием x(t0 ) ∈ M0 такая, что x(t1 ) ∈ M1 .Из определения множества достижимости ясно, что объект управляем на заданном отрезке [t0 , t1 ] из M0 в M1 тогда и только тогда,когда множество достижимости X(t1 ) ≡ X(t0 , t1 , M0 ) пересекается смножеством M1 :Управляемость на [t0 , t1 ]из M0 в M1⇐⇒ X(t0 , t1 , M0 )95"M1 = ∅(1)Так как X(t1 ), M1 ∈ Ω(E n ), то, на основании утверждения (1) и первой части свойства 140 опорных функций (см.
раздел 2.5), получаемнеобходимое условие управляемости в формеc(X(t1 ), ψ) + c(M1 , −ψ) 0 ∀ψ ∈ E n , ψ = 0,(2)которое можно переписать, заменив ψ на ψ(t1 ), в видеc(X(t1 ), ψ(t1 )) + c(M1 , −ψ(t1 )) 0 ∀ψ(t1 ) ∈ E n , ψ(t1 ) = 0.(3)Так как ψ(t1 ) = 0, то этот ненулевой вектор в (3) можно рассматривать как значение сопряжённой переменной в момент времени t1 .Тогда, привлекая при t = t1 формулу (5) раздела 3.9 из леммы осопряжённой переменной, условие (3) можно переписать в формеt1c(U, ψ(s)) ds + c(M1 , −ψ(t1 )) 0,c(M0 , ψ(t0 )) +(4)t0причём условие (4) должно выполняться для любой сопряжённой переменной ψ(s):= ψ(t0 ), ψ(s)= ψ(t1 ).ψ(s)s=t0s=t1Итак, получено необходимое условие управляемости в форме (4) (первая часть следующей теоремы).Теорема (критерий управляемости).1) При M0 , M1 ∈ Ω(E n ) условие (4) является необходимым условием управляемости объекта на заданном отрезке времени [t0 , t1 ]из M0 в M1 .2) При M0 , M1 ∈ conv Ω(E n ) условие (4) является необходимыми достаточным условием управляемости объекта на заданномотрезке времени [t0 , t1 ] из M0 в M1 .2 Часть 1) этой теоремы доказана выше.
Для доказательства части 2) остаётся проверить, что в случае выпуклых компактов M0 ,M1 условие (4) влечёт управляемость. Условие (4) равносильно условию (3), а условие (3) может быть записано в форме (2), т.е.c(X(t1 ), ψ) + c(M1 , −ψ) 0 ∀ψ ∈ E n .96Последнее условие и выпуклость компактов X(t1 ), M1 на основанииследствия из свойства 14◦ раздела 2.5, влекут соотношение"X(t1 ) M1 = ∅,равносильное управляемости, см.
формулу (1). Критерий управляемости установлен.Другая формулировка критерия управляемости. Перепишемусловие управляемости (4), заменив там сопряжённую переменнуюпо формуле (3) раздела 3.9:t1c(M0 , ψ(t0 )) +∗c(U, e−(s−t0 )A ψ(t0 )) ds+t0∗+ c(M1 , −e−(t1 −t0 )A ψ(t0 )) 0∀ψ(t0 ) ∈ E n .Введём функциюt1Φ0 (ψ) = c(M0 , ψ) +∗∗c(U, e−(s−t0 )A ψ) ds + c(M1 , −e−(t1 −t0 )A ψ) (5)t0(функция управляемости).
Положимm0 = min Φ0 (ψ).ψ∈SЯсно, что условие управляемости (4) равносильно каждому из следующих условий:(6)Φ0 (ψ) 0 ∀ψ ∈ E n ,Φ0 (ψ) 0(6 )∀ψ ∈ S,(6 )m0 0.Неравенства (6), (6 ), (6 ) являются другой формой условия управляемости (4) в терминах функции управляемости (5). Условия управляемости в форме (6 ), (6 ) удобны при рассмотрении конкретных примеров. Чтобы установить неуправляемость, достаточно указать такойвектор ψ̃ ∈ S, для которого Φ0 (ψ̃) < 0.Упражнение 10.1. Записать условие управляемости в терминахфункции управляемости−(t0 −t1 )A∗Φ1 (ψ) = c(M0 , et1ψ)+∗c(U, e−(s−t1 )A ψ) ds+c(M1 , −ψ). (7)t097Какая связь существует между функциями управляемости (5) и (7)?Пример 10.1.
Пусть n = 2, t0 = 00 1A=,U = S1 (0),−1 0 3π0, M1 = Sπ.M0 = S π00Исследовать управляемость объекта из M0 в M1 на отрезках времениа) [0, π/2], б) [0, π], в) [0, 2π].Множества M0 , M1 (см. рисунок 10.1) – выпуклые компакты, иусловие (6 ) является необходимым и достаточным условием управляемости.πx2M1−πM00π2π3πx14π−πРисунок 10.1Для решения вопроса об управляемости найдём функцию управляемости Φ0 (ψ) на отрезке [0, t1 ]. Имеем:c(M1 , ψ) = πψ, c(U, ψ) = ψ;∗cos s sin s= e−sA =,− sin s cos sc(M0 , ψ) = 3πψ1 + πψ,e−(s−t0 )A∗∗∗c(U, e−(s−t0 )A ψ) = e−sA ψ = ψ,∗∗c(M1 , −e−(t1 −t0 )A ψ) = πe−t1 A ψ = πψ.Находим теперь функцию управляемости (5)Φ0 (ψ) = 3πψ1 + πψ +t1ψ ds + πψ = 3πψ1 + (2π + t1 ) ψ098и числоm0 = min Φ0 (ψ) = t1 − π.ψ=1Условие управляемости (6 ) принимает видt1 − π 0.Таким образом, на отрезке [0, t1 ] объект управляем при t1 π инеуправляем при 0 < t1 < π.
В частности, на отрезке [0, π2 ] объектнеуправляем, а на отрезках [0, π], [0, 2π] объект управляем.В примере 10.1 вопрос об управляемости был решён аналитическими средствами на основе критерия управляемости. Чтобы выяснить геометрические причины управляемости или неуправляемостина данном отрезке, мы в примере 10.2 изучим динамику множествадостижимости X(t) = X(0, t, M0 ) объекта из примера 10.1.Пример 10.2. Найти множество достижимости X(t) для объектаиз примера 10.1 в произвольный момент времени t 0.Привлекая формулу (5) раздела 3.8, (t0 = 0)tA∗c(X(t), ψ) = c(M0 , etψ) +∗c(U, e(t−s)A ψ) ds,(8)0найдём опорную функцию множества достижимости X(t).
Имеем:∗etA ψ =c(M0 , ψ) = 3πψ1 + πψ, cos t − sin tψ1ψ1 cos t − ψ2 sin t,=sin tcos tψ2ψ1 sin t + ψ2 cos t∗∗c(M0 , etA ψ) = 3π(ψ1 cos t − ψ2 sin t) + πetA ψ == (3π cos t)ψ1 + (−3π sin t)ψ2 + πψ,tc(U, e(t−s)A∗ψ) ds = t ψ.(9)(10)0Тогда подстановка (9), (10) в (8) даётc(X(t), ψ) = (3π cos t)ψ1 + (−3π sin t)ψ2 + (π + t) ψ == c(Sr(t) (a(t)), ψ),99(11)cos tгде r(t) = π + t, a(t) = 3π. Из (11) следует, что− sin tX(t) = Sr(t) (a(t)),т.е. множество достижимости X(t) является кругом радиуса r(t) =π + t, центр которого a(t) движется по окружности радиуса 3π внаправлении вращения часовой стрелки (см. рисунок 10.2).Ясно, что 3π= M0 ,X(t) = Sπ0t=00X(t) π = S 3π,−3πt= 22−3πX(t) = S2π.0t=πx23πX(0) = M0πX(π)−5π−3π−πM10π 2π−π−3πXπ2−5πРисунок 10.2100M03πx14πПри 0 < t < π множество достижимости X(t) не пересекается смножеством M1 (что соответствует неуправляемости объекта на отрезке [0, t], 0 < t < π).
В момент времени t = π возникает первыйконтакт множества достижимости с множеством M1 в точке (−π, 0)∗(время π − 0 = π – минимальное время перехода из M0 в M1 , т.е.время быстродействия). При всех t π множество X(t) пересекается с M1 , что соответствует управляемости объекта на любом отрезке [0, t], где t π. Упражнение 10.2. Построить множества X 3π2 , X(2π), X(3π).Упражнение 10.3. Построить множество управляемости Z(t) =Z(t, π, M1 ), 0 t π.
Показать, что Z(t) = S2π−t (0). Установитьвзаимное расположение множеств X(t) и Z(t) при 0 t π.Рассмотрим множества X(π) и M1 , имеющие одну общую точку (−π, 0)∗ . Для этих множеств должно выполняться условие управляемости(12)c(X(π), ψ) + c(M1 , −ψ) 0 ∀ψ ∈ S.Это условие можно проверить непосредственно:c(X(π), ψ) = −3πψ1 + 2πψ;c(M1 , −ψ) = πψ;c(X(π), ψ) + c(M1 , −ψ) = −3πψ1 + 2πψ + πψ == 3π(ψ − ψ1 ) 0 ∀ψ ∈ S.
1выполОбратим внимание на то, что для единичного вектора ψ =0няется равенствоc(X(π), ψ) + c(M1 , −ψ) = 0,(13)т.е. неравенство (12) при ψ = ψ превращается в равенство. Вектор ψ, для которого выполнено равенство (13), имеет простой геометрический смысл (см.