Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения, страница 15
Описание файла
PDF-файл из архива "Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения", который расположен в категории "". Всё это находится в предмете "вариационное исчисление" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 15 страницы из PDF
Оптимальной по быстродействию траекторией является траектория CDM1 .Рассмотренный пример показывает, что выполнения принципа максимума, который, напомним, обоснован как необходимое условие оптимальности (раздел 3.11), не всегда влечёт оптимальность. В разделах 3.14, 3.15 проводится изучение достаточных условий оптимальности. Ценность принципа максимума не снижается и в тех случаях, когда пара (x(t), u(t)), удовлетворяющая принципу максимума,неединственна. Принцип максимума позволяет выделить, вообще говоря, отдельные траектории, из которых дополнительным анализом126могут бытьоптимальные. Так, в примере 13.2 с начальной отобраны−1точкой Cвыделены траектории CDM1 и CEM1 , причём по1следняя оказалась неоптимальной.Упражнение 13.6.
Указать начальные точки x0 в примере 13.2,для которых неединственна пара (x(t), u(t)), удовлетворяющая принципу максимума.Пример 13.3. Найти оптимальное управление и оптимальную траекторию в линейной задаче быстродействия, в которой n = 2, t0 = 0,0 1A =,U = S1 (0),−1 0 3π, M1 = Sπ (0),M0 = S π0т.е. в задаче⎧ẋ1 = x2 + u1 ,⎪⎪⎪⎪⎨ ẋ2 = −x1 + u2 ,x(0) ∈ M0 , x(t1 ) ∈ M1 ,(17)⎪222⎪:u+u1};u∈U={u∈E⎪12⎪⎩t1 → min . u1x1Здесь u =, x =, область управления U является круu2x2гом S1 (0) радиуса 1 с центром в начале координат, множества M0 ,M1 являются кругами радиуса π (рисунок 13.10).x2πM1−π0M0π 2π3πx14π−πРисунок 13.10Оптимальная пара(x(t), u(t)),0 t t1 ;x(t0 ) ∈ M0 ,127x(t1 ) ∈ M1 ,(18)удовлетворяет принципу максимума Понтрягинаа) (u(t), ψ(t)) = c(U, ψ(t)),t ∈ [0, t1 ],б) (x(t0 ), ψ(t0 )) = c(M0 , ψ(t0 )),в) (x(t1 ), −ψ(t1 )) = c(M1 , −ψ(t1 )),с некоторой сопряжённой переменной∗ψ(t) = e−tA ψ(0),ψ(0) ∈ S.(19)Мы покажем, что пара (18), удовлетворяющая принципу максимумаа), б), в), существует и единственна.
Кроме того, будет описана процедура нахождения такой пары.Выпишем опорные функции множеств U , M0 , M1 :c(U, ψ) = ψ,c(M0 , ψ) = 3πψ1 + πψ,c(M1 , ψ) = πψ.(20)Привлекая первую из формул (20), запишем условие максимума а) вформе(u(t), ψ(t)) = ψ(t), u(t) 1,откуда следует, чтоψ(t).(21)ψ(t)Так как в случае матрицы A = −10 01выполняется равенствоψ(t) = ψ(0) и ψ(0) ∈ S, то ψ(t) ≡ 1. Поэтому формулу (21)можно записать в формеu(t) =u(t) = ψ(t),0 t t1 .(22)Подчеркнём, что момент времени t1 > 0 нам неизвестен; начальнаяточка x(0) и конечная точка x(t1 ) траектории x(t) нам также поканеизвестны; неизвестна пока и сопряжённая переменная ψ(t).Из условия трансверсальности б) следует, что точка x(0) лежитна границе круга M0 и связана с вектором ψ(0) ∈ S соотношением 3π+ π ψ(0).(23)x(0) =0128ψ(0)x2x(0)M1M0 x1π 2π04π3πx(t1 )−ψ(t1 )Рисунок 13.11Из условия трансверсальности в) следует, что точка x(t1 ) лежит награнице круга M1 и связана с вектором ψ(t1 ) ∈ S соотношениемx(t1 ) = −π ψ(t1 ).(24)Геометрический смысл формул (23), (24) указан на рисунке 13.11.Используя формулу Коши и соотношения (19), (22), (23), запишемтраекторию x(t) в форме⎛⎞t%&x(t) = etA ⎝x(0) + e−sA u(s) ds⎠ =формулы (19), (22), (23)⎧⎨0⎫⎬t∗3π+ πψ(0) + e−sA e−sA ψ(0) ds =⎭⎩ 00 3π= etA+ (π + t)ψ(0) ,0= etA%∗e−sA e−sA = E&таким образом,x(t) = etA3π+ (π + t) ψ(0) ,0(25)в частности,x(t1 ) = et1 A3π+ (π + t1 ) ψ(0) .0Привлекая последнюю формулу и формулу (19), запишем теперь усло129вие (24) в форме: ∗3πet1 A+ (π + t1 ) ψ(0) = −πe−t1 A ψ(0).0(26)∗Умножение равенства (26) на матрицу et1 A и приведение подобныхчленов даёт 3π(27)= −(2π + t1 ) ψ(0).0Принимая во внимание соотношения ψ(0) = 1, t1 > 0 и сравниваямодули векторов, стоящих в левой и правой частях равенства (27),приходим к уравнению 3π = |2π + t1 |, из которого находитсяt1 = π.(28)Из (27), (28) получаем, чтоψ(0) = −1.0Из формулы Коши (19) при t = t1 с учётом (28), (29) находим ∗∗1.ψ(t1 ) = e−t1 A ψ(0) = e−πA ψ(0) = −E ψ(0) =0(29)(30)Теперь по формулам (23), (24) находим начальную и конечную точкутраектории x(t): 3π−12πx(0) =+π=,(31)000 1−π=;(32)x(t1 ) = −π00по формуле (25) находим траекторию x(t): 3π−1+ (π + t)=x(t) = etA00 1cos t= (2π − t) etA= (2π − t),0− sin t130(33)и по формулам (22), (19) находим управление u(t):∗u(t) = ψ(t) = e−tA ψ(0) = cos t sin t−1− cos t==.− sin t cos t0sin t(34)Таким образом, пара (18), удовлетворяющая принципу максимума,единственна и определяется формулами (33), (34), (28).
Следовательно, найденная пара (x(t), u(t)), 0 t π, оптимальна. Вид оптимальной траектории показан на рисунке 13.12 жирной линией.ẋ(π)−ππx2M1M0 x1π 2π0 −πẋ π23π4πẋ(0)Рисунок 13.12При построениишения: 2πx(0) =,0π 0 = −3π ,x2 2−πx(π) =,0оптимальной траектории полезно учесть соотно 0 12π−1−1+=,−1 000−2π π 0 1 0 0 −3π 2=,ẋ+=−3π−1 01122 0 1−π11ẋ(π) =+=.−1 000πẋ(0)=Итак, мы показали, решая пример 13.3, как может быть найденапара (18), удовлетворяющая принципу максимума. Приведём сейчасдругое решение этого же примера, опираясь на геометрические соображения.
Мы знаем, что для рассматриваемого управляемого объектамножество достижимости X(t) = X(0, t, M0 ) является кругом (см.131раздел 3.10):X(t) = Sr(t) (a(t)),r(t) = π + t, a(t) = 3πcos t.− sin tКруг X(t) при 0 t < t1 = π не имеет общих точек с множеством M1 , а при t = t1 = π множество достижимости X(t) впервые−πкоснётся множества M1 в точке:0 "−π.X(π) M1 =0−π– конечСледовательно, t1 = π – оптимальное время, x(t1 ) =0ная точка оптимальной траектории; тогда, в силу условия трансверсальности в), 11ψ(t1 ) = − x(t1 ) =;0πдалее,−(0−t1 )A∗ψ(0) = eπA∗ψ(t1 ) = eψ(t1 ) = −ψ(t1 ) =−1.0По найденномувектору ψ(0) из условия трансверсальности б) нахо 2πдим x(0) =. Нахождение оптимальной пары (x(t), u(t)) произ0водится, как указано выше, см. (33), (34).В заключение обратимся к геометрической интерпретации сопряжённой переменной ψ(t), множества достижимости X(t) = X(0, t, M0 )и множества управляемости Z(t) = Z(t, π, M1 ):"X(t) = Sπ+t (a(t)),Z(t) = S2π−t (0),X(t) Z(t) = {x(t)}.Расположение этих множеств и вектора ψ(t) указано на рисунке 13.13.Пример 13.4 (неединственность экстремального процесса).Рассмотрим линейную задачу быстродействия при n = 2, t0 = 0, 0 10aA=, U = SR (0), M0 = SR0,, M1 =−1 0−a0132x2Z(t)M12π−t−3πM0 x1π2π3π4πt)ψ(π+ta(t)X(t)Рисунок 13.13где R = ρ/π, R0 , a – положительные параметры,2a2 > R02 .(35)Условие (35) показывает, что круг M0 не содержит точки M1 .Здесь множество достижимостиa cos t, t 0,X(t) = SR0 +tR−a sin tявляется кругом, причём точка M1 оказывается на границе множества X(t) в такие моменты времени t > 0, которые являются корнямиуравнения2t2(36)2a (1 − sin t) = R0 + ρ .πНа рисунке 13.14 построены графики функций, стоящих в левой иправой частях уравнения (36).При условии (35) уравнение (36) всегда имеет хотя бы один положительный корень.
При достаточно больших значениях параметра ρ1332y = R0 + πt ρy4a2y = 2a2 (1 − sin t)2a2R020t1t2 πt32πtРисунок 13.14уравнение (36) имеет единственный положительный корень (см. пунктирную кривую на рисунке 13.14). При уменьшении ρ у этого уравнения появляются другие положительные корни. Пусть t1 – наименьшийположительный корень уравнения (36). В момент времени t1 множество достижимости X(t) впервые захватывает точку M1 : t1 – оптимальное время в примере 13.4. Оптимальное решение может бытьнайдено по схеме, использованной в предыдущем примере.Рассмотрим ситуацию когда уравнение (36) имеет несколько положительных корней. Например, при511*a, R0 =(37)ρ=2 1− *√√ −2 a32+ 32+ 3корни уравнения (36) не зависят от a, и это уравнение имеет ровнотри положительных корняt1 =1π,3t2 =5π,6t3 ≈7π − 0.05,4(38)причёмt1 ≈ 1.047197551,t2 ≈ 2.617993878,t3 ≈ 5.443787543.Далее считаем a = 1. В этом случае множество достижимости впер-134вые захватывает точку M1 при t = t1 :"X(t)M1 = ∅при"X(t1 ) M1 = M1 = ∅.0 t < t1 ,При t1 < t < t2 точка M1 расположена внутри круга X(t).
В моментвремени t2 множество достижимости X(t) отрывается от точки M1 :"X(t2 ) M1 = M1 = ∅,"X(t)M1 = ∅при t2 < t < t3 .Наконец, в момент времени t3 множество достижимости X(t) опятьнакрывает точку M1 , и в дальнейшем точка M1 лежит внутри X(t):"X(t3 ) M1 = M1 = ∅,"X(t)M1 = M1 = ∅ при t3 < t.На рисунке 13.15 показаны множества достижимости X(t) при t = t1 ,t2 , t3 .Упражнение 13.7.
В примере 13.4 построить оптимальную пару(x(t), u(t)), 0 t t1 .Упражнение 13.8. Показать, что в случае (37), (38) на каждомиз отрезков [0, t1 ], [0, t2 ], [0, t3 ] может быть построена пара (x(t), u(t)),удовлетворяющая принципу максимума. В каждом из этих случаевпостроить траекторию x(t), соединяющую множество M0 с множеством M1 .Пример 13.5. Решить линейную задачу быстродействия, в которойn = 2, t0 = 0, 0 13π, U = S1 (0), M0 = Sπ (0), M1 = SπA=.−1 00Этот пример отличается от примера 13.3 только выбором множествM0 , M1 .Найдём пару (x(t), u(t)), 0 t t1 , удовлетворяющую принципумаксимума с сопряжённой переменной ψ(t), ψ(0) ∈ S. Из условиямаксимума а) следует, чтоu(t) = ψ(t),135(39)x2a =1t1 =t2 =t3 ≈X(t3 )π356π74πX(t2 )a0x1M0X(t1 )M1Рисунок 13.15а из условий трансверсальности б), в) получаемx(0) = π ψ(0), 3πx(t1 ) =− π ψ(t1 ).0Привлекая формулу Коши и соотношения (39), (40), получаем⎛⎞tx(t) = etA ⎝x(0) + esA u(s) ds⎠ = (π + t) etA ψ(0),(40)(41)(42)0в частности, при t = t1 имеем:x(t1 ) = (π + t1 ) et1 A ψ(0).136(43)Из (43), (41) получаем:(π + t1 ) et1 A ψ(0) =∗3π− πe−t1 A ψ(0).0∗Отсюда с учётом равенства et1 A = e−t1 A следует, что 3π.(2π + t1 ) et1 A ψ(0) =0(44)Так как ψ(0) = et1 A ψ(0) = 1, то из (44) вытекает, что 2π+t1 = 3π,т.е.(45)t1 = π.Из (44), (45) находим−πAψ(0) = e −101−11==.00 −100(46)Из (40), (41), (46) получаем начальную и конечную точки траектории x(t):−πx(0) = π ψ(0) =,0 3π12π−π=.x(t1 ) =000Наконец, находим: ⎫− cos t ⎪x(t) = (π + t) e ψ(0) = (π + t),⎪sin t ⎬0 t t1 = π.⎪∗− cos t⎪⎭,u(t) = ψ(t) = e−tA ψ(0) =sin ttA(47)Итак, найдена пара (x(t), u(t)), 0 t t1 , см.
(47), удовлетворяющая принципу максимума. Эта пара единственна, и поэтому оптимальна. Оптимальная траектория x(t) изображена жирной линией нарисунке 13.16.137x2ẋ(0)−π ẋ π2πM00M1 x1π 2π3π4π−πẋ(π)Рисунок 13.16При построении оптимальной траектории полезно учесть соотношения −π−1x(0) =,ẋ(0) =,0ππ π3π0= 3π ,= 2 ,ẋx1222 2π1x(π) =,ẋ(π) =.0−2πУпражнение 13.9. Изучить динамику множества достижимости X(t) в примере 13.2 и на этой основе дать геометрическое объяснение неоптимальности траектории CEM1 , удовлетворяющей принципумаксимума.Пример 13.6.