rybalev optimal systems_(отсюда брал лекции) (842910), страница 3
Текст из файла (страница 3)
Матрица D нами не используется.Для нахождения постоянных С1…C4 воспользуемся граничными условиями:x1(0) = x2(0) = 0,x1(1) = 1, x2(0) = 0.Из первых двух уравнений (51) получаем:ìx1 (0) = C1a1(1) + C 2a1( 2) + C3a1(3) + C 4a1( 4) = 0,ï(1)( 2)(3)( 4)ïïx 2 (0) = C1a 2 + C 2a 2 + C3a 2 + C 4a 2 = 0,í( 4) l(1) l( 2) l( 3) lïx1 (1) = C1a1 e 1 + C 2a1 e 2 + C3a1 e 3 + C 4a1 e 4 = 1,ïïîx 2 (1) = C1a (21) e l1 + C1a (22) e l 2 + C3a (23) e l 3 + C 4a (24) e l 4 = 0,(52)или в матричной форме:MC = N,(53)гдеé a1(1)ê (1)aM = ê (1)2 lêa e 1ê 1(1) l1ëêa 2 ea1( 2)a (22)a1( 2) e l 2a (22) e l 2a1(3)a (23)a1(3) el 3a (23) el 3a1( 4) ùúa (24) ú,a1( 4) e l 4 úúa (24) e l 4 ûúN = [0, 0, 1, 0]Т.(55)С = [C1, C2, C3, C4]T - вектор, подлежащий определению.Сформируем матрицы M и N и решим уравнение (53) в Matlab:M = [V(1:2,:);V(1:2,:)*diag(exp(L))];N = [0; 0; 1; 0];C = M\NC =-1.4951-1.4951-5.6584-5.6584++-(54)1.2951i1.2951i9.2247i9.2247iПерепишем систему (51) следующим образом:15ìX̂1 = C11¢ e l1t + C12¢ e l 2 t + C13¢ el 3 t + C14¢ el 4 t ,ïïX̂ 2 = C¢21el1t + C¢22e l 2 t + C¢23el 3 t + C¢24e l 4 t ,íl tl tl tl tïX̂ 3 = C¢31e 1 + C¢32e 2 + C¢33e 3 + C¢34e 4 ,ïl 3tl1tl2tl4tîX̂ 4 = C¢41e + C¢42e + C¢43e + C¢44e ,(56)где C¢i, j = C ja i( j) .Матрицу С¢ определим с помощью кодаC_ = V*diag(C)C_ =-0.4042+0.9026i-1.2948-1.1216i00-0.4042-0.9026i-1.2948+1.1216i000.4042-0.6589i1.2948+0.3408i-4.8500+7.9069i-5.1790-1.3631i0.4042+0.6589i1.2948 - 0.3408i-4.8500 - 7.9069i-5.1790 + 1.3631iДалее получим решение в обыкновенном виде, перейдя от комплексных функций к действительным.
Для этого рассмотрим, например, первые дваслагаемых первого уравнения системы (56). Показатели степени экспонент l1¢ = a1 + ib1 , C12¢ = a 2 + ib 2 ,и l2 - комплексно сопряженные числа. Примем C11тогда¢ el1t + C12¢ e l 2 t = (a1 + ib1 )e(a1 + ib1 )t + (a 2 + ib 2 )e(a1 - ib1 )t =C11[]= e a1t (a1 + ib1 )eib1t + (a 2 + ib 2 )e - ib1t .(57)Применим известные равенстваeib1t = cos(b1t ) + i × sin (b1t ) ,(58)e -ib1t = cos(b1t ) - i × sin (b1t ) .(59)Подставляя (58), (59) в (57), после преобразований получим¢ el1t + C12¢ e l 2 t = e a1t [(a1 + a 2 ) cos(b1t ) + (- b1 + b 2 )sin (b1t ) +C11+ i(b1 + b 2 ) cos(b1t ) + i(a1 - a 2 ) cos(b1t )] .(60)Решение не должно содержать мнимой части, поэтому очевидноa 2 = a 2 , b 2 = -b1 ,(61)что подтверждается предыдущим расчетом.С учетом (61) окончательно запишем¢ el1t + C12¢ e l 2 t = e a1t [2a1 cos(b1t ) - 2b1 sin (b1t )] .C11(62)Аналогично поступая со всеми слагаемыми решения, содержащимиэкспоненты комплексно сопряженных чисел, решение системы уравненийпредставим в виде16x1 = e-0,5 t [- 0,8084 cos(1,6583t ) - 1,8052 sin(1,6583t )]+(63)[0,8084 cos(1,6583t )+1,3178 sin(1,6583t )] ,x 2 = e -0,5 t [- 2,5964 cos(1,6583t )+2,2432 sin(1,6583t )]++ e 0,5t [2,5964 cos(1,6583t ) - 0,6816 sin(1,6583t )] ,y1 = e 0,5 t [- 9,7 cos(1,6583t ) - 15,8138 sin (1,6583t )] ,y 2 = e 0,5 t [- 10,358 cos(1,6583t )+ 2,7262 sin (1,6583t )] .+e0,5 t(64)(65)(66)Управление:u = -0,5y 2 = e 0,5 t [5,179 cos(1,6583t ) - 1,3631sin (1,6583t )] .(67)Графики полученных оптимальных траекторий и оптимального управления приведены на рис.
1.ux1 ,x21.661.45x21.243120.8x10.610.400.2-10-2-0.200.20.40.60.81t-30a)0.20.40.60.81tб)Рис. 1. Графики изменения координат объекта (а) иуправления (б)Значение функционала определим численным интегрированием с помощью следующего кода Matlab:t = 0:.01:1;u = exp(.5*t).*(5.179*cos(1.6583*t)-1.3631*sin(1.6583*t));J = trapz(t,u.*u)J =12.2882Здесь использовалась библиотечная функция trapz, выполняющая интегрирование методом трапеций.2.2.
Задача с незакрепленными концами и фиксированным временемКак и раньше, рассмотрим сначала задачу поиска безусловного экстремума функционала одной функции17tкJ( y( t ), y& ( t ), t ) = g 0 (y( t 0 ), y( t к ) ) + ò f 0 (y( t ), y& ( t ), t )dt .(68)t0Интегральная составляющая критерия определяет «качество» y(t) напромежутке времени t0…tк. Функция g0(…) определяет составляющую качества, связанную с незакрепленными левым и правым концами.В соответствии с ранее приведенной классификацией задача поискаэкстремума функционала (68) есть задача Больца.Для определения необходимых условий экстремума функционала (68)необходимо найти его первую вариацию и приравнять ее к нулю.
Отметим, чтоприращение Dy(t) в данном случае приводит к приращению интеграла и функции g0(…). Последнее связанно с приращениями значений незакрепленныхконцов:ìDy( t 0 ) ¹ 0,íîDy( t к ) ¹ 0.(69)Определим приращение функционала (68), вызванное приращениемфункции Dy(t):DJ = g 0 (y( t 0 ) + Dy( t 0 ), y( t к ) + Dy( t к ) ) - g 0 (y( t 0 ), y( t к ) ) ++tкò [f 0 (y(t ) + Dy( t ), y& ( t ) + dDydt , t ) - f 0 (y( t ), y& ( t ), t )]dt.(70)t0Разложив в DJ ряд Тейлора и отбросив все слагаемые выше первого порядка малости, получим первую вариацию функционала:tкé ¶f¶g 0¶g 0¶f dDy ùdJ =Dy( t 0 ) +Dy( t к ) + ò ê 0 Dy( t ) + 0ú dt.&yydt¶y( t 0 )¶y( t к )¶¶ût ë(71)0Проинтегрировав второе слагаемое подынтегрального выражения (71)по частям, получим:tк¶g 0¶g 0¶fdJ =Dy( t 0 ) +Dy( t к ) + ò 0 Dy( t )dt +¶y( t 0 )¶y( t к )t ¶y0+tкtк00¶f 0d ¶f 0Dy - òDy( t )dt.&¶y&dt¶ytt(72)Поскольку функция y(t) доставляет экстремум функционалу (68), егопервая вариация, определенная на этой функции, должна быть равна нулю.Сгруппировав слагаемые в (72), запишем:18é ¶g 0ùùé ¶g 0¶f¶f+ 0 (t к )ú Dy( t к ) +dJ = ê- 0 (t 0 )ú Dy( t 0 ) + êûë ¶y( t к ) ¶y&ë ¶y( t 0 ) ¶y&ûtкé ¶fd ¶f 0 ù+ òê 0 ú Dy( t )dt = 0.&¶¶ydtyûët0(73)Равенство (73) должно выполняться при любых произвольных функциях Dy(t) и их граничных значениях Dy(t0) и Dy(tк).
Поэтому необходимые условия экстремума функционала (68) можно записать в виде:¶g 0¶f- 0 (t 0 ) = 0 ,¶y( t 0 ) ¶y&(74)¶g 0¶f+ 0 (t к ) = 0 ,¶y( t к ) ¶y&(75)¶f 0 d ¶f 0= 0.¶y dt ¶y&(76)Уравнение (76) есть уравнение Эйлера, а уравнения (74), (75) называются условиями трансверсальности.Условия трансверсальности связывают частные производные функцийg0(…) и f0(…) и после их вычисления преобразуются в алгебраические уравнения.В случае, когда функционал зависит от нескольких функций, уравненияЭйлера записываются для всех функций, а условия трансверсальности - длявсех незакрепленных концов.Применительно к задачам оптимального управления объектом, описываемым n дифференциальными уравнениями первого порядка, функционал качества приводится обычно к виду:tкJ = g 0 (x1 ( t 0 ),...x n ( t 0 ), x1 ( t к ),...x n ( t к ) ) + ò f 0 (x1 ( t ),...x n ( t ), u ( t ), t )dt .(77)t0Как максимум, мы имеем n незакрепленных левых и n незакрепленныхправых концов, что и отражено в (77).
На практике число незакрепленныхконцов обычно меньше, и в g0(…) является функцией менее чем 2n переменных.Для учета ограничений, накладываемых на функции xi(t), управлениеu(t) и незакрепленные концы, используется метод неопределенных множителей Лагранжа. Исходный функционал (77) «расширяется» путем включения внего всех ограничений (в виде равенств нулю), помноженных на неопределенные множители:19tкJ = G (...) + ò L(...)dt ,*(78)t0rG = g 0 (...) + å n i g i (...),(79)i =1n& , u, t ) ,L = f 0 (X, u ( t ) ) + å y i ( t )ji (X, X(80)i =1где gi(…) = 0 - ограничения, накладываемые на незакрепленные концы (максимальное их количество равно числу незакрепленных концов); ni - неопределенные множители.Необходимыми условиями экстремума функционала (78) будут¶L d ¶L¶L= 0,= 0, i = 1…n,¶x i dt ¶x& i¶u(81)¶G¶L¶x j (t н ) ¶x& j(82)= 0,tнгде j - индексы незакрепленных левых концов,¶G¶L+= 0,¶x s (t к ) ¶x& s t(83)кгде s - индексы незакрепленных правых концов.Уравнения (81) есть уравнения Эйлера-Лагранжа, а уравнения (82) и(83) - условия трансверсальности для функционала (78).nУчитывая, что L = H - å y i ( t ) x& i , уравнения (81) -(83) можно записатьi =1через функцию Гамильтона:¶H¶H&i,= -y= 0,¶x i¶u¶G= - y j (t н ) ,¶x j (t н )(84)(85)¶G= y s (t к ) .(86)¶x s (t к )Как уже указывалось, уравнения (84) совместно с уравнениями объектаобразуют систему из 2n дифференциальных уравнений первого порядка.
Дляих решения необходимо 2n дополнительных условий. Если задача содержит rнезакрепленных концов, то мы имеем 2n - r граничных условий и r условийтрансверсальности (85),(86). Таким образом, общее число дополнительных условий равно 2n, и, следовательно, задача имеет решение.20Пример 2.Требуется объект, описываемый уравнениямиìx& 1 = x 2 ,íîx& 2 = -3x1 - x 2 + u,(87)перевести из состояния x1(0) = x2(0) = 0 в положение x1(1) = 1 таким образом,чтобы обеспечить минимум потребления энергии:1J = ò u 2 ( t )dt ® min .(88)0Конечное значение координаты x2(1) может быть любым (т.е. нас неинтересует конечная скорость объекта).В данной задаче имеется один незакрепленный правый конец - x2(1).Эта переменная не входит в функционал, а кроме того, на нее не наложено никаких ограничений. Поэтому в данном случаеg0 = 0, G = 0.(89)Запишем гамильтониан:H = u 2 + y1x 2 + y 2 (-3x1 - x 2 + u ).(90)Необходимыми условиями экстремума будут:¶Hy& 1 = = 3y 2 ,¶x1¶Hy& 2 = = -y1 + y 2 .¶x 2¶H= 2u + y 2 = 0 .¶u(91)(92)(93)Из (93) получимu = -0,5y 2 .(94)Подставив (94) во второе уравнение системы (87) и объединив последние с уравнениями (91), (92), получим систему дифференциальных уравнений:ìx& 1 = x 2 ,ïx& = -3x - x - 0,5y ,ï 2122íïy& 1 = 3y 2 ,ïîy& 2 = -y1 + y 2 .(95)Для ее решения необходимо четыре дополнительных условия.
Мы имеем три граничных условия: x1(0) = 0, x2(0) = 0, x1(1) = 1. Для нахождения четвертого условия используем уравнение трансверсальности для x2(1):21¶G= y 2 (1) .¶x 2 (1)(96)Откуда с учетом (89) получим: y2(1) = 0.Дальнейшее решение производится аналогично решению задачи изпримера 1.Приведем решение для координат объекта и управления:x1 = e-0,5t [- 0,2208 cos(1,6583t ) - 1,8052 sin (1,1932t )]+(97)+ e 0,5 t [0,2208 cos(1,6583t )+1,06 sin(1,6583t )] ,x 2 = e -0,5 t [- 1,8682 cos(1,6583t )+0,9626 sin (1,6583t )]+(98)+ e 0,5t [1,8682 cos(1,6583t ) + 0,164 sin (1,6583t )] ,u = e 0,5 t [3,7376 cos(1,6583t ) + 0,3278 sin (1,6583t )] .x1,x2(99)u1.54.54x23.5132.52x11.50.510.50000.20.40.60.81t-0.50a)0.20.40.60.81tб)Рис. 2.
Графики изменения координат объекта (а) иуправления (б)Подставляя t = 1 в (87), получим конечное значение координаты x2(1):x2k = exp(-.5)*(-1.8682*cos(1.6583)+.9626*sin(1.6583))+...exp(.5)*( 1.8682*cos(1.6583)+.164*sin(1.6583))x2k =0.6808Определим значение функционала:t = 0:.01:1;u = exp(.5*t).*(3.7366*cos(1.6583*t)+.3278*sin(1.6583*t));J = trapz(t,u.*u)J =10.255322Значение функционала меньше, чем в предыдущем примере. Очевидно,это связано с тем, что в данном случае не накладывалось ограничений на конечную скорость объекта, следовательно, и не потребовалось его торможениена заключительной стадии переходного процесса.Пример 3.Требуется объект, описываемый уравнениямиìx& 1 = x 2 ,íîx& 2 = -3x1 - x 2 + u,(100)перевести из состояния x1(0) = x2(0) = 0 в положение x1 (1) = 1 таким образом,чтобы обеспечить минимум функционала:J= 10x 22 (1) +1òu2dt .(101)0В данной задаче требования к переходному процессу выражают компромисс между желанием обеспечить минимум потребления энергии (интегральная часть функционала) и желанием иметь как можно меньшую скоростьобъекта (x2) в конечный момент времени (алгебраическая часть функционала).Запишем гамильтониан и функцию G.H = u 2 + y1x 2 + y 2 (-3x1 - x 2 + u ) ,(102)G = 10 x 22 (1) .(103)Гамильтониан (102) полностью совпадает с гамильтонианами из примеров 1 и 2, поэтому воспользуемся полученными ранее решениями и сразузапишем систему уравнений, выражающую необходимые условия оптимальности:ìx& 1 = x 2 ,ïx& = -3x - x - 0,5y ,ï 2122íïy& 1 = 3y 2 ,ïîy& 2 = -y1 + y 2 .(104)Решение системы уравнений имеет вид (см.