Методы оптимизации (часть 1) (1264230), страница 4
Текст из файла (страница 4)
Дадимприращение функции xо (t) + x(t) . Приращение, как и раньше, обладает следующимсвойством x(t0 ) = x(t1) = 0 , что обращается в нуль на границах. Затем определимприращение функционала (2.12)16УМКД Методы оптимизацииt1 J = [Fx x(t) + Fx x(t ) + Fx x(t ) + ...]dt = 0(2.14)t0Интегрируем это выражение по частямt1t1d F xdt = F x − x dt F dtt1xxt0xt0t0t1tt11ddttFxdt=Fx−xFdt=Fx−Fxxt x dt x x t0 dt x t0 +t0t00t1t1d2+ x 2 Fxdt.dtt0(2.15)Т.к. концы закреплены и вариации на концах x, x,... = 0 , то все внеинтегральныечлены обращаются в ноль, следовательно, вариация функционала (2.15) примет вид:t1 J = (Fx x −t0dd2Fx x + 2 Fx x − ...)dt .dtdtСогласно лемме Лагранжа следует решение уравнения Эйлера-ПуассонаFx −dd2dnFx + 2 Fx − ...(−1)n n Fx(n) = 0 .dtdtdt(2.16)В общем случае порядок уравнения Эйлера-Пуассона равен 2n .
Для его решениянеобходимо иметь 2n краевых условий.Условие Лежандра для задач, содержащих производные высшего порядкаДля того чтобы функционал видаt1J = F[ x(t), x(t), x(t),..., x(n) (t), t]dtt0в задаче с закрепленными граничными точками достигал на экстремали минимума илимаксимума, необходимо, чтобы вдоль этой кривой x0 (t ) выполнялось условие2 Fx( n )2 Fx( n )0или 0.x( n)x( n)x( n)x( n)(2.17)Fx( n ) x( n ) 0 , то экстремальx0 (t ) доставляет минимумЕсли выполняется условиефункционалу.
А, если выполняется условие Fx( n ) x( n ) 0 , то экстремаль x0 (t ) доставляетмаксимум исследуемому функционалу.Пример.1Дано: функционал вида J = x2dt → extr ,0граничные условия: x(0) = x(0) = x(1) = 0; x(1) =1.Решение: частные производные интегранта соответственно равныFx = 0,Fx = 0,F = 2x, xследовательно, уравнение Эйлера-Пуассона, согласно (2.16) примет вид:17УМКД Методы оптимизации0 − 0 + 2x(4) = 0 .x(4) = 0 .Так как корни характеристического полинома равнысемейства допустимых функций можнонеопределенный интеграл четыре разазаписатьp1,2,3,4 = 0 , то уравнениеследующимобразом,взяв32x(t) = Ct1 + C2t + C3t + C4 .Производная по времени данной функции имеет вид2x(t) = 3Ct1 + 2C2t + C3 .Постоянные интегрирования Ci , i = 1,4 определяются из граничных условий.x(0) = 0, x(0) = C1 03 + C2 02 + C3 0 + C4 = 0 .Следовательно, С4 = 0 и описание семейства траекторий принимает вид32x(t) = Ct1 + C2t + C3t .x(0) = 0, x(0) = 3C1 02 + 2C2 0 + C3 = 0 .Следовательно, C3 = 0 и описание семейства траекторий принимает вид32x(t) = Ct1 + C2t ,а описание скорости принимает вид2x(t) = 3Ct1 + 2C2t .x(1) =1, x(1) = C1 13 + C2 12 = 1,C1 + C2 = 1.x(1) = 0, x(1) = 3C1 12 + 2C2 1 = 0 ,3C1 + 2C2 = 0 .Решая совместно систему уравненийС1 + С2 = 1,3С1 + 2С2 = 0,можно определить значения констант интегрированияС1 = −2, С2 = 3.Тогда уравнение экстремали принимает видxo (t) = −2t3 + 3t 2 .График оптимальной траектории движения материальной точки представлен на рис.
2.3.Рис. 2.3. Оптимальная траектория движения материальной точкиУравнение, описывающее оптимальное изменение скорости движения во времениимеет вид18УМКД Методы оптимизацииxo (t) = −6t 2 + 6t .График оптимальной скорости движения материальной точки представлен на рис. 2.4.Рис. 2.4. Оптимальная скорость движения материальной точкиПродифференцировав последнее уравнение, можно определить оптимальноеускорение движения материальной точкиxo (t) = −12t + 6 .График оптимальной траектории движения материальной точки представлен на рис. 2.5.Рис. 2.5. Оптимальное ускорение движения материальной точкиTОпределим условие Лежандра для функционала J = x2dt .0Поскольку Fx = 2x , а Fx, x = 2 0 , то искомая экстремаль доставит функционалуабсолютный минимум.1Jmin= ( −12t + 6) dt = 12.202.3.Вариационная задача с несколькими переменнымиЕё решение простейшей вариационной задачи легко обобщается на более сложныеслучаи.Например, функционалы, зависящие от нескольких функций.
Так, длина кривой втрехмерном пространстве выражается формулойbJ = (1 + x12 + x22 )dtaи служит примером функционала, зависящего от двух функций x1(t) и x2 (t ) .19УМКД Методы оптимизацииРассмотрим общее выражение функционала, зависящее от n неизвестных функцийвидаt1J = F[ x1(t), x2 (t),..., xn (t),x1(t), x2 (t),..., xn (t), t]dt → extr .(2.18)t0Граничные условия должны быть определены для каждой переменной xi (t ), i = 1, n x1(t0 ) = x10 x (t ) = x 2 020 xn (t0 ) = xn0x1(t1 ) = x11x2 (t1) = x21(2.19)xn (t1 ) = xn1.Требуется определить уравнения экстремалей x10 (t ), x 20 (t ),..., xn0 (t) , доставляющиеэкстремум функционалу (2.18).Предположим, что экстремум функционала (2.18) существует и доставляетсяэкстремалями x10 (t ), x 20 (t ),..., xn0 (t) . Зафиксируем все функции, кроме x1(t) , которойпридадим приращение x(t) , то есть x1(t ) = x10 (t ) + x .
Тогда вариация функционала будетзависеть только от одной функции. И из условия обращения первой вариации в нольследует необходимое условие экстремума – выполнение уравнения Эйлера для функцииx1(t) :Fx1 −dF =0.dt x1(2.20)Но такое же точно рассуждение можно, очевидно, применить и к функциям x2 (t),..., xn (t) , итогда приходим к окончательному выводу: функции x1(t), x2 (t),..., xn (t) , доставляющиеэкстремум функционалу (2.18), должны удовлетворять системе дифференциальныхуравнений Эйлера:F − d F =0 x1 dt x1 F − d F = 0xx 2 dt 2F − d F = 0. xn dt xn(2.21)Условие Лежандра для функционалов, зависящих от n переменныхДля того чтобы функционал видаt1J = F[ x1(t),..., xn (t),x1(t),..., xn (t), t]dtt0в задаче с закрепленными граничными точками достигал на экстремалях минимума илимаксимума, необходимо, чтобы вдоль этих кривых x01(t ),..., x0n (t ) выполнялось условиеЯкоби:20УМКД Методы оптимизации2 Fx1x12 FJ a = x2x12 Fx1x22 Fx2x22 Fx1xn2 Fx2xn или 02 Fxnx12 Fxnx22 Fxnxn(2.22)Если выполняется условие Ja 0 , то – это условие минимума, если Ja 0 – условиемаксимума, если часть главных определителей матрицы (2.22) больше нуля >0, а частьопределителей меньше нуля <0, то решение является седловой точкой.
Если же Ja = 0 , товопрос о существовании экстремума исследуется другими методами.Пример:tkДано: функционал вида J = ( x12 + x22 + 2x1x2 )dt → extr ,0граничные условия: x1(0) = x10 x2 (0) = x20 x1(tk ) = x1k x2 (tk ) = x2k .Решение: вначале определим частные производные интегранта по каждой из входящих вфункционал координатеFx1 = 2x2Fx1 = 2x1Fx2 = 2x1Fx2 = 2x2и составим систему уравнений Эйлера: x1(4) − x1 = 02x2 − 2x1 = 0x1 = x2 (4)2x1 − 2x2 = 0 x2 = x1 x2 − x2. = 0.А так как корни характеристического полинома соответственно равны p12, ,3,4 = 1; j , тообщее решение системы уравнений Эйлера имеет видx1 (t ) = C1et + C2e−t + C3 cos t + C4 sin tt−tx2 (t ) = x1 (t ) = C1e + C2e − C3 cos t − C4 sin t,где постоянные интегрирования Ci , i = 1,4 определяются из граничных условий.Пример:Определить условие Лежандра для функционала видаTJ = ( x12 + x22 + 2x1x2 )dt .0В этом случае частные производные интегранта, взятые от производных входящих внего функций, будут равныFx1 = 2x1,Fx2 = 2x2а определитель (2.22)21УМКД Методы оптимизацииJa =Главныеопределителиэтой2 0.0 2матрицы1 = 2 0 и 2 = 2 0положительны.Следовательно, экстремали x10 (t ) и x20 (t ) доставят функционалу абсолютный минимум.Как можно заметить, с помощью условия Лежандра можно определить видэкстремума еще до определения уравнений экстремалей x10 (t ) и x20 (t ) .2.4.Вариационная задача ЛагранжаПользуясь математическим аппаратом классического вариационного исчисления,решить задачу, поставленную в разделе 1.1.3, не представляется возможным, но, если науправляющее воздействие и координаты состояния не наложены ограничения в явном виде,то оптимальное программное управляющее воздействие uo (t) определить можно.В терминах классического вариационного исчисления такую постановку задачиназывают задачей Лагранжа, или задачей на условный экстремум.
В задаче на условныйэкстремум требуется определить уравнения экстремалей xio (t ) , i = 1, n и uko (t ) , k = 1, m ;которые не только доставляют экстремум функционалу, и удовлетворяют граничнымусловиям, но также являются решениями уравнений связи.Замечание: в теории оптимального управления уравнениями связи называютсясистемы дифференциальных уравнений, описывающие динамическое поведение объектауправления, то есть его, объекта управления, математическая модель.Правило решения задачи Лагранжа.1)На основе математического выражения критерия качества и математической моделиобъекта управления необходимо составить расширенный функционал качества вида:tkI p = Fp ( x, x, u, u, 0,, t)dt → extr ,(1)t0гдеnFp = 0 F ( x, x, u, u, t ) + i (t) xi − fi ( x, u, t ), i = 1, n ;(2)i =1i (t), i = 1, n — вектор неопределенных множителей Лагранжа;0 — число, причем, обычно полагают 0 >0, если решается задача минимизациифункционала качества, а если решается задача максимизации функционала, полагают 0 <0.Чаще всего выбирают 0 = +1 или 0 = −1 , соответственно, что упрощает выражениерасширенного функционала.С помощью расширенного функционала (1) первоначальная задача определенияусловного экстремума редуцируется к задаче определения безусловного экстремума (1).2)Требуется определить необходимые условия существования экстремумарасширенного функционала, то есть составить систему уравнений Эйлера – Лагранжа длякаждой переменной, входящей в выражение (1).
То есть для переменных xi , uk , i .Fpf ( x, u, t)F nF==− j (t) j, i = 1, n0 pxi xxi j=1xiiF = Fp = F + (t), i = 1, n.0 pxi xixi i(3)22УМКД Методы оптимизацииFpF=p i = xi − fi ( x, u, t), i = 1, niF = Fp = 0, i = 1, n pi i(4)Fpf ( x, u, t)F nF==− j (t) j, k = 1, m0 puk uuuj=1kkkF = Fp = F , k = 1, m0 pui ukuk(5)Из выражений (3 – 5) необходимо составить систему уравнений Эйлера – ЛагранжавидаF − F = 0; i = 1, n pxi t pxi F − n (t) f j ( x, u, t) − F + (t ) = 0, i = 1, nj 0 x xit 0 xi i j =1iFpi − Fpi = 0t x − f ( x, u, t ) = 0, i = 1, n i iFpuk − t Fpuk = 0n F − (t) f j ( x, u, t) − ( F ) = 0, k = 1, m.j 0 uk ukt 0 ukj =1(6)Система уравнений (6) называется уравнениями Эйлера – Лагранжа. Размерностьсистемы 2n + m .3)Решить систему дифференциальных уравнений (6).
Решением будут искомыеуравнения экстремалей xio (t ) и uko (t ) .Причем, uko (t ) — оптимальное программное управление, переводящее ОУ изначального состояния в конечное состояние, за конечный интервал времени t t0 , tk пооптимальной траектории xio (t ) , i = 1, n . Следовательно, функционал качества (1), асоответственно и исходный критерий, принимает экстремальное значение.ПримерПредположим, что математическая модель объекта управления второго порядка,граничные значения координат состояния, выражение критерия качества и длительностьинтервала управления заранее определены, то есть задача формализована. Рассмотрим ходрешения поставленной задачи подробно.Дано: математическая модель объекта управления x1 = x2 x2 = u(t)23УМКД Методы оптимизациии состояние ОУ в начальный и конечный момент времени, то есть граничные условия x1(0) = 5и x2 (0) = 0 x1(1) = 0 x2 (1) = 0.Критерий качества определен априори в виде1J = (4x12 + 5x22 + u2 )dt → min .0Требуется определить: u (t ) — оптимальное программное управляющее воздействие,oпереводящее ОУ из начального состояния x10 = 5; x20 = 0 в конечное состояниеx21 = 0; x22 = 0 за интервал времени равный t 0;1сек по оптимальной траекторииxio (t ) , i = 1,2 .Решение:Составим выражение расширенного функционала (2.10)tkJ p = Fp ( x, x, u, u, 0,, t)dt → min ,t0где, согласно (2), интегрант расширенного функционала с учетом 0 = +1 , будет иметь видFp = 4x12 + 5x22 + u2 + 1(t)( x1 − x2 ) + 2 (t)( x2 − u)Найдем все частные производные расширенного функционала J p по всем, входящимв него, координатам: x1, x2 , u, 1, 2 .Fpx1 = 8x1;F= px1 1Fpx2 = 10x2 − 1;F=2 px2Fpu = 2u − 2.Fpu = 0Тогда система уравнений Эйлера – Лагранжа (6) примет иметь вид8x1 − 1 = 010x2 − 1 − 2 = 0или в форме Коши x1 = x2x = u 22u − 2 = 0Чтобы решить эту системухарактеристического полиномауравнений,p−1 x1 = x2 x = 0,52 21 = 8x1 = 10x − . 221необходимоопределитькорни0010p 0 −A( p) = det( Ep − A) = det2 = p4 − 5 p2 + 4 = 0 .−8 0 p 00 −10 1 pПоскольку корни соответственно равны p1,2,3,4 = 1; 2 , то общий вид уравненийискомых экстремалей определяется однозначно24УМКД Методы оптимизации x1o (t ) = C1e−t + C2et + C3e−2t + C4e2t o−tt−2t2t x2 (t) = −C1e + C2e − 2C3e + 2C4e .Где постоянные интегрирования Ci , i = 1,4 определяются из граничных условий исоответственно равны: C1 = 25,0984;C2 = −7,3028;C3 = −14,4981;C4 = 1,7025 .Уравнение оптимального программного управления uo (t ) определяется в силуматематической модели исходного объекта управления с учетом выражений оптимальныхпрограммных траекторий xio (t ) , i = 1,4 и имеет видuo (t) = C1e−t + C2et + 4C3e−2t + 4C4e2t =.= 25,0984e−t − 7,3028et − 57,992e−2t + 6,81e2tГрафик оптимального управления приведен на рис.