1612726833-e6f68fc32d761b4e64266f5c195a8f96 (828578), страница 10
Текст из файла (страница 10)
Задача отыскания оптимальных управлений и траекторий в этом случае называетсязадачей об оптимальном быстродействии.612 мая 2014Принцип максимума для линейной задачибыстродействия:Пусть H ( x, u, P ) = ( P, f ( x, u )) – функция Понтрягина, аif∂P&k = − ∑( x (t ), u(t )) Pi , k = 1,K, n ,i =1∂x kn(3)сопряженная система уравнений для соответствующей пары ( x (t ) , u (t ) ).Из линейности и однородности системы (при любых начальных условиях для Pk , k = 1,K, n ,)∃ единственное решение этой системы (определенное на всем отрезке, накотором определены управление u (t ) и траектория x (t ) ).Функции P1 (t ), K, Pn (t ) непрерывны и имеют всюду, кроме конечногочисла точек разрыва управления u (t ) , непрерывные производные по t .712 мая 2014Теорема 1 (принцип максимума).Пусть ( ( x∗ (t ), u∗ (t )) , t ∈ [t 0 , t1 ] – оптимальный управляемый процесс.
Тогда существует ненулевая непрерывная вектор-функцияP(t ) = ( P1 (t ), K , Pn (t )) такая, что справедливы следующие утверждения:if∂a) P&k = − ∑( x∗ (t ), u∗ (t )) Pi , k = 1,K, n ;i =1∂x kб) H ( x∗ (t ), u∗ (t ), P (t )) = max H ( x∗ (t ), u, P (t )) , t ∈ [t 0 , t1 ];nu∈Uв) H ( x∗ (t1 ), u∗ (t1 ), P (t1 )) ≥ 0 .812 мая 2014Соглашения:Пусть f линейна система (1) записывается:iв виде x& = Ax + Bu или x& =ki∑ aα xα +α =1rib∑ β uβ .β =1В дальнейшем предполагается, что U – выпуклый многогранник в R r ,0 ∈ U , и 0 не является вершиной U .912 мая 2014Теорема 2 (принцип максимумазадачи быстродействия).длялинейнойПусть ( x∗ (t ), u* (t )) , t ∈ [t 0 , t1 ] – оптимальный управляемый процесс.Тогда существует такое непрерывное нетривиальное решение P (t ) сопряженной системы P& = − PA , что справедливоP(τ ) Bu* (τ ) = max P(τ ) Bu , τ ∈ [t 0 , t1 ].u∈U(4)Управление u* (t ) удовлетворяет принципу максимума, если существует нетривиальное решение сопряженной системы (3) и выполняется равенство (4).1012 мая 2014Задача синтеза оптимальных управленийПример:Рассмотрим уравнениеd 2xdt2= u , где u – вещественный управляющийпараметр, удовлетворяющий ограничению | u |≤ 1.
В фазовых координа-dxтах x = x , x =это уравнение переписывается в виде следующейdt12системы:2dx1dx= x 2,= u.dtdt11(5)12 мая 2014Задача синтеза оптимальных управленийРассмотрим для фазовой точки, движущейся по закону (5), задачу онаискорейшем попадании в начало координат x1 = (0,0) из заданногоначального состояния x0 .Функция H в данном случае имеет видH = ψ 1x 2 +ψ 2u .(6)Далее, для вспомогательных переменных ψ 1, ψ 2 получается системауравнений (см. (3), (6))dψ 1dψ 2= 0,= −ψ 1,dtdtоткуда ψ 1 = c1, ψ 2 = c 2 − c1t , где c1, c2 – постоянные.1212 мая 2014Задача синтеза оптимальных управленийС учетом (6) и условия | u |≤ 1, из соотношения (4) следуетu(t ) = sign ψ 2 (t ) = sign ( c 2 − c1t ) .(7)Откуда получим, что каждое оптимальное управление u (t ) ,t 0 ≤ t ≤ t1, является кусочно-постоянной функцией, принимающей значения ± 1 и имеющей не более двух интервалов постоянства, так как линейная функция c 2 − c1t не более одного раза меняет знак на отрезке[t0 , t1 ].Обратно, любая такая функция u (t ) может быть получена из соотношения (7) при некоторых значениях постоянных c1, c2 .1312 мая 2014Задача синтеза оптимальных управленийДля отрезка времени, на котором u ≡ 1, в силу системы (5) справедливо2⎞2⎛st1x 2 = t + s 2 , x 1 = + s 2 t + s1 = (t + s 2 ) 2 + ⎜ s1 − 2 ⎟ ,⎟⎜222⎠⎝где s1, s2 – постоянные интегрирования, откуда следует1 2 2x = ( x ) + s,21(8)1 2где s = s1 − s 2 – постоянная.
Таким образом, часть фазовой траекто2рии, для которой u ≡ 1, представляет собой дугу параболы (8).Семейство парабол (8) показано на рис. 1.1412 мая 2014Задача синтеза оптимальных управленийАналогично, для отрезка времени, на котором u ≡ −1, имеемx 2 = −t + s 2′ ,2t1112 ⎛2⎞′′′′′x = − + s 2 t + s1 = − ( −t + s 2 ) + ⎜ s1 + ( s 2 ) ⎟ ,222⎠⎝откуда получим1 2 2x = − ( x ) + s ′.21(9)Семейство парабол (9) показано на рис.
2. По параболам (8) фазовыеdx 2= u = +1, а по параболам (9) –точки движутся снизу вверх, так какdtdx 2сверху вниз, так как= −1.dt1512 мая 2014Задача синтеза оптимальных управленийx20Рис. 1x2x10x1Рис. 2Если управление u (t ) в течение некоторого времени равно + 1, а затемравно − 1, то фазовая траектория состоит из частей двух парабол (рис. 3),примыкающих друг к другу, причем одна из этих частей лежит на той изпарабол (9), которая проходит через начало координат, так как искомаятраектория должна вести в начало координат.
Если же, наоборот, сначала u = −1, а затем u = +1, то фазовая кривая заменяется центральносимметричной (рис. 4).1612 мая 2014Задача синтеза оптимальных управленийu = −1x20x0x1x2u = −1x10u = +1u = +1x0Рис. 3Рис. 4x2Bu = −10u = +1x1AРис. 5На рис. 3, 4 на дугах парабол надписаны соответствующие значенияуправляющего параметра u . На рис. 5 изображено все семейство полученных таким образом фазовых траекторий (АО – дуга параболы1712 мая 2014Задача синтеза оптимальных управлений1 2 2x = ( x ) , расположенная в нижней полуплоскости; ВО – дуга па21 2 21раболы x = − ( x ) , расположенная в верхней полуплоскости).2Итак, если начальное положение x0 расположено выше линии АОВ, тофазовая точка должна двигаться под воздействием управления u = −1 до1тех пор, пока она не попадет на дугу АО; в момент попадания на дугуАО значение u переключается и становится равным + 1 вплоть до момента попадания в начало координат.Если же начальное положение x0 расположено ниже линии АОВ, то uдолжно быть равно + 1 до момента попадания на дугу ВО, а в моментпопадания на дугу ВО значение u переключается и становится равным− 1.1812 мая 2014Задача синтеза оптимальных управленийИтак, согласно теореме 2, только описанные выше траектории могутбыть оптимальными, причем из проведенного исследования видно, чтоиз каждой точки фазовой плоскости исходит только одна траектория, ведущая в начало координат, которая может быть оптимальной, то есть задание начальной точки x0 однозначно определяет соответствующуютраекторию.Из теорем существованияв данном примере для любой начальнойточки x0 существует оптимальная траектория.
Таким образом, найденные траектории (рис. 5) являются оптимальными, и других оптимальныхтраекторий, ведущих в начало координат, не существует.1912 мая 2014Задача синтеза оптимальных управленийПолученное в рассмотренном примере решение оптимальной задачиможноистолковатьследующимобразом.Обозначимчерезv ( x 1 , x 2 ) = v ( x ) функцию, заданную на плоскости x1, x 2 :⎧ + 1 ниже линии АОВ и на дуге АО ,v( x ) = ⎨⎩− 1 выше линии АОВ и на дуге ВО.Тогда на каждой оптимальной траектории значение u (t ) управляющегопараметра в произвольный момент t равно v ( x (t )) , то есть равно значению функции v в той точке, в которой в момент t находится фазоваяточка, пробегающая оптимальную траекторию u (t ) = v ( x (t )) .
Это означает, что, заменив в системе (5) величину u функцией v (x ) , получимсистему2012 мая 2014⎧ dx 12=,x⎪⎪dt⎨ 2⎪ dx = v ( x 1 , x 2 ),⎪⎩ dt(10)решение которой при произвольном начальном состоянии x0 дает оптимальную фазовую траекторию, ведущую в начало координат. Иначе говоря, система (10) представляет собой систему дифференциальных уравнений с разрывной правой частью для нахождения оптимальных траекторий, ведущих в начало координат.2112 мая 2014Доказательство принципа максимума для линейнойзадачи быстродействияПусть T > 0 – верхняя граница на длины интервалов, на которых будутрассматриваться управления.
Будем говорить, что точка x принадлежитсфере достижимости (см. рис. 6), если на интервале [t 0 , t1 ] существуетдопустимое управление u (t ) и соответствующая ему траектория x (t ) такие, что x (t 0 ) = x , x (t1 ) = 0, t1 − t 0 ≤ T .VT0xРис. 62212 мая 2014Доказательство принципа максимума для линейнойзадачи быстродействияЛемма 1. Сфера достижимости VT является выпуклым множеством.Лемма 2. Если x0 – внутренняя точка VT , то из x0 можно перейти вточку 0 за время строго меньше T .y1ysz1x0zs0y2z2Рис. 82312 мая 2014Доказательство принципа максимума для линейнойзадачи быстродействияЛемма 3. Пусть u (t ) – допустимое управление на интервале [t 0 , t1 ],x (t ) – соответствующее решение, P(t ) – произвольное решение сопряженной системы P& = − PA на данном интервале.
Тогда во всех точкахнепрерывности управления u (t ) справедливы следующие равенства:d( P (t ) x (t )) = P (t ) Bu (t ) ,dtt1P (t1 ) x (t1 ) − P (t 0 ) x (t 0 ) = ∫ P (t ) Bu (t )dt.t02412 мая 2014Доказательство принципа максимума для линейнойзадачи быстродействияДоказательство.d( P (t ) x (t )) = P& (t ) x (t ) + P (t ) x& (t ) = − P (t ) Ax (t ) + P (t )( Ax (t ) + Bu (t )) =dt= P (t ) Bu (t ) . ▄2512 мая 2014Лекция № 14Задачи оптимального управления:1.
Доказательство принципамаксимума для линейной задачибыстродействия2. Достаточность принципамаксимума 12 мая 2014Принцип максимума для линейной задачибыстродействия:Пусть H ( x, u, P ) = ( P, f ( x, u )) – функция Понтрягина, аif∂P&k = − ∑( x (t ), u(t )) Pi , k = 1,K, n ,i =1∂x kn(3)сопряженная система уравнений для соответствующей пары ( x (t ) , u (t ) ).Из линейности и однородности системы (при любых начальных условиях для Pk , k = 1,K, n ,)∃ единственное решение этой системы (определенное на всем отрезке, на котором определены управление u (t ) и траектория x (t ) ). ФункцииP1 (t ), K, Pn (t ) непрерывны и имеют всюду, кроме конечного числа точек разрыва управления u (t ) , непрерывные производные по t .212 мая 2014Теорема 1 (принцип максимума).Пусть ( ( x∗ (t ), u∗ (t )) , t ∈ [t 0 , t1 ] – оптимальный управляемый процесс.
Тогда существует ненулевая непрерывная вектор-функцияP (t ) = ( P1 (t ), K , Pn (t )) такая, что справедливы следующие утверждения:if∂a) P&k = − ∑( x∗ (t ), u∗ (t )) Pi , k = 1,K, n ;i =1∂x kб) H ( x∗ (t ), u∗ (t ), P (t )) = max H ( x∗ (t ), u, P (t )) , t ∈ [t 0 , t1 ];nu∈Uв) H ( x∗ (t1 ), u∗ (t1 ), P (t1 )) ≥ 0 .312 мая 2014Соглашения:Пусть f линейна система (1) записывается:в виде x& = Ax + Bu или x& =ik∑ aα xα +α =1irib∑ β uβ .β =1В дальнейшем предполагается, что U – выпуклый многогранник в R r ,0 ∈ U , и 0 не является вершиной U .412 мая 2014Теорема 2 (принцип максимума для линейной задачибыстродействия).Пусть ( x∗ (t ), u* (t )) , t ∈ [t 0 , t1 ] – оптимальный управляемый процесс.Тогда существует такое непрерывное нетривиальное решение P (t ) сопряженной системы P& = − PA , что справедливоP(τ ) Bu* (τ ) = max P(τ ) Bu , τ ∈ [t 0 , t1 ].u∈U(4)Управление u* (t ) удовлетворяет принципу максимума, если существует нетривиальное решение сопряженной системы (3) и выполняется равенство (4).512 мая 2014Доказательство принципа максимума для линейнойзадачи быстродействияПусть T > 0 – верхняя граница на длины интервалов, на которых будутрассматриваться управления.
Будем говорить, что точка x принадлежитсфере достижимости (см. рис. 6), если на интервале [t 0 , t1 ] существуетдопустимое управление u (t ) и соответствующая ему траектория x (t ) такие, что x (t 0 ) = x , x (t1 ) = 0, t1 − t 0 ≤ T .VT0xРис. 6612 мая 2014Доказательство принципа максимума для линейнойзадачи быстродействияЛемма 1. Сфера достижимости VT является выпуклым множеством.Доказательство.x 0 ∈ VT , т.е. существует допустимое управление u (t ) ,Пусть x 0, ~t ∈ [t 0 , t1 ], где t1 ≤ t 0 + T , которое переводит фазовую точку x из положения x0 в точку 0 .Аналогично, существует допустимое управление u~(t ) , t ∈ [t 0 , ~t ], где~t1 ≤ t 0 + T , которое переводит фазовую точку x из положения ~x0 в точку 0 .Можно считать, что t1 = t 0 + T .