1612726855-66ce2678ed92310585f0bb1a36623206 (828576), страница 21
Текст из файла (страница 21)
Иначе говоря, система (10) представляет собой систему дифференциальных уравнений с разрывной правой частью для нахождения оптимальных траекторий, ведущих вначало координат.§ 3. Доказательство принципа максимума для линейной задачи быстродействияВведем понятие сферы достижимости. Пусть T > 0 – верхняя граница надлины интервалов, на которых будут рассматриваться управления. Будем говорить, что точка x принадлежит сфере достижимости (см.
рис. 6), если на112интервале [t0 , t1 ] существует допустимое управление u (t ) и соответствующаяему траектория x(t ) такие, что x (t0 ) = x , x (t1 ) = 0, t1 - t0 £ T .VTx0Рис. 6Лемма 1. Сфера достижимости VT является выпуклым множеством.Доказательство. Пусть x0, x~0 ÎVT . По определению это означает, чтосуществует допустимое управление u (t ) , t Î [t0 , t1 ] , где t1 £ t0 + T , котороепереводит фазовую точку x из положения x0 в точку 0 . Аналогично, суще~~ствует допустимое управление u~(t ) , t Î [t0 , t ] , где t1 £ t0 + T , которое переводит фазовую точку x из положения ~x в точку 0 .0Можно считать, что t1 = t0 + T .
В противном случае решим систему (2) сначальным условием x (t1 ) = 0 , доопределив управление u (t ) , как показанона рис. 7:u (t )t0u (t ) = 0t1t0+TРис. 7Получим, что x (t ) = 0 на интервале [t1, t0 + T ] . Аналогично, для u~(×) и~~x (×) можно считать, что t1 = t0 + T . Пусть y 0 = lx0 + (1 - l ) ~x0 , 0 £ l £ 1 . То~гда управление u* (t )= lu (t ) + (1 - l )u ( t ), определенное на интервале[t0 , t0 + T ] , является допустимым управлением. Ему соответствует траекторияx * (t ) = lx (t ) + (1 - l ) ~x (t ) , по которой фазовая точка переходит из начальногоположенияx * (t0x* (t0 ) = lx0 + (1 - l ) ~x0 = y0вконечноеположение+ T=) 0. ▄Лемма 2.
Если x0 – внутренняя точка VT , то из x0 можно перейти в точку 0 за время строго меньше T .Доказательство. Рассмотрим произвольную точку x0 Î Int VT . Из определения внутренней точки следует, что существует шар B ( x0 , r ) Í VT . Так113как из леммы 1 следует, что множество VT выпукло, то по лемме Каратеодори существуют (n + 1) точка z1, K, zn +1 [3], расположенные внутри шара итакие, что симплекс, образованный ими, содержит x0 строго внутри. Следовательно, в силу непрерывности расстояния найдутся достаточно малые окрестности точек z j , содержащие точки y j из VT , такие, что симплекс, образованный этими точками из сферы достижимости, как показано на рис.
8, содержит x0 . Тогда по определению множества VT существуют допустимыеуправления us (t ) на интервале [t0 , t0 + T ] такие, что xs (t0 )= y s ,x s (t0 + T )= 0 , s= 1, K, n + 1 . Так как функции xs (t ) непрерывны, то существует e > 0 , для которого x0 Î Int Co{x1 (t0 + e ), K, xn +1(t0 + e )}. Но все точкиx s (t0 + e ) , s = 1,..., n + 1, лежат в сфере достижимости VT -e . Это означает, чтоx0 ÎVT -e . ▄y1ysz1x0zs0y2z2Рис. 8Лемма 3. Пусть u (t ) – допустимое управление на интервале [t0 , t1 ] , x(t ) –соответствующее решение, P(t ) – произвольное решение сопряженной системы P& = - PA на данном интервале.
Тогда во всех точках непрерывностиуправления u (t ) справедливы следующие равенства:d( P( t ) x ( t )) = P (t ) Bu(t ) ,dtt1P( t1 ) x (t1 ) - P( t0 ) x (t0 ) = ò P( t ) Bu( t ) dt.t0Доказательство.d( P(t ) x (t )) = P& (t ) x ( t ) + P( t ) x& (t ) = - P( t ) Ax ( t ) + P( t )( Ax (t ) + Bu(t )) =dt= P(t ) Bu(t ) . ▄Перейдем к доказательству принципа максимума, то есть докажем, что оптимальное управление удовлетворяет (4).Пусть u (t ) – оптимальное управление на интервале [t0 , t1 ] , x (t0 ) = x0 ,x (t1 ) = 0. Положим T = t1 - t0 . Из леммы 2 следует, что x0 – граничная точка114сферы достижимости V T . Следовательно, по теореме отделимости [2, 3] существует вектор d ¹ 0 такой, что для всех векторов x из множества VT выполняется неравенство d ( x - x0 ) ³ 0 .
Рис. 9 иллюстрирует сказанное выше.VTrn0x0x0*Рис. 9rПусть P – решение P& = - PA с начальным условием P( t0 ) = n . Для неговыполняется равенство P( t ) Bu (t ) = max P( t ) Bu для всех t из интервалаuÎU[t0 , t1 ] . Действительно, допустим противное: пусть существует t Î [t0 , t1 ] такое, что P (t ) Bu (t ) < max P (t ) Bu . Это означает, что существует такое v Î U ,uÎUчто P (t ) Bu(t ) < P(t ) Bv . Из непрерывности управления следует, что существует интервал [t 0 , t1 ] Ì [t0 , t1 ] такой, что P (t ) Bu(t ) < P (t ) Bv для всехt Î [t 0 ,t1]. Пустьìv, t Î [t 0 ,t1 ),u* ( t ) = íîu( t ), [t0 , t1] \ [t 0 ,t1 ).Очевидно, что u* – допустимое управление. Пусть x* ( t ) – соответствующая ему траектория и x* (t1 ) = 0. Пусть x0* = x* ( t0 ) .
Имеем, что x0* ÎVT и, следовательно, d ( x0* - x0 ) ³ 0 . Из леммы 3 имеем:d ( x0* - x0 ) = P (t0 )( x* (t0 ) - x (t0 )) = ( P(t1 ) x (t1) - P (t0 ) x(t0 )) t1- ( P(t1) x* ( t1 ) - P (t0 ) x* (t0 )) = ò [ P (t1) Bu( t ) - P (t ) Bu* (t )] dt =t0t1= ò [ P (t ) Bu(t ) - P(t ) Bv ] dt < 0. Противоречие с неравенством, которое слеt0дует из теоремы отделимости. ▄§ 4.
Достаточность принципа максимумаПусть X – конечномерное пространство, Y Í X – подпространство,A : X ® X – линейное преобразование. Будем говорить, что Y – подпро-115странство инвариантное относительно A , если A(Y ) Í Y . Когда Y ¹ X , то Y– собственное подпространство. Пусть a Î X . Элемент a принадлежит собственному инвариантному подпространству Y тогда и только тогда, когдавектора {a, Aa,K , Ak -1a} линейно зависимы, что очевидно, так как из независимости этой системы следует, что подпространство Y совпадает с X .Будем говорить, что для задачи быстродействия выполнено условие общности положения, если для каждого вектора w параллельного некоторомуребру многогранника U , вектор Bw не принадлежит никакому собственномуинвариантному подпространству A , то есть вектора {Bw, ABw,K, A k -1Bw} образуют линейно зависимую систему.Замечание1.Множествовекторов,длякоторыхdet{Bw, ABw,K, A Bw} ¹ 0 , является нигде неплотным.
Следовательно, добиться выполнения условия общности положения можно всегда сколь угодномалым сдвигом. Напомним, что множество называется нигде неплотным, если его дополнение всюду плотно (см. приложение).k -1Лемма 4. Пусть P(t) – нетривиальное решение сопряженной системыP& = - PA , a ¹ 0 такое, что P(t ) a = 0 для всех t Î (t 0 ,t1 ).
Тогда a принадлежит некоторому собственному инвариантному подпространству относительно преобразования A .{}Доказательство. Пусть y Î Y , где Y = y Î R n : P(t ) y = 0 , t Î (t 0 ,t 1 ) –инвариантное собственное подпространство относительно A . Тогдаd(P(t), y)= 0 , что эквивалентно условию P& (t)y= 0 . Следовательно,dt- P(t)Ay= 0 . Таким образом Ay Î Y и Y ¹ R n , так как существуетt Î (t 0 ,t 1 ) такое, что P(t ) ¹ 0 . Тогда P(t ) Ï Y , так как P(t ) ¹ 0 . ▄Теорема 3. Пусть u (t ) – допустимое управление, заданное на отрезке[t0 , t1 ] , x(t ) – соответствующая траектория, удовлетворяющая начальнымусловиям x(t0 ) = x0 и x(t1 ) = 0 . Тогда для оптимальности управления необходимо и достаточно, чтобы оно удовлетворяло принципу максимума.Доказательство.
Необходимость следует из теоремы 2 (принцип максимума).Достаточность. Пусть существует P (t ) ¹ 0 такое, что P& = - PA иmax P(t ) Bu = P(t ) Bu (t ) . Докажем, что лучшего управления, чем u (t ) не суuÎUществует, то есть не существует другого управления u* , которое переводит116фазовую точку x из положения x0 в положение 0 за меньшее время, чем(t1 - t0 ).Предположим противное: пусть на интервале [t0 , t* ] определен управляемый процесс (u* (t ), x* (t )) такой, что x * (t0 ) = x 0 , x* (t* ) = 0 и t* < t1 . Очевидны следующие неравенства:1) P(t )Bu(t ) ³ 0, t Î[t0, t1] , так как 0 Î U ;2) P(t )Bu(t ) ³ P(t )Bu*(t ), t Î[t0 , t* ] , поскольку u* (t ) удовлетворяет принципу максимума.Далее, P( t * ) x (t * ) = [ P(t * ) x (t * ) - P(t0 ) x ( t0 )] - [ P( t * ) x * (t * ) - P(t0 ) x * (t0 )] =t*= ò [ P(t ) Bu(t ) - P(t ) Bu* (t )] dt ³ 0,t0t1P( t * ) x (t * ) = -[ P(t1 ) x ( t1 ) - P(t * ) x (t * )] = - ò P (t ) Bu(t )dt £ 0 ,таккакt*P(t ) Bu=(t ) 0 для всех t Î [t* , t1] .
Следовательно, max P (t ) Bu = 0 , t Î [t* , t1 ].uÎUПусть U1 – грань многогранника минимальной размерности и 0 Î U1 .Следовательно, dim U1 ³ 1 , так как по условию 0 не является вершиной U .Поэтому в U1 имеется не меньше двух соседних вершин. Пусть (u1, u2 ) – одна из таких пар соседних вершин. Нулевой вектор является относительновнутренней точкой U1 , так как 0 ÎU 1 и 0 не является вершиной U1 . Следовательно, max P (t ) Bu = 0 . Так как max P(t ) Bu = 0 , t Î [t* , t1] , то линейнаяuÎU1uÎUфункция P( t ) Bu , достигающая максимума во внутренней точке, тождественно равна 0 на грани U1 .Пусть w = u1 - u2 .
Следовательно, P(t ) Bw = 0 , t Î [t* , t1] . По лемме 4 вектор Bw принадлежит некоторому собственному инвариантному пространству относительно преобразования A , что противоречит условию общностиположения. ▄Теорема 4 (о конечности переключений). Для любого нетривиальногорешенияP(t )сопряженнойсистемы=P& - PAсоотношениеP( t ) Bu (=t ) max P( t ) Bu однозначно определяет управление u(t ) . Кроме того,uÎUуправление u(t ) оказывается кусочно-постоянным и его значениями являются лишь вершины многогранника U (рис.
10).117t0t1Рис. 10Доказательство. Очевидно, что P(t ) Bu – функция линейная по u прификсированном t . Она также является аналитической функцией по t . Значит,она разлагается в ряд Тейлора и всюду сходится. Зафиксируем отрезок[t0 , t1 ] . Точки этого отрезка можно разбить на две группы:1) точки первого рода – это те точки, где P( t ) Bu( t ) достигает максимума вединственной точке, а именно, в вершине многогранника U ;2) точки второго рода – остальные точки, то есть те точки, где максимумP( t ) Bu( t ) достигается на некоторой грани размерности не меньше единицы.Докажем, что множество точек второго рода конечно.