1612726833-e6f68fc32d761b4e64266f5c195a8f96 (828578), страница 11
Текст из файла (страница 11)
В противном случае решим систему (2)с начальным условием x (t1 ) = 0 , доопределив управление u (t ) , как по-казано на рис. 7:712 мая 2014u (t )t0u (t ) = 0t1t0+TРис. 7Получим, что x (t ) = 0 на интервале [t1 , t 0 + T ].Аналогично, для u~(⋅) и ~x (⋅) можно считать, что ~t1 = t 0 + T .y 0 = λx 0 + (1 − λ ) ~x0,0 ≤ λ ≤ 1.
Тогда управлениеu * (t ) = λu (t ) + (1 − λ )u~(t ), определенное на интервале [t 0 , t 0 + T ] , явПустьляется допустимым управлением.Ему соответствует траектория x * (t ) = λx (t ) + (1 − λ ) ~x (t ) , по которойфазоваяточкапереходитизначальногоположенияx * (t 0 ) = λx 0 + (1 − λ ) ~x 0 = y 0 в конечное положение x * (t 0 + T ) = 0.▄812 мая 2014Доказательство принципа максимума для линейнойзадачи быстродействияЛемма 2. Если x0 – внутренняя точка VT , то из x0 можно перейти вточку 0 за время строго меньше T .Доказательство. Рассмотрим произвольную точку x0 ∈ Int VT . Так какInt VT ⊆ VT , то найдутся точки y j из VT , такие, что симплекс, образованный этими точками из сферы достижимости, как показано на рис.
8,содержит x0 . Из леммы Каратеодори следует, что их не более чем n+1точка.y1z1x0yszs0y2z2Рис. 8912 мая 2014Доказательство принципа максимума для линейнойзадачи быстродействияТогда по определению множества VT существуют допустимыеуправления u s (t ) на интервале [t 0 , t 0 + T ] такие, что x s (t 0 ) = y s ,x s (t 0 + T ) = 0 , s = 1, K , n + 1.Так как функции x s (t ) непрерывны, то существует ε > 0 , для которого x 0 ∈ Int Co{x1 (t 0 + ε ), K , x n +1 (t 0 + ε )}.Но все точки x s (t 0 + ε ) , s = 1,..., n + 1, лежат в сфере достижимостиVT − ε .
Это означает, что x 0 ∈ VT −ε . ▄1012 мая 2014Доказательство принципа максимума для линейнойзадачи быстродействияЛемма 3. Пусть u (t ) – допустимое управление на интервале [t 0 , t1 ],x (t ) – соответствующее решение, P(t ) – произвольное решение сопряженной системы P& = − PA на данном интервале. Тогда во всех точкахнепрерывности управления u (t ) справедливы следующие равенства:d( P (t ) x (t )) = P (t ) Bu (t ) ,dtt1P(t1 ) x (t1 ) − P(t 0 ) x (t 0 ) = ∫ P(t ) Bu (t )dt.t01112 мая 2014Доказательство принципа максимума для линейнойзадачи быстродействияДоказательство.d( P (t ) x (t )) = P& (t ) x (t ) + P (t ) x& (t ) = − P (t ) Ax (t ) + P (t )( Ax (t ) + Bu (t )) =dt= P (t ) Bu (t ) .
▄1212 мая 2014Доказательство принципа максимума для линейной задачи быстродействияДокажем, что оптимальное управление удовлетворяет (4), т.е.P(τ ) Bu* (τ ) = max P(τ ) Bu , τ ∈ [t 0 , t1 ].u∈UПусть u (t ) – оптимальное управление на интервале [t 0 , t1 ], x (t 0 ) = x 0 ,x (t1 ) = 0. Положим T = t1 − t 0 . Из леммы 2 следует, что x0 – граничнаяточка сферы достижимости VT . Следовательно, по теореме отделимостисуществует вектор d ≠ 0 такой, что для всех векторов x из множестваVT выполняется неравенство d ( x − x 0 ) ≥ 0 .
Рис. 9 иллюстрирует сказанное выше.VTrn0x0x0*Рис. 91312 мая 2014Доказательство принципа максимума для линейной задачи быстродействияrПусть P – решение P& = − PA с начальным условием P (t 0 ) = n . Нужнодоказать равенство P (t ) Bu (t ) = max P (t ) Bu для всех t из интервалаu∈U[t0 , t1 ] .Действительно, допустим противное: пусть существует τ ∈ [t 0 , t1 ] такое, что P (τ ) Bu (τ ) < max P (τ ) Bu .u∈UТ.е. существует такое v ∈ U , что P (τ ) Bu (τ ) < P (τ ) Bv .Из непрерывности управления следует, что существует интервал[τ 0 ,τ 1 ] ⊂ [t 0 , t1 ] такой, что P (τ ) Bu(τ ) < P(τ ) Bv для всех τ ∈ [τ 0 ,τ 1 ].1412 мая 2014Определим управление на интервале [t0 , t1 ]⎧v, t ∈ (τ 0 ,τ 1 ],u (t ) = ⎨⎩ u (t ), [t0 , t1 ] \ (τ 0 ,τ 1 ].*Очевидно, что u* – допустимое управление. Выберем траекторию x* (t )соответствующую u* такую, что x * (t1 ) = 0 . Пусть x 0* = x * (t 0 ) .
Тогдаx 0* ∈ VT и, следовательно, d ( x 0* − x 0 ) ≥ 0 .Имеем следующие наборы функций: u (t ), x (t ), P (t ) и u* (t ), x ∗ (t ), P (t ) .Из леммы 3 имеем:d ( x 0* − x 0 ) = P (t 0 )( x * (t 0 ) − x (t 0 )) = ( P (t1 ) x (t1 ) − P (t 0 ) x (t 0 )) −t1− ( P(t1 ) x * (t1 ) − P(t 0 ) x * (t 0 )) = ∫ [ P(t1 ) Bu(t ) − P(t ) Bu * (t )] dt =t01512 мая 2014τ1= ∫ [ P(τ ) Bu(τ ) − P(τ ) Bv ] dτ < 0.
Противоречие с неравенством, котоτ0рое следует из теоремы отделимости. ▄1612 мая 2014Достаточность принципа максимумаПусть X – конечномерное пространство, Y ⊆ X – подпространство,A : X → X – линейное преобразование. Будем говорить, что Y – подпространство инвариантное относительно A, если A(Y ) ⊆ Y . КогдаY ≠ X , то Y – собственное подпространство.Пусть a ∈ X . Элемент a принадлежит собственному инвариантномуподпространству Y тогда и только тогда, когда вектора {a , Aa , K , A k −1a}линейно зависимы.1712 мая 2014Достаточность принципа максимумаБудем говорить, что для задачи быстродействия выполнено условиеобщности положения, еслидля каждого вектора w параллельного некоторому ребру многогранника U , вектор Bw не принадлежит никакому собственному инвариантному подпространству A, то есть вектора {Bw, ABw, K , A k −1 Bw} образуют линейно независимую систему.Замечание.Множествовекторов,дляdet{Bw, ABw,K, Ak −1Bw} = 0, является нигде неплотным.которыхСледовательно, добиться выполнения условия общности положенияможно всегда сколь угодно малым сдвигом.(Множество называется нигде неплотным, если его дополнение всюдуплотно).1812 мая 2014Лемма 4.
Пусть P(t) – нетривиальное решение сопряженной системыP& = − PA , a ≠ 0 такое, что P(τ )a = 0 для всех τ ∈ (τ 0 ,τ 1 ). Тогда aпринадлежит некоторому собственному инвариантному подпространству относительно преобразования A.{}Доказательство.
Пусть y ∈ Y , где Y = y ∈ R n : P(τ ) y = 0 , τ ∈ (τ 0 ,τ 1 ) .Покажем, что Y – собственное подпространство инвариантное относительно A.d(P(t), y) = 0 , что эквивалентно условию P& (t)y = 0 .ДействительноdtТ.е. − P(t)Ay = 0 .Таким образом Ay ∈ Y и Y ≠ R n , так как существует τ ∈ (τ 0 ,τ 1 ) такое, что P (τ ) ≠ 0 . Тогда P (τ ) ∉ Y , так как P (τ ) P (τ ) ≠ 0. ▄1912 мая 2014Достаточность принципа максимумаТеорема 3.
Пусть u (t ) – допустимое управление, заданное на отрезке[t 0 , t1 ], x (t ) – соответствующая траектория, удовлетворяющая начальным условиям x(t 0 ) = x 0 и x(t 1 ) = 0 . Тогда для оптимальности управления необходимо и достаточно, чтобы оно удовлетворяло принципумаксимума.Доказательство. Необходимость следует из теоремы 2 (принцип максимума).Достаточность. Пусть существует P (t ) ≠ 0 такое, что P& = − PA иmax P(t ) Bu = P(t ) Bu (t ) .
Докажем, что лучшего управления, чем u(t ) неu∈Uсуществует, то есть не существует другого управления u * , которое пере2012 мая 2014водит фазовую точку x из положения x0 в положение 0 за меньшее время, чем (t1 − t 0 ).Предположим противное: пусть на интервале [t 0 , t * ] определен управ-ляемый процесс (u * (t ), x * (t )) такой, что x * (t 0 ) = x 0 , x * (t * ) = 0 иt * < t1.
Очевидны следующие неравенства:1) P(t ) Bu(t ) ≥ 0, t ∈ [t 0 , t1 ], так как 0 ∈ U ;2) P(t ) Bu(t ) ≥ P(t ) Bu* (t ), t ∈ [t 0 , t * ], поскольку u * (t ) удовлетворяетпринципу максимума.Далее,P (t * ) x (t * ) = [ P (t * ) x (t * ) − P (t 0 ) x (t 0 )] − [ P (t * ) x * (t * ) − P (t 0 ) x * (t 0 )] =2112 мая 2014t*= ∫ [ P (t ) Bu (t ) − P (t ) Bu * (t )] dt ≥ 0,t0t1P (t * ) x (t * ) = −[ P (t1 ) x (t1 ) − P (t * ) x (t * )] = − ∫ P (t ) Bu (t )dt ≤ 0 ,т.е.t*P (t ) Bu (t ) = 0 для всех t ∈ [t * , t1 ]. Следовательно, max P (t ) Bu = 0 ,t ∈ [t * , t1 ].u∈UПусть U1 – грань многогранника минимальной размерности и 0 ∈ U 1.Следовательно, dim U 1 ≥ 1, так как по условию 0 не является вершинойU . Поэтому в U1 имеется не меньше двух соседних вершин.2212 мая 2014Пусть (u1 , u 2 ) – одна из таких пар соседних вершин.
Нулевой вектор является относительно внутренней точкой U1, так как 0 ∈U 1 и 0 не является вершиной U1.Так как max P (t ) Bu = 0 , t ∈ [t * , t1 ], то линейная функция P (t ) Bu , досu∈Uтигающая максимума во внутренней точке, тождественно равна 0 награни U1.Пусть w = u1 − u 2 . Следовательно, P (t ) Bw = 0 , t ∈ [t * , t1 ].По лемме 4 вектор Bw принадлежит некоторому собственному инвариантному пространству относительно преобразования A, что противоречит условию общности положения. ▄2312 мая 2014.