Громов Ю.Ю. и др. - Специальные разделы теории управления, оптимальное управление динамическими системами (955108), страница 10
Текст из файла (страница 10)
происходит выделение симметричной части ( M + M T ) матрицы М);222) скалярное произведение обладает свойством транспонируемости y T b = b T y , получим1 T &x [ R + R ( A − BP −1 N T ) + ( A − BP −1 N T )T R + Q − NP −1 N T −2− RBP −1B T R]x + [q& T + qT ( A − BP −1 N T ) − l T3 P −1B T R − qT BP −1B T R −− l T3 P −1 N T + l T2 + (Cf )T R ]x + r& −−1 T −1l3 P l3 = 0 .21 T −1 Tq BP B q − l T3 P −1B T q + qT Cf −2(XI)Поскольку условие (XI) должно выполняться тождественно для любых значений x и поскольку при t = t1 для любыхзначений x должно выполняться тождественно следующее соотношение [см. (V) и (VIII)]1 T1x R (t1 )x + q T (t1 )x + r (t1 ) = xT R1x + l1T x ,22то для определения матрицы R(t), вектора q(t) и скаляра r(t) получаем следующие уравнения и граничные условия:1)R& + R ( A − BP −1 N T ) + ( A − BP −1 N T )T R − RBP −1 B T R + Q −− NP −1 N T = R& + RA + AT R − ( RB + N ) P −1 ( N T + B T R ) + Q = 0; (XII)R (t1 ) = R1.(XII')2)q& T + qT ( A − BP −1 N T ) − l T3 P −1 BT R − qT BP −1B T R −− l T3 P −1 N T + l T2 + (Cf )T R = 0 ;(XIII)qT (t1 ) = l1T .(XIII')3)11r& − q T BP −1 B T q − l T3 P −1 B T q + q T Cf − l T3 P −1l 3 = 0 ;22r (t1 ) = 0 .(XIV)(XIV')Полученные уравнения следует интегрировать в обратном времени от t = t1 к t = t0 .Оптимальный закон управления с обратной связью имеет видu * (x, t ) = − P −1 (t )[ B T (t ) R(t ) + N T (t ))x + B T (t )q(t ) + l 3 (t )] .
(XV)Решения некоторых других задач оптимального управления для линейных систем с квадратичным критерием качестваприведены в табл. 3. В пп. 1 – 7 (строках 1 – 7) этой таблицы приведены постановка и решения задачи синтеза оптимальногозакона управления при свободных граничных условиях на правом конце траектории, а в п. 8 – постановка и решение задачипри заданных граничных условиях на правом конце. В пп. 1 – 6, 8 рассматриваются однородные линейные системы, в п. 7 –неоднородная линейная система. В п. 1 дано решение задачи синтеза для нестационарной линейной системы и нестационарного квадратичного критерия качества при фиксированном конечном интервале времени процесса управления, в п.
2 – длястационарной (независящей явно от t) системы и стационарного критерия качества при фиксированном конечном интервалевремени процесса управления, в п. 3 – для стационарной системы и стационарного критерия качества на неограниченноминтервале времени ( [0, ∞ ] ), в п. 4 – для нестационарной системы и нестационарного квадратичного критерия более общеговида, чем в пп. 1 – 3 (критерий содержит перекрестные члены типа xT Nu ).
В п. 5 приведено решение задачи, которая в определенном смысле эквивалентна задаче п. 4 (см. 5-й столбец таблицы), в п. 6 дано решение для оптимизации отклонениясистемы от заданного желаемого поведения, в п. 7 рассмотрен случай синтеза оптимального закона управления для неоднородной линейной системы, в п. 8 – синтез оптимального закона управления при заданных граничных условиях на правомконце и квадратичном критерии более общего вида.
Некоторые из приведенных в табл. 3 решений (пп. 1 – 4, 6, 7) являютсячастными случаями рассмотренной выше задачи.Контрольные вопросы№ строки1. Принцип оптимальности динамического программирования.2. Ослабленное необходимое условие.3 Оптимизация линейных систем с квадратичным критерием качества при отсутствии ограничений на значенияуправляющих функцийУравнениесистемыдвижения121x& = A(t )x + B(t )u ,НачальныеконечныеусловияКритерий качества J[u]Оптимальный закон управлеОптимальноениязначение крите(в смысле минимума J[u])рия качества**u = v (x, t)45и36u * = − P −1 (t ) B T (t ) R (t )x ,J * = J min =x(t 0 ) = x 0где R(t) – решение матрич- = V (t 0 , x 0 ) =x = ( x1 , ..., x n ) ,t1ногоуравнения Риккати:задано,1 T1Tu = (u1 , ..., u m ) T ,+[xQ(t)x+uP(t)u]dt&= x T (t 0 ) ×RtRtAt()=−()()−t 0 ≤ t ≤ t12t2A(t) – матрица раз0× R (t 0 )x(t 0 )мерности n × n, B(t) t1 – задано, R , Q(t ) – положительно − A(t ) R(t ) − Q(t ) +– матрица размер- x(t1 ) = x1 – 1+ R (t ) B (t ) P −1 (t ) B T (t ) R (t ),полуопределенные симности n × mсвободноR (t1 ) = R1метричные матрицы(интегрированиеотразмерности n × n;P(t) – положительноt1доt0 )илиопределенная симметTt 0 – задано,1J [u] = x1T R1x1 +2–∫ричная матрица размерности m × md −1( R (t )) = AR −1 + R −1 AT −dt− BP −1B T + R −1QR −1R −1 (t1 ) = R1−12x& = Ax + BuA, B – постоянныематрицы размерности n × n и n ×m, соответственноx = ( x1 , ..., xn )T ,u = (u1 , ..., u m )T3x& = Ax + BuA, B – постоянныематрицы размерности n × n и n ×m, соответственноx = ( x1 , ..., xn )T ,u = (u1 , ..., u m )Y ,x = ( x1 , ..., xn ) T ,u = (u1 , ..., u m ) T ,t0 = 0 ,x(t 0 ) = x 0 –задано,0 ≤ t ≤ t1t1 – задано,x(t1 ) = x1 ,x1– свободноJ [u] =t11[xT Qx + uT Pu]dt ,2 ∫0+Q, R1 – постоянныеположительно полуопределенные симметричные матрицы размерности n × n; P – постоянная положительноопределенная симметричная матрица размерностиm×mt0 = 0 ,J [u] =x(t0 ) = x0 –задано,=u* = − K (t1 − t )x ,гдеK (t1 − t ) = P −1 B T R (t1 − t )R (t1 − t ) – решение матричного уравнения Риккати:–свободно∫Q – постоянная положительно полуопределенная симметричнаяматрица размерности n× n; P – постояннаяположительно определенная симметричнаяматрица размерности m×mK = P −1BT R0– постоR0янная матрица;– установившееся решение матричного уравнения Риккати, т.е.гдеR0 = lim R(τ)τ→∞,гдеdR= RA + A T R + Q −dτR0 может быть также определена из квадратногоалгебраического матричного уравнения РиккатиR0 A + AT R0 + Q −− R0 BP −1 B T R0 = 0как его единственное положительно определенноерешение4x& = A(t )x + B (t )u ,где A(t), B(t), x, u –матрицы и векторы, определенныев п.
1t0 – задано,x(t0 ) = x0 –задано,t0 ≤ t ≤ t1,t1 – задано,11J [u] = x1T R1x1 + ×22t1Q× ∫ [xT , uT ] TNt01= xT (t0 ) ×2× R(t1 − t0 )x(t0 )t0 = 0J * = J min =− RBP −1 B T R; R (0) = 03= V (t0 , x0 ) =0 ≤ τ ≤ t1u* = –Kx,1[xT Qx + uT Pu] dt ,20J * = J min =dR= R (τ) A + AT R (τ) + Q −dτ− R (τ) BP −1 B T R (τ),R (0) = R1 , τ = t1 − t ,∞0 ≤ t ≤ t1 = ∞,x(t1 )1 Tx1 R1x1 +2u * = − P −1 [ B T R + N T ]x ,гдеN x dt,P u= V (t0 , x 0 ) ==1 Tx 0 R0 x 02x(t1 ) = x1 ,x1–свободно5x& = ( A − BP−1 N T )x + t 0 – задано,+ Bu,x0 – зада-где A(t), B(t), x, u –матрицы и векторы, определенныев п.
1; P(t), N(t) –матрицы, определённые в п. 46x& = A(t )x + B(t )u ,где A(t), B(t), x, u –матрицы и векторы, определенныев п. 1но,t 0 ≤ t ≤ t1 ,t1 – задано,x(t1 ) = x1 ,x1Q − NP −1N T ≥ 0 ;гдеN(t) – матрица размерности n × m; P(t) – положительноопределенная матрица размерностиm × m; R1 – см. п. 1J [u] =1 Tx1 R1x1 +2t1+1[xT , uT ] ×2 t∫0Q − NP−1N T , 0 x× dt0,PuR& = − RA − A T R ++ ( RB + N ) P −1 ×× ( N T + B T R ) − Q,R (t1 ) = R1u * = − P −1 B T R x == u*( 4) + P −1 N T x,где R ип.
4u*( 4)определены в–свободноt 0 – задано,x0 – зада-но,t 0 ≤ t ≤ t1 ,t1 – задано,x(t1 ) = x1 ,x1свободно–tu* = −C (t )x + h(t ),1 1J [u] = ∫ [(y (t ) −2tгде− M (t )x)T Q(t )(y (t ) −C = P −1 B T R;− M (t )x) + uT P (t )u]dt ,h = P −1 B T g,0где y(t) – заданнаяфункция(желаемыйвыходной сигнал); M(t)– матрица размерностиn × n; P(t), Q(t) – см.п.2;M(t)x – полученныйвыходной сигналy = ( y1 , y 2 , ..., y n )Tа матрица R(t) и вектор g(t)определяется из решенийуравнений:R& = − RA − AT R ++ RBP −1BT R − M T QM ,R(t1 ) = 0,g& = −( AT − RBP −1B T )g ++ M T Qy ,g(t1 ) = 078x& = A(t )x +t0 – задано,11J [u] = x1T R1x1 + ×x(t)=x–22+ B(t )u + f (t ),00t1где f(t) – известный задано,× ∫ [xT Q(t )x + uT P(t )u]dt ,n-мерныйвектор; t0 ≤ t ≤ t1 ,элементы A(t), B(t), t1 – задано, t 0x, u – определены в x(t1 ) = x1 – R1 , Q(t ), P(t ) – см. п.
1п. 1свободноt1&x = A(t )x + B(t )u ,t 0 – задано,1[]Ju=[xT Q (t )x +–где A(t), B(t), x, u – x(t 0 ) = x 02 t∫матрицы и векторы, задано,0Tопределенные в п. 1 t 0 ≤ t ≤ t1 ,2x N (t )u + uT P (t )u]dt +t1 – задано, 1+ x1T R1x1 ,Mx(t1 ) = φ1 ,2M – матрица Q (t), N(t), P(t), R –1(q×n);см.
п. 1φ1 – заданныйq-мерныйвектор q ≤ nu* = − P −1 B T ( Rx + w ),гдеR& = − RA − AT R −− Q + RBP −1B T R,R (t1 ) = R1 ,& = ( RBP −1B T − AT )w − Rf ,ww (t1 ) = 0u * = − P −1 [ N T + B T ×× ( R − FG −1 * F T )]x −− P −1 B T FG −1 φ1 ,гдеR& = − RA − AT R − Q ++ ( RB + N ) P −1 ( N T + BT R),R(t1 ) = R1 ,F& = −[ AT − (RB + N ) P −1BT ]F ,F (t1 ) = M T ,G& = F T BP−1BT F ,G(t1 ) = 0J * = J min == V (t 0 , x 0 ) =1 Tx 0 (R(t 0 ) −2− F (t )G −1 (t ) ×=× F T (t ))x 0 ++ (FG−1φ1 ) ×1× x 0 − φ1T G −12Глава 6НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИОСОБОГО УПРАВЛЕНИЯ6.1. Краткая формулировка задачиПри решении задач встречаются случаи, когда управление u входит в дифференциальные уравнения математическоймодели объекта линейно,dx= f (t , x, u) = γ (x, t ) + R(x, t )u ,dt(56)гдеx = ( x1 , x2 , ..., xn )T , x ∈ X n ;u = (u1 , u 2 , ..., u m )T , u ∈ U m ;γ = ( γ1 , γ 2 , ..., γ n )T ;R = {rij (t , x)} (i = 1, n, j = 1, m) ;t ∈ [t 0 , t1 ],а критерий качества имеет видt1∫ f 0 (t , x, u)dt = Φ(t0 , t1, x0 , x1 ) +J [u, t0 , t1 , x 0 , x1 ] = Φ (t0 , t1 , x 0 , x1 ) +t0t1+ ∫ [ γ 0 (x, t ) + uT r0 (x, t )]dt ,(57)t0mгде r0 = (r01 , r02 , ..., r0 m )T ; u T r0 = ∑ r0 u j .j =1Функция Гамильтона H для (56), (57) имеет видH=n∑i =0=λi fi =n∑λ i γ i (x, t ) +i =0n∑ ∑ rij u j =i =0nmnmλij =1∑ λ i γ i (x, t ) + ∑ ∑ λ i rij u j .i =0(58)j =1 i = 0Если U m – m-мерный прямоугольник:U m = {u = (u1 , u 2 , ..., u m )T a1 ≤ u1 ≤ b1 , a2 ≤ u 2 ≤ b2 , ..., am ≤ u m ≤ bm },a j < b j ( j = 1, m)( a j , b j могут зависеть от t), то в силу принципа максимума (см.
п. 4.3) для минимизации J[u] оптимальное управление определяется из условияu = arg min H (t , x, u, λ )u∈U m(59)илиa j приuj = b при jn∑ λ i rij > 0 ;i =0n(60)∑ λ i rij < 0 .i =0При некоторых значениях x и λ функция H в (58) может оказаться независящей явно от какой-либо компоненты u j наотрезке [τ1 , τ 2 ] τ 2 − τ1 > 0 . В этом случае выполняется соотношение (рис. 9)Φ j (λ , x, t ) =n∑ λ i rij (x, t ) ≡ 0 ,i =0которое формально совпадает с условием(61)n∂H= λ i rij (x, t ) ≡ 0∂u j i =0∑(62)на отрезке [τ1 , τ 2 ] .Отрезок [τ1 , τ 2 ] , на котором имеет место соотношение (61), называется участком особого управления для компонентыu j , а оптимальное управление u *j (t ) на таком участке существует, называется особым оптимальным управлением.