Ким Д.П. Сборник задач по теории автоматического управления (2008) (1151994), страница 43
Текст из файла (страница 43)
Пусть уравнение объекта и критерий оптимальности имеют вид х = Ах+ Вц+ '17о, х(1о) = хо; (10.1ба) $г ,Т = М хт(зг)Рх(зг) + [хт(4)фс(з) + пт (1)Вп($)]дь . (10.166) Здесь то — гауссов белый шум, хо — гауссова случайная величина; з7о н хо не коррелированы и имеют следующие характеристики: Мхе = хо, М[(хо — хо)(хо — хо)т ] = Ро, М ~~7о(1)] = О, М[Чо(1)178 (б)] = (~о(4)б(1 — б)' матрицы А, В, Я и В, вообще говоря, являются функциями времени,  — положительно определенная матрица, чг, Ро, Яо — положительно полуопределенные матрицы, объект стабилизируем.
Требуется найти оптимальное управление объекта с обратной связью, обеспечивающее минимум заданному критерию оптимальности, при условии, что фазовый вектор доступен точному измерению. Те ор е м а 10.3. Стокастическое оптимальное управление с обратной связью для объекта (10.16а) при критерии оптимальности (10.166) имеет вид — 1г-'ВТК (10.17а) где К вЂ” симметрическая матрица, которая определяется из мат- ричного уравнения Риккати К КА АтК + КВК-1ВтК (10 176) при граничном условии К(су) = Р. (10.! 7в) Оптимальный закон управления (10.17) совпадает с оптимальным законом управления в детерминированном случае. Таким образом, случайное воздействие на объект и случайное начальное условие не 70.3.
Стохастические оптимальные системы 267 влияют на оптимальный закон управления, если имеется полная информация о фазовом векторе. Стохастическое оптимальное управление при неполной информации о состоянии. Принцип разделения. По с та но вка задач и. Пусть уравнения объекта и наблюдения и критерий оптимальности имеют вид х = Ах+ Вц+ Чо, х(ао) = х; у = Сх+Ч„; (10. 18а) (10.18б) О ,7 = М хт(17)Ех(17) + [х~(1)Ях(1) + ц~(1)Вц(С)1 лс . (!0.18в) Здесь Чо, ׄ— гаоуссовы белые шумы, хе — гауссова случайная величина; Чо, Ч„и х не коррелнрованы н имеют следующие характеристики: Мхе = хо, М[(хв — хо)(хо — хо)т = Ро, М[Чо(1)[ = О, М[Чо(С)Чает(1')! = Юо(1)б(С вЂ” й'); М[Ч- (1)[ = О М[Ч (1)Чт(1')[ = Во(1)6(1 — 1') матрицы А, В, (г и В, вообще говоря, являются функциями времени, В, Во — положительно определенные матрицы, 9, Ро, Яо — положительно полуопределенные матрицы. Требуется найти управление ц = и (у(т), 7о < т < т), 1о < 1 < сг, при котором критерий оптимальности (10.18а) принимает минимальное значение.
Эта задача отличается от задачи стохастического оптимального управления с полной информацией тем, что в данном случае управление формируется на основе информации, получаемой путем обработки измеряемой с помехой выходной переменной. Теорема 1ОА. Стохастическое оптимальное управление с обратной связью для объекта (10.18а), (10.18б) при критерии оптимальности (10.!8в) имеет вид и = — В 'ВтКх, (10.19а) К КА АтК+ КВВ-1ВтК Я (1О 19б) при граничном условии К(17) = Г, (10.19в) где К вЂ” симметрическая матрица, которая определяется из мат- ричного уравнения Риккати 268 Га.
1О. Синтез оптимайьник систем правления х — оптимальная оценка, получаемая фильтром Калмана-Бьюси х = Ах+ Вп+ Ко(у — Сх), х(Зо) = х; (10.20а) Ко = РС Во ', (10.20б) Р = АР+ РАт РСтй-~СР+ Яо. Р(зо) = Ро (10.20в) Оптимальный закон управления (10.!9) совпадает с оптимальным законом управления в детерминированном случае и стохастическим оптимальным управлением при полной информации лишь с тем отличием, что в законе управления (10.19а) используется не сам фазовый вектор, а его оценка, которая определяется фильтром Калмана-Бьюси.
Таким образом, при неполной информации стохастически оптимальный регулятор состоит из оптимального фильтра (фильтра Калмана-Бьюсн) и детерминированного оптимального регулятора. Этот результат известен как принцип разделения, или принцип стахастической эквивалентности. В соответствии с этим принципом задача синтеза стохастической оптимальной системы управления при неполной информации сводится к двум задачам: задаче синтеза фильтра Калмана-Бьюси и задаче синтеза детерминированной оптимальной системы.
Если шумы и начальное состояние подчиняются нормальному закону распределения, то в результате такого синтеза получим стохастическую оптимальную систему, в противном случае (шумы и начальное состояние подчиняются другим законам) можем только гарантировать, что полученная таким путем система будет оптимальной в классе линейных систем.
Задачи 10.10. Определить стохастическое оптимальное управление при полной информации в следующих задачах управления: а) х = (2е ' — 1)к+2и+Уо, х(0) =х ю х= м)) а* .\-2 ')й)] ы: ~о б) й=(1+аш~с)*+ +Ус), х(0) =хо, )о 1=М /)2 ' ~-2 ')й)] о в) й) = аз, йз = 2и+Ъзо, х(0) =хо, ю =м1И+ *,+4+")й)]- „'; о !0.3. Задачи г) х) = хз, хз = 4и+ Ухо, х(0) = хо, ю .7 = М (хз(+ хз з+ 2х(хз + 4из)411) -+ п)1п; ч о д) х) =ха, хз = -хз+2и+ Узо, х(0) = х, о ю 2 М ) ( ',4-4 )й)] о е) х( = хз, хз = -2хз+и+Узо, х(0) = хо, )о 2 = М ) (2 ',:: 4 -:-»2)44)]- о ж) х) =ха, хз =-х) — ха+ 2и+ Узо, х(0) =хо, ю -М ((.)444»*)й)]--: о з) х) =хз,-ха =-2х) — хз+2и+Узо, х(0) =хо, ю 2 =М (( ',,,,'4.4 ')й)] Ю,; о и) х) = хз, хз = — х) — 2хз + и + Узо. х(0) = хо ю 2=М ) ( ',4-2*)4-2 ')й)] о к) х) = ха, хз = — 2х) — 2хз+2и+Узо, х(0) =хо, )о 2=М ) (2*)44(4 )44)] Ь.
о 269 10.11. Определить стохастическое оптимальное управление и' = = и(у,у) при условии, что на объект воздействует помеха — гауссов белый шум Узо, выходная переменная у и ее производная могут быть измерены без ошибок, в следуюших задачах оптимального управления: 2 а) у = (и + Узо), у(0) = уо, у(0) = уо, уз+ р ( (2 .22ч.2. )й)] о 270 Ги ! О. Синтез аппимальнмл систем управления б) у = (и+ Уоо), у(0) = уо, у(0) = уо, ро + 2р У-М ~ )р 42у' ур ')й)1 о в) у = (и+Уоо) у(0) = у у(0) = у рр+ 4р ьо У= и ) )22'422 4-2уру-» )й)1 о 2 Г) у= ро+ 2р+ 1 (В+ У2О), у(О) у у(0) = у, У=и ()рр'422'Уррр...р ')й)1 ь: о д) у= (и+Уоо), у(0) =у'. у(0) =у', рр + 4р + 3 У-М (442'422'42 ')й)1 ~Щ о е) у= 4 о о ря + бр + б (и+ Уоо), у(0) = у, у(0) = уо У=м ()22 .';ру урн 4 )й)1 о 2 ж) У = (и+ Уоо) У(0) Уо У(0) Уо рр + 4р + 5 у - М ( )р' 4- 4у 4- 2 ')й)1 о з) у= (и+Уоо).
у(0) =у', у(0) =уо, ро + 2р .1. 5 У=М ) )42 .,'.у .-2224 )й)~ 4у о И) у= 1 р'+ бр+ 10 (ю+ УеО) у(0) = у у(0) = у, У=М ~)У 442 44уу44 )44)~ о ! О.з. 0)яземы 271 к) и = (и+1ю), и(О) = и', и(О) = и', рз+бр+ 13 10.12. Дана управляемая система х) = хз, хз = а)х) + аехз + Ьи + Удо, х)(0) = О, хз(0) = О, у = х) + Ъ'„. Шумы объекта ~за и наблюдения К„являются белыми с интенсивностями )7 и т соответственно, и они не коррелированы. Определить на основе наблюдения выхода р на интервале [О,т] стохастическое оптимальное управление, минимизирующее критерий оптимальности З=м ~)а ',~ел-';д ° ~-:-%)й)~ о при следующих значениях параметров аи ав 6, д, г, 4и, йзз Фз и г: а) а)=0, аз=2, 6=2, 4=1, т=1, ди=1, два=1, дп=! г=1' б) а)= — 4, аз=2, Ь=1, 4=2, г=1; 4и=2, дат=1, 4)з=1 т=1' в) а) =О, аз= — 4, Ь=4, 4=2, г=2, ди=2, дат=2, дп=О, т=2; г) а)= — 1, аз=-4, 6=2, у=4, т=2, )7и=4, 4зз=2, д)з=О, т=2; д) а)=-2, аз=-1, 6=2, 4=4, г=1, )7и=4, Щ)=4, д)з=2, г=4; е) а) = -2 аз =2 6= 8 4=2 т =4, )7и = 1 4зз=2 )7)з =О, т =4; ж) а) = — 2, аз= — 4, 6=8, 4=2, г=4, ди=4, 4зз=1, д)з=1, т=2; з) а)=-4, аз=4, 6=4, д=1, т=2, пи=1, дат=4, )7п=О, г=2; н) а)- — -5, аз=-4, 6=4, )7=1, т=2, ди=З, дх)=4, )7)з=З, т=4; к) а)=-5, аз=2, Ь=1, д=1, т=1, ди=5, дх)=З, д)з=5, т=4.
Ответы за+2,5з+ 1 з" + 9,2зз + 24,8зз + 19,6з + 3 ' зз+4з+3 ) е( з+115 в+435 з+59з+20' за+4,5з+2 аз+4,6зз+7,4зз+5з+ 1 2' аз+1,6з+0,6 ") Ф( ) аз+ 75зз+195зз+20з+6' зв + 3,5з+ 1,5 зл + 8вв + 21зв + 22з + 8 ' за +5з+4 К) И'Ф(з) = е) И~Ф(з)— ел+ 7,5зв+ 19,5зв +20з+6 зв + 2,5в +! ж) И'Ф(з)— ве + 10зв + 32вх + 38в+ 15 вв+2,5з+ 1 в) И'Ф(з)— за + 10вв + 32вз 4. 38в + 15 ив+бе+6 и) И~~(з)— зл+бвв+925вз+525в+! аз+ 4,5з+ 2 к) И'Ф(в)— ел+ 11зв+ 4!ив+ б! з+ 30 4 ыз — 0,84ыл + 0,84иР + 0,16' 2 И' (з) = Ф. ° аз+ 1 4вв+ 1 4з+0 4' 4 из+2,25ол+ 1,5оР+0,25' 2 Ф(. ) из+ 2,5зв + 2з+ О 5' !б ~в+2!ил+84иР+64' 4 и ~ Р~7 .~!4 ..'-В' г).Я )= 4' зв + бвв + 12з + 8 ' 16 ыв + 14юл + 49иР + 36 ' 4 И' (з) = Ф( ) зв+бвв.и!!в.+б 4 иФ+ 43юл+ 531иР+ 2025' 2 И~ (з) = зв+ 1!ив+ 39з+45' 4 мв + 2бмл + 169иР + 144' 2 И~ (в) = зв+ 8зв+ 19з+ 12' Гл.
10. Синтез оптимальных систем правления 273 10.З. Оеаевгы в) Я(ю = 9 в + 22 з + 153 в + 324' 3 зз + 8вз + 21з + 18' 4 иР + 24юз + 144мз + 256' 2 И'а(з) = Ф( ) = вв ! 8в2 !.З)з,!.16 4 к) Я(и) = аФ + 27ые + 51иР + 25' 2 Ф( ' вз -1- 7вй -1- 11з -1- 5 10.4. а) х~ =хз+ри(у — х~), хз=2хв+2и+рп(у-х!), ри=2рп — ри, рп=2рп+раз — Рирп, Рп=4рп-рп+1; 2 б) х~ =хз+Ри(у-х~), ха= — 4х!+2хз+и+рп(у — х~), ри =2рп-ри, рп=-4р~г+2рп+Рхз — рирп, 2 рзз = — 8рп+4рп — рп+2; в в) х~ =ха+0,5ри(у — х~), хз = — 4хз+4и+0,5рп(у — х~), ри =2рп-0,5ри, рп= — 4рп+рю — 0,5рирп, Рп= — 8Рп — 05Рвп+2 г) к~=ха+О,бри(у — х~), хз=х~+хт+и+рп(у — х~) ри =2рп-0,5р~ и рп = — ри — 4рп+рп — 0,5рирп, рве = — 2рп — 8рп — 0,5рвп+4; д) х~=хз+ри(у-х~), ха= — 2х! — хз+2и+рп(у — хь), Р~~ =2рп — Ри, Рп=-2ри — Рп+Рзз — Рирп раз = -4рп — 2рд — рп+4; 1О.З.