Ким Д.П. Сборник задач по теории автоматического управления (2008) (1151995), страница 42
Текст из файла (страница 42)
Дана управляемая система х~ = хм хз = а~х~ + азха+ Ьи+ Узз, х~(0) = О, хз(0) = О, у = х~ + з, где Узо н з — шумы объекта н наблюдення соответственно, н онн не коррелированы. Шум объекта Ур является белым с интенсивностью 4, шум наблюдеяня з — цветным с корреляцнонной функцией Кз(т) = 2е а1т1(гз, Определять несмещенную оптимальную оценку фазового вектора, прнннмая за наблюдаемый выход у=у — СВи — Ыу (С= г(! 0~, В= [О Ь~ ) а) а~ =-1, б) а~ =-2, в) а~ =-2, г) а~ =-1, д) а~=-2, е) а~ =-2, ж) а~=-2, з) а~= — 5, н) а~ =-3, к) а~ =-5, аз = -1, ат = -1, аз=-1, аз = — 2, аз = — 2, аз = -4, аз = — 3, аз = — 3, И=-1, д= — 1, И= — 2, Ы=-2, й= — 4, д= — 2, д= — 2, И= — 1, о=1; 4=1; 4=2; 4=2; 4=2; 4=2; 4=1; 4=1; 4=3; 4=3. 264 эл.
10. Синтез опмнмальных систем управления значениях параметров аы оз= — 1, а= — 1, 6=2, аз=-1, 6=2, а= — 1, аз= — 1, а= — 2, 6=4, аз = — 2, а= — 2, 6=4, аз= — 2, а= — 4, 6=3, аз= — 4, а=-2, 6=3, а= — 2, 6=5, а= — 1, 6=5, аз = — 3, о = — 3, а=4, 6=2„4 а= — 1, 6=2, аз = — 4, аз = — 4, 10.9. Дана управляемая система где Ка н К, — белые шумы объекта и наблюдения с интенсивностью д~ и соответственно, и онн не коррелированы; уы уз — выходные (наблюдаемые) переменные. Определить несмещенную оптимальную оценку фазового вектора прн следующих значениях параметров ан аь Ь, д~ ит: а) а1 = 1, аз = 2, Ь = 1, д1 = 1, т = 2; б) а1 = 2, ог = 2, 6 = 1, 41 = 2, г = 2; в) а~ = 2, аз = 4, Ь = 2, д = 2, т = 4; г) а~ = 3, аэ = 4, 6 = 2, д~ = 4, т = 4; д) а~ = 3, от = 5, 6 = 3, Е = 4, т = 2; е) а1 = 4, аз = 5, Ь = 3, д~ = 2, г = 2; ж) а~ = 4, аз —— 3, Ь = 5, 4~ = 2, т = 1; з) а~ = 5, аз = 3, Ь = 5, д1 = 1, т = 4; и) а~ = 5, ат = 4, Ь = 4, щ = 4, т = 1; к) а1 = 6, аз = 4, 6 = 4, 4~ = 2, т = 2.
10.3. Стохастические оптимальные системы Для строго детерминированных систем управления не имеет значения, какое управление — программное или с обратной связью — используется, так как знание управления и начального состояния позволяет однозначно определять состояние системы в любой момент времени. Наблюдение за текущим состоянием системы не дает новой при следующих а) а~ =-1, б) а~ =-2, в) а~ =-2, г) а1 =-1, д) а1=-2, е) а1 = — 2, ж) а~= — 2, з) а1 =-5, и) а1=-3, к) а~ -5, аьа, Ьид: 4=2; 4=2; 4=1; 4=1; д=1; 4=1; 4=3; 4=3; =4; 4 =4.
х~ = хз + 'тю, хз = а1х~ + атхз + Ьи, х~(0) = О, хз(0) = О, у~ = хе+ Кн, уз = хь 265 10.3. Столастические оптимальные системы информации. В стохастических системах управления, т.е. в системах, подверженных случайным воздействиям, по известным управлению и начальному состоянию предсказать ход протекания процесса невозможно. И возможности качественного управления такими системами существенно зависят от той информации, которая может быть получена путем измерения (наблюдения) и обработки выходными (наблюдаемыми) переменными. Поэтому стохастнческне системы управления должны быть замкнутыми. При рассмотрении детерминированных систем управления также основное внимание уделяется замкнутым системам, так как практически все системы управления подвержены случайным или неслучайНым, но заранее не прогнозируемым, воздействиям.
Т.е. строго детерминированных систем управления не бывает. Однако при анализе и синтезе рассматриваются детерминированные модели в виду их простоты по сравнению со стохастическими моделями, когда случайные воздействия не оказывают существенных влияний. Стохастнческое оптимальное управление при полной информации. Уравнение объекта имеет вид х = Г(х,п,с)+~го(з), х(зо) = хо, где хо — гауссова случайная величина, Уо($) — гауссов белый шум, хо и ч'о($) не коррелированы; белый шум имеет следующие характеристики: М[~о(З)[ ='О, М[Уо(З)Уоц(З')[ = Яо(й)Ю(С вЂ” З'). Пусть требуется определить управление с обратной связью, доставля- ющее минимум критерию оптимальности.
$/ 7 = М ро(х(йу),зу) + Яф(х,н,с)й Такое управление называется стохастическим оптималычым управлением. Итак, рассматривается задача стохастического оптимального управления, в которой шум объекта является гауссовым белым шумом и входит в уравнение аддитивио; ограничение на правый конец траектории отсутствует, фазовый вектор наблюдается полностью н без помех.
В этой задаче х(с) является марковским процессом (так как случайное воздействие является белым шумом), и вся информация, которая может быть использована при определении характеристики будущего состояния, содержится в х(с). Поэтому оптимальное управление должно быть функцией только от текугцего состояния н, быть может, текущего времени. 266 Ги 10. Синтез оптимальнык систем у веления Управление и = (х(т),з) считается допустимым, если функция п(1) = (х(т),1) кусочно-непрерывна. Кроме того, предполагается, что при допустимом управлении уравнение' х = Г(х,п(х,з),1) при каждом фиксированном х(го) = х имеет единственное решение на интервале [Со, 17].
Функции Хо(х, и, т), Г(х, и, т) и Яо(т) предполагаются непрерывными. Стохастическая оптимальная линейная система при полной информации о состоянии. Пусть уравнение объекта и критерий оптимальности имеют вид х = Ах+ Вц+ '17о, х(1о) = хо; (10.1ба) $г ,Т = М хт(зг)Рх(зг) + [хт(4)фс(з) + пт (1)Вп($)]дь . (10.166) Здесь то — гауссов белый шум, хо — гауссова случайная величина; з7о н хо не коррелированы и имеют следующие характеристики: Мхе = хо, М[(хо — хо)(хо — хо)т ] = Ро, М ~~7о(1)] = О, М[Чо(1)178 (б)] = (~о(4)б(1 — б)' матрицы А, В, Я и В, вообще говоря, являются функциями времени,  — положительно определенная матрица, чг, Ро, Яо — положительно полуопределенные матрицы, объект стабилизируем.
Требуется найти оптимальное управление объекта с обратной связью, обеспечивающее минимум заданному критерию оптимальности, при условии, что фазовый вектор доступен точному измерению. Те ор е м а 10.3. Стокастическое оптимальное управление с обратной связью для объекта (10.16а) при критерии оптимальности (10.166) имеет вид — 1г-'ВТК (10.17а) где К вЂ” симметрическая матрица, которая определяется из мат- ричного уравнения Риккати К КА АтК + КВК-1ВтК (10 176) при граничном условии К(су) = Р. (10.! 7в) Оптимальный закон управления (10.17) совпадает с оптимальным законом управления в детерминированном случае.
Таким образом, случайное воздействие на объект и случайное начальное условие не 70.3. Стохастические оптимальные системы 267 влияют на оптимальный закон управления, если имеется полная информация о фазовом векторе. Стохастическое оптимальное управление при неполной информации о состоянии. Принцип разделения. По с та но вка задач и.
Пусть уравнения объекта и наблюдения и критерий оптимальности имеют вид х = Ах+ Вц+ Чо, х(ао) = х; у = Сх+Ч„; (10. 18а) (10.18б) О ,7 = М хт(17)Ех(17) + [х~(1)Ях(1) + ц~(1)Вц(С)1 лс . (!0.18в) Здесь Чо, ׄ— гаоуссовы белые шумы, хе — гауссова случайная величина; Чо, Ч„и х не коррелнрованы н имеют следующие характеристики: Мхе = хо, М[(хв — хо)(хо — хо)т = Ро, М[Чо(1)[ = О, М[Чо(С)Чает(1')! = Юо(1)б(С вЂ” й'); М[Ч- (1)[ = О М[Ч (1)Чт(1')[ = Во(1)6(1 — 1') матрицы А, В, (г и В, вообще говоря, являются функциями времени, В, Во — положительно определенные матрицы, 9, Ро, Яо — положительно полуопределенные матрицы.
Требуется найти управление ц = и (у(т), 7о < т < т), 1о < 1 < сг, при котором критерий оптимальности (10.18а) принимает минимальное значение. Эта задача отличается от задачи стохастического оптимального управления с полной информацией тем, что в данном случае управление формируется на основе информации, получаемой путем обработки измеряемой с помехой выходной переменной. Теорема 1ОА. Стохастическое оптимальное управление с обратной связью для объекта (10.18а), (10.18б) при критерии оптимальности (10.!8в) имеет вид и = — В 'ВтКх, (10.19а) К КА АтК+ КВВ-1ВтК Я (1О 19б) при граничном условии К(17) = Г, (10.19в) где К вЂ” симметрическая матрица, которая определяется из мат- ричного уравнения Риккати 268 Га. 1О. Синтез оптимайьник систем правления х — оптимальная оценка, получаемая фильтром Калмана-Бьюси х = Ах+ Вп+ Ко(у — Сх), х(Зо) = х; (10.20а) Ко = РС Во ', (10.20б) Р = АР+ РАт РСтй-~СР+ Яо.
Р(зо) = Ро (10.20в) Оптимальный закон управления (10.!9) совпадает с оптимальным законом управления в детерминированном случае и стохастическим оптимальным управлением при полной информации лишь с тем отличием, что в законе управления (10.19а) используется не сам фазовый вектор, а его оценка, которая определяется фильтром Калмана-Бьюси. Таким образом, при неполной информации стохастически оптимальный регулятор состоит из оптимального фильтра (фильтра Калмана-Бьюсн) и детерминированного оптимального регулятора.
Этот результат известен как принцип разделения, или принцип стахастической эквивалентности. В соответствии с этим принципом задача синтеза стохастической оптимальной системы управления при неполной информации сводится к двум задачам: задаче синтеза фильтра Калмана-Бьюси и задаче синтеза детерминированной оптимальной системы. Если шумы и начальное состояние подчиняются нормальному закону распределения, то в результате такого синтеза получим стохастическую оптимальную систему, в противном случае (шумы и начальное состояние подчиняются другим законам) можем только гарантировать, что полученная таким путем система будет оптимальной в классе линейных систем. Задачи 10.10.