Г.К. Гудвин - Проектирование систем управления (1054010), страница 111
Текст из файла (страница 111)
Обратная связь по оценке состояний х(1) =Аох($)+В и($) у(в) = Сох(в) (22.2.1) (22.2.2) где х(в) Е Кп, и($) Е К"' и у(г) Е Кр. По аналогии с обратной связью по оценке состояния в 31БО-случае (как в гл. 7) мы ищем матрицу К Е вс'лк", такую, что А„— В К имеет собственные значения в ЛПП и усиление наблюдателя Д, такое, что Аь — ЛС„имеет собственные значения в ЛПП. Далее мы будем обычно требовать, чтобы полюсы замкнутого контура располагались в некоторой заданной области левой половины комплексной плоскости. Средства типа МАТЮКАВ обеспечивают решения этих проблем.
Проиллюстрнруем это простым примером. Пример 22.1. Рассмотрим 1ИПМО-объект, имеющий номинальную модель 1 12(в+1) -О.бз(в+1)) о(з) = (22.2.3) з(з + 1)(з + 2) ~ з 2з Пусть зтпот объектп имеетп стпупепчатпые входные возмущения в обоих каналах. Используя идеи обратной связи по восстпаиовленному состпоянию, нужно спроектпировать мультиперемепный регулятпор, который стабилизирует объект и в то же самое время гарантирует нулевую ошибку в установившемся состоянии для постоянных зтпалонных сигналов и возмущений. Решение Сначала построим модели пространства состояний (Ар,Вр,Ср,О) и (Аа,Вв, Са, 0) для объекта и для входных возмущений соответстпвенно.
Следуя тпой же самой основной идее, как и в ИБО-случае (в равд. 18.7), мьт оцениваем не тполько состпояние объектпа хр(в), но также и вектор возмущений сЦг). Затем сформируем закон управления и(г) = -Крх(г) — гЦг) + р(г) (22.2.4) Напомним, что возмущения наблюдаемы с выхода объекта, хотя недостижимы со стороны входа объекта. Одна пара возможных мо- Рассмотрим следующую М1МО-модель пространства состояний, имею- шую т входов и р выходов.
делей пространства состояний имеет вид хр(т) = Архрф+ Ври(с) хе(Ф) = Архе(1) + Вди(8) у(1) = Срхр(Ф) (22.2.5) Ыг(1) = Сдхе(Ф) (22.2.6) где 0 1 0 0 В Ар —— (22.2.7) Ав=О; Вд=О; Сд=1я (22.2.8) где 1я — единичная матрица в пространстпве 112" з. Тогда расширенная модель простпранства состпояний (А, В, С, 0) может быть предстпавлена в виде С=[С, О~ (22.2.9) что приводитп к модели с шестью состояниями Затем рассчитаем усиление наблюдателя Л, выбрав шестпь полюсов наблюдателя, расположенных в точках — 5,— 6,— 7,— 8,-9 и — 10. Это можно выполнитпь, используя команду р1асе пакетпа МАТйАВ для пары матриц (А~, С~).
Далее втячислим усиление обратной связи К. Заметим, что из (22.2.4) это эквивалентно (при г(с) = 0) выражению и(1) = — [Кр Сд~ ~ ~ =ь К = [Кр 12) (22.2.10) Ь,(~)1 ~*-.()1 т. е. нужно лишь вычислить Кр. Это сделано с помощью команды р1асе пакета МАТЮКАВ для пары матриц (Ар, Вр).
Полюсы в этом случае выбраны равными — 1.5~21.32, -3 и — 5. Напомним, что два других полюса соответпствуют неуправляемым состояниям возмущения. Они находятся в начале координата. Проект проверен при использовании следующих ступенчатых эталонных сигналов и возмущений в обоих каналах: Ит( ~(1) = р(с — 10); Ит( ~(1) = р($ — 15) (22.2.11) гт(1) = р(ь — 2); гг(ь) = -1з(ь — 5); — 3 -2 0 0 1 0 0 0 0 0 — 2 2 0 0 0 0 22.2.
Обратная связь по оценке состояний 681 1 2 0 0 0 — 0.5 1 0 682 Глава 22. Проектирование через методы оптимального управления Рис. 22.1. М1МО-проект, основанный на обратной связи по оцененному состоянию где г)1 ~(4) и И1 ~(т) — первый и второй компоненты вектора входного (1) (2) возмущения соогпветстпвенно. Результат показан на рис.
22.1. Проектирование было основано на произвольном выборе полюсов наблюдагиеля и регулятора (полиномы Е(з) и Р(з) соответпсгпвенно), Таким образом, очевиднь1й треугольный характер связи парамегпров не был целью проекта. Однако выбор закона управления гарантирует, что возмущения полностью компенсируются в усгпановившемся состоянии. Файл тгто2.тп<И пакегпа Б1М1111)11К содержит схем~ое решение М1МО-коыт ура управления для этого примера. ППП Мы не будем в дальнейшем развивать идею назначения полюсов.
Вместо этого обратимся к альтернативной процедуре, которая имеет дело с М1МО-случаем, использующей методы оптимизации. Особенно хорош для проектирования матриц К и Л метод квадратичной оптимизации, потому что он дает простые решения в аналитическом виде. Детали рассматриваются в следующих разделах. 22.3. Динамическое программирование и оптимальное управление Рассмотрим нелинейную систему общего вида со входом и($) Е ))сл, описанную в форме пространства состояний — = )(х(г),и(1),г) Их(т) (22.3.1) 1.5 1 хй им ~х 8 0.5 ОИ 0 2 х н И ох 05 зо -1.5 0 2 4 8 8 10 12 14 18 18 20 Время )с) 22чс Дннамнческее протраммнрованне н оптимальное управление 683 где х(с) Е Ж", вместе со следующей задачей оптимизации: Одним из возможных путей решения этой задачи является использование динамического программирования; этот подход основывается на следующем результате.
Теорема 22.1 (Принцип оптимальности Беллмана). Если |и(г) = и'(с), ь й [ь„уу]'г — оптимальное решение предыдущей задачи, то и"(С) являетпся также и оптимальным решением для (под)интпервала [с + ссс,су], где с < с + са8 < су. Доказательство (От противного) Обозначим через х'(С) поведение состояния, возникающее в результате использованиЯ ие(с) на всем интеРвале, т. е. длл г й [ге,сУ]. Тогда мы можем описать оптимальную стоимость на интервале в виде | с.+сьс ест У(х',и с)ас+ / У(х',иеДас+ д(х (Су)) (22.3.3) с. с.+сьс Предположим теперь, чпсо существует вход й(г), такой, чтпо ест й(г) =агйшсп~/ У(х,и,С)ссс+д(х(Я)) (22.3.4) н(с) ! с.+ссс с соответствующей траекторией состпояния х(С), такой, что х(г + Ьс) = х"(1„+ Ы). Предположим тпакже, что | с, гсс У(х,й,г)дС+д(х(Фу)) < / У(х',и Дав+у(х'(8у)) (22.3.5) с.+ос с.+ос Расслсотрим теперь стпратегию использования и(г) = и" (г) на интервале [С~,С,+саС] и затем примем и(с) = й(с) на интпервале [с,т+ЬС,$у].
Суммарная стоимость на всем интпервале будет с.+ас гс/ У(хе, ие, С)дС+ / У(х, й, С)дС+ д(х(С,)) (22.3.6) с.+а, Сравнивая (22.3.3) и (22.3.6), учитывая (22.3.5), мы заключаем, что стратпегия использования и(с) = и ($) для с й [с„с + Ы) и й(г) для 684 Глава 22. Проектирование через методы оптимального управления с Е [Со+гас, Су] дастп меньигую стоимость, чем использование и(1) = ио($) на всем интервале. Однако это противоречит оптимальности и (т) на всем интервале.
ППП Далее мы будем использовать теорему 22.1, чтобы получить необходимые условия для оптимального и. Идея состоит в том, чтобы рассмотреть общий интервал времени [$,Фу], где Ф Е [то,$у] и затем использовать принцип оптимальности с бесконечно малым интервалом времени [с,с + с'.тт]. Обозначим через У'(х($),1) оптимальную (минимальную) стоимость в интервале [С,Еу] с начальным состоянием х(с): гст .7о(х(с),с) = ппп ~! ),т(х,итт)с(т+9(х(СУ)) (22.3.7) и(т) те(с,с,) Тогда, применяя теорему 22.1, мы получим Г гс+дс .Г(х(С), С) = шш ~ / р(х, ит и) г(т+ У'(х(С+ с~~),1+ гете) и(т) тй[с,с+дс] (22.3.8) Далее рассмотрим небольшие отклонения от точки (х(1),1), считая Ьс малой величиной.
Чтобы получить это, разложим У'(х(т+ Ьт), с+ Ы) в ряд Тейлора. Таким образом, мы получим ,7'(х(Ф), с) = шш(1т(х($), и($), $)с) с+ и(с) д,го(х(С),1) Гдд (х(С),С))' ,7'(х($), $) + ' сас+ ~ ' ~ [х($+ с)сс) — х(С)) + О(х,с)) (22.3.9) где С)(х,с) включает члены высоких порядков в разложении Тейлора. Если теперь положим Ы -+ Н, уравнение (22.3.9) даст — = ппп(и~(х(С),и(С),$)) (22.3.10) дУ'(х(с), с) дй и(с) где Ю(х(Ф), и($),1) = )т(х(С), и(т), т) + ~ ' ~ Г(х(т), и(С), с) (22.3.11) (д Го( (1) С)) Заметим, что мы использовали тот факт, что 1пп х(т + с.'т$) — х(С) с(х(т) дс-+о сХт ссС и выражение (22.3.1). 22.4.
Линейный квадратичный регулятор (ЛКР) 685 Оптимальное значение и(т), удовлетворяющее правой части уравнения (22.3.10), может быть выражено символически в виде о(е) тт (х( )~ ) х(е) е дх (22.3.13) которое при подстановке в (22.3.10) приводит к следующим уравнениям для оптимальной стоимости: На этой стадии мы не можем идти далее без уточнения первоначальной проблемы. Заметим также, что мы неявно предположили, что функция У'(х($), в) хорошо обусловлена, а это означает, что она непрерывна относительно своих аргументов и может быть разложена в ряд Тейлора.
Было доказано (см. ссылки в конце главы) что эти условия достаточны, чтобы (22.3.13) давало оптимальное решение. 22.4. Линейный квадратичный регулятор (ЛКР) Далее мы применим вышеупомянутую общую теорию к следующей задаче. Задача (ЛКР-задача). Рассмотрим линейную сгпационарную систе- му, имеющую модель просгпрансгпва сосгпояний следующего вида: — = Ах(~) + Ви(8) дх(г) аг у($) = Сх(т) + Ри(г) х(1,) = х, (22.4.1) (22.4.2) где х Е Жн является вектпором состояния, и Е вч™ — входом, у Е вкр— выходом, х„Е Ин — вектором состояния в момента в = г, а А,В, С и 1г — магприцы соответсгпвующих размерностей.