Г.К. Гудвин - Проектирование систем управления (1054010), страница 114
Текст из файла (страница 114)
Связь с технологией назначения полюсов 697 Пример 22.3. Рассмотрим .гнультиперемеппую систему разгнерно- стью 2 х 2, имеющую модель пространства состояний 2 — 1 О; В А,= [ ~1О О1 1О 1 О1 ' (22.8.6) Чтобы проиллюстрировать применение этого преобразования, возьмем представление в форме преобразований Лапласа (22.2.1) зХ(з) = А Х(в) + В У(в) (22.8.2) в то время как в о-форме это же выражение ьХ(ь) = (А + ст1)Х(о) + ВоУ(о) = Ао'Х(о) + ВоУ(о) (22.8.3) Следовательно, если полюсы замкнутого контура находятся в ЛПП ь-плоскости, они будут левее ст в в-плоскости.
Заметим однако, что эта процедура сама по себе не вызывает никакого изменения в демпфировании полюсов. Это — хороший пример операции, которая гарантирует конкретное конструируемое свойство (вещественная часть полюсов замкнутого контура находится левее от заданной области), но не говорит ничего относительно связанного с этим свойства демпфирования. Несколько более интересное требование — чтобы полюсы замкнутого контура лежали внутри круга с радиусом р и, центром в ( — ст,О) при ст > р > О, т. е.
в круге, полностью находящемся в пределах ЛПП. Это может быть получено с помощью двухступенчатой процедуры: 1) Сначала мы преобразуем переменную Лапласа в в новую переменную ~, определенную следующим образом: (22.8.4) Р Это преобразует исходный круг в в-плоскости в единичный круг в г,-плоскости, Соответствующая преобразованная модель пространства состояний имеет вид ~Х(~) = — (ст1+А )Х(~)+ — В У(~) (2285) 1 1 Р Р 2) Далее обращаемся к (22.8.5) как к описанию пространства состояний дискретной системы. Таким образом, решение соответствующей дискретной оптимальной задачи управления дает усиление обратной связи К, такое, что 1 (сг1+ А — В К) содержит собственные значения внутри единичного круга.
Это в свою очередь подразумевает, что если тот же самый закон управления применяется к непрерывному времени, полюсы замкнутого контура будут располагаться в исходном круге в в-плоскости. 898 Глава 22. Проектирование через методы оптимального управления Решение Используем подход, предложенный выше: преобразуем комплексную переменную з согласно (22.8.4) и загнем решим дискрегпную задачу оптимального регулятора. Сначала нужно предсгпавить пространсгпво состояний в преобразованном просгиранстве.
Это выполняется с помощью уравнения (22.8.5), которое дает 1 1 Ас = -(ст1+ Ао) и Вс = -Во (22.8.7) Р Р Для получения оптпимального усиления Кс используетсл команда сйт7г пакегпа МАТЮКАВ с весовыми матрицами Ф = 1з и т1г = 1з, что дает ~7.00 — 4.58 7.73 ~ С= ~318 702 410 (22.8.8) Когда это оптимальное усиление используется в исходной непрерывной системе, полюсы замхнугпого контура, вычисленные из уравненил де~(з1 — Ао+ В Кс) = О, Расположены в гпочках -5.13, — 5.45 и -5.59. Все эти полюсы лежат в предписанной области, хак и ожидалось.
ППП Заметим, что вышеупомянутые идеи могут быть расширены на другие случаи, в которых желаемая область может быть преобразована в область устойчивости для непрерывного или дискретного случая посредством подходящего рационального преобразования. Предлагаем читателю исследовать другие возможности. 22.9. Проектирование наблюдателя Далее мы рассмотрим задачу оценки состояния. Здесь мы ищем матрицу Л Е м""", такую, что А — ЛС имеет собственные значения внутри области устойчивости.
Снова удобно использовать квадратичную оптимизацию. Как первый шаг, заметим, что наблюдатель можно разработать для пары (С,А), просто рассматривая эквивалентную (называемую дуаль- Нужно найти матрицу К усилений обратной связи по переменным состпояния, такую, чтпо все полюсы замкнутого контура расположены в круге в центром в ( — сц0) и радиусом р, где ст = 6 и р = 2. 22.10. Линейные оптимальные фильтры 699 ной) задачу управления для пары (А,В).
Чтобы проиллюстрировать, как это сделать, рассмотрим дуальиую систему с А~ =Ат ВР=СТ (22.9.1) Тогда, используя любой метод для проектирования обратной связи по состоянию, мы можем найти матрицу К' Е ЖР"", такую, что А' — В'К' имеет собственные значения внутри области устойчивости. Следовательно, если выбрать Л = (К')т, то мы гарантируем, что А — ЛС имеет собственные значения внутри области устойчивости. Таким образом, мы завершили проектирование наблюдателя.
Процедура приводит к оценке устойчивого состояния в виде хлЯ = АохЯ+ Вои(8) + Л(у(Ф) — Сх(Ф)) (22.9.2) Конечно, при использовании описанных выше приемов для обратной связи по переменным состояния можно также применять и приемы преобразования, чтобы гарантировать, что полюсы наблюдателя размещаются в любой области, которая может быть связана или с непрерывным, или с дискретным случаем рационального преобразования. Мы покажем, как вышеупомянутая процедура может быть формализована, используя теорию оптимальной фильтрации. Полученный оптимальный фильтр называется фильтром Калмана, в честь плодотворного вклада Калмана в эту проблему. 22.10.
Линейные оптимальные фильтры Мы рассмотрим два альтернативных подхода к оптимальным фильтрам — один, основанный на вероятностном моделировании шума (разд. 22.10.1) и другой, основанный на детерминированных предположениях (разд. 22.10.2). Читатели могут выбрать или любой из этих подходов, или оба в зависимости от точки зрения, которую они желают использовать.
22.10.1. Подход, основанный на вероятностной модели шума В этом разделе мы покажем, как проектирование оптимального фильтра может быть основано на задаче квадратичной оптимизации. Она показывает, что фильтр является оптимальным при некоторых предположениях относительно механизма формирования сигнала. На практике это свойство, вероятно, менее важно, чем наличие у сформированного фильтра средстве настройки, которые позволяют гибко применять его для большого диапазона практических задач.
Однако читатель должен 700 Глава 22. Проектирование через методы оптимального управления г1х(1) = Ахай+ йод Ну(т) = Сх(т)аз+ й~(т) (22.10.1) (22.10.2) где Ии(т) и йо(т) известны как орптогональные приращения процессов. Поскольку формальное обращение с вероятностными дифференциальными уравнениями вне возможностей этой книги, мы ограничимся здесь формальным обозначением через то(1) и и($) процессов белого шума с импульсной корреляцией: б~т5(1)т5(~)т) = Цб(1 Д Е(б(1) „. (~) т) (22.10.3) (22.10.4) где Е1о) обозначает математическое ожидание, а Б(о) — дельта-функция Дирака.
Мы можем тогда неформально записать модель (22.10.1)— (22.10.2) в виде — = Ах(1)+— тЬ(1) йо(1) ат т1т р'(т) = — = Сх(т) +— ~д(~) ~1и(~) ах тй' (22.10.5) (22.10.6) Предположим также, что то(з) и 0(т) взаимно некоррелированы. Для читателей, знакомых с понятием спектральной плотности для случайных процессов, мы просто требуем, чтобы спектральные плотности для то(8) и 0(Ф) были С~ и В. соответственно. Наша цель будет состоять в том, чтобы найти линейный фильтр, управляющий параметром тГ'(Ф), который формирует оценку состояния х(т). Оптимизируем фильтр, минимизируя квадратичную функцию ,у, = г(х(т)х(у)т1 (22.10.7) где х(с) = х(т) — х(т) (22.10.8) является ошибкой оценки. Выполним решение этой задачи в четыре шага.
понять, что это и есть основная идея фильтра Кэлмана; это, возможно, один из наиболее ценных инсптррлтенптов проектировщика систем управления. Рассмотрим линейную вероятностную систему вида 22.10. Линейные оптимальные фильтры 701 Шаг ! Рассмотрим нестационарный вариант модели (22.10.5), имеющей вид — = Аи($)х(!) + т5,(Ф) <Ь,(ь) й у!(!) = — ' = Се(!)хе(!) + о. (!) Иу (ь) сп (22.10.10) где т5,(!) и 6,(!) имеют нулевое среднее значение и они некоррелированы, а также Е(т5,(!)т5Д)~) = Ц,(!)5(! — ~) Е(т1,(!)с,((')~) = 11 (!)5(а- ~) (22.10.11) (22.10.12) Для этой модели мы хотим вычислить Р(!) = Е(х,(Ф)х,(1)т).
Предположим, что Е(х,(0)х,(0)т1 = Р, где параметр тй,(!) некоррелирован с начальным состоянием х,(0) = х,. Решение Решение для (22.10.9) имеет вид гт х,(!) = ф,(1,0)х„+ / ф,(г,т)от,(т)т1т (22.10.13) А где ф,(8г,!д) Е Жп"и — переходная матрица состояния для системы (22.10.9). Тогда, взяв квадрат (22.10.13) и вычислив математические ожидания, получим /Ф Р(!) = Е(х,(!)х,(!)~) = фЯО)РофЯО) + / ф,(Гтт)С)е(т)ф,(! т) йт А (22.10.14) где мы использовали (22.10,11).
Заметим, что, применяя правило Лейбница (3.7.4) к (22.10.14), пол чим У вЂ” = АиР(Ф) + Р(Ф)Ае~+ Щ1) (22.10.15) <1 где мы также использовали тот факт, что — ф($,т) = А Яф(Ф,т). й Шаг 2 Вернемся опять к первоначальной задаче: получить оценку х(1) для состояния х($) в (22.10.5). Допустим, что фильтр имеет следующую линейную форму: = Ах(8) + Л(Ф) [у'(Ф) — Сх(!)) (22.10.16) 702 Глава 22.
Проектирование через методы оптимального управления Шаг 3 Предположим, что мы также имеем оценку начального состояния х, статистической характеристики Е((х(0) — х,) (х(0) — хо)~) = Р„, (22.10.17) и временно предположим, что имеем усиление Л(т) для 0 < т < 1. Получим выражение для Р($) = Е((х($) — х(1))(х(1) — х(ь)) =Е(х(в)х(в) ) (22.10.18) Реатение Вычитая (22.10.16) из (22.10.5), получим — = (А — Л($)С)х(й) +Л(т)и(ь) — то(Ф) тБ(~) тй (22.10.19) Мы видим, что (22.10.19) — нестационарная система и позтому можем сразу же применить решение шага 1 после выполнения следующих подстановок: х,(й) -+ х(й); АвЯ вЂ” + (А — Л(й)С); пт,(й) -+ Л(й)6($) — ттт(й) (22.