Пупков К.В. Методы классической и современной теории автоматического управления. Том 2 (2000) (1095389), страница 118
Текст из файла (страница 118)
120) Х, х Х, х„ В, Вз 0 0 А11 А11 Ам Ап А14 Ам А14 Ам Аз4 А44 Х, Хь Х, х Х, =(О С, О С,)(Х„Х„Х, Х,). 41* для которой рассчитаем сходящийся фильтр Калмана (39): с(Х(г) = А(г) Х(г) + К (г) (4. (4) -С(г) Х(г)); (5.119) К(г) =Р(г)С(г)В '(!); аР(г) 48 А(г)Р(г)+Р(г)А (!) Р(г)С(г)В-~(г)Сс(!)Р(!)+В(г)9(!)В (!)! (5121) Р(О) = Р„ (5.122) где Х(г)- оптимальная по Калману оценка вектора состояния системы (5.118); К(!)- матрица коэффициентов оптимального фильтра Калмана, вычисляемая по формулам (5.120), (5.121), (5.122); Рс =(Р 4)(1~' = 1,л- заданное исходное значение дисперсионной матрицы (матрицы ковариацнй); Р(г) — ошибки оценивания Х(4) = Х(г) — Х(г): РИ =! Рь (1)) — = М( Х(4) Хт (4)~; (5.123) здесь М вЂ” символ операции математического ожидания. Как видно из выражения (5.123), диагональные элементы матрицы Р(1) прелставляют собой дисперсии ошибок оценнвания фильтром соответствующих координат вектора состояния.
Если в процессе работы фильтра окажется, что в установив- ШЕМСЯ РЕЖИМЕ 1-й ДИаГОНаЛЬНЫй ЭЛЕМЕНТ Р„(ьс) УМЕНЬШИЛСЯ В СРаВНЕНИИ С ЕГО ИС- ходным значением Р„(0) на 50% и более, то система (5.118) и исходная система хорошо наблюдаема по ь-й координате, т.к. из теории оптимальной фильтрации известно, что фильтр Калмана работоспособен только при наличии свойства наблюдаемости системы, для которой он строится. Обеспечить сходимость процедуры (5.119)— (5.122) в данном случае достаточно просто ввиду того, что все ее параметры известны точно.
Выше были введены понятия управляемости и наблюдаемостн, В (22] рассмотрены вопросы декомпозиции систем; показано, что многомерная система может быть декомпозирована на четыре подсистемы: управляемую и ненаблюдаемую 51, управляемую и наблюдаемую 51, неуправляемую и ненаблюдаемую оз, неуправляемую и наблюдаемую 54 .
Управление системы можно записать следующим образом (рнс. 5.26) 628 Методы тео ни оптимального п авления. х1асть111 Рис. 5дб. Структуриаи схема системы, декомиозирооаииоа ие четыре иодсиетемы 6.8. НЕКОТОРЫЕ ПОДХОДЫ К СИНТЕЗУ ОПТИМАЛЬНЫХ СИСТЕМ, РАБОТАЮЩИХ ПО ПРИНЦИПУ ОБРАТНОЙ СВЯЗИ Напомним некоторые определения, связанные с проблемой синтеза систем с оптимальными обратными связями.
Вектор-функцию 0 (г), зависящую от г, называют апти иальным программным (временным) управлением. Системы, в которых аплпьиальное управление 0 (Г) является функцией времени, называют системами программного управления, или незамкнутыми системами, или системами без обратной связи. Траектория Х (г), являющаяся решением уравнения объекта при 11(г)= 0 (г), ~ азываетсл программной траекторией или оптимальной программой.
Ветор-функцию 0 (г,Х(г)), зависящую от вектора Х(г), называют коорди- нотным управлением, или законом управления. Закон управления 11 (г, Х(г)) физически выражает известный принцип обратной связи, согласно которому величина упраачяющего воздействия опредгляетсл на основании измерения текущего состояния системы Х(г) . Сравним две линейные системы, представленные на рис.
5.27 и рис. 5.28. На рис. 5.27 представлена разомкнутая система; такой класс систем может быть реализован, если: ° известна с достаточной степенью точности математическая модель объекта управления; ° объект не подвергается воздействию случайных возмущений; о все каналы связи управляющей системы и объекта защищены от каких-либо случайных влияний; ° известны и точно реализуются начальное Х и конечное Х состояния; ° точно реализуется программное управление 11 (г) . 629 Глава 5. Методы математического п о амми ования Системы этого класса в большинстве случаев неработоспособны. В самом деле, при создании систем приходится допускать некоторую погрешность, обусловленную, например, ограниченной точностью изготовления нх компонент.
Динамические характеристики могут меняться со временем из-за старения, изменения температурных условий, атмосферных явлений и т.п. Это приводит к неточности задания динамических характеристик, а последние определяют вектор-функцию П (г) . Кроме того, имеют место внешние возмущения, которые часто не подлежат контролю и не могут быть скомпенсированы. Для некоторых систем, когда, например, неизвестно конечное состояние (задача о перехвате цели), вообще невозможно построить системы программного управления. Поэтому трудно представить процесс управления без обратной связи, который бы имел сколько-нибудь существенное значение. Входи данны Х,Х Рнв 5.27.
Структурная схема разомкнутой системы Процесс управления с обратной связью (сьь рис, 5.28) наблюдается везде; в живых организмах, в социальных, экономических, хорошо работающих технических системах. Однако синтез систем, работающих по принципу обратной связи, представляет собой чрезвычайно сложную задачу.
Изложим некоторые подходы к ее решению, т.е. рассмотрим задачу синтеза аптпмальных обратных связей. Рис. 5.28. Структурная схема оптимальной системы, работающей по прнипипу обратной связи Первый подход состоит в том, что для решения поставленной задачи используются методы, позволяющие сразу же рассчитать координатное управление и, таким образом, реализовать управление объектом по принципу обратной связи.
К таким методам можно отнести: ° метод динамического программирования; ° метод решения линейно-квадратичных задач; о метод моментов. Второй подход основан на использовании понятия двухэтапнай анптизааацпн Вяз Методы тео ии оптимального авления. Часть Н1 630 Выше были подробно рассмотрены методы расчета оптимальных программных управлений 1) (г) и оптимальных программ Х (г). Расчет 1) (г) и Х*(г) представляет собой первый этап решения задачи синтеза оптимальных систем. Пусть Х (г) — оптимальная программа, 1) (г) — оптимальное управление. Полагая, что эквивалентные случайные возмущения малы, можно предполагать, что Х (г) получит некоторое приращение ЬХ (г); тогда реальная фазовая траектория имеет вгщ Х(г)=Х (г)+8Х(г). [5.124) Для компенсации ЬХ(г) реальная управляющая вектор-функция 1)(г) должна иметь внд [38) и(г) =и'(г)+бы(г).
(5. 125) х, г Рнс. 5д9. Струатурнан схема оптимальной системы, работаюпгей по принципу обратной спнзи Структурная схема системы, построенная с использованием двухэтапной оптимизации, представлена на рис. 5.29. В последующих параграфах основное внимание будет уделено методам реализации схемы двухэтапной оптимизации.
Задача расчета 8ЩГ, Х) носит название задачи проектирования оператора обрагнной связи н составляет содержание второго этапа. Таким образом, на втором этапе определяются параметры системы, обеспечивающей максимально возможную точность достижения цели. Эта схема решения проблемы управления носит название двух»таиной олгпимизатуии. Как указано в работе академика Н.Н. Моисеева [381, «схема двухэтапной оптимизации, разделяющая процесс управления на два последовательных этапа — выбор программы н построение механизма реализации этой программы, — является одним из важных эвристических приемов современной теории управления.
Он в равной степени необходим и для управления техническими и технологическими, где он возник, и для управления социальными и экономическими системами, где он сделался основой программного метода управления». В [38) приведено обоснование возможности использования идей двухэтапной оптимизации для решения конкретных задач. Глава 5. Методы математического п о амми ования 631 6.9. СИНТЕЗ ОПТИМАЛЬНЫХ ОБРАТНЫХ СВЯЗЕЙ Выше был рассмотрен вопрос синтеза линейных систем по интегральному квадратичному критерию. Принципиальным фактором при решении линейно- квадратичных задач является возможность синтезировать системы, работающие по принципу обратной связи.
Эти результаты можно использовать для синтеза оптимальных нелинейных систем, работающих по принципу обратной связи. Далее изложим алгоритм решения этой задачи [44, 49]. 6.9.1. РАСЧЕТ ОПТИМАЛЬНОЙ ПРОГРАММНОЙ ТРАЕКТОРИИ, ИСХОДЯЩЕЙ ИЗ НАЧАЛЬНОГО СОСТОЯНИЯ Х[0) = Х Пусть нелинейный объект описывается векторно-матричным дифференциальным уравнением Х(0) = Х' [5.! 26) с критерием оптимальности /= И (ХИ)ь$МХИ,П(г))г/г.
[5.127) 6.9.2. ЛИНЕАРИЗАЦИЯ В ОКРЕСТНОСТИ ОПТИМАЛЬНОЙ ПРОГРАММЫ Х (г) и пРОГРАммнОГО упРАВления !) (г) Для вариации функционала путем разложения выражения [5.127) в ряд Тейлора в окрестности Х (г) и П (г) можно получить зависимость б/=(д8о~дх))гбх(Т)+1/2бх~(Т)(д 8о дхг1 бх(Т)- г -3~(Т)бх(Т)+)~(0)бх(0)+фдН/ди)~ биь о +1/2би (д Н/ди 1 би+(дН/дх)' бх+1/2бх (д Н/дх гмбх+ +бхт(дзН/дяди ~ би+(сг)т/г/г )бх) г/г, где бх = х - х', би = и - и', Н = /о ь 3 г г . Положим, что Х' (г) и !1' (г) удовлетворяют необходимым условиям оптимальности первого порядка [49) дН/ди =О,ой. /г/г=-(дН/дх)1,). (Т)=(дно/дх(Т))~, [5.129) причем предполагается, что Х(0) = Х задано (Х(0) = Х (О)), а Х(Т) свободно.
В этом случае Х (г) и П (г) определяют оптимальную программу и оптимальную траекторию. Тогда выражение [5.128) принимает вид о Для решения этой задачи можно применять методы математического программирования, подробно рассмотренные выше и не использующие непосредственно аналитический аппарат принципа максимума. Вместе с тем разработано большое число алгоритмов, основу которых составляет совокупность необходимых условий оптимальности.
Выбор того или другого алгоритма расчета оптимальной программы Х (г) определяется конкретным содержанием задачи. 632 Методы тео ии оптимального и авления. Часть П1 гг Ь/ =) ~1/2бп~(д Н/дп~)] бн+Ьх (д Н/дхдц~ Ьв+ о (5.130) +1/2бхт(д~Н/дхг)] бх]!/!+1/2бх (Т)(дзб/дх ]] Ьх(Т). вт Учитывая свойство нелинейности объекта, оптимальная программа Х (!) и оптимальное программное управление 1/ (!) рассчитываются для каждого начального состояния Х(0) = Х . Для решения этой задачи можно применить линеаризацию уравнения (5.!26) в окрестности Х (!) и 11 (!) при Х(0)= Х . В результате будет иметь место уравнение в вариациях для возму!ценного движения (1, 49].