Пупков К.В. Методы классической и современной теории автоматического управления. Том 2 (2000) (1095389), страница 104
Текст из файла (страница 104)
положим х'=О. Качество процесса управления будем оценивать функционалом (4 28] Нз (4 29) находим ! дл к= — —, 2дхг' (4 30) и уравнение Беллмана принимает вид г г г дд !(до] х, +хг+ — хг--~ — 1 /=0 дх! 4 ( дхг ) (4 31) Будем искать решение уравнения (4.31) в виде квадратичной формы Я(х) =Сх, +Сгхгхг+Сгхг. г г Тогда дд дд — =2С,х, +Сгхг, — =С,х, +2С,х, дх, дхг Уравнение (4 31) принимает вид г г 11 г г г гз г х~ + хг -! 4Сз хг + 4СгСзх~хг + Сг х! )+ 2С~хрг 'Сгхг = О 4 Коэффициенты Сь Сг, Сг определяются из системы уравнений; 1--С =О, г 4 1-С,'+Сг =О, (4.32) 2С,-С,С,=О Система нелинейных алгебраических уравнений (4.28) имеет два вещественных решения Сг =2 Сз='/3 С! =э/3 С, =2, С, =-э/3, С, =-з/3 Эти решения в соответствии с (4 30) приводят к двум синтезирующим функциям и=-х, — /Зхг, (4.33] и= — х, + /Зхг (4 34) В результате получаем две линейные системы, причем линейная система, порождаемая функцией (4.34), окиываегся неустойчивой и, следовательно, не может обеспечить перевод фазовой точки в начало коор- динат.
Таким образом, оптимальная синтезирующая функция (оптимальная стратегия) задается равенством (4 33). На оис. 4.1 изобовжена стоткттоная схема оптимальной системы г у =)'(х, +хг+к )г(г (4 27) с Таким обриом, речь идет об определении оптимальной стратегии и = 9(хохг), которая обеспечивает перевод фазовой точки из произвольного начального состояния в начало координат, и притом так, чтобы на траекториях движения функционал (4 27) принимал наименьшее значение Вмпипгем функциональное уравнение Беллмана г г г до дс О=пил х| +хг+и + — хг+ — и| дх! дхг Так как на управляющий параметр и не наложено никаких ограничений, то для определения минимума необходимо продифференцировщь правую часть уравнения (4 28) по и 2и+ — = 0 дд (4 29] дхг 547 Глава 4.
Динамическое н о амм рвание Рис. 4.1. Структурнан схема оптимальной системы Пример 4.4. Рассмотрим простейшее уравнение х=и-х, (4 35) полагая, что на управляющий параметр и наложено ограничение (и(<1. Будем решать задачу перевода переменной х из произвольного начального значения в нуль. Как следует из (4.26), уравнение Беллмана имеет вид . ггпу -1= пнп — (и — х) Им й Оптимальное по быстродействию управление (4 36) Ж и=-мал— пт (4 37) Подставляя (4 37) в(4.36), получим уравнение по с!8 . Ж -1 = — х '5!Оп 4т цт гй (4 38) Найдем решение уравнения (4 38), полагая — > О . Из соотношения сю пт — (!+х) =1 Дб цх следует, что 5 (х) = )п (х ь 1) + С', Ж здесь С" — произвольная константа При — < 0 аналогичным обриом найдем сгх У(х) = 1и(1-х) яс" (4 40) Полагая, что равенства (4 38) и (4 40] справедливы при х=о, то в соответствии с граничным условием (4 25) С'=С"=0 Функция 8(х) задает минимальное время движения и может быть только положительной величиной Из (4.39) и (4.40) следует тогда, что 1п(х+!) при х а О, о(х) = !п(1-х) при хЯО (4 41) Оптимальное по быстродействию управление, таким образом, определяется равенством прих<0, и= -! при х>0 Ю(х) Как следует из (4 41), производная — имеет разрыв в точке х = О.
Это ставит под сомнение спрайт велливость функционального уравнения Беллмана (4.38). Однако, поскольку в оптимальном движении переменная х(г) не изменястзнак, функцию 8(х) можно отдельно рассматривать при х > 0 и при х< О, а в каждой из этих областей функция 8(х) является непрерывно дифференцируемой Это позволяет за- ключить о справедливости равенства (4 4! ).
Во избежание недоразумений отметим, что целью настоящего примера является не демонстрация того, как с помощью динамического программирования можно осуществлять синтез оптимального по быстро- 548 Методы тес ив оптимального п авления. Часть!Н 4.3.2. НЕАВТОНОМНАЯ СИСТЕМА рассмотрим неавтономную систему уравнений Ы~; — '= Г,'(хпхз,...,х„,и,,из,...,и,!), 7'=1,л. (4.42) Й Будем, далее, предполагать, что подынтегральная функция функционала также зависит от времени 7, т.е. 7' .l = ) ьг(Х„ХЗ,..., Х„, и„и„...,и,г) Й. (4.43) зо По-прежнему рассматривается задача о нахождении управления, задаваемого в виде оптимальной стратегии, которое осушествляет перевод фазовой точки х=(х7,хз,...,х„) системы (4.42) из заданного, но любого начального состояния, в некоторую заданную точку х' = (хз",...,х„') так, чтобы функционал (4.43) принимал наименьшее значение. При этом начальный момент времени го предполагается фиксированным.
Однако, в соответствии с формализмом динамического программирования, начальный момент времени 7, хотя и считается заданной, но может быть любой величиной. Относительно конечного момента времени Т будем предполагать, что он не задан, а опРеделЯетсЯ из УсловиЯ пРохождениЯ тРаектоРии х(7), го < 7 < Т, чеРез точку х, т.е.
х(Т) = х . Воспользуемся рассмотренным в параграфе 2.2 способом сведения неавтономной задачи оптимального управления к автономной. Запишем уравнения (4.42) в векторной форме — = Г(х,и,7), и'х Й здесь х =(хп...,хл) и Г мЯ,..., Г'„) — и мерные векторы, и =(ип...,им) — имерный вектор. Присоединим к уравнениям (4.43) уравнение Ан.! = 1 " +7 (го ) = го Й Из(4.45) следует, что х„„(7)=7. Неавтономная задача оптимального управления (4.42), (4.43), таким образом, сводится к автономной задаче для'системы дифференциальных уравнений гГх — = Г(х,ц,х„„)„ ли Й (4.45) (4.46) и функционала вида .У=) ьг(х,и,х,„7)Й. (4.47) га Так как конечный момент времени Т не фиксирован, то на конечное значение коор- действию управления, а желание показать, что предположение о непрерывной дифференцируемости функции о(л) является вес~ма существенным ограничением метода динамического программирования, когда он применяется лля непрерывных процессов.
Этот пример также показывает, что двя синтеза опти- мального по быстродействию управления целесообразна использовать принцип максимума Понтрягина Глава 4. Динамическое и о амми ование 549 Задача оптимального управления (4.46),(4.47) по терминологии главы 2 является задачей с закрепленным левым и подвижным правым концами траектории.
Это обстоятельство, как легко видеть, не оказывает никакого влияния на вывод функционального уравнения Беллмана, а находит свое отражение лишь в изменении граничного условия. В соответствии с (4.24) для задачи (4.46), (4.47) функциональное уравнение Беллмана имеет вид д5 дб О = пни "б(х,ц,хьы)+ — 1'(х,и,х„„)+ — 1, (4.48) здесь 4.4.. ЗАДАЧА ОБ АНАЛИТИЧЕСКОМ КОНСТРУИРОВАНИИ РЕГУЛЯТОРА Задача синтеза для линейных обьектов управления, минимизирующего квадратичный критерий, называется задачей об аналитическом конструировании регуляторов.
В этом случае оптимальный закон управления является линейным. Таким образом, задачу об аналитическом конструировании регуляторов можно рассматривать как метод синтеза линейных систем. 4.4.1. АВТОНОМНЫЙ СЛУЧАЙ Рассмотрим автономный линейный объект управления — =Ах+Вв, дх (4.5 1) дг здесь А и  — постоянные матрицы, имеющие размерность соответственно пхп, пхт, в=(и„и„...,и ) — т-мерный вектор управления, х=(х,,хз,...,х„) и-мерный вектор состояния.
Векторы и и х рассматриваются как векторы-столбцы. Будем искать управление, минимизирующее функционал З= — )(х Ох+в Ки)ад 2о (4.52) — матрица-строка. Поскольку х„„= г, то уравнение (4.48) можно переписать в виде д5 дЗ вЂ” — = ш(п~б(х,в,г)»- — Т(х,п,г) . (4.49) дг ч.о дх К уравнению (4.49) следует добавить граничное условие .9(х*,Т)= О. (4.50) Так как хьм(Т)= Т может быть любой величиной, то условие (4.50) должно иметь место для любого Т. Последний результат нуждается в пояснении. Введем (п+1)-мерное фазовое пространство Х с декартовыми координатами хпхы...,х„,г.
Обозначим П прямую линию, проходящую в пространстве Х через точку (х, 0) параллельно оси к Граничное условие (4.50) заключается в следующем; функция о (х,г) должна обращаться в нуль в каждой точке прямой П. Это возможно, очевидно, только в том случае, когда функ- ЦИЯ о'(Х,Г) ПРИ Х=Х НЕЗаанентатк Если конечный момент времени Т фнксирован,,то граничное условие по- прежнему задается равенством (4.50), в котором Ттеперь — заданная величина. 550 Методы тес ии оптимального п авления. Часть Ш вЂ” ~в~Кв~=2в К, Й~ — — Ви = — В.
В результате получим уравнение т и К+ — В=О. дх Из уравнения (4.52) находим, что и = — — В К т с(5 дх (4.54) и= — — В К ' (4.55) Используя известное матричное тождество (С.М) =М С, равенство (4.55) пет репишем в виде где С4 и К вЂ” постоянные матрицы, имеющие соответственно размерности пхп и якт. Матрица (г предполагается неотрицательно определенной, а матрица К вЂ” положительно определенной. Пусть, далее, на вектор и не наложено ограничений, т.е. он может быть любым. Матрица чг называется неотрицательно определенной, если для любого вектора х и 0 х Сгх > О.
Матрица К называется положительно определенной, если для лют бого вектора и и 0 и Ки > О. Матрица С называется симметрической, если т С = С . В соответствии с критерием Сильвестра (34), для того чтобы симметрит ческая матрица К была положительно определенной, необходимо и достаточно, чтобы все ее ведущие главные миноры были положительны. Ведущим главным минором порядка й называют определитель, составленный из элементов матрицы К, стоящих на пересечении первых к строк и первых к столбцов.
С помощью матриц Я и К в равенстве (4.52) заданы квадратичные формы х~Ях и итКи . Поскольку любую квадратичную форму можно задать с помощью симметрической матрицы, будем полагать, что матрицы Сг и К симметрические. В сформулированной задаче условия на правый конец траектории не налагаются. Однако функционал (4.52) может быть конечным лишь в том случае, если х(г) -ь О при Г-+ьз Минимальное значение функционала (4.52) однозначно определяется начальным значением вектора х.
Обозначим минимальное значение функционала Я(х) . Хотя в рассматриваемой задаче оптимального управления правый конец траектории свободен, приведенный в параграфе 4.3 вывод уравнения (4.24) сохраняет свою силу, т.е. для рассматриваемой задачи функциональное уравнение Беллмана задается равенством (4.24).
Таким образом, уравнение Беллмана имеет вид О=шш — х Ях+ — и Кц+ — (Ахч-Ви) . (4.53) ,~(т ) т ЖВ ° ~2 2 д Найдем уравнение, минимизирующее правую часть уравнения (4.53). Для этого продифференцируем правую часть по и и приравняем полученную производную к нулю. Справедливы следующие формальные правила дифференцирования по вектору и: Глава 4. Динамическое п о амм ование 551 хт хт ) — х Кх+ — ВК Кй В ~ — ~ + — Ах-ВК В ~ — ~ =О, т 1 ~(5 -1 -~ т по по -1 т 2 2с1х (.Ых Их~ ~Ь или т 1по -~ т(~)™ — х Кх- — — ВК В вЂ” ) + — Ах=О.