Пупков К.В. Методы классической и современной теории автоматического управления. Том 2 (2000) (1095389), страница 101
Текст из файла (страница 101)
3. ! 3. Остановимся на способе определения запаздывания т. Известно, что для рассматриваемого объекта поверхность переключения представляет собой совокупность идущих в начало координат оптимальных траекторий, на которых допускается одно переключение управления. С другой стороны, в релейной системе (необязательно оптимальной) движение по поверхности переключения возможно в скользящем режиме. Так как оптимальная поверхность переключения состоит из траекторий движения, то ее можно рассматривать как предельную поверхность скольжения. Значение запаздывания т будем выбирать так, чтобы поверхность переключения, реализующая закон управления (3.59), также была предельной (в рамках заданной структуры) поверхностью скольжения. Это является косвенным критерием близости по- Глава 3.
Оптимальные по быс одействию САУ 533 верхности переключения, входящей в закон (3.59), к строго оптимальной поверхности. При таком выборе т траектории, порождаемые законом (3.59), имеют характер строго оптимальных: фазовая точка объекта сначала выводится на поверхность переключения, а затем по поверхности переключения переводится в начало координат. В соответствии с работой [7] на поверхности переключения 1 уз+узт-<р У2+ — (у,-У2)т =О, Т2 (3.60) условия существования скользящего режима задаются неравенствами — ~уз + узт — фр + — (у) — У2)т дг~ ~ т, )'3 + У22 — т „У2 + Ь У2)т с((~ ~ Т >О, а=я <О. Выполнив дифференцирование, получим соотношения д(рт 1 1- — у + — у, — — 1 — — (у, -уз)- — — (А-у,)>0, Т2 т2 дз т2 Т2 дз Т2 т) с дпр т ! '- — у'2+ — У( — — ~1- — ~ — (У) -у,) ч.— — (А+У)) Т2~ Т2 дз~ Т2)Т2 дг Т2 Т) (3.61) где 1 2=уз+ (У) У2).
Т2 Отметим, что неравенства (3.6!) должны выполняться в каждой точке поверхности (3.60). Так как запаздывание т входит в условия существования скользящего режима (3.61), то для определения предельной поверхности скольжения необходимо найти такое запаздывание т~, любое малое изменение которого приводит к срыву скользящего режима движения. Обозначим левую часть соотношений (3.61) И'(у),уз,и,т) (для статического объ- и у2 изменяются в пределах -А<у <А, — А<уз <А.
Область, выделяемую неравенствами (3.63), обозначим 0. Пусть !!(2) = пнп И'(упуз,т, А), (л утмп Я (т) = шах И'(упуз,т,-А) . (у~.уи мп (3.63) Нетрудно видеть, что Р (т) =-Л(т). Величина запаздывания т, при которой поверхность (3.60) является предельной поверхностью скольжения, удовлетворяет уравнению Я(т~) = 0 . екта координата уз также входит в условия существования скользящего режима; при определении функции И'(у(,уз,и,т) ее необходимо выразить из уравнения (3.60) через у, и у2 ). Из перелаточной функции объекта следует, что фазовые переменные у, Методы тес ии оптимального п авления.
Часть !П 534 На рис. 3.14 изображен график функции )!(т) при Т, = 0,02, Тз =1, А =1. Так как дср/дз=О в точке а=О, то при я =0 неравенства (3.61) не зависят от знака управления. Для соответствующих у,, уз, как непосредственно следует из (3.61) и (3.62), левые части соотношений (3.61) при любом т равны нулю. Этим и объясняется наличие на графике функции В(т) участка, лежащего на оси т. л 0,5 0 0,01 0,02 т, с Рнс.
3.14. График функнии Л(с) Другой способ определения запаздывания т основывается на приравнивании площадей криволинейного треугольника ас! и шзямоугольника асс!Ь (см. рис. 3.!3). Легко убедиться, что запаздывание т, если его определять указанным способом, равно Т1 . Более того, если дополнительная система состоит из 1г апериодических звеньев, включенных последовательно и имеющих постоянные времени Т,, Т~, ..., Т„, то запаздывание т = Т, +Тз+...+Т, .
Отметим, что лля рассматриваемого объекта оба способа дают примерно одинаковый результат. На рис. 3.! 5 изображена осциллограмма отработки системой (с законом управления (3.59)) начального рассогласования по координате уз. Из рисунка видно, что координата у,(г) имеет два излома, что соответствует двум переключениям управления. Длительность переходного процесса при этом практически не отличается от строго оптимальной. Исследование на ЭЦВМ закона управления (3.59) при различных значениях постоянных времени Т, и Т, показывает, что указанный подход можно успешно использовать при разносе постоянных времени в пять и более раз. 0.5 -0,5 -00 0 0, 00 05 (ое Рас. ЗЛ5. Графики сигналов Глава 3.
Оптимальные по быс одействию САУ 535 Изложенный на конкретном примере способ учета при синтезе оптимального управления малых постоянных времени практически без изменений переносится на случай любой базовой передаточной функции, а также на случай любого порядка вспомогательной системы.
При этом, упреждая координаты объекта, можно использовать такое число членов ряда Тейлора, которое соответствует порядку вспомогательной системы. Это позволяет включить в закон управления все фазовые координаты объекта. Если прн формировании упреждения используются !с членов ряда Тейлора, то такое упреждение будем называть упреждением ус -го порядка. На рис.
3.1б изображена структурная схема объекта, у которого базовая передаточная функция остайтся прежней, т.е. Т, «Т2, Т, «Т2 . Воспользовавшись для упреждения координат двумя членами ряда Тейлора, по аналогии с действиями, проведенными выше, получим закон управления 1! т ~ 1 и =-А 5!8П УЗ +У22 ь — !У! У2) ср У2+ !2! У2)т+ 2 Т, ' 2 ~ Т, 2 ТТ ~ ~ ТТ У 2 Запаздывание т определим рассмотренными выше способами. Необходимо только иметь в виду, что не всегда выбором т можно обеспечить существование скользящего режима на всей поверхности переключения. На практике существование скользящего режима на всей поверхности переключения, вообще говоря, не требуется.
Рнс. 3.16. Структурная схема объекта Если дополнительная система состоит из апериодических звеньев, как на рис. 3.!6, то вместо упреждения !с -го порядка можно использовать ус упреждений первого порядка. Сначала учитывается только одно апернодическое звено. С помощью упреждения первого порядка для такой системы строится оптимальный закон управления.
Этот закон затем рассматривается как базовый для новой системы, в которую включается другое апериодическое звено, и т.д. На рис. 3.17 изображена осциллограмма отработки системой четвертого порядка ( То = 0,01, Т, = 0,02) начального рассогласования. Оптимальный закон управления строился путем двукратного применения упреждения первого порядка. Следует отметить, что получаемый таким образом закон управления оказывается более близким к оптимальному, чем закон управления (З.б4).
На рис. 3.18 изображена осциллограмма отработки начального рассогласования оптимальной системой, базовая передаточная функция которой совпадает с рассмотренной выше, а вспомогательная представляет собой колебательное звено с параметрами Т=0,02!с), Ц=0,5. При построении оптимального закона управления было использовано упреждение второго порядка. Если передаточная функция объекта содержит колебательное или консервативное звено, то, как известно, оптимальные траектории образуют только часть поверхности 536 Методы тес ни оптимального п авления. Часть1П переключения.
В этом случае при выборе времени запаздывания т по первому способу необходимо ориентироваться именно на эту часть поверхности. 9с ил -со о ол со ьо Фс Рис. 3.17. Графика сигналов Хяэ 0,8 32 0,4 16 -16 -0,4 32 0,8 -1,2 -48 0 0,5 1,0 1,5 г,с Рнс. З.18. Графики сигналов Описанный выше прием приближенного учйта малых постоянных времени может эффективно использоваться и в более сложных задачах оптимального управления, например, если требуется построить оптимальный закон управления при наличии ограничений на фазовый вектор системы или при синтезе оптимального управления для объекта с ограничителями и т,п. Необходимо, однако, иметь в виду, что в задачах с ограничениями на фазовый вектор системы указанный приам приводит к небольшому смешению граничного участка оптимальной траектории.
Это может вызвать, в конечном счете, нарушение (правда, незначительное) заданных ограничений. С практической точки зрения такие нарушения вполне допустимы. Глава 4. Динамическое п о амми ование 537 ГЛАВА 4. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ И АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ РЕГУЛЯТОРА Динамическое программирование, наряду с принципом максимума, является основным математическим методом, с помощью которого определяется оптимальное управление. В отличие от принципа максимума, который формулируется таким образом, что оказывается ориентированным, прежде всего, на определение оптимального управления в виде оптимальной программы, динамическое программирование позволяет определять оптимальное управление только в форме синтезирующей функции.