Диссертация (1150745), страница 12
Текст из файла (страница 12)
Если аппроксимировать оптимальную обратную связь ломаной, построенной с шагом 0,5 по x, в системе возникают колебания в окрестности нуля (точечная линия на рис. 5.1), которые устраняютсяиспользованием вблизи положения равновесия линейной обратной связиu = −2x(сплошная линия на рис. 5.1).Этот пример иллюстрирует необходимость квазилинейного режима управления, рассмотренного в главе 3.9321024068t86xu-2-442-6t-82468-2-10Рис.
5.1: Управление (слева) и движение (справа) в системе (5.1), замкнутойточным регулятором «предиктор-корректор» (пунктирная линия) и приближенным без использования квазилинейного режима (точечная линия) и с квазилинейным режимом (сплошная линия).5.2Система второго порядкаРассмотрим модель маятника с нулевым равновесием в верхнем положениии управлением в виде горизонтально направленной силы. Непрерывная модельимеет видϕ̈(t) = sin ϕ(t) + u(t) cos ϕ(t).(5.2)Зададим допустимые множества (5ϕ)2 + ϕ̇2 6 152 , |u| 6 1000 и функционалвида (1.2) с `(ϕ, ϕ̇, u) = 10000ϕ2 + 10ϕ̇2 + u2 , `T = 0. Дискретизируем системус шагом 0,05 и выберем горизонт прогноза T = 7 тактов.На рис. 5.2 методом главы 2 построена оценка области управляемости в видесовокупности прямоугольных ячеек.
На рис. 5.3 изображена аппроксимация11Fоптфункции Беллмана Iопт. На рис. 5.4 показана приближенная обратнаясвязь uявн (x). Использование точного и приближенного регуляторов «предиктор-корректор» дает результаты, показанные на рис. 5.5.94ϕ̇3ϕ−33−3Рис. 5.2: Оценка области управляемости в примере (5.2).
Более темные областиуправляемы за меньшее число тактов.#10 5151050-5-15-10-5-3'_0-2-150110'21531Рис. 5.3: Аппроксимация функции Беллмана Iоптв примере (5.2).9510005000-500-15-10003-102-5100'_'5-110-2-315Рис. 5.4: Аппроксимация оптимальной обратной связи в примере (5.2).32.5'21.510.500.10.20.30.40.50.60.70.80.9tРис.
5.5: Движение системы (5.2), замкнутой точным регулятором «предикторкорректор» (пунктир) и приближенным (сплошная линия).96ЗаключениеПодведем итог полученным результатам.В главе 2 дан способ построения оценки области управляемости регуляторас терминальным ограничением (теорема 2). Предложенный способ основан натом, что в системе с липшицевой правой частью образ многогранника при фиксированном управлении можно приблизить также многогранником.
Это позволяет строить оценку области управляемости в виде многогранного множества,интегрируя систему в конечном множестве точек при убывании времени. Достоинством этого метода является возможность оценить управляемость системы взависимости от горизонта прогноза. Благодаря этому можно выбирать допустимо малый горизонт прогноза, не нарушающий управляемость.
С другой стороны, применимость метода может быть ограничена необходимостью разбиенияпространства на большое число ячеек.Также в главе 2 описан способ построения приближенного решения оптимизационной задачи (1.3) в виде кусочно заданной явной функции uявн (x) вобласти значений x, отделенных от нуля (теорема 4). Способ заключается ввычислении оптимального управления в узлах некоторой сетки и интерполировании обратной связи в остальных точках пространства.
При этом непрерывная интерполяция, например, линейная, вообще говоря, неприемлема, т. к.оптимальная обратная связь может быть разрывна. Вместо этого даны допустимые границы, в которых может находиться uявн (x). Удовлетворяющая этимограничениям обратная связь является стабилизирующей и ε-субоптимальной.Выбирая достаточно мелкую сетку, можно добиться сколь угодно малой оценки субоптимальности ε, а также того, что приращение функции Ляпунова взамкнутой управлением uявн (x) системе не более чем на сколь угодно малуюконстанту больше, чем при использовании точного регулятора «предиктор-корректор».97В главе 3 рассмотрена линейно-квадратичная аппроксимация задачи (1.3) вокрестности нулевого положения равновесия.
Это необходимо, т. к. метод главы 2 работоспособен только при x, отделенных от нуля. Оптимальное линейноеуправление u = Kx, полученное как решение линеаризованной задачи, оказывается первым приближением решения исходной задачи (1.3) при малых x. Оноявляется стабилизирующим и субоптимальным в окрестности нуля (теорема 8).Его недостаток — в том, что полученная оценка субоптимальности не зависитот окрестности линейного приближения. Как альтернатива линейному управлению, рассмотрен вариант приближенного динамического программированияс квадратичной аппроксимацией функции Беллмана.
В этом случае также достигается устойчивость и субоптимальность (теорема 9), причем оценка субоптимальности теперь уменьшается с сокращением окрестности нуля, а скоростьубывания функции Ляпунова стремится к ее скорости на движениях системыс точным регулятором. Это позволяет строить регулятор с наперед заданнымиоценками субоптимальности и скорости убывания функции Ляпунова. С другойстороны, преимуществом линейной обратной связи является ее простота.В главе 4 в регулятор вводится вычислительное запаздывание. Предлагается рассматривать управление, которое складывается из двух компонент: низкочастотной u1 с бо́льшим запаздыванием и высокочастотной u2 с меньшимзапаздыванием.
Регулятор u1 строит программную траекторию, а u2 стабилизирует ее по линейному приближению, подавляя случайные возмущения. Дляпостроения управления используется метод компенсации запаздывания. В системе линейного приближения, для которой метод компенсации уже известен влитературе, получена оценка робастности замкнутой системы по отношению кнеточностям в модели, используемой для компенсации запаздывания (теорема10). В нелинейном случае метод компенсации, интерпретируемый как предсказывающее преобразование состояния, обобщен на системы с несколькими запаздываниями.
Это преобразование приводит систему к виду, аффинному повысокочастотному слагаемому u2 , которое теперь не содержит запаздывания98(теорема 11). Дано достаточное условие существования управления u2 , стабилизирующего линейное приближение системы в окрестности программной траектории (теорема 12).Данная работа касается исключительно теоретического обоснования и анализа регулятора типа «предиктор-корректор». За рамками остаются такие задачи, как, например, оптимизация расхода памяти, затрачиваемой на хранение кусочно заданной обратной связи uявн (x), а также быстрое ее вычисление.Можно, однако, утверждать, что решение этих вопросов для систем небольшойразмерности вполне реалистично (см.
обзор литературы).Следует отметить, что для всех оценок, о которых идет речь в настоящейработе, даны выражения или указан способ их получения. Эти оценки далекиот минимальных. Например, указанная в теореме 4 плотность сетки, по которой строится функция uявн (x), вероятно, чрезмерна. Тем не менее, благодарятому, что эта плотность является достаточной, можно вычислить указанную втеореме аппроксимацию по предлагаемой сетке, но затем, исходя из вида функции uявн (x) в конкретной задаче, построить более экономную аппроксимацию.То же касается констант Липшица для функций Беллмана, приведенных в теореме 3. Их цель — обосновать аппроксимацию функции Беллмана с заданнойточностью.
Когда такая аппроксимация построена, во-первых, ее можно попытаться упростить, а во-вторых, по найденной аппроксимации можно уточнитьконстанты Липшица и далее использовать именно их.99Список литературы1. Беллман Р., Кук К. Л. Дифференциально-разностные уравнения. — М.:Мир, 1967. — 548 с.2. Болтянский В. Г. Оптимальное управление дискретными системами. —М.: Наука, 1973. — 448 с.3. Веремей Е. И., Сотникова М. В. Стабилизация плазмы на базе прогнозас устойчивым линейным приближением // Вестник Санкт-Петербургскогоуниверситета. Серия 10: Прикладная математика.
Информатика. Процессы управления. — 2011. — № 1. — с. 117—134.4. Горбунов А. В. Метод гарантированного оценивания области притяжениялинейной системы с выпуклым допустимым множеством // Наука и образование: научное издание МГТУ им. Н. Э. Баумана. — 2012. — № 12. —с. 30.5. Горбунов А. В. О методах построения области притяжения динамическойсистемы с ограничениями на состояние // Дифференциальные уравнения. — 2009. — т.
45, № 2. — с. 283—284.6. Горбунов А. В. Оценка степени затухания и перерегулирования в линейнойсистеме с запаздыванием // Наука и образование: научное издание МГТУим. Н. Э. Баумана. — 2013. — т. 11. — с. 107—118.7. Деменков М. Н. Оценка области управляемости и максимизация области притяжения методом опорных гиперплоскостей // Материалы конференции «Управление в технических системах» (УТС-2010). — СанктПетербург, 2010.
— с. 391—394.8. Егоров А. И. Уравнения Риккати. — М.: ФИЗМАТЛИТ, 2001. — 320 с.1009. Жабко А. П., Котина Е. Д., Чижова О. Н. Дифференциальные уравнения и устойчивость. — СПб.: Лань, 2015. — 320 с.10. Зубов В. И. Лекции по теории управления. — М.: Наука, 1975. — 496 с.11. Математическая теория оптимальных процессов / Л. С. Понтрягин [идр.]. — М.: Физматгиз, 1961. — 392 с.12. Морозов Ю. В. Оценка области притяжения с помощью функций Ляпунова из класса форм высших степеней в задаче управления мобильнымроботом // Навигация и управление движением: Материалы докладов IXКонференции молодых ученых. — 2007. — с.
358—364.13. Пестерев А. В. Построение наилучшей эллипсоидальной аппроксимацииобласти притяжения в задаче стабилизации движения колесного робота //Автоматика и телемеханика. — 2011. — № 3. — с. 51—68.14. Пономарев А. А. Алгоритм оценки области управляемости нелинейной системы многогранником // Современные методы прикладной математики,теории управления и компьютерных технологий (ПМТУКТ-2016): Сборник трудов IX Международной научной конференции.
— 2016. — с. 277—280.15. Пономарев А. А. Аппроксимация управления в регуляторе «предикторкорректор» // Устойчивость и процессы управления: Материалы III международной конференции. — СПб.: Издательский Дом Федоровой Г.В.,2015. — с. 329—330.16. Пономарев А. А. О выборе параметров метода «предиктор-корректор» //Вестник Мордовского университета. — 2010. — № 4. — с. 124—132.17. Пономарев А. А. О выборе параметров метода «предиктор-корректор» //Процессы управления и устойчивость: Труды 42-й международной научной конференции аспирантов и студентов / под ред.