Диссертация (1150745), страница 2
Текст из файла (страница 2)
∂xПредположение 8. Весовые функции ` и `T в функционале (1.2) липшицевы:k`(x, u) − `(x̄, ū)k 6 L` kx − x̄k + ku − ūk ,k`T (x, u) − `T (x̄, ū)k 6 L`T kx − x̄k + ku − ūk .Предположение 9.` f (x, u), u > ` kxk2 ,eгде ` > 0.eЗамечание. Предположения 7–9 могут быть обоснованы, например, если система (1.1) и функционал (1.2) получены дискретизацией непрерывной системыи интегрального функционала.Определение 1. Число T в функционале (1.2) называется горизонтом прогноза.Определение 2. Слагаемое `T в функционале (1.2) называется терминальным слагаемым.Поставим оптимизационную задачу0Ix,u(·)→ inf ,u(·)u(·) ∈ U ,0xt,x,u(·)∈Xx T, x0 , u(·) ∈ XT ,где X , XT ⊂ Rn , U ⊂ Rm .(1.3)∀t ∈ [0, T ],10Определение 3. Множество X в задаче (1.3) называется множествомдопустимых состояний, а U — множеством допустимых управлений.Определение 4.
Множество XT в задаче (1.3) называется терминальнымограничением.Предположение 10. Множества X , XT и U в задаче (1.3) — связные,компактные и содержат внутри себя начало координат.Предположение 11. Для каждого x ∈ X существует такое u ∈ U , чтоf (x, u) ∈ X .Предположение 12. При любых x, x̄ ∈ X и ū ∈ U таких, что f (x̄, ū) ∈X , существует такое u ∈ U , чтоku − ūk 6 γ kx − x̄k ,f (x̄, u) ∈ X ,f (x, u) ∈ X ,где γ — некоторая постоянная.Замечание. Предположение 12 означает, что множество управлений, допустимых с учетом ограничения на состояние системы, меняется в некоторомсмысле непрерывно с изменением начального условия задачи (1.3). Способ проверки этого предположения предлагается ниже в лемме 3.Предположение 13.
Решение задачи (1.3) существует при любом начальном состоянии x0 ∈ X .Обозначение 2. 1) uопт (·, x0 ) есть решение задачи (1.3). Если оно не един-ственно, то имеется в виду любое решение.2) xопт (k, x0 ) = x k, x0 , uопт (·, x0 ) .3) Iопт (x0 ) = I x0 , uопт (·, x0 ) .Определение 5.
Функция uопт (·, x0 ) называется оптимальным управлением, xопт (·, x0 ) — оптимальной траекторией, а Iопт (x0 ) — оптимальным значением функционала при начальном условии x0 .111.1.3Метод управления «предиктор-корректор»Определение 6. Регулятором «предиктор-корректор» называется обратная связьu(k) = uопт 0, x(k) .Как алгоритм, метод управления «предиктор-корректор» означает, что накаждом такте k управление генерируется следующим образом:• для начального состояния x(k) строится оптимальное управление на горизонте прогноза T :uопт κ, x(k)κ = 0, 1, . .
. , T − 1;• в систему подается первый такт оптимального управления uопт 0, x(k) ;• в момент k + 1 оптимизация повторяется при новом начальном условииx(k + 1), и т. д.Такая интерпретация объясняет название «предиктор-корректор», где слово«предиктор» означает предсказание поведения системы на горизонте прогнозаи оптимизацию этого поведения, а «корректор» — обновление прогноза на каждом шаге с учетом текущего состояния.1.1.4Регулятор с двумя режимами функционированияВ данной работе будем рассматривать регулятор, который подчиняется разным алгоритмам вблизи и вдали от начала координат, т. е. обладает двумярежимами функционирования:1.
Квазилинейный режим используется в окрестности начала координат.2. Нелинейный режим используется вдали от начала координат — там, гдесистема существенно нелинейна.Будем считать, что в нелинейном режиме выполнено условие следующей известной теоремы, гарантирующей устойчивость нелинейного регулятора «предиктор-корректор».12Теорема 1. [40; 63; 82] Пусть существует функция κ(x) такая, чтоf x, κ(x) ∈ XT∀x ∈ XTи`T (x) > ` f x, κ(x) , κ(x) + `T f x, κ(x)∀x ∈ XT .Тогда регулятор «предиктор-корректор» стабилизирует систему (1.1). Приэтом в качестве функции Ляпунова можно выбрать функцию Iопт (x), которая, действительно, удовлетворяет неравенствуIопт f x, uопт (0, x) − Iопт (x) 6 −` f x, uопт (0, x) , uопт (0, x)∀x ∈ X .Здесь правая часть отрицательно определена в силу предположения 9.1.21.2.1Обзор литературыО регуляторе «предиктор-корректор»Метод управления «предиктор-корректор» также известен в литературе подназваниями model predictive control (MPC), receding horizon control (RHC), управление с прогнозирующими моделями, упреждающее управление и т.
д. Впервыеон был описан в [69] и с тех пор получил широкое распространение и признание.Теории и практике использования регуляторов «предиктор-корректор» посвящены подробные монографии [40; 63; 82]. К достоинствам этого класса регуляторов часто относят робастность [29; 49; 75], близость к оптимальному управлению (субоптимальность) [80] и фундаментальную способность явно учитыватьограничения в процессе вычисления управления.Обзор коммерческих систем управления типа «предиктор-корректор», доступных в промышленности, можно найти в [79].
Модель системы в них можетбыть задана в частотной области или в пространстве состояний. Функционалкачества может быть линейным или квадратичным, скалярным или векторнымс ранжированными по приоритету компонентами. Допускаются жесткие и мягкие ограничения, и т. д.13Если в начале своего существования регуляторы «предиктор-корректор»применялись в основном в медленных процессах, например, в химической промышленности, то с развитием вычислительных возможностей стали доступныреализации для быстрых систем — как линейных, так и нелинейных [81].
Сейчас есть примеры использования этих регуляторов, например, в автомобильной промышленности [34], управлении морскими объектами [88], стабилизацииплазмы [3; 87; 92], составлении расписаний [46] и т. д.Несмотря на активное успешное применение, с регуляторами «предикторкорректор» по-прежнему связан ряд открытых вопросов [42; 65; 72], например:• расширение области устойчивости, которая гарантируется терминальным ограничением и терминальным слагаемым [27];• расширение границ свойственной регулятору робастности [28; 37];• разработка адаптивных схем управления «предиктор-корректор», а также схем с оценкой состояния по наблюдениям [73].Ниже мы подробнее остановимся на других важных проблемах: реализациирегулятора в реальном времени и вычислительном запаздывании.1.2.2О существовании оптимального управленияЗадача оптимального управления лежит в основе регулятора «предикторкорректор».
Известны примеры таких задач, где есть допустимые управления,но не оптимальное. Вопрос существования оптимального управления, такимобразом, представляет значительный интерес в контексте данной работы. Длясистем дискретного времени на конечном промежутке этот вопрос решается существенно проще, чем для непрерывных систем. Действительно, функционалкачества в этом случае есть функция конечного числа переменных.
Достаточнопредположить непрерывность этого функционала и компактность допустимыхмножеств, чтобы показать существование минимума указанной функции. Похожие соображения приводят к следующим результатам.В [24] рассмотрена задача оптимального управления на конечном проме-14жутке времени в нелинейной системе дискретного времени с ограничением науправление, но без ограничений на состояние.
Получены необходимые и достаточные условия оптимальности, аналогичные принципу максимума Понтрягина [11]. В частности, доказано, что если ограничения на управление компактны, правая часть системы непрерывна как функция состояния и управления,а весовые функции функционала качества дифференцируемы, то оптимальноеуправление существует для любого начального состояния, причем оптимальноезначение функционала конечно.Результат [24] был обобщен в [2], где добавлены ограничения на состояниесистемы. Оказалось, что если множества допустимых управлений и начальных состояний компактны, ограничения на будущие состояния представленызамкнутыми множествами и в системе всегда существует хотя бы одна допустимая последовательность управлений, то всегда существует и оптимальнаяпоследовательность.Дальнейшее развитие условия существования оптимального управления получили в [44], где были рассмотрены ограничения на управление, зависящие отсостояния, а также несколько ослаблены предположения о функциях задачи:весовые функции считаются полунепрерывными снизу, а ограничения на управление — полунепрерывными сверху точечно-множественными отображениямисостояния системы в компактное множество управлений.На бесконечном промежутке задача оптимального управления дискретнойсистемой была изучена в [55] в предположениях, аналогичных [44], с дополнительным условием, отражающим специфику бесконечного промежутка времени: должна существовать допустимая управляющая последовательность, доставляющая функционалу качества конечное значение.
Доказано, что при этомоптимальное управление также существует.Эти результаты обуславливают сделанное выше предположение 13 о существовании оптимального управления.В связи с проблемой существования оптимального управления при наличии15ограничений на состояние следует отметить вопрос существования хотя бы одного допустимого управления. Задача нахождения множества начальных состояний, при которых существует допустимое управление, называется в литературе задачей о построении области управляемости. Смежной проблемой являетсяпостроение области притяжения, которую можно интерпретировать как областьуправляемости в ноль за бесконечное время. В достаточно общем нелинейномслучае практично лишь построение оценки этого множества. Среди методов,используемых для оценивания областей достижимости и управляемости, отметим в линейном случае метод опорных плоскостей [7; 30], а в нелинейном —метод функций Ляпунова, которые часто выбирают в виде форм второй илиболее высокой степени [12].