Диссертация (Системный анализ регуляторов типа предиктор-корректор)
Описание файла
Файл "Диссертация" внутри архива находится в папке "Системный анализ регуляторов типа предиктор-корректор". PDF-файл из архива "Системный анализ регуляторов типа предиктор-корректор", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст из PDF
Санкт-Петербургский государственныйуниверситетНа правах рукописиПономарев Антон АлександровичСистемный анализ регуляторовтипа «предиктор-корректор»05.13.01 Системный анализ, управление и обработка информации(по прикладной математике и процессам управления)Диссертация на соискание ученой степеникандидата физико-математических наукНаучный руководительдоктор физико-математических наук,профессор А. П. ЖабкоСанкт-Петербург20162ОглавлениеВведение4Обозначения61 Предварительные сведения71.1 Регулятор «предиктор-корректор» . .
. . . . . . . . . . . . . . . .71.1.1Управляемая система . . . . . . . . . . . . . . . . . . . . .71.1.2Задача оптимального управления. . . . . . . . . . . . . .81.1.3Метод управления «предиктор-корректор» . . . . . . . . .111.1.4Регулятор с двумя режимами функционирования . . . . .111.2 Обзор литературы . . . . .
. . . . . . . . . . . . . . . . . . . . . .121.2.1О регуляторе «предиктор-корректор» . . . . . . . . . . . .121.2.2О существовании оптимального управления . . . . . . . . .131.2.3О реализации в реальном времени . . . . . . . . . . . . . .151.2.4О вычислительном запаздывании . . . . . . . . . . . . . . .171.3 Структура работы . . . . . . . .
. . . . . . . . . . . . . . . . . . .192 Анализ нелинейного режима212.1 Оценка области управляемости и выбор горизонта прогноза . . .212.2 Построение явной обратной связи . . . . . . . . . . . . . . . . . .272.2.1Понятия и обозначения, связанные с динамическим программированием . . .
. . . . . . . . . . . . . . . . . . . . .2.2.2Вспомогательный результат: непрерывность функции Беллмана . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2.2.32729Шаг 1: оценка близости решения задачи приближенногодинамического программирования к оптимальной обратной связи . .
. . . . . . . . . . . . . . . . . . . . . . . . . .3432.2.4Шаг 2: аппроксимация решения задачи приближенного динамического программирования явной функцией . . . . . .2.2.538Построение субоптимальной обратной связи в заданной близости от оптимальной . . . . . . . . . . . . . . . . . .
. . .3 Анализ квазилинейного режима42453.1 Оптимальное управление в линейно-квадратичной задаче . . . . .463.1.1Построение оптимального управления без ограничений . .463.1.2Оптимальное управление, ограниченное по норме . . . . .483.2 Реализация регулятора в квазилинейном режиме . . . . . . . . . .513.2.1Свойства линейной обратной связи . .
. . . . . . . . . . . .593.2.2Приближенное динамическое программирование . . . . . .624 Компенсация вычислительного запаздывания694.1 Анализ линейного приближения . . . . . . . . . . . . . . . . . . .704.1.1Предсказывающее преобразование состояния . . . . . . . .704.1.2Функционал Ляпунова — Красовского . .
. . . . . . . . . .724.1.3Устойчивость регулятора с компенсацией запаздывания . .744.1.4Робастность регулятора с компенсацией запаздывания. .784.2 Нелинейный случай . . . . . . . . . . . . . . . . . . . . . . . . . .834.2.1Схема компенсации запаздывания . . . . . . . .
. . . . . .4.2.2Устойчивость нелинейного регулятора с компенсацией запаздывания . . . . . . . . . . . . . . . . . . . . . . . . . . .5 Примеры8389925.1 Система первого порядка . . . . . . . . . . . . . . . . . . . . . . .925.2 Система второго порядка . . . . . . .
. . . . . . . . . . . . . . . .93Заключение964ВведениеПод системным анализом регулятора будем понимать анализ регулятора каксложной системы, на вход которой поступает информация о состоянии управляемого объекта, а на выходе появляется управляющий сигнал. Такое пониманиепротивопоставляется точке зрения на регулятор как на функцию, отображающую выход объекта в управление.Регулятор «предиктор-корректор» основан на повторяющемся решении задачи оптимального управления и поэтому является сложным как с точки зрениясложности вычисления управления, так и с точки зрения анализа.Цели системного анализа регуляторов типа «предиктор-корректор», преследуемые в данной работе, таковы:1.
Практическая реализуемость регулятора в реальном времени. Под реализуемостью понимается:• существование конечного (вероятно, приближенного) алгоритмауправления;• возможность компенсации запаздывания, обусловленного вычислительной сложностью регулятора.2. Устойчивость: начало координат системы, замкнутой приближеннымрегулятором, должно быть асимптотически устойчиво в обычном смысле, и область притяжения должна содержать все допустимые состояния.3. Субоптимальность: приближенный регулятор должен быть в некоторойстепени близок к оптимальному.Для достижения поставленных целей решаются следующие задачи:1.
Оценить область управляемости регулятора с терминальным ограничением (при выполнении некоторых известных условий она также является областью притяжения нулевого решения).2. Найти условия аппроксимации обратной связи «предиктор-корректор»5явной функцией с сохранением устойчивости и достижением заданнойстепени субоптимальности.3. Доказать устойчивость и робастность регулятора с компенсацией вычислительного запаздывания.Используются следующие методы:1. Линейные оценки решений дискретных динамических систем с липшицевой правой частью.2. Для изучения оптимального управления вблизи положения равновесияиспользуется линейно-квадратичная оптимизация.3. Приближенное управление строится с помощью динамического программирования.4. Для оценки близости управления к оптимальному используются аналитические свойства некоторых атрибутов задачи оптимального управления (например, непрерывность и квадратичная аппроксимация оптимального значения функционала качества как функции начального условия).5.
Для доказательства устойчивости и робастности регулятора с компенсацией запаздывания используется метод Ляпунова — Красовского.Результаты, выносимые на защиту:1. Метод оценки области управляемости нелинейного регулятора «предиктор-корректор» (теорема 2).2. Алгоритм аппроксимации обратной связи нелинейного регулятора «предиктор-корректор» (теоремы 8 и 9).3. Оценка робастности метода компенсации распределенного запаздыванияв линейных системах (теорема 10) и обобщение этого метода на нелинейные системы (теорема 12).6Обозначения• M T — транспонирование матрицы M ;• O — нулевая матрица, E — единичная;• λmax (M ) и λmin (M ) — наибольшее и наименьшее собственные числа симметрической матрицы M ;√√pTT• kxk = x x, kAk = λmax (A A), kxkM = xT M x (M — положительноопределенная матрица);• Br = {x : kxk < r}, Br (x̄) = {x : kx − x̄k < r};• ρ(X) = sup{kxk : x ∈ X};∂f (x, u)— матрица частных производных f по u:•∂u∂f1 ∂f2∂fn ∂u1 ∂u1 .
. . ∂u1 ∂f1 ∂f2∂fn...∂f (x, u) ∂u2 = ∂u2 ∂u2; ..∂u...... . ∂f1 ∂f2∂fn ...∂um ∂um∂umo(x)• o(x) понимается в обычном смысле: lim= 0;x→0 kxk1,x > 0,• sign x = 0,x = 0,−1, x < 0;• conv(x1 , x2 , . . . , xN ) — выпуклая оболочка набора точек.7Глава 1Предварительные сведения1.1Регулятор «предиктор-корректор»1.1.1Управляемая системаВ данной работе идет речь об управляемых системах видаx(k + 1) = f x(k), u(k) ,k = 0, 1, . . . ,(1.1)где x ∈ Rn , u ∈ Rm .Предположение 1. f (0, 0) = 0.Предположение 2.
Функция f допускает выделение линейной части:kf (x, u) − f (x̄, ū) − A(x̄, ū)(x − x̄) − B(x̄, ū)(u − ū)k 66 Mf kx − x̄k2 + ku − ūk2 ,где A(x̄, ū) и B(x̄, ū) — некоторые матрицы, а Mf — константа, одинаковая длявсех точек (x̄, ū).Предположение 3. Функция f липшицева:kf (x, u) − f (x̄, ū)k 6 Lf kx − x̄k + ku − ūk .Предположение 4. При любой равномерно ограниченной последовательности u(k) и любом начальном состоянии x(0) система (1.1) имеет решение x(k),определенное при всех k > 0.Предположение 5. Функция f (x, u) обратима по x, т.
е. существует однозначная функция f −1 (x, u) такая, что f −1 f (x, u), u ≡ x, причем эта функция8также липшицева: −1f (x, u) − f −1 (x̄, ū) 6 Lf −1 kx − x̄k + ku − ūk .Замечание. Предположения 2–5 могут быть обоснованы, например, если система (1.1) получена дискретизацией непрерывной системы, которая обладаетсвойствами продолжимости решений, непрерывной зависимости решений от начальных условий и управления и дифференцируемости решения по начальнымусловиям [9].Обозначение 1.
x k, x0 , u(·) есть cостояние системы (1.1) на шаге k приначальном состоянии x0 и управлении u(·).1.1.2Задача оптимального управленияВведем квадратичный функционал, характеризующий управление при заданном начальном условии:T −1 X00I (x , u(·)) =` x k + 1, x , u(·) , u(k) + `T x T, x , u(·) ,0(1.2)k=0где T — некоторое положительное число или бесконечность.Предположение 6. Весовые функции ` и `T в функционале (1.2) положительно определены, т. е.`(0, 0) = `T (0) = 0,`(x, u) > 0`T (x) > 0∀x, u : x2 + u2 6= 0,∀x 6= 0.Предположение 7. Весовые функции ` и `T в функционале (1.2) допускают квадратичное приближение в окрестности нулевого положения равновесия,причем градиенты допускают соответствующее линейное приближение:22 33`(x, u) − kxkM − kukN 6 M` kxk + kuk ,9 ∂`(x, u)− 2M x 6 M∂x ` kxk2 + kuk2 , ∂x ∂`(x, u)− 2N u 6 M∂u ` kxk2 + kuk2 , ∂u2 3`T (x) − kxkMT 6 M`T kxk , ∂` (x) T− 2MT x 6 M∂`T kxk2 .