Диссертация (1145289), страница 17
Текст из файла (страница 17)
Степень сложности задачи оптимизации (3.1.8) и, соответственно, вычислительные затраты на каждом такте формирования управления определяютсятакже выбором типа прогнозирующей модели (3.1.4).Рассмотрим простейшую частную ситуацию с прогнозирующей моделью ввиде системы линейных разностных уравненийx[i + 1] = Ax[i ] + Bu[i ] , i = k + j , j = 0,1,2,..., x[ k ] = ~x[ k ],y[i ] = Cx[i ] ,(3.1.9)и с минимизируемым квадратичным функционалом{J k = J k (x, u) = ∑ (x[k + j ] − r x [k + j]) R k + j (x[k + j ] − r x [k + j]) +PTj =1(u[k + j −1] − ru [k + j −1] ) Qk + j (u[k + j −1] − ru [k + j −1]) }.(3.1.10)TЗдесь R k + j и Q k + j – положительно определенные симметрические матрицы длялюбого дискретного момента j = 1,..., P .Легко видеть, что в данном случае в силу уравнений (3.1.9) векторы x и uсвязаны соотношениемx = Lx[k ] + M u , где(3.1.11)0 K 0 A B 2B0A ABL=, M =.M MO M p p−1AABKABBВведем следующие обозначения:r x = (r x [k + 1] r x [k + 2] ...
r x [k + P ]) ∈ E nP ,Tr u = (r u [k ] r u [k + 1] ... r u [k + P − 1]) ∈ E mP ,TR = diag (R k +1 , R k + 2 ,..., R k + P ), Q = diag (Q k +1 , Q k + 2 ,...Q k + P ).Учитывая принятые обозначения и соотношение (3.1.11), функционал(3.1.10) можно представить в виде100J k = u T Hu + 2f T u + g , гдеH = MT RM + Q, f = 2(MT RLx[k ] − Qr u − MT Rr x ), g = const .Таким образом, функционал (3.1.10) в данном случае можно трактовать, какквадратичную функцию от конечного числа переменных с положительно определенной матрицей H . Для простоты положим, что весовые матрицы не зависят отномера такта, т. е.R k +1 = R k + 2 = ...
= R k + P = R 0 ; Qk +1 = Qk +2 = ... = Qk + P = Q0 .Кроме того, зададим векторы rx и ru , не зависящими от такта:r x [k + 1] = r x [k + 2] = ... = r x [k + P] = r x ,ru [k ] = ru [k + 1] = ... = ru [k + P − 1] = ru ,где r x и ru – желаемое положение равновесия замкнутой системы.В данном частном случае задача оптимизации (3.1.8) с очевидностью имеетследующее аналитическое решениеu = u* = Kx[k ] + Tx r x + Tu r u ,где u* = (u*[k ] , u*[k + 1],...,u*[k + P − 1]) – оптимальное программное управление наTгоризонте прогноза, матрицы K , Tx , Tu определяются формулами()−1()−1()−1K = − Q + MT RM MT RL , Tx = Q + MT RM MT R , Tu = Q + MT RM Q .Однако, в соответствии со стратегией управления с прогнозом, из последовательности u* = (u*[k ], u*[k + 1],...,u*[k + P − 1]) используется только первый элеTмент на следующем такте.
Этот элемент определяется какu*[k ] = Kx[k ] + Tx r x + Tu r u ,(3.1.12)где K , Tx , Tu – первые m строк матриц K , Tx , Tu соответственно.Из (3.1.12) следует, что для дискретной линейно-квадратичной задачи стратегия формирования управления с прогнозирующей моделью определяется пропорциональным статическим регулятором по состоянию. Поскольку матрицы K ,Tx , Tu не зависят от номера такта, их достаточно вычислить один раз вне контура101управления, что в данном случае значительно упрощает его реализацию.Ситуация существенно усложняется, если в линейно-квадратичную задачуввести ограничения на управления:u min≤ u j [i ] ≤ u max,jj∆u minj≤ ∆u j [i ] ≤i = k , k + 1,..., k + P − 1, j = 1,..., m,∆u max,j(3.1.13)maxmaxгде u min, ∆u min– вещественные числа, не зависящие от номера такта иj ,u jj , ∆u jявляющиесякомпонентамивекторовumin , umax , ∆umin , ∆umaxсоответственно,∆u[i ] = u[i ] − u[i − 1] .
Кроме того, ограничения могут быть наложены и на выходные переменные:y min≤ y j [i] ≤ y maxjj , i = k + 1,..., k + P, j = 1,..., r .(3.1.14)Нетрудно показать, что введенные ограничения (3.1.13), (3.1.14) можнопреобразовать к системе линейных неравенств:~Au ≤ b .(3.1.15)При этом задача (3.1.8), решаемая на каждом такте формирования управления, сводится к задаче квадратичной оптимизации:J k (u[k ], u[k + 1],..., u[k + P − 1], x[k ]) = u T H u + 2f T u + g → min mP , (3.1.16)u ∈Ω ⊂ Eгде множество допустимых последовательностей векторов управления определя~ется линейной системой (3.1.15), т.
е. Ω = {u ∈ E mP | Au ≤ b}.Поскольку H – положительно определенная матрица, а множествоΩ ⊂ E mP – выпуклое, то, если допустимое множество не пусто, задача (3.1.16)всегда имеет единственное решение.Очевидно, что в данном случае управляющее воздействие является нелинейным и пересчитывается заново на каждом такте, как решение задачи (3.1.16).Это не позволяет построить уравнения замкнутой системы в явном виде, что затрудняет анализ устойчивости положения равновесия.Существенным недостатком рассмотренного базового подхода является наличие статической ошибки по задающему сигналу при действии на объект посто-102янного или медленно меняющегося внешнего возмущения.В связи с этим рассмотрим иной вариант управления с линейной прогнозирующей моделью. Введем вектор ∆u[i ] изменений управляющих переменных наi -м такте процесса управления∆u[i ] = u[i ] − u[i − 1] .(3.1.17)Пусть линейная прогнозирующая модель задана системой разностныхуравненийx[i + 1] = Ax[i ] + Bu[i ] + Hϕ[i ], i = k + j , j = 0,1,2,..., x[k ] = ~x[k ],y[i ] = Cx[i ],(3.1.18)где ϕ[i ] ∈ E l – оценка постоянного или медленно меняющегося возмущения, полученная с помощью асимптотического наблюдателя.
Исходя из данного предположения, будем считать, что на горизонте прогноза выполняются равенстваϕ[k ] = ϕ[k + 1] = ... = ϕ[k + P − 1] .Однако теперь вместо квадратичного функционала (3.1.10) будем рассматривать функционалJ k = J k ( y , ∆ u ) = ∑ {(y[k + j ] − r[k + j ]) T R k + j (y[k + j ] − r[k + j ]) +Pj =1+ ∆u T [k + j − 1]Q k + j ∆u[k + j − 1]},(3.1.19)где R k + j и Q k + j – заданные положительно-определённые матрицы,y = (y[k + 1] y[k + 2] ...
y[k + P ]) ∈ E rP ,T∆ u = (∆ u[k ] ∆u[k + 1] ... ∆u[k + P − 1]) ∈ E mPT– вспомогательные векторы, представляющие регулируемые и управляющие последовательности соответственно на горизонте прогноза.Как и для базового варианта, поставим оптимизационную задачуJ k = J k ( y (∆ u ), ∆ u ) = J k (∆ u ) → minmP∆u∈E(3.1.20)о поиске программной последовательности векторов ∆u[i ] , которая минимизирует функционал (3.1.19). Для решения задачи (3.1.20) введем в рассмотрение вектор ∆x[i ] изменений переменных состояния на i -м такте:103∆x[i ] = x[i ] − x[i − 1] .(3.1.21)Найдем систему разностных уравнений, которой удовлетворяют векторы ∆x[i ] . Сэтой целью рассмотрим уравнение состояния в модели (3.1.18)x[i + 1] = Ax[i ] + Bu[i ] + Hϕ[i ] ,из которого следует равенствоx[i ] = Ax[i − 1] + Bu[i − 1] + Hϕ[i − 1] .Вычитая из первого уравнения второе и принимая во внимание, что внешнее возмущение остается постоянным на горизонте прогноза, получим∆x[i + 1] = A∆x[i ] + B∆u[i ] .(3.1.22)Теперь обратимся к уравнению измерения в (3.1.18), на основании которогоимеем y[i + 1] = Cx[i + 1] .
Вычтем отсюда уравнение измерения:y[i + 1] − y[i ] = C(x[i + 1] − x[i ]) = C∆x[i + 1] ,откуда следуетy[i + 1] = y[i ] + C∆x[i + 1] = y[i ] + C( A∆x[i ] + B∆u[i ])илиy[i + 1] = CA∆x[i ] + y[i ] + CB∆u[i ] .(3.1.23)Уравнения (3.1.22) и (3.1.23), рассматриваемые совместно, составляют систему уравнений, которой удовлетворяют компоненты вектора ∆x[i ] p[i ] = y[i ] (3.1.24)состояния новой прогнозирующей модели объекта управления.
Входной переменной для этой модели в текущий момент i дискретного времени, в отличие от(3.1.18), служит вектор v[i ] = ∆u[i ] , а выходной – вектор z[i ] = y[i ] . Уравненияновой модели в пространстве состояний записываются следующим образомp[i + 1] = Ap[i ] + B v[i ], i = k + j ,j = 0,1,2,...,(3.1.25)z[i ] = C p[i ],причемначальныеусловиязадаютсявектором~[k ]p[k ] = p(где104x[k ] − ~x[k − 1] ~~ ), а матрицы A , B , C – формуламиp[k ] = C~x[k ] A 0n× r B , B = , C = (0 r ×nA = CAECBr×r Er ×r ) .(3.1.26)С учетом введенных обозначений функционал (3.1.19) можно представить вследующем эквивалентном видеJ k = J k ( z , v ) = ∑ {(z[k + j ] − r[k + j ]) T R k + j (z[k + j ] − r[k + j ]) +P(3.1.27)j =1+ v T [k + j − 1]Q k + j v[k + j − 1]} ,z = (z[k + 1] z[k + 2] ...
z[k + P ]) ∈ E rP ,Tгдеv = ( v[k ] v[k + 1] ... v[k + P − 1]) ∈ ETmP(3.1.28).Функционал (3.1.27) характеризует качество процессов управления прогнозирующей моделью (3.1.25). При этом задача его минимизацииJ k = J k ( z ( v ), v ) = J k ( v ) → minmP(3.1.29)v∈Eна движениях прогнозирующей модели (3.1.25) принципиально ничем не отличается от базовой задачи, рассмотренной выше.
Здесь, аналогично (3.1.11), междувекторами z , v и p[k ] имеет место линейная связьz = Lp[k ] + Mv ,где L и M – матрицы, определяемые равенствамиEr ×r C A CA2 CA + CA E 2r ×r CA L==... ,... P ...i C A P ∑ CAEr ×r i =1 CB CABM=...P −1 CA B0CB...C A P−2 BCB... 0 ...
0 CAB + CB=... ... P −1 ...i... C B ∑ CA Bi=0(3.1.30)0CB0 0 ....... ... P −2∑ CA i B ... CB i=0......При этом решение задачи (3.1.29), в соответствии с равенством (3.1.12), на-105ходится по формулеv * = Kp[k ] + T r ,(3.1.31)где K = −(M T RM + Q ) M T RL , T = (M T RM + Q ) M T R .−1−1Итак, последовательность векторовv * = (v * [k ] v * [k + 1] ... v * [k + P − 1]) =T= (∆ u * [k ] ∆u * [k + 1] ... ∆u* [k + P − 1])T–этооптимальнаяпрограммнаяпоследовательностьизменений∆u[i ](i = k , k + P − 1) управляющих переменных на i-ом такте процесса управления взадаче (3.1.29). При этом на объект на i-ом такте подается управлениеu[i ] = u[i − 1] + ∆u * [i ] ,i = k , k + 1,..., k + P − 1.В соответствии со стратегией MPC-подхода, из найденной последовательности векторов v * используется только первый вектор v * [k ] = ∆u * [k ] , который сучетом (3.1.31) задается равенствомv * [k ] = Kp[k ] + Tr ,(3.1.32)где K и T – первые m строк матриц K и T соответственно.
Тогда управлениеu[k ] в текущий момент k вычисляется по формулеu[k ] = u[k − 1] + ∆u * [k ] = u[k − 1] + Kp[k ] + Tr .(3.1.33)На практике алгоритм управления (3.1.33) удобнее реализовать в форме динамического регулятораm[k + 1] = m[k ] + Kp[k ] + Tr ,u[k ] = m[k ] + Kp[k ] + Tr.(3.1.34)Здесь m[k ] = ∆u[k ] – вектор состояния, ∆u[k ] – входной сигнал DLTI-модели(3.1.34).
Заметим, что, как и в базовом случае, матрицы K и T остаются постоянными на каждом такте, при условии стационарности системы (3.1.18), постоянства горизонта прогноза P и независимости весовых матриц в функционале(3.1.19) от номера такта. При этом нулевое положение равновесия замкнутой системы (3.1.25), (3.1.32) устойчиво, если собственные числа матрицы A + BK ле-106жат внутри единичного круга. По собственным числам этой матрицы можно судить об устойчивости положения равновесия реальной замкнутой системы, включающей объект управления (3.1.1) и динамический регулятор (3.1.34).Т е о р е м а 3 . 1 .
Пусть y ∈ E r , u ∈ E m , причем r = m и матрица M , опре-деляемая формулой (3.1.30), является неособой. Тогда регулятор (3.1.32) обеспечивает нулевую ошибку воспроизведения задающего сигнала r = r0 для любого постоянного внешнего возмущения ϕ = ϕ0 .Доказательство. С учетом введенных обозначений запишем выражениедля функционала (3.1.19) в следующем видеJ k = J k ( z , v ) = ( z − r ) R ( z − r ) + v T Qv =T(Lp[k ] + Mv − r )T R(Lp[k ] + Mv − r ) + v T Qv.(3.1.35)∂J kи приравнивая его нулевому вектору, находим, что∂vВычисляя градиентвектор v* удовлетворяет равенству:M T R (Lp[k ] + Mv − r ) + Qv = 0 ,Отсюда, с учетом линейной связи z = Lp[k ] + Mv , следует выражение∆ u * = v * = −Q −1M T R ( z − r ) = −Q −1M T R ( y − r ) .(3.1.36)Если матрица M не особая, то этим же свойством обладает и квадратнаяматрица Q −1M T R .