rybalev optimal systems_(отсюда брал лекции) (842910), страница 6
Текст из файла (страница 6)
матрицы[]G j = b j | Ab j | A 2 b j | ...A n -1b j , j = 1...m ,(190)где bj - j-й столбец матрицы B, для всех j являются невырожденными. Это означает управляемость системы по всем управляющим воздействиям.Пусть область допустимых значений управления U представляет собойm-мерный параллелепипед, задаваемый неравенствамиu j, min £ u j £ u j, maх ,j = 1...m ,(191)где u j, min < 0 , u j, maх > 0 .Требуется определить управление, обеспечивающее максимальное быстродействие системе (189) при переводе ее из состояния X(t0) в состояниеX(tк), т.е.
доставляющее минимум функционалу:tкJ = ò dt .(192)t0Составим гамильтониан:nnnmi =1j =1i =1k =1H = -1 + å y i å a ij x j + å y i å bik u k ,(193)или в матричной формеH = -1 + Y T AX + Y T BU .(194)Уравнения (187) примут вид:dY= -A T Y .dt(195)Оптимальное управление доставляет максимум функции Гамильтона вкаждый момент времени. Для этого оно должно максимизировать функциюY T BU , которую можно представить в виде:énùY BU = å êå y i bik úu k .k =1ëi =1ûTm(196)Так как компоненты вектора u могут изменяться независимо друг отдруга, максимум функции (196) достигается при следующих условиях:41ìïu k , max , еслиïuk = íïu, еслиïî k , minnå y i bik > 0,i =1n(197)å y i bik < 0, k = 1...m.i =1Таким образом, оптимальные управления uk(t) являются кусочнопостоянными функциями, принимающими значения uk,min и uk,mах.
Необходимовыяснить, определяются ли эти функции однозначным способом (за исключением конечного числа точек).Как следует из (197), uk(t) определяется неоднозначно, еслиnå y i bik = 0 .(198)i =1Вектор-функция Y(t) - аналитическая функция, так как является решением системы линейных однородных уравнений с постоянными коэффициентами (195). Следовательно, аналитической является и функцияnå y i ( t )bik .i =1Предположим, что эта функция обращается в нуль на бесконечноммножестве точек t, т.е.nå y i bik º 0 .(199)i =1Запишем это тождество в векторной форме:Y T ( t )b k º 0 ,(200)где bk - k-й столбец матрицы B.Продифференцировав (200) n-1 раз с учетом (195), получим системууравнений:ìY T ( t )b k º 0,ï TïY ( t )Ab k º 0,íï...ï Tn -1îY ( t ) A b k º 0 .(201)Относительно вектора Y(t) уравнения (201) представляют систему линейных однородных алгебраических уравнений. Принимая во внимание (190),систему (201) можно переписать в компактной форме:Y T ( t )G Tk º 0 .(202)Определитель этой системы( )det G Tk ¹ 0 ,(203)42так как система (189) является нормальной.
Тогда тождество (202) можетиметь место только в случае, еслиY T (t) º 0 .(204)Однако это противоречит принципу максимума. Таким образом, предположение (199) неверно и оптимальное управление U(t) определяется однозначно за исключением конечного числа точек.Для решения задач на максимальное быстродействие часто полезнознать число точек, в которых наблюдается равенство (198), так как это числоопределяет количество переключений управляющих сигналов между максимальным и минимальным уровнями.Пусть матрица A объекта имеет только вещественные (возможно, кратные) собственные числа, а уравнения uj(t) доставляют минимум функционалу(192). Определим, сколько раз может обращаться в нуль функцияnå y i ( t )bij .i =1Пусть p1,p2,…,pr - различные собственные числа матрицы А (r £ n засчет того, что среди собственных чисел имеются кратные).
Тогда матрица -AT,входящая в уравнение (184), имеет собственные числа l1, l2,… lr, где ln = -pn,n = 1…r. Таким образом, собственные числа матрицы -AT также являются вещественными. Обозначим кратность собственного числа ln как rn. Очевидно,что r1+r2+…+rr = n.Каждая функция y i ( t ) , i = 1…n, является решением системы однородных линейных дифференциальных уравнений (184), которое имеет видy i ( t ) = f1 ( t )e l1t + f 2 ( t )e l 2 t + ... + f r ( t )e l r t .(205)Входящие в (205) функции fn(t), n = 1…r представляют собой многочлены, причем степень каждого многочлена определяется кратностью соответствующего собственного числа ln и не превышает rn - 1.Очевидно, что линейная комбинацияnå y i ( t )bij будет иметь вид, анало-i =1гичный (205):nå y i (t )bij = s1 (t )el1t + s2 ( t )el 2 t + ...
+ sr ( t )el r t ,(206)i =1где sn(t), n=1…r - многочлены, имеющие ту же степень, что и многочленыfn(t).Докажем следующее утверждение: выражение (206) может обращатьсяв нуль не более чем(r1 - 1) + (r2 - 1) +… (rr - 1) + (r -1) = n - 1раз.В случае, если r = 1, утверждение справедливо, так как функция43s1 ( t )el1t обращается в нуль в точках, в которых обращается в нуль многочленs1 ( t ) , и, следовательно, имеет не более r1 - 1 нулей, а кроме того, в данномслучае n = r1.Предположим, что утверждение справедливо, когда число слагаемых в(206) меньше r.
Покажем, что оно справедливо и при r слагаемых. Это позволит нам, исходя из справедливости утверждения при r = 1, доказать его справедливость для случая r = 2 и далее для любого r.Предположим, что при r слагаемых наше утверждение неверно и функция (206) имеет, по крайней мере, (r1 - 1) + (r2 - 1) +… (rr - 1) + r нулей. Умножим (206) на e - l r t , что не изменит ее нулей. В результате получим функциюs1 ( t )e(l1 - l r )t + s 2 ( t )e (l 2 - l r )t + ... + s r -1 ( t )e(l r -1 - l r )t + s r ( t ) .(207)Продифференцировав (207) rr раз, получимg1 ( t )e(l1 - l r )t + g 2 ( t )e(l 2 - l r )t + ...
+ g r -1 ( t )e (l r -1 - l r )t ,(208)где gn(t) - многочлены, имеющие ту же степень, что и многочлены s n ( t ) .Поскольку между двумя нулями функции лежит, по крайней мере, одиннуль ее производной, то при каждом дифференцировании может «теряться» неболее одного нуля, т.е. функция (208) имеет не менее(r1 - 1) + (r2 - 1) +… + (rr - 1) + r - rr == (r1 - 1) + (r2 - 1) +… (rr-1 - 1) + r -1нулей. Но функция (208) имеет r - 1 слагаемых, числа (li - lr) - различны.
Поранее сделанному предположению, для него справедливо наше утверждение иона должна иметь не более чем (r1 - 1) + (r2 - 1) +… (rr-1 - 1) + r -2 нулей. Полученное противоречие доказывает, что если наше утверждение справедливодля r - 1 слагаемых, то оно справедливо и для r слагаемых. Далее: посколькуоно справедливо для одного слагаемого, оно справедливо для двух, трех и такдалее для любого r.Сформулируем полученные результаты в виде следующей теоремы:Если матрица состояния А линейного объекта имеет только вещественные собственные числа, а управления uj, j = 1…m удовлетворяет принципуtкмаксимума и доставляет минимум функционалу J = ò dt , то каждое из управt0лений uj является кусочно-постоянной функцией, принимающей предельныезначения uj,min, uj,mах, и имеет не более n - 1 переключений, где n порядок системы.Данная теорема называется теоремой о числе переключений, или теоремой об n интервалах (управления). Впервые она была доказана А.А.
Фельдбаумом.44В заключение отметим, что если среди собственных чисел матрицы Aобъекта имеются комплексно-сопряженные пары, оптимальное управлениетакже описывается кусочно-непрерывными функциями, число интерваловтакже конечно, но зависит от начального и конечного состояний объекта.Ниже приведены примеры решения задач на максимальное быстродействие с помощью принципа максимума с применением теоремы об n интервалов.Пример 6.Требуется объект, описываемый уравнениямиìx& 1 = x 2 ,íîx& 2 = - x 2 + u,(209)перевести из состояния x1(0) = x2(0) = 0 в состояние x1(tк) = 1, x2(tк) = 0 за минимальное время при ограничении на управлениеu £ 1.(210)Функционал качества будет иметь видtкJ = t к = ò dt ® min .(211)0Полагая y 0 = -1 , запишем гамильтониан:H = -1 + y1x 2 + y 2 (- x 2 + u ).Уравнения (187) в данном случае будут иметь вид:¶Hy& 1 = = 0,¶x1¶Hy& 2 = = -y1 + y 2 .¶x 2(212)(213)(214)Из уравнений (213), (214) получаемy1 = С = const,(215)y& 2 = -C + y 2 .(216)Из (212) найдем условия максимума гамильтониана по управлению:ìu = u max = 1íîu = u min = -1приy 2 > 0,приy 2 < 0.(217)При y2 = 0 управление не определено.
Из (216) видно, что при любыхзначениях С и y2(0) функция y2(t) меняет знак не более одного раза. Такимобразом, управление будет формироваться не более чем двумя интерваламипостоянного значения, что согласно теореме об n интервалов подтверждаетправильность нашего решения.Подставив (217) в (212), определим функцию М(Y,X):45M = -1 + Cx 2 + y 2 (- x 2 + sign (y 2 ) ) .(218)Согласно принципу максимума на всем интервале управления функцияМ(Y,X) постоянна и равна нулю. Из физических соображений ясно, что в начальный момент времени управление должно быть положительным, так как впротивном случае объект начнет удаляться от цели. Поэтому y2 (0) > 0 и из(218) получимM (0) = -1 + Cx 2 (0) + y 2 (0)(- x 2 (0) + 1) = -1 + y 2 (0) = 0 ,(219)откуда y2 (0) = 1.Для определения константы С по уравнениям (209), (212), (213), (214) и(217) составим Simulink-модель системы (рис.
6). Модель предусматриваетвычисление координат объекта и функции y2(t), а также значения гамильтониана H при заданном С. Остановка вычислений производится с помощьюбиблиотечного блока Stop Simulation в момент, когда x2 изменяет знак с положительного на отрицательный (т.е. становится практически равной нулю). Приэтом фиксируется значение x1(tк). Подбирая значение С, добиваемся выполнения условия: x1(tк) = 1.