54676_47af5332d12a983f86c22596d809b788 (842909), страница 5
Текст из файла (страница 5)
Зв), а соответственно задачу называют задачей орегуляторе состояния .В стационарном случае предполагается, что матрицы А, В,иRне зависят от времени, а tkQ= оо .Кроме рассмотренных случаев на практике встречаются задачис оптимизацией нелинейных объектов и ограничением на управляющее воздействие. Тогда решение задачи АКОР осуществляетсяна основе принципа максимума Понтрягина, который приспособлен специально для решения подобного рода задач, т. е .
для решения задач оптимизации с нелинейным объектом и ограничением науправляющее воздействие и фазовые координаты.Управление и(t),минимизирующее функционал (2.За}--(2.Зв),можно найти путем совместного решения уравненияния Эйлера -уравнеЛагранжа~танР =- ахпри р (tk)(2.1) и(2.4)= Gkx (tk), где функция Гамильтонан1 - TQ-х+ 1 -и TR и+р-Т(АВ-)х+и.22=-х(2.5)Оптимальное управление определяют из необходимого условия оптимальности38ан =Одii(2.6)'откуда-*и= R -1вт р.Подстановка соотношения(2.7)в(2.7)(2.1)приводит к следующейлинейной двухточечной краевой задаче на оптимальной траектории:(2.8)где х (t0) задано ;...:...*р-*=-Q-х * - АТ р'2.1.2.
Решение краевой задачи(2.9)с помощью переходной матрицыДля решения краевой задачи(2.8), (2.9)с помощью переходной матрицы определяется система п линейно независимых решений указанной системы:xc0 (t)2n дифференциальных уравнений, т. е.и p (i)(t), i = 1, 2, ... , п. При этом каждое решение удовле-творяет терминальным граничным условиям :Удобный способ нахождения такого решения состоит в построении так называемого единичного или фундаментальногорешения системы(2.8), (2.9),т.
е. решения, удовлетворяющегоусловиямx (i) (tk )]1 если i = I'. .{= 'О, еслиПолученные таким путем для1* ;;i = 1, 2, ... ,п решения могутбыть записаны в виде столбцов, образующих две переходныематрицы X(t) и P(t), размером п х п каждая с элементами(2.10)39Эти матрицы в силу способа их построения удовлетворяютусловиям(2.11)В силу справедливости для линейных систем принципа суперпозиции можно записать общее решение системы при известном х(tk)в видех (t)= X(t)х (tk);(2.12)р (t)= P(t)х (tk),(2.13)Поскольку задано х (t0) приуравненияt = t0,а не х (tk), необходимо из(2.12) при t = t0 получить зависимостьх (tk) от х (t0):х (tk) = x -\t) х (to).Подставив(2.14) в (2.12) и (2.13), получимПодстановкаи (t) =-х (t) = X(t) x -\to) х (to);(2.15)р (t)(2.16)= P(t) x - 1(to) х (to).(2.16) в (2.
7) приводит к выражениюR - 1 вт р (t) =Уравнение(2.14)-(2.17)R - 1 Вт P(t) x -\t0) х (t0)= -K(t, to) х (to). (2.17)может рассматриваться как дискретный закон управления с обратной связью, в котором время t0 являетсязначением предыдущего момента дискретизации .Если проводится непрерывное измерение состояния х системы, то значением предыдущего момента дискретизации являетсявремят. е. t0 = t, и соотношение (2.17) превращается в непрерывный закон управления с обратной связьюt,и (t)= - K(t)х (t),(2.18)где переменная по времени матрица коэффициентов усиленияK(t)имеет видK(t) = R-1(t) B\t)P(t) x -1(t).40(2.19)Решение для р (t) в этом случае с помощью(2.16) может бытьзаписано следующим образом:р (t)= P(t) x -1(t) х (t) = S(t) х (t);S(t) = P(t)2.1.3.
Решение краевой задачи(2.20)x -1(t).(2.21)с помощью метода прогонкиВ некоторых задачах, особенно в тех, которые связаны спроцессами рассеивания, численное определение матрицX(t)иP(t) фундаментальных решений может быть затруднительнымвследствие различных скоростей роста фундаментальных решений. Другими словами, вычисления могут сопровождаться значительной потерей точности из-за того, что значения элементовматрицX(t) и P(t) изменяются на интервале времени [to, tk] наразные порядки .В этом случае может оказаться полезным использование длярешения метода прогонки.
Идея метода прогонки содержится всоотношениях(2.20)и(2.21 ).Вместо того, чтобы определятьматрицы фундаментальных решенийX(t), P(t), следует непосредственно находить матрицу S(t) = P(t)X-1(t). Этот процесс можнорассматривать как формирование для системы(2.8), (2.9)граничного условия, эквивалентного терминальному условиюно для более ранних моментов времени.
В действительности коэффициенты терминального условия прогоняются (переносятся)назад к начальному времени. Затем, поскольку х (t0 ) известно,р (t0 ) можно вычислить по уравнениюр (to)и систему(2.8), (2.9)= S(to) х (to)проинтегрировать вперед с уже известныминачальными условиями (задача Коши).Подстановка(2.20) в (2.9) дает уравнениеs(t) х (t) + S(t) х (t) = -Q(t) х (t) -AT(t)S(t) х (t).(2.22)Далее, подставляя х из (2.8) в (2.22) и снова используя (2.20),получаем41S (t) х (t) + S(t)[A(t) х (t) х S(t) х (t)]B(t)R-\t)Bт(t) х+ Q(t) х (t) + A\t)S(t) х (t) = О,или(2.23)Так как х (t) ~О, из уравнения(2.23) следуетS=-SA -Атs + sвR- втs _ Q1(2.24)при граничном условии(2.25)что вытекает из уравненияотносительно матрицыSУравнение(2.9).(2.24)квадратичнои называется матричным уравнениемРиккати.Посколькуние(2.24)Gk являетсясимметрической матрицей, а уравнетакже симметрично, торица при всех значенияхУравнение(2.24)S(t)также симметрическая матt.можно проинтегрировать (прогнать) назадt = tk к начальному моментус помощью уравнения (2.20) можно получитьот терминального момента времениt = t0 .После этогор (to)Вектор= S(to)х (to).(2.26)р (t0) можно рассматривать как эквивалент терминального граничного условия(2.9),перенесенного на более ранние моменты времени.
Теперь решения для системы(2.8), (2.9)могут быть получены путем интегрирования в «прямом» времени(т. е. от t0 кtk),поскольку начальные условия х (t0) и р(t0)ужеизвестны .Итак, результатом решения краевой задачи(2.8), (2.9)является программное управлениеи (t)=- K(t) х (t), при K(t) = R- 1(t) B\t) S(t),где симметрическая матрицаS(t)определяется из матричногоуравнения Риккати :S= - sл - Атs + sвR- втs 142(2.27)Qпри граничном условииа .х и р связаны линейным преобразованиемр* =Sx* -v*,в котором вектор(2.8)v*(2.28)после подстановки уравнения (2.28) в (2.9) инаходится из уравнения(2.29)- наВ случае отсутствия ограниченииимеем р * (tk)иv*= О.-*х в- точкеконечно иtkТогда граничные условия, накладываемые на Sв соответствии с уравнением (2.28), состоят в равенстве нулю ЭЛеМеНТОВ S И у* при t = tk•При определенных S иv*закон управления оптимальной системы получается в результате подстановки уравненияуравнение(2.28)в(2.7):-*- -R-1вт(s х-* -v- *) .и-(2.30)В рассмотренном случае закон управления является линейным и составляющие коэффициента усиления обратной связи Кне зависят от состояния объекта управления.Так как законуправления не зависит от начальных значений переменных состояния, структура оптимальна при любых начальных условиях(рис.2.1).~--------------------------------------------,1Объект::управления1х+ОптимальныйрегуляторРис.2.1.Структура оптимальной линейной системы43Определив и*, реакцию оптимальной системы найдем из выражения(2.31)Таким образом, двухточечная краевая задача сведена к двумзадачам Коши, т.
е . это решение уравненияt = t0 и последующее= to К t = tk.крешение уравнения(2.29) назад от t = tk(2.31) вперед - от t =Часто основной интерес для задачи терминального управления представляет сам непрерывный закон управления с обратнойсвязью по состояниюи(х)= -K(t)x(t)приK(t) = K\t)Bт(t)S(t),(2.32)а не программное управление и (t).В качестве примера рассмотрим задачу синтеза оптимальногоуправления боковым движением летательного аппарата (ЛА). Полагая, что траектория движения ЛА представляет собой отрезокгоризонтальной прямой, движение по которой происходит с постоянной скоростью, можно считать, что боковое движение независимо от продольного. Это обстоятельство позволяет проводить синтез оптимального управления отдельно по каждому из каналов.В силу стационарности параметров опорной траектории икритерия качества матрицы А, В и С математической модели ЛА,а также матрицыQиRквадратичного функционала будут постоянными.Уравнения бокового движения ЛА в отклонениях имеют видdЛА1-'Т---=&лdЛ'f =Лrо .dtdЛу -Лdt -44т/3ттонmVmV.
z1 ЛА sq cosV.л.zi л~<:р+ -- 1-'Т +V+sшат у+-- uн;У1'.rоч'dЛrox1- - = - (mwx лro1dtХ]Jw~Б~Б+т У Лrо + т тлв +т э л8 )sql·Х1Х[У1Х[ТХ]э'Х]dЛrodt_ _Y_I1Jw=-(т У ЛrоУ1wУ1+т х лrоУ1У1где В т-угол скольжения (угол между вектором путевой скорости и плоскостью симметрии ЛА);крена; Э -Б+т тлв +т э лв +т н Л8 )sqlх1У1тУ1эу1н,угол тангажа; ат-\j/- угол рыскания; у- уголугол атаки (угол между проекциейпутевой скорости на плоскость симметрии и осью ЛА) ;вая скорость полета; т-путемасса ЛА;относительно соответствующихJ - моменты инерции ЛАосей; ro проекции вектораскорости ЛА на оси связанной системы координат;крыльев; q -V-скоростной напор;отклонения рулей; тх 1 , ту 1 , т 21 -s-размах крыльев;l-площадь8-углыкоэффициенты моментов аэродинамических сил .В качестве вектора координат состояния объекта выберемвектор х:х=Х1Л\j/Х2ЛrоуХ3ЛуХ4Лrох1Х5а в качестве управления-1ЛВтвектор и:Уравнение движения объекта с учетом введенных обозначений можно записать в нормальной форме:= а2 1Х2;Х2 = а22Х2 + а24Х4 + а25Х5 + Ъ21И1 + Ъ22и2 ;Х3 = а34Х4 ;Х4 = а42Х2 + а44Х4 + а45Х5 + Ь41И1 + Ь42И2;Х5 = а52Х2 + а53Х3 + а54Х4 + а55Х5 + Ь5 1И1,Х145или в векторном виде:х = Ах +Bii.Элементы матриц А и В имеют следующие значения:а21аа34= 1;_ sq l т Фу •22-JУ1 'а= 1;- sql тФх.24-JУ1'У1YlФу .,_ sqlJа42 - - тх1Xj- sql т О)х .а44 -у-Xj'XjНеуказанные элементы матриц равны нулю .В функционале качестванальными, причемR = Е.-1 CX)f2J(х , и)= - (q1X1Jвыберем матрицыQиR диагоВ этом случае функционал примет вид222222+q2X2 + q3x3 +q4x4 + q5x5 +и1 +u2)dt.20Элементы матрицыQследует выбирать таким образом, чтобыоптимальная система удовлетворяла заданным показателям качества: необходимый запас устойчивости, требования к качествупереходного процесса, статическая и динамическая точность системы.В соответствии с уравнением(2.32) оптимальное управлениеи* =-К хпри К = R- 1 втs, а матрица S находится из уравнения (2.24).В исходных переменных управление имеет вид{46◊н = kl: лрт + 14н Л\\f + k~: Лrох + k~: Лrоу;8 = k~э лрт + '4э Л\Jf + k~э Лrох + k~э Лrоу.3~тхуДля реализации оптимального'1' ирудован датчиками углавой скоростиroYI1иуправления ЛА должен быть обоуглорыскания, углау и угловой скорости rоч крена, аРегулятортакже угла скольжения Вт•ВхРис.качестве второго примера2.2.
Регулятор для колебательного звенарассмотрим задачу синтеза опти-мального регулятора для колебательного звена (рис.В2.2).качестве критерия оптимизации выберем квадратичныйкритерий00J(x)=f (q x( + q xi + ru122)dt,огдеq 1 ?:.О,q 2 ?:.О,r>О-некоторые весовые коэффициенты.Зададим граничные условиях1 (0)=х10 , х2 (0)= ,½0 ;Х1 ( 00) = Х2 ( 00) =О.Динамика колебательного звена описывается системой уравненийXi = Х2;х2= -ro~x1 - 2½ro0 x2 + и.В соответствии с методикой решения задачи составим гамильтонианН = q1xf + q2 x~ + ru + Р1Х2 + Р2 (-ro~x1 -2 ½ro~x2 + и),2в котором переменные р 1 и р 2 находятся из уравнений Эйлера-Лагранжа:47Управление найдем из необходимого условия оптимальностидН- = 2ru + р2= Оди'откуда1и =- - Р2·2rПодставив это значение управления и в уравнение исходнойсистемы для х2 , получим следующую краевую задачу:Х1 =Х2;при р2 (tk) = 1.Запишем характеристическое уравнение полученной системыуравнений:det(A -µЕ) = л, + 2(ro6 -2l;;2ro6 - q2r2 Jл.
+Я!_+Ф6 = О.r42ОбозначимВ=со6(1-2½ 2 )- ~~;Тогда в зависимости от соотношения между В и С имеют место два случая.2Случай 1. Если В ~ С, то при В > О все корни характеристического уравнения чисто мнимые и оптимальный регулятор несуществует. При В<О корни будут следующими :А1 2 = ±µ1;'где48Аз 4'= ±µ2,В общем решении системы уравнений для краевой задачи переменнаяпричем произвольные постоянные с 1= с3 =О в силу граничныхусловий .Выразив производную х2 через переменные состоянияполучим уравнение оптимального регулятораи= - (µ1µ2-ro~) х1 - (µ1+ µ2 -2½ro0 )x2.2Случай 2. Пусть теперь В < С. Тогда корни характеристического уравнениял1' 2 = µ ± jv ; лз ,4 = -µ ± jv 'гдеВ общем решении системы уравнений для краевой задачи дляэтого случая переменнаях1 (t)= eµt ( с1 cos vt + с2 sin vt) + e-µt ( с3 cos vt + с4 sin vt),где произвольные постоянные с1 = с2 = О в силу граничных условий.Выразив производную х2 через переменные состояния объекта, т.