54676_47af5332d12a983f86c22596d809b788 (842909), страница 7
Текст из файла (страница 7)
рассмотрена методика выбора вектораq,основанная на требовании быстрейшего убывания функции Ляпунова-Белмана вдоль траектории замкнутой системы. ФункциюЛяпунова-Белмана можно трактовать как текущее расстояниемежду возмущенным состоянием замкнутой системы и невозмущенным . Динамические свойства системы тем выше, чем быстрееубывает это расстояние в переходном процессе. Метод требуетзначительного объема вычислений в процессе его реализации,а также может приводить к весьма большим значениям коэффициентовусиленияоптимальногорегулятора,лым значениям весовых коэффициентовсоответствующихма-qi (i = 1 : п) .Таким образом, закон управления и реакция системы в значительной степени зависят от выбора весовых коэффициентов показателя качества.
Выбор этих коэффициентов представляет трудную задачу, так как взаимосвязь весовых коэффициентов и параметров оптимальной системы или ее реакцией в общем случаеочень сложная.63Контрольные вопросы и задачи1. Как ставится задача АКОР нахождения оптимального управления?2. Изложите методику решения задачи АКОР.3. Какие основные проблемы возникают при решениизадачианалитического конструирования регуляторов?4.Как решаются проблемы, возникающие при решении задачи аналитического конструирования регуляторов?5.Какие условия накладываются на исходные данные присинтезе линейного квадратичного регулятора?6.Изложите основы теории синтеза оптимальных линейныхсистем по интегральному квадратичному критерию.7. Каково назначение матриц Q и R в критерии качества?8. Как задать элементы матриц Q и R в критерии качества,используя прямые показатели качества, методом А. Брайсона?9.Как выбрать элементы матрицQиRв критерии качестваиRв критерии качестваметодом Эллерта?10.Как выбрать элементы матрицQметодом М.Е.
Салуквадзе?11 . Какой вид имеет оптимальное управление в задаче АКОР?12. В чем состоит особенность решения уравнения Риккати?13. Какова структура оптимальной системы в задаче АКОР?14. Для объекта, поведение которого описывают уравненияii = ,½,х2 = ах2+ Ьи,определите методами классического вариационного исчисления оптимальное управление, обеспечивающеепереход из произвольного начального состояния в заданное конечное состояние{x 1(tk) = x 2(tk) =О} так, чтобы критерий оптимальностиtkJ=~f (a1.x; +а2 х~ +PииЗдесь а 1 , а2 , Р-2)dt.toнекоторые положительные постоянные.
Составьте структурную схему оптимальной системы.Глава3Задачи оптимизации динамических системпри наличии ограничений на траекториюЗадачи оптимального управления являются задачами минимизации на множестве функций. В отдельных случаях эти задачимогут быть решены методами классического вариационного исчисления. Однако чаще всего задачи оптимального управленияставятся как задачи минимизации при ограничениях на состоянияили функцию управления.Ранее были рассмотрены задачи оптимизации нелинейныхдинамических систем при наличии ограниченной в конечнойточке траектории.В данной главе рассмотрены задачи с ограничениями на всютраекторию в целом, т.
е. при t0 ::;; t::;; tk, а не только в конечнойточке t =tk·При наличии дополнительных ограничений типа равенствC(x,u,t) = О, где составляющие вектора С функции ck, k = 1, . . ., r~ п дважды дифференцируемы, для определения экстремумафункционала можно использовать множители Лагранжа. В этомслучае , как всегда, при введенииlпеременных Лагранжа, которые являются функциями от времени t:µ1(t) , ...
, µ 7 (t) ,задачунахождения минимизирующего решения для исходного функционала с ограничениями типа равенства можно рассматривать какзадачу минимизации функционала видабез учета ограничений.65Если минимизирующая траектория удовлетворяет требуемымграничным условиям, то функционалJ1не зависит от переменных Лагранжа, и, следовательно, в выражениивариации функционалаµk (t)ла J 1J1(1.3)для первойкоэффициент при каждом множителеравен нулю, и поэтому стационарное значение функционасоответствует стационарному значению функционалаJ.В этом и заключается идея метода множителей Лагранжа.3.1. Интегральные(изопериметрические) ограниченияПотребуем, чтобы некоторый интеграл вдоль оптимальнойтраектории принимал заранее заданное значениеtkfХп+1 (tk) = N(x,u,t)dt,(3.1)toгде xn+l (tk) -заданное число; N- заданная скалярная функция.Естественный подход к решению такой задачи состоит в присоединении к исходной системе уравнений, описывающей динамику объекта, уравнения состояния, полученного из(3.1):.iп+l (t) = N(x,u,t)(3.2)с граничными условиями:(3.3)Xn+l (tk) задано.Пустьµ -функция влияния (множитель Лагранжа, функциячувствительности), соответствующая координате xn+l.Гамильтониан расширенной системы имеет видН=L+рУравнения Эйлера -т f+µN.(3.4)Лагранжа таковы:(3.5)66ан = aL + -Таиaf + aN = О·аи Раи µаи(3.6)'.
__ ан _0'µдх гдеµ -коэффициент чувствительности критерия качестваJк изменению хп+~, т. е.aJµ=-- -(3.7)axn+lУравнения(3.6) и (3.1) можно рассматривать как системуразмерности т + 1 для определения т компонент вектора уравнения и (t) и постоянной величины µ .Итак, в задачах с ограничениямистванатраекторию(3.1)типавеличинаравенN(x,u,t)присоединяетсяксмножителемпостояннымхгамильтониану--~Лагранжаµ .Класс задач, в которых в качестведополнительныхвыступаетклассоминтеграл ,tусловийназываетсяизопериметрическихРис.3.1. Изопериметрическаязазадачадач по наименованию одной из них.
Среди линий равной длинынайти такую, которая охватывает наибольшую площадь (рис.l3.1).Уравнение линии имеет видtkxl(tk)=f✓O+x2 )dt=l,toгде длина линииlизвестна.Площадь под линией определяют по формулеtkJ= f xdt.to67В качестве примера рассмотрим следующую задачу: средикривых, проходящих через точки А(О,О) и В(Ь,О) и имеющих заданную длинуl,найти кривую у(х) , для которой площадь, за-ключенная между этой кривой и осью Ох, имеет максимальноезначение .Таким образом, в задаче требуется определить максимумфункционалаьfJ(y) = ydxопри условииььооfN(x,y)dx = f✓1 + у' dx = l2и граничных условияху (О)=О; у (Ь)О.=В соответствии с методикой решения задачи классическимвариационным исчислением составляем функционал:J1 (у) =ьf (у+ µ✓1 + у'2)dx.оУравнение Эйлера для функционалаJ 1(у)дLd дL _ 0дуdx ду'имеет вид-----'гдеПодынтегральная функция не зависит явно от х, поэтомуможно записать первый интеграл уравнения Эйлерау = µ✓1 + у'2 Решив это уравнение, получим68µу'2,J1 + у'2(х - С2 ) = µ sin <р;(у- С1 )= -µcos<p,откудаили с учетом граничных условий222( 2bJ +( ✓4µ 2-Ь J 2х- -Постояннаяµу- ----_µ2 .может быть найдена из граничных условий.Экстремаль представляет собой дугу окружности с центром вточке ( ~ , J43.2.µ: -ьz Jи радиусомµ.Ограничения в виде равенств на управлениеРассмотрим дополнительно ограничение на управляющие переменные в виде равенстваC(u,t) = О,гдескалярная функция;C(u,t) -u(t) -(3.8)т-мерный управляющий вектор, т ~Условие2.т~2необходимо для того, чтобы задача представляла интерес (при тфункциюu(t)= 1 ограничение (3.8)полностью определяети никакой проблемы оптимизации не возникает) .
Втех случаях, когда т ~2,влияние ограничения(3.8)сводитсяк уменьшению свободы выбора управляющих переменных и.Один из возможных подходов к решению этой задачи состоитв исключении с помощьюных и(3.8)одной из управляющих переменпоследующем решении задачи минимизации понию к оставшимся управляющим переменным,отношекоторые уже несвязаны никакими ограничениями. При таком подходе необходимые условия минимизации, выведенные для задач без ограничений, остаются справедливыми и в этом случае.69Другой подход заключается в том, что выражениемножителем Лагранжаµ(t)(3.8)сприбавляется к гамильтониану. Приэтом получается расширенный гамильтониан(3.9)Такая форма гамильтониана вносит изменения только в условие оптимальности(3.1 О)Это условие вместе суправления3.3.u(t)(3.8)определяет т компонент вектораи скалярную функциюµ(t).Ограничения в виде равенств на функции управленияи фазовых координатПусть оптимальное решениеx(t), ii(t)должно удовлетворятьограничениюC(x,ii,t) = О,причем-асаи=1:-одля лю(3 .11)б ого -и.Следуя принятой методике, добавим к гамильтониану вариационной задачи без связи ограничениес множителем(3.11)µ(t).В результате получим гамильтониан(3 .12)Условие оптимальности в этом случае совпадает с(3 .10):(3.13)а уравнения Эйлера ---=-тр70Лагранжа должны быть модифицированы:анaLдхдх-Т= -- = - - - рaf --дхасµ-ах.(3.14)Все остальные уравнения необходимых условий остаются безизменений.Необходимое условие(3.13) и ограничение (3.11) составляютсистему т + l уравнений с т + 1 неизвестными величинами µ и и.Характерное отличие этой задачи от предыдущих появление в уравненииЕслидС(3.14) слагаемого µ -дхC(x,u,t) = О.является вектор-функцией, число компонент которой меньше числа компонент вектора управления иуравнения(3 .12)-(3.14) соответственно примут видН= pTJ +L+r?c;дНди~трЗдесьµ-, то(3.15)= дL + _ т дf + _ т дС = О·ди рди µди'дН-Т дfдхдх=- - =-р-дL- -дх- т дС-µ - .дх(3.16)(3 .17)вектор множителей Лагранжа, размерность которыхсовпадает с размерностью вектора3.4.C(x,u ,t).Ограничения в виде равенствна функции фазовых координатЕсли функция, задающая ограничение, явно не зависит отуправляющих переменных, то в этом случае при решении задачивозникают дополнительные осложнения.Пусть задано ограничение в виде следующего равенства:S(x,t) = О.Если равенство(3.18)(3.18)справедливо для любого значенияt,t 0 ~ t < tk, то производная по времени от функции вдоль оптимальной траектории должна обращаться в нуль:dSdt= дS + дS х = дS + дS 1(x,u,t) = о.дtдхдtдх(3.19)71Выражение(3 .19)может, в свою очередь, оказаться либоявно зависящим от и, либо снова не зависящим от и.