Теория систем автоматического управления. В.А. Бесекерский, Е.П. Попов, 1975 (1189552), страница 72
Текст из файла (страница 72)
е. при наличииналоженных связей).При учете связей в виде дифференциальных уравнений класс функций С2m долженопределяться по наивысшей производной выражения (12.131).Если рассматривается одна переменная х (t), но функционал включает в себя производныех(t) более высоких порядков и имеет, например, вид(12.132)то уравнения Эйлера будут иметь вид(12.133)Как и ранее, при наличии связей вместо функции F должна рассматриваться функция H,определяемая (12.131). Класс функций С2m определяется по наивысшей производной (12.131) mго порядка.Отметим, что решение уравнений (12.130) или (12.133) часто приводит к корнямхарактеристического уравнения, половина которых лежит в левой, а половина — в правойполуплоскости. Это наблюдается при использовании квадратичных функционалов и конечномвремени регулирования.Для устранения неустойчивости, которая получится в случае присоединения подобногорегулятора к системе (если, конечно, не обеспечивается его отключение после завершениятребуемого процесса перевода из одного состояния в другое), можно, например, действоватьаналогично изложенному в § 11.9 и отбросить в решении те полюсы передаточной функции,которые лежат в правой полуплоскости.
Это соответствует, вообще говоря, переходу кфункционалу видат. е. бесконечному времени регулирования.В этом случае искомые функции должны принадлежать к классу Ст, причем производная тго порядка может иметь разрыв первого рода в точке t = 0.При использовании изопериметрических ограничений типа (12.127) задача оптимизациирешается также в соответствии с уравнениями (12.131), но должна быть использована функция(12.135)где— произвольные постоянные множители Лагранжа. В этом случае для определенияк граничным условиям должна добавлятьсяпроизвольных постоянных и множителейсовокупность условий (12.127).Рассмотрим простейшие примеры. Пусть объект управления описывается уравнениемЦель управления заключается в переводе объекта из состояния у = 0 при t = О в состояниеу=у0 при t=Т.
В качестве критерия качества примем минимум функционалагде(12.137)— некоторый весовой коэффициент. Для функции (12.131)Совместное решение (12.136) и (12.139) дает характеристическое уравнение(12.140)Это уравнение содержит только четные степени р. Поэтому, если половина корней лежит влевой полуплоскости, то половина — в правой.. Тогда получим характеристическоеУпростим задачу и положимуравнение в видеРешение его дает корни(12.141)Теперь можно записать выражение для управляемой величины:(12.142)где С1 и С2 — произвольные постоянные.
Из начального и конечного условий можноопределить, что С1+С2= —у0, а такжеОтметим, что принятие более сложного функционалаПусть теперь в рассматриваемом примере функционал не содержит управляющейвеличины и имеет, например, видне зависит от вида полинома D(р). Подобный результат был получен другим способом.ранее в § 8.8, когда экстремаль была решением характеристического уравненияОднако при отсутствии ограничений на вид D (р) реализация экстремали (12.148) можетпривести к физически не осуществимым регуляторам.
Действительно, из (12.136) следует, чторегулятор должен обеспечить управляющее воздействие вида.Однако уже первая производная (12.148) имеет при I = 0 разрыв первого рода, а вторая иследующие производные содержат слагаемые типа δ-функции и ее производных:Поэтому физическая реализация возможна для степени D (р) не выше первой, но даже и вэтом случае регулятор должен быть практически безынерционным.Получение физически не реализуемого регулятора произошло вследствие отсутствияограничений или учета управления в принятом функционале качества (12.146). Для получениявозможности применения инерционных регуляторов в функционал качества можно вводитькроме управления и его производные. Однако в этом случае смысл функционала качествастановится неясным.Рассмотрим теперь замкнутую систему, у которой объект управления описываетсядифференциальным уравнением(12.149)с начальным условием у (0) =y0.
Требуется определить оптимальное управление, переводящее систему в состояние у = 0 с бесконечным временемрегулирования и минимизирующее функционали используя уравнения (12.130) или (12.132), а также уравнение объекта {12.149), можнополучить характеристическое уравнение замкнутой оптимальной системы в виде(12.151)Корень, лежащий в левой полуплоскости,Уравнение экстремали, проходящей через граничные точки,из (12.149) можно найти, что управление должно изменяться по законуза неизвестную, входящую в два уравнения (12.152) и (12.153), можноПринявзаписать условие их совместности:Отсюда получается уравнение регулятора(12.154)Первое слагаемое в правой части (12.154) соответствует собственно искомомуоптимальному закону регулирования(12.155)Второе слагаемое в правой части (12.154) соответствует постоянному значению управления, которое необходимо искусственно создать на выходе регулятора, чтобы взамкнутой системе до момента времени t=0 (т.
е. при t < 0) управляемая величина была бы равназаданному значению y0. Как следует из (12.154), при t = 0 это постоянное управление снимается исистема начнет приходить в согласованное положение.Если при t < 0 рассматриваемая система была выключена и имела рассогласование у = у0, тослагаемое u0 не нужно и формула (12.154) сводится к (12.155).Рассмотренный пример относится к так Называемому аналитическому конструированиюрегуляторов, которое будет изложено более подробно в § 12.10.§ 12.9. Динамическое программированиеМетод динамического программирования был разработан Р.
Беллманом [5]. Он применимне только для решения задач оптимизации систем управления, но и для самых различныхтехнических и экономических задач. При обосновании этого метода предполагается, чтофункционал качества является дифференцируемой функцией фазовых координат системы.Заметим, что это условие выполняется не всегда.Пусть система описывается совокупностью п уравнений, записанных для фазовыхкоординат;(12.156)где fi — некоторые, в общем случае нелинейные функции фазовых координат и управлений.Число последних для общности принято равным числу фазовых координат.Уравнения (12.156) можно представить также в матричной форме:(12.157)где х и u — матрицы-столбцы фазовых координат и управлений размеромВ качестве критерия оптимальности примем минимум функционала.(12.158)Функции f0 и ft, вообще говоря, могут содержать в явном виде текущее время t. Однако этоне меняет принципиальной постановки задачи.Целью управления является перевод системы из состоянияпри t=0 в состояние.
Такая задача управления называется терминальной, и онасоответствует определению в фазовом пространстве оптимальной траектории с закрепленнымиконцами.Будем считать, что фазовые координаты и управления должны принадлежать некоторымзамкнутым (ограниченным) пространствам, т. е.(12.159)Можно несколько расширить цель управления и считать, что конец траектории должентолько находиться в заданной областипри t =-Т. Это будет задача со свободнымконцом траектории.Вместо исходной можно решать более общую задачу отыскания оптимального управлениядля произвольной временной точки 0 < t0 < Т и произвольной точки в фазовом пространствев смысле минимума функционала(12.160 )Минимум функционала (12.160) зависит от начального момента времени tо и начальнойточки х0 = х (t0).
Обозначим этот минимум через. Функциядля некоторойсовокупности фазовых координат x(t0) может, вообще говоря, не существовать, так как может несуществовать допустимого управления, удовлетворяющего (12.156).Если найдены функцияи требуемое управление u (t, х0), то, положив, где а — матрица-столбец начальных условий, мы получим решение исходнойзадачи.Принцип оптимальности. Примем начальные условия: при,оптимальное управление u (t, а0) реализует минимум функционала (12.160), а х (t, а0) —оптимальная траектория в фазовом пространстве. Выберем произвольный момент времени t1,принадлежащий интервалу t0 — Т, и обозначим через а1 точкуна оптимальной. Принцип оптимальности гласит следующее.траекторииЕсли принять значенияза начальные, то на интервалеоптимальноесовпадет с оптимальным управлениеми, следовательно, участокуправлениеоптимальной траекториидля задачи с начальной точкой (t0, а0) на интервалесовпадет с оптимальной траекторией для задачи с начальной точкой.
Доказательстводостаточно очевидно. Оно исходит из того, что значение функционала качества на участке t1—Тдолжно быть одинаковым при управлениях u(t, а1) и u(t, а0). Если бы это было не так и значениефункционала на этом интервале времени было бы, например, меньше для управления u(t, а1), тоуправление u(t, а0) можно было бы улучшить, заменив его на интервале t1—Т управлением, что противоречит принятому предположению об оптимальности управления.Итак, в соответствии с изложенным введем функциональное уравнение(12.161)на основании которого может быть найдено оптимальное управление и (х).
Если напромежутке t0 — Т выбрать промежуточную точку t1, то на основании принципаоптимальности(12.162)Функция и оптимальное управление обычно не могут быть найдены аналитическимпутем. Для этой цели применяются приближенные методы с использованием вычислительныхмашин. Рассмотрим идею приближенного расчета.Пусть t — фиксированное значение времени, а— малый отрезок времени, причем.
Тогда(12.163)где функциисвязаны условиями (12.157).Вид управленияне оказывает влияния на первое слагаемое вправой части (12.163). Поэтому на рассматриваемом интервале времени следует так выбратьуправление, чтобы минимизировать второе слагаемое в правой части (12.163) при выполненииусловий(12.164)На основании принципа оптимальности перепишем (12.163) следующим образом:(12.165)На интерваледолжно быть выбрано так, чтобы минимизироватьправую часть (12.165). От этого выбора зависят оба слагаемых правой части.Заменим на малом интервалематричную функцию f(х, u) и функцию fо (х, u) ихфиксированными значениями в точке t, а производную отношением конечных разностей. Тогда вместо (12.165) можно записать приближенно(12.166)Кроме того, имеем(12.167).