Теория систем автоматического управления. В.А. Бесекерский, Е.П. Попов, 1975 (1189552), страница 73
Текст из файла (страница 73)
ДляНа основании (12.166) и (12.167) можно найти приближенное значениеконечного момента времени Т и любыхследует, что. Поэтому вычислениеудобно начинать с конца, т. е. с момента времени t=Т и области GT. На первом шагерасчета рассматривается момент временивследствие краевого условия принадлежит множеству Gт. Подставляя в (12.166) и (12.167)и учитывая, что, имеемзначение(12.168). Минимум правой части первогоДалее фиксируется произвольное значениеравенства (12.168) вычисляется по тем значениямиз множества U, для которых точка, определяемая вторым равенством (12.168), соответствует значению.
Если длятаких значенийне существует, то функциянекакой-либо точкиопределена в точке х.Таким образом, по значению функцииможно приближенно определить значенияфункциина некотором подмножестве Х1 из X. Так как на интервалеуправлениепринято постоянным и равным, то одновременно с нахождениемфункцииприближенно найдено управление, которое реализует этуфункцию.'На втором шаге рассматривается момент времени. Из (12.166) и (12.167)можно получить(12.169)Далее фиксируется произвольная точка.
Минимум правой части (12.169) вычисляетсяпо тем значениям, для которых точка, определяемая вторымравенством (12.169), принадлежит подмножеству Х1. Находится значение функциина некотором подмножестве Х2 из Х1. На интервалеуправлениепринимается постоянным и равным значению, реализующим. Наинтервалеуправление, как функция, было определено после первого шага.связано свторым равенством (12.169), то после двух шаговТак какоказывается определенным управлениена интервале времени. Это будеткусочно-постоянная функция с интервалами постоянства, равными .Последующие шаги рассчитываются аналогично. Если весь интервал управления Т разбитна m шагов, то после m-го шага определяется функцияна подмножестве Хm из X иуправление u (0, х), как кусочно-постоянная функция с интервалами постоянства .
Еслиначальная точка х (0) = а принадлежит подмножеству Хm, для которого определена функция, то, положив х = а, получаем— минимум функционала (12.161) исходнойзадачи управления и— оптимальное управление. Подставляя затемоптимальное управление в (12.156) или (12.157) и решая систему исходных дифференциальныхуравнений, можно определить оптимальную траекторию движения.Если х (0) = а не принадлежит подмножеству Хm, то задача не имеет решения. Надоучитывать при этом, что вся задача решалась приближенно, в том числе найдено былоприближенно и подмножество Хm.При использовании динамического программирования число шагов должно бытьдостаточно большим, чтобы получить приемлемую точность решения. В результате большойтрудоемкости использование этого метода оказывается невозможным без применениявычислительных машин.Серьезным недостатком метода является то, что с ростом размерности задачи (порядка nдифференциального уравнения) весьма серьезно возрастают требования к быстродействию иобъему памяти вычислительных машин.
Действительно, на k-м шаге вычисляется функция, зависящая от переменныхи определенная на множестве Хk. Ее надохранить в памяти машины до тех пор, пока не будет вычислена функция. Этозначит, что в памяти машины должна храниться таблица, в которой записаны значениядля различных точек из Хk. Этих точек оказывается много, так как таблицадолжна достаточно точно и равномерно определять функцию.
Кроме того, впамяти машины приходится запоминать кусочно-постоянную в общем случае «-мерную, зависящую от х1, . . ., хn и вычисленную при значенияхфункцию управленияаргумента т с интервалом .В сложных системах объем вычислительных операций при реализации приближенногорешения задачи динамического программирования оказывается непосильным даже для самыхкрупных и быстродействующих современных вычислительных машин.Уравнение Беллмана. Введем предположение, что функция имеет непрерывные частныепроизводные по всем своим аргументам:. Тогда в равенстве (12.166) функциюможно представить следующим образом:Здесь— величина более высокого порядка малости, чемчасть (12.170) производныеПоэтому(12.170)Входящие в правуюудовлетворяют (12.156).(12.171)Подставим (12.171) в (12.166). Функцияне зависит от управления u(t) в момент t.Поэтому ее можно вынести за знак минимума.
Деля полученное равенство наи переходя кпределу при, имеемУравнение (12.172) и представляет собой уравнение Беллмана с краевым условием. Сумма первых двух членов (12.172) есть полная производная функциивремени. Поэтому уравнение Беллмана можно записать в другом виде:по(12.174)Требование непрерывной дифференцируемости функцииявляется весьма жесткими во многих задачах не выполняется. В. Г. Болтянский показал [18], что можно ослабитьтребования к функции.
В ней допускаются разрывы частных производных на некотороммножестве точек.Заметим, что если функции, не зависят явно от времени, то решение уравнения(12.174) — функция и оптимальное управление u, которое реализует минимум в (12.174), тожене зависит явно от времени, т. е.и u = u (х), однако в общем случае.Аналитическое нахождение функции т|з в явной форме удается только в некоторых частныхслучаях. Один из таких случаев рассмотрен в следующем параграфе.§ 12.10. Аналитическое конструирование регуляторовТак называемая задача аналитического конструирования регуляторов была сформулированаи решена А.
М. Летовым [77]. Эта задача развивалась также в работах А. А. Красовского [60] и Н.Н. Красовского [62, 63].Скалярное управление. Пусть имеется стационарный объект, уравнения которого дляфазовых координат, записанные в матричной форме, имеют вид(12.175)Здесь— матрица-столбец фазовых координат,— квадратная— матрица-столбец коэффициентов, u — скаляр.матрица коэффициентов,Требуется определить оптимальное управление, минимизирующеефункционал качества(12.176)Задача управления заключается в переводе системы из начального состоянияв конечное.
Из формулировки задачиследует, что система должна быть при этом асимптотически устойчива.В рассматриваемом случае уравнение Беллмана (12.172) имеет вид(12.177)Оказывается, что функция , входящая в (12.177), является функцией Ляпунова, а функцияV в функционале (12.176) — ее полной производной, т. е.чем решается вопрос об устойчивости синтезируемой системы (см. ниже § 17.2).Так как на управление u ограничения не накладываются и а > 0, то минимум в (12.177)достигается в точке, где обращается в нуль производная по u, т.
е. приЭто — нелинейное уравнение в частных производных относительно функции . Будемискать решение этого уравнения в виде квадратичной формы от фазовых координат:ЗдесьСильвестра(12.180)— квадратная матрица коэффициентов, удовлетворяющая критерию(12.181)причем матрица может быть принята симметричной, т. е.- Функция (12.180)удовлетворяет граничному условию, так как при хi = 0 (i = 1,..., n) имеем.Дифференцируя (12.180), имеемПодставляя полученные выражения в (12.179), приходим к уравнению вида(12.182)В левой части (12.182) находится квадратичная форма переменных х1,...,хn- Она будеттождественно равна нулю при равенстве нулю всех ее коэффициентов:(12.183)В результате получена система из 0,5n(n+1) алгебраических уравнений, содержащих такоеже количество неизвестных(при учете равенства коэффициентов)После нахождения неизвестных коэффициентов -угь из (12.178) можно определитьоптимальное управление(12.184)Аналогичный результат может быть получен при использовании классических методоввариационного исчисления (§ 12.8).Решение обратной задачи.
В полученных формулах для оптимального управленияконструктору -необходимо формировать управление в функции всех фазовых координат, так какв (12.184) все коэффициенты.Если конструктор может использовать ограниченное число фазовых координат, то частькоэффициентов dk в (12.184) должна быть тождественно равна нулю. В этом случае дляформирования оптимального управления можно воспользоваться решением обратной задачи иотыскать допустимую форму функционала качества при неполном управлении. Для этогофункционал качества (12.176) представим в измененном виде:(12.185)Минимизация функционала I1 вместо I не меняет задачи.Будем считать отличные от нуля коэффициенты dk известными числами, а коэффициенты li— неизвестными. Тогда совокупность уравнений (12.183) может быть представлена в виде(12.186)Эта система содержит 0,5n (n+1) неизвестных коэффициентови n неизвестныхкоэффициентов функционала I1. Добавляя к уравнениям (12.186) n уравнений из (12.184)(12.187)получим систему уравнений, которая в принципе может быть разрешена относительноискомых неизвестных.
Если система уравнений (12.186) и (12.187) имеет решение, при которомкоэффициентыудовлетворяют критерию Сильвестра (12.181), а коэффициенты функционалаlk>0, то задача аналитического конструирования при заданном неполном управлении имеетсмысл.Так как коэффициенты функционала получаются в виде lk = 1k (d1; ...
. . ., dn), то найденныйответ дает и решение прямой задачи. Варьируя коэффициенты управления dk в пределах,допускаемых условиями Сильвестра и условиями, можно выбрать подходящий критерийкачества и оптимальное управление.Методика обратного решения аналитического конструирования может оказаться полезной ипри возможности использования полного управления (в функции всех фазовых координат). Этообъясняется тем, что система уравнений (12.186) и (12.187) оказывается линейной относительнокоэффициентови решается проще, чем система уравнений (12.183), которая нелинейнаотносительно искомых коэффициентов.Векторное управление. В работах В. И.
Зубова [46] рассматривается более общая задача,когда дан нестационарный объект, описываемый матричным уравнением(12.188)где А (t) и С, (t) — квадратные матрицы коэффициентов— матрицы-столбцыфазовых координат и управлений. Вводится квадратичный функционал вида(12.189)где— заданные квадратные матрицы, а— положительно определенные квадратичные формы. Решение задачи сводитсяк линейному управлению вида(12.190)Матрица Г определяется решением нелинейного матричного уравнения(12.191)Для стационарных объектов матрицы А к С не зависят от времени и уравнение (12.191)принимает вид(12.192)В большинстве случаев результаты, полученные при аналитическом конструированиирегуляторов, не могут быть реализованы точно вследствие необходимости использовать дляуправления все фазовые координаты.