Бесекерский В.А. Теория систем автоматического регулирования (1972) (1151987), страница 86
Текст из файла (страница 86)
(12 164) На основании принципа оптимальности перепишем (12.163) следующим обрааом: 3-)-д3 $(), х) =ппп )' ~ Л,(х, и) Нт+ф [С+Л2, х(С+ЛС)! (. (12.165) Р На интервале 2, 2 + Ы управление и (т) должно быть выбрано так, чтобы минимизировать правую часть (12.165). От этого выбора зависят оба слагаемых правой части. Заменим на малом интервале Ы матричную функцию ~ (х, и) и фуккцию 7э (х, и) их фиксиРованными аначенивми в точке Г, а пРоизвоДнУю х отношением конечных разностей Лх = х (г+ Л)) — х (С) и Лг. Тогда вместо(12.165) моя<ко записать приближенно Ф (Г, х) ж ш)В ((э (х, и) Л)+ Ф (Г+ ЛГ, х+ Лх)).
(12.166) и Кроме того, имеем х+Лх=х(г+Лг)=х(2)+Лг ) [х(2), и(2)! =х+Ы ) (х, и). (12.167) На основании (12.166) и (12 167) можно найти приближенное значение ф (), х). Для конечного момента времени Т и любых х ~ бт следует, что 2Р (Т, х) = О. Поэтому вычисление ф (2, х) удобно начинать с конца, т. е. с момента времени 2 = Т и области 6т. На первом шаге расчета рассматри- вается момент времени 2 = Т вЂ” Лг. При 2+ Ы = Т величина х+ Лх вследствие краевого условия принадлежит множеству бт.
Подставляя в (12.166) и (12 167) значение 2 = Т вЂ” Лг и учитывая, что ф (Т, х) = О, имеем ф(Т вЂ” ЛФ, х) =п2[п(д [х, и(Т вЂ” Л))! Ы, (12,168) х+Лх=х+ЛЬ '[[х, и(Т вЂ” Л))!. Далее фиксируется произвольное зкачеиие х Е Х. Минимум правой части первого равенства (12.168) вычисляется по тем значениям и (Т вЂ” Л|) из мпо- жества 5г, для которых точка х + Лх, определяемая вторым равенством (12.168), соответствует значению Ь ~ 6т. Если для какой-либо точки х с Х таких значений и (Т вЂ” Л)) не существует, то функция ф (Т вЂ” Ы, х) не опре- делена в точке х.
Таким образом, по значению функции ф (Т, х) можно приближенно определить значекия функции ф (Т вЂ” Ы, х) на некотором подмножестве Х, из Х. Так как на интервале Т вЂ” Лг, Т управление и (т) принято постояиным и равным и (Т вЂ” Л)), то одновременно с нахождением функции 2[) (Т вЂ” Л|, х) приближенно найдено управление и (Т вЂ” Лг, х), которое реализует эту функцию. На втором шаге рассматривается момент времени 2 = Т вЂ” 2Л). Из (12.166) и (12 167) можно получить ф (Т вЂ” 2ЛГ, х) = ш)п ((э [х, и (Т-2Л2) ! Л|+ Ч) (Т вЂ” Ы, х+ Лх)), (12.169) х+Лх=х+Ы [[х, и(Т вЂ” 2Ы)!.
25Р 388 метОды синтезА систем АВтомАтического РеГулиРОВАния !гл. 3з Далее фиксируется произвольная точка х ~ Х. 51инимум правой части (12.169) вычисляется по тем значениям и (Т вЂ” 2Л!) ~ П, для которых точка х + Лз, определяемая вторым равенством (12.169), принадлежит подмножеству Х,. Находится значение функции ф (Т вЂ” 2Лд х) на некотором подмножестве Х, из Х,.
На интервале Т вЂ” 2Лд Т вЂ” Лг управление и (т) принимается постоянным и равным значению и (Т вЂ” 2Л!), реализующим »г (Т вЂ” 2Лд х). На интервале Т вЂ” Лд Т управление, как фуккцпя х(Т вЂ” Л!), было определено после первого шага. Так как х (Т вЂ” Лг) связано с х (Т вЂ” 2Лг) вторым равенством (12.169), то после двух шагов оказывается определенным управление и(Т вЂ” 2ЛГ, х) на интервале времени Т вЂ” 2ЛГ, Т. Это будет кусочно-постоянная функция с интервалами постоянства, равными Л!.
Последующие шаги рассчитываются аналогично. Если весь интервал управления Т разбит на !я шагов, то после т-го шага определяется функция »р (О, х) на подмножестве Х из Х и управление и (О, з), как кусочно-постоянная функция с интервалами постоянства Лг. Если начальная точка л (0) = = а принадлежит подмножеству Х, для которого определена функция »р (О, х), то, положив х =- а, получаем ф (О, а) — минимум функционала (12.161) исходной задачи управления и и (О, а) = и* (т) — оптимальное управление, Подставляя затем оптимальное управление в (12 156) или (12.157) и решая систему исходных дифференциальных уравнений, можно определить оптимальную траекторию движения хл (т).
Если х (0) = а не принадлежит подмножеству Х, то задача не имеет решения. Надо учитывать при атом, что вся задача решалась приближенно, в том числе найдено было приближенно и подмножество Х Прн использовании динамического программирования число шагов должно быть достаточно большим, чтобы получить приемлемую точность решения. В результате большой трудоемкости испольаование этого метода оказывается невозможным без применения вычислительных машин. Серьезным недостатком метода является то, что с ростом размерности задачи (порядка я дифференциального уравнения) весьма серьезно возрастают требования к быстродействию и объему памяти вычислительных машин.
Действительно, на я-м шаге вычисляется функция ф (Т вЂ” й Лг, х), зависящая от переменных х„..., хл и определенная на множестве Х». Ее надо хранить в памяти машины до тех пор, пока не будет вычислена функция »г [Т— — (й+1) Лг, х!. Это значит, что в памяти машины должна храниться таблица, в которой записаны значения ф (Т вЂ” я Лг, з) для различных точек из Х». Этих точек оказывается много, так как таблица должна достаточно точно и равномерно определять функцию »р (Т вЂ” я ЛГ, х).
Кроме того, в памяти машины приходится запоминать кусочно-постоянную в общем случае я-мерную функцию управления и (Т вЂ” к Лг, х), зависящую от х„..., хл и вычисленную при значениях аргумента т с интервалом Л!. В сложных системах объем вычислительных операций при реализации приближенного решения задачи динамического программирования оказывается непосильным даже для самых крупных и быстродействующих современных вычислительных машин.
Уравнение Беллмана. Введем предположение, что функция ф имеет непрерывные частные производные по всем своим аргументам: г, х„.. „х„. Тогда в равенстве (12.166) функцию»р (г + Лг, х + Лз) можно представить следующим образом: ф(г+Лг, +Лз) =.ф(г, з)+~ — + ')! з ~,' ~ ~г+6~Лг)Лг. (12.1гО) !=1 Здесь б(Лг) — величина более высокого порядка малости, чем Л!. Входящие в правую часть (12.170) производные х! удовлетворяют (12.156). 389 5 12.10! АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ РЕГУЛЯТОРОВ Поэтому 1ф(»+А», х+Ах) =1ф(», х)+~ — ф.-',- ~ — 71~А»+Ь(л»)Л».
(12 171) Подставим (12.171) в (12.166). Функция 1ф (», х) не аависит от управления и (») в момент». Поэтому ее можно вынести за знак мнннмума. Деля полученное равенство на А» и переходя к пределу при А» — О, имеем н пнп Я+ 'Я ~~ »! (х(»), и(»)1+»о (х(»), и(»)1~ =0 (12.172) 1=1 при условиях х=»(х, и), х(0)=а, х(Т)=-ЬбСГ (12.173) х(») ЕХ, 0~(»~(Т. Уравнение (12Л72) и представляет собой уравнение Беллмана с краевым условием 1ф (Т, х) = О. Сумма первых двух членов (12Л72) есть полная производная функции 1ф (», х) по времени. Поэтому уравнение Беллмана можно записать в другом виде: 1.
Я+~.1. (»),. (»)1~ =-О. (12.174) 5 12ЛО. Аналитическое конструирование регуляторов Так называемая задача аналитического конструирования регуляторов была сформулирована и решена А. М. Летовым 1771. Зта задача раавивалась также в работах А. А. Красовского (601 и Н. Н. Красовского',162, 631. Скалярное управление, Пусть имеется стационарный объект, уравнения которого для фазовых координат, записанные в матричной форме, имеют вид х =Ах+Си. (12Л 75) Здесь х = 11х111„>„— матрнца-столбец фазовых координат, А = 11 аы 11 „„„— квадратная матрица коэффициентов, С = 11 с! 11 „„1 — матрица-столбец коэффициентов, и — скаляр.
Требуется определить оптимальное управление и = и (х„..., х,), минимизирующее функционал качества ю и 1 = ~ ( ~~~ Ь;х',+аио) !»» = ~ 'г' !»» (12.176) О 1=1 о (Ь,>0, 1=-1, ..., и, а>0). Требование непрерывной дифферендируемости функции 1ф (», х) является весьма жестким и во многих задачах не выполняется. В. Г. Болтянский показал Н81, что можно ослабить требования к функции 1ф (», х). В ней допускаются разрывы частных производных на некотором множестве точек. Заметим, что если функции»о и»! Не зависят явно от времени, то решение уравнения (12Л74) — функция 1ф и оптимальное управление и, которое реалиаует минимум в (12Л74), тоже не зависит явно от времени, т.
е. ф = =- оф (х) и и = и (х), однако в общем случае 1ф (», х) и и = и (», х). Аналитическое нахождение функции 1ф в явной форме удается только в некоторых частных случаях. Один из таких случаев рассмотрен в следующем параграфе. Задача управления заключается в переводе системы из начального состояния х! =- а! (! = 1... „и) при г = 0 в конечное х! —— 0 при ! -~- оо. Из формулировки задачи следует, что система должна быть при этом асимптотически устойчива. В рассматриваемом случае уравнение Беллмана (12.172) имеет вид и и и — — ь*!.!- ~=0.