Бесекерский В.А. Теория систем автоматического регулирования (1972) (1151987), страница 85
Текст из файла (страница 85)
Это соответствует, вообще говоря. переходу к функционалу вида 382 мктоды сппткза систвм автомлтнчвского эвгулиуовлння [ее, оз где Ло — произвольные постоянные множители Лагранжа. В этом случае для определения произвольных постоянных и множителей Ло к граничным условиям долонн» добавляться совокупность условий (12.127). Рассмотрим простейшие примеры. Пусть объект управления описывается уравнением г Х == ] [(у — уо)'л- [еоио] ой, о где )о — некоторый весовой коэффвциент. Для функции (12.131) ХХ = (у — уо) о+ роио -'- Л [П (р) у — и] определим производные (12.137) ан, аН вЂ” — - 2]еои — Л, —. -- О, ди — -':2(у — уо) [ )ае, —.'— '"Лае 1 ) дН дН ду (12.138) дН вЂ .—.- Лао, дусе~ Далее в соответствии с (12.133) находим Л=-2[оои, а таконе 2у+ 29' [а„— а„,р+...
+ ( — 1)" а,р"] ..—.. 2у,. (12Л39) Совместное решение (12.136) и (12.139) даст характеристическое урав- нение 1-у[со(а„+... -';-а„р") [а„— ае,р '-... +( — 1)" аэро].=-0. (12.140) Это уравнение содержит только четные степени р. 11оэтому, если половина корней лежит в левой аолупзоскостн, то половина в в правой. Упростим задачу и полов им Ю(р) =-: аор — , 'а,. Тогда получим характеристическое уравнение в виде 1+ ро (а, + аор) (а, — аар) —. 1+ ро (а,' — а,'р') --= О.
Решение его дает корни рьз-= о ]' 1+рос,'.—. ~и. (12.141) уоо Теперь можно записать выраокение для управляемой величины: у (1) =- уо1 (1) + Сое-"' 1 (г) —, С,е"'1 (г), (12.142) где С, и С,— произвольные постоянные. Из начального и конечного условий можно определить, что С,+С,=- — у, а также уое"' ат -аг уое С,=+ е" — е Х) (р) у .—.= (а,ро + а,р"-' + ... + а„) у --= и, (12.136) д где р =- —.
де Цель управления заключается в переводе объекта из состояния у = О при 1 =- 0 в состояние у =" у, при т =--= Т. В качестве критерия качества примем минимум функционала 1 12 81 испОльзОВАнии клАссичвских ВАРНАциопных метОДОВ 383 Если Т-с-оо, то С,=О, а С,= — уо. Тогда у (1) =-- уо (1 — е-'"') ° 1 (1), У(1) Уо '1(1) (12.143) и(1) =а,У(1)+аоУ(8) =Уо (ас+(аоа — а,) е-а') ° 1(1). Отметим, что принятие более сложного функционала 7 == ~ ((у — уо)а+ тауа+ Фиа) 81 (12.144) о пе усложняет исследования и дает корни вместо (12.141) в виде / 1+ 1сааас р1' ~ ~ а+ аа Пусть теперь в рассматриваемом примере функционал не содержит управляющей величины и имеет, например, вид т ) НУ вЂ” Уо) + т У ) ссг о Тогда для функции (12,131) Н=.(У Уо) +т У +) (Р(Р)у — и) имеем Н' = — Х и ̈́— О.
Отсюда следует, что Х= — О. Тогда из уравнения Эйлера (12 145) (12.146) Но — — Н' = 2у — 28'у — 2уо ' — — О е ес о (12.147) получаем характеристическое уравнение и корни: 1 — тара = О, 1 р,,=- ~ —,= 3=а, Уравнение зкстремали при Т вЂ” оо у = уо (1 — е ' ) ° 1 (1) (12.148) не зависит от вида полинома Р (р). Подобный результат был получен другим способом ранее в $ 8.8, когда экстремаль была решением характеристического уравнения 1 + тр = О. Однако прн отсутствии ограничений на вид Р (р) реализация зкстремали (12.148) может привести к физически не осуществимым регуляторам. Дей- ствительно, из (12.136) следует, что регулятор должен обеспечить управляю- щее воздействие вида и (1) =- а„у (с) + а„су (1)+...
+аоус ' (1) Однако уже первая производная (12.148) имеет при 1 = О разрыв первого рода, а вторая и следусощие производные содержат слагаемые типа б-функ- ции и ее производных: у(1) =- уоа е-а'1(1), у (1) .= — Уоссае-а' 1 (1) + уоссб (1), у (1), у а -ас.1(1) у с„аб(1)+у сс б(1) 384 МГТОИЫ СИИТКЗА СИСТЕМ АВТОМАТИЧЕСКОГО ЗЕГУЛИРОВАИИИ [гв. 12 (12Л50) 1Х вЂ” уэ + т2у2 + рэиз + А (у — ии — еи) и используя уравнения (12,130) нли (12.132), а также уравнение объекта (12Л49), можно получить характеристическое уравнение замкнутой опти- мальной системы в виде (сэтэ + )22) р2 — (с2 + р'а') =- О.
Корепь, леясащий в левой полуплоскости, -/ "+из ' Р1 а у 2( 22' Уравнение экстремали, проходящей черев граничные точки, у .= у, — у, (1 — е-"') 1 (1). Предварительно определив (12Л51) у =- — ае а1 ° 1 (1), из (12,149) можно найти, что управление должно изменяться по закону и =- — е 1 (у — ау) =- уе ' ( — (а+ а) е-"' 1 (1) — а (1 — 1 (1))) . (12.153) Приняв е-"' за неизвестную, входящую в два уравнения (12.152) и (12.153), можно записать условие их'совместности: у — уе [1 — 1(г)) у,1(О =- О. и-Оуеас '(1 — 1(1)) (а+а)уэе '1(1) Отсюда получается уравнение регулятора и ='- — — у + — у, (1 — 1 (1)).
(12 Л54) Первое слагаелгое в правой части (12.154) соответствует собственно искомому оптимальному закону регулирования а'и и =- — и'эе„(р) у = — — у. (12 Л 55) Поэтому физическая реализация возможна для степени Й (р) не выше первой, но даже и в этом случае регулятор должен быть практически безынерционным. Получение физически не реализуемого регулятора произошло вследствие отсутствия ограничений или учета управления в принятом функционале качества (12Л46). Для получения Возможности применения инерционных регуляторов в функционал качества можно вводить кроме управления и его производные. Однако в этом случае смысл функционала качества становится неясным. Рассмотрим теперь замкнутую систему, у которой объект управления описывается дифференциальным уравнением — =..
ау+ си Л2 (12Л49) с начальным условием у (0) = уэ. Требуется определить оптимальное управление и = — И'р,„(р) у, переводящее систему в состояние у --:: 0 с бесконечным временем регулирования и минимизирующее функционал О т — ~ (у2+ теу2 („рзи2) ат 2 Рассматривая функцию (12Л31) 2 $2.23 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Второе слагаемое в правой части (12.154) соответствует постоянному значению управления и = ио — — ауос ', которое необходимо искусственно создать на выходе регулятора, чтобы в замкнутой системе до момента времени 8 = 0 (т.
е. при г ( 0) управляемая величина была бы равна заданному значению уо. Как следует из (12 154), при 2 = 0 зто постоянное управление снимается и система начнет приходить в согласованное положение. Если прн 2 < 0 рассматриваемая система была выключена и имела рассогласование у = уо, то слагаемое и, не нужно и формула (12.154) сводится к (12.155). Рассмотренный пример относится к так называемому аналитическому конструированию регуляторов, которое будет изложено более подробно в $12.10. й 12.9.
Динамическое программирование Метод динамического программирования был разработан Р. Беллманом !5). Он применим не только для решения задач оптимизации систем управления, но и для самых различных технических и экономических задач. При обосновании этого метода предполагается, что функционал качества является днфференцируемой функцией фазовых координат системы. Заметим, что зто условие выполняется ке всегда. Пусть система описывается совокупностью и уравнений, записанных для фазовых координат: —,' =~л(хы..., х„; и„..., и„) (2=1,..., и), (12.156) где 7с — некоторые, в общем случае нелинейные функции фазовых координат и управлений.
Число последних для общности принято равным числу фазовых координат. Уравнения (12.156) можно представить также в матричной форме: —,=~(х, и), (12 157) где х н и — матрицы-столбцы фазовых координат и управлений размером и х 1. В качестве критерия оптимальности примем минимум функционала т 1= ) ~о(х„..., х„' и„..., и„) й. (12.158) о Функции ~о и 1О вообще говоря, могут содержать в явном виде текущее время 2.
Однако это не меняет принципиальной постановки задачи. Целью управления является перевод системы нз состоянии х; = — а; при 2 =- 0 в состояние х; =. Ь, прн 2 = Т (с=-1,..., п). Такая задача управления называется терминальной, и она соответствует определению в фазовом пространстве оптимальной траектории с закрепленными концами. Будем считать, что фазовые координаты и управления должны принадлежать некоторым замкнутым (ограниченным) пространствам, т. е.
х(2) сХ, х(0)=аббе х(Т)=ЬЕСт, и(1)бУ, 0<2«<Т. (12.159) Можно несколько расширить цель управления и считать, что конец траектории должен только находиться в ааданной области х (Т) ~ Оь при 2 = Т. Это будет задача со свободным концом траектории. Вместо исходной можно решать более общую аадачу отыскания оптимального управления для произвольной временной точки 0 С Го Т и В. А. Весекерскка, Е. П. Попов 366 методы синтезА систем АВтОИАтическОГО РБГулиРОВАния 1тл.
12 произвольной точки в фазовом пространстве х (1е) ~ Хэ в смысле минимума функционала Тз= ') ~,(х, и) и'1. (12 160 на основании которого может быть найдено оптимальное управление и (х). Если на промежутке Г, — Т выбрать промежуточную точку г„ то на основании принципа оптимальности и ф [Т, х (гз)[ = шп1 ~ ) 4з (х, и) й+ ф [Т, х (~,)[) . (12.162) изп м Функция ф и оптимальное управление обычно не могут быть найдены аналитическим путем. Для этой цели применяются приближенные методы с использованием вычислительных машин. Рассмотрим идею приближенного расчета.
Пусть | — фиксированное аначение времени, а Л1 — малый отрезок времени, причем 0 ~ 1 + йт ( Т. Тогда 1+А| т ф(г, х)=ппп ( ) ~о(х, и)г[т+ ~ !0(х,и)с[т~, (12.163) с с+у где функции х (т) и и (т) связаны условиями (12.157). м Минимум функционала (12.160) зависит от начального момента времени Га и начальной точки хэ — — х (1З). Обозначим этот минимУм чеРез ф (хэ). ФУнкция ф (хэ) для некоторой совокупности фазовых координат х (гз) может, вообще говоря, не существовать, так как ьшжет не существовать допустимого управления, удовлетворяющего (12.156).
Если найдены функция ф (хз) и требуемое управление и (1, х,), то, положив г, = 0 и хз — — а, где а — матрица-столбец начальных условий, мы получим решение исходной задачи. Принцип оптимальности. Примем начальные условия; при г== ге х (гз) = = ае 6 6, оптимальное управление и (г, аэ) реализует минимум функционала (12.160), а х (1, аз) — оптнмальнаЯ тРаектоРин в фазовом пРостРанстве. Выберем произвольный момент времени 1„принадлежащий интервалу 1з — Т, и обозначим через а, точку а, =.
х (1„ а,) на оптимальной траектории х (1, а,). Принцип оптимальности гласит следующее. Если принять значения г, и а, за начальные, то на интервале 1, — Т оптимальное управление и (г, а,) совпадет с оптимальным управлением и (г, а,) и, следовательно, участок оптимальной траектории х (8, а,) для задачи с начальной точкой (1ю ае) на интервале 8, — Т совпадет с оптимальной траекторией для задачи с яачальной точкой (г„, а,). Доказательство достаточно очевидно. Оно исходит из того, что значение функционала качества на участке г~ — Т должно быть одинаковым прн управлениях и (8, а,) и и (г, аз).
Если бы это было не так и значение функционала на этом интервале времени было бы, например, меньше для управления и (1, а,), то управление и (1, аз) можно было бы улучшить, заменив его па интервале Г, — Т управлением и(1,а,), что противоречит принятому предположению об оптимальности управления и (г, аэ). Итак, в соответствии с изложенным введем функциональное уравнение г 'т[Тю х(~о)1 ш[п Ь (х' в) <~1' (12.161) ~ел м 387 1 22.9) ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Вид управления и (т) на интервале 2 + Ы, Т не оказывает влияния на первое слагаемое в правой части (12.163). Поэтому на рассматриваемом интервале времени следует так выбрать управление, чтобы минимизировать второе слагаемое в правой части (12.163) при выполнении условий и(т)ЕУ, х(т)ЕХ, х(Т)ЕСГ, )+Л) с.тс Т.