Бесекерский В.А., Попов Е.П. - Теория систем автоматического регулирования (963107), страница 87
Текст из файла (страница 87)
) 0 и г".. )~0. Эти условия аналогичны требованию пололсительности хсзр! и .иг второй производной в точке минимума функции у = у (х). Однако задача без ограничений не имеет смысла применительно к системам регулирования и управления. Введем ограничения в виде связей типа (12.125) нлн (12.126). Тогда в уравнениях (12ЛЗО) вместо функции Р должна использоваться функция (12ЛЗ2) 1= ~Г,(г, (12Л34) о т.
е. бесконечному времени регулирования. В этом случае искомые функции должны принадлежать к классу С причем производная т-го порядка может иметь разрыв первого рода в точ- ке 1 =-- О. При использовании пзопернметрнческнх огранпчений типа (12.127) задача оптимизация решается также в соответствии с уравнениями (12.131), но должна быть использована функция Н=Г+~ ).,С„, ь-~ (12.135) Н=Г+,", )„(1)а„, (12.131) «=1 где Х„(~) — произвольные множители Лагранжа, в общем случае зависящие от времени г. Это будет вариационпая задача на так называемый условный экстремум (т.
е. при наличии наложенных свяаей). Прн учете связей в виде дифференциальных уравнений класс функций Сз должен определяться по наивысшей производной выражения (12,131). Если рассматривается одна переменная х (1)„но функционал включает в себя проиаводные х (О более высоких порядков и имеет, например, вид н х=- ) Р(х, х,..., х'"'; и, и) ю, и чо уравнения Эйлера будут иметь вид ДВ ж ~'+'' +( 1) "Е"оп 0' ) (12ЛЗЗ) Как и ранее, при наличии связей вместо функции г" должна рассматри- ваться функция П, определяемая (12ЛЗ1). Кчасс функций Сз определяется по наивысшей производной (12.131) вт-го порядка.
Отметим, что решение уравнений (12.130) или (12.133) часто приводит к корням характеристического уравнения, половина которых лежит в левой, а половина — в правой полуплоскости. Это наблюдается при использовании квадратичных функционалов н конечном времени регулирования Т = 1, — Га. Для устранении неустойчивости, которая получится в случае присоеди- нения подобного регулятора к системе (если, конечно. не обеспечивается его отключение после завершения требуемого процесса перевода из одного состояния в другое), можно, например, действовать аналогично изложен- ному в з 11.9 и отбросить в решении те полюсы передаточной функции, которые лежат в правой полуплоскости. Это соответствует, вообще говоря.
переходу к функционалу вида 382 мктоды сппткза систвм автомлтнчвского эвгулиуовлння [ее, ез где Ло — произвольные постоянные множители Лагранжа. В этом случае для определения произвольных постоянных и множителей Ло к граничным условиям долонн» добавляться совокупность условий (12.127). Рассмотрим простейшие примеры. Пусть объект управления описывается уравнением г Х == ] [(у — уо)'л- [ооио] ой, о где )о — некоторый весовой коэффвциент. Для функции (12.131) ХХ = (у — уо) о+ роио -'- Л [П (р) у — и] определим производные (12.137) ан, аН вЂ” — - 2]оои — Л, —.
-- О, ди — -':2(у — уо) [ )ае, —.'— '"Лао е ) дН дН ду (12.138) дН вЂ .—.- Лао, дусе~ Далее в соответствии с (12.133) находим Л=-2[оои, а таконе 2у+ 29' [а„— а„,р+... + ( — 1)" а,р"] ..—.. 2у,. (12Л39) Совместное решение (12.136) и (12.139) даст характеристическое урав- нение 1-у[со(а„+... -';-а„р") [а„— а„,р '-...
+( — 1)" аэро].=-0. (12.140) Это уравнение содержит только четные степени р. 11оэтому, если половина корней лежит в левой аолупзоскостн, то половина в в правой. Упростим задачу и полов им Ю(р) =-: аор — , 'а,. Тогда получим характеристическое уравнение в виде 1+ ро (а, + аор) (а, — аар) —. 1+ ро (а,' — а,'р') --= О. Решение его дает корни рьз-= о ]' 1+рос,'.—. ~и. (12.141) уоо Теперь можно записать выраокение для управляемой величины: у (1) =- уо1 (1) + Сее-"' 1 (г) —, С,е"'1 (г), (12.142) где С, и С,— произвольные постоянные.
Из начального и конечного условий можно определить, что С,+С,=- — у, а также уое"' е ' еат — е ат уое С,=+ е" — е Х) (р) у .—.= (а,ро + а,р"-' + ... + а„) у --= и, (12.136) д где р =- —. де Цель управления заключается в переводе объекта из состояния у = О при 1 =- 0 в состояние у =" у, при т =--= Т. В качестве критерия качества примем минимум функционала 1 12 81 испОльзОВАнии клАссичвских ВАРНАциопных метОДОВ 383 Если Т-с-оо, то С,=О, а С,= — уо.
Тогда у (1) =-- уо (1 — е-'"') ° 1 (1), У(1) Уо '1(1) (12.143) и(1) =а,У(1)+аоУ(8) =Уо (а,+(аоа — а,) е-а') ° 1(1). Отметим, что принятие более сложного функционала 7 == ~ ((у — уо)а+ тауа+ Фиа) 81 (12.144) о пе усложняет исследования и дает корни вместо (12.141) в виде / 1+ 1сааас р1' ~ ~ а+ аа Пусть теперь в рассматриваемом примере функционал не содержит управляющей величины и имеет, например, вид т ) НУ вЂ” Уо) + т У ) ссг о Тогда для функции (12,131) Н=.(У Уо) +т У +) (Р(Р)у — и) имеем Н' = — Х и ̈́— О. Отсюда следует, что Х= — О.
Тогда из уравнения Эйлера (12 145) (12.146) Но — — Н' = 2у — 28'у — 2уо ' — — О е ес о (12.147) получаем характеристическое уравнение и корни: 1 — тара = О, 1 р,,=- ~ —,= 3=а, Уравнение экстремали при Т вЂ” оо у = уо (1 — е ' ) ° 1 (1) (12.148) не зависит от вида полинома Р (р). Подобный результат был получен другим способом ранее в $ 8.8, когда экстремаль была решением характеристического уравнения 1 + тр = О. Однако прн отсутствии ограничений на вид Р (р) реализация экстремали (12.148) может привести к физически не осуществимым регуляторам.
Дей- ствительно, из (12.136) следует, что регулятор должен обеспечить управляю- щее воздействие вида и (1) =- а„у (8) + а„су (1)+... +аоусео (1) Однако уже первая производная (12.148) имеет при 1 = О разрыв первого рода, а вторая и следусощие производные содержат слагаемые типа б-функ- ции и ее производных: у(1) =- уоа е-а'1(1), у (1) .= — Уоссае-а' 1 (1) + уоссб (1), у (1) ау а -ас.1(1) у с„аб(1)+у сс б(1) 384 МГТОИЫ СИИТКЗА СИСТЕМ АВТОМАТИЧЕСКОГО ЗЕГУЛИРОВАИИИ [гв.
12 (12Л50) 1Х вЂ” уз + т'у2 + рэиз + А (у — ии — еи) и используя уравнения (12,130) нли (12.132), а также уравнение объекта (12Л49), можно получить характеристическое уравнение замкнутой опти- мальной системы в виде (сэтэ + )22) р2 — (с2 + р'а') =- О. Корепь, леясащий в левой полуплоскости, -/ "+из ' Р1 а у 2( 22' Уравнение экстремали, проходящей черев граничные точки, у .= у, — у, (1 — е-"') 1 (1).
Предварительно определив (12Л51) у =- — ае а1 ° 1 (1), из (12,149) можно найти, что управление должно изменяться по закону и =- — е 1 (у — ау) =- уе ' ( — (а+ а) е-"' 1 (1) — а (1 — 1 (1))) . (12.153) Приняв е-"' за неизвестную, входящую в два уравнения (12.152) и (12.153), можно записать условие их'совместности: у — уе [1 — 1(г)) у,1(О =- О. и-Оуеас '(1 — 1(1)) (а+а)уэе '1(1) Отсюда получается уравнение регулятора и ='- — — у + — у, (1 — 1 (1)).
(12 Л54) Первое слагаелгое в правой части (12.154) соответствует собственно искомому оптимальному закону регулирования а'и и =- — и'эе„(р) у = — — у. (12 Л 55) Поэтому физическая реализация возможна для степени Й (р) не выше первой, но даже и в этом случае регулятор должен быть практически безынерционным. Получение физически не реализуемого регулятора произошло вследствие отсутствия ограничений или учета управления в принятом функционале качества (12Л46). Для получения Возможности применения инерционных регуляторов в функционал качества можно вводить кроме управления и его производные. Однако в этом случае смысл функционала качества становится неясным.
Рассмотрим теперь замкнутую систему, у которой объект управления описывается дифференциальным уравнением — =.. ау+ си Л2 (12Л49) с начальным условием у (0) = уэ. Требуется определить оптимальное управление и = — И'р,„(р) у, переводящее систему в состояние у --:: 0 с бесконечным временем регулирования и минимизирующее функционал О т — ~ (у2+ теу2 („рзи2) ат 2 Рассматривая функцию (12Л31) 2 $2.23 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ Второе слагаемое в правой части (12.154) соответствует постоянному значению управления и = ио — — ауос ', которое необходимо искусственно создать на выходе регулятора, чтобы в замкнутой системе до момента времени 8 = 0 (т.
е. при г ( 0) управляемая величина была бы равна заданному значению уо. Как следует из (12 154), при 2 = 0 зто постоянное управление снимается и система начнет приходить в согласованное положение. Если прн 2 < 0 рассматриваемая система была выключена и имела рассогласование у = уо, то слагаемое и, не нужно и формула (12.154) сводится к (12.155). Рассмотренный пример относится к так называемому аналитическому конструированию регуляторов, которое будет изложено более подробно в $12.10. й 12.9.
Динамическое программирование Метод динамического программирования был разработан Р. Беллманом !5). Он применим не только для решения задач оптимизации систем управления, но и для самых различных технических и экономических задач. При обосновании этого метода предполагается, что функционал качества является днфференцируемой функцией фазовых координат системы. Заметим, что зто условие выполняется ке всегда.
Пусть система описывается совокупностью и уравнений, записанных для фазовых координат: —,' =~л(хы..., х„; и„..., и„) (2=1,..., и), (12.156) где 7с — некоторые, в общем случае нелинейные функции фазовых координат и управлений. Число последних для общности принято равным числу фазовых координат. Уравнения (12.156) можно представить также в матричной форме: —,=~(х, и), (12 157) где х н и — матрицы-столбцы фазовых координат и управлений размером и х 1.