Пупков К.В. Методы классической и современной теории автоматического управления. Том 2 (2000) (1095389), страница 95
Текст из файла (страница 95)
2.28 траектории получены с помощью необходимых условий оптимальности, следовательно, только эти траектории могут быть оптимальными, если они вообще существуют. Существование оптимальных траекторий представляется достаточно очевидным по физическим соображениям.
508 Методы тео ии оптимального п веления. Часть 111 ГЛАВА 3. ОПТИМАЛЬНЫЕ ПО БЫСТРОДЕЙСТВИЮ СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ Одной нз наиболее важных проблем теории оптимального управления является проблема синтеза систем, оптимальных по быстродействию. Время регулирования входит в число основных характеристик системы автоматического управления. Для многих технических систем уменьшение времени регулирования, т.е. повышение быстродействия системы, имеет большое практическое значение. Синтезу оптимальных по быстродействию систем автоматического управления посвящено большое число работ.
Основоположником этого направления является А.А. Фельдбаум [64]. Особенно много публикаций на эту тему выполнено в шестидесятые годы. В настоящей главе работы рассматриваются основные этапы синтеза оптимальной по быстродействию системы: синтез оптимального управления, аппроксимация поверхности переключения, учет входных сигналов, исследование ошибок слежения, приближенный метод синтеза систем высокого порядка. 3.1. СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ МЕТОДОМ ФАЗОВОГО ПРОСТРАНСТВА 3 1.1. ПОСТАНОВКА ЗАДАЧИ СИНТЕЗА Пусть задан некоторый объект регулирования, который будем называть также неизменяемой частью системы (рис. 3.1).
Требуется выбрать структуру и параметры управляющей части, которые обеспечивают в системе при любых входных воздействиях уо(г) и любых начальных условиях оптимальные по быстродействию процессы. Рнс. ЗЛ. К постановке зааачн сннтеза На практике задачу синтеза ставят обычно более узко. Рассматривают не произвольные входные воздействия, а лишь некоторый подкласс, в который включают наиболее существенные. Часто нет необходимости отождествлять множество начальных условий со всем фазовым пространством, т.к.
иногда заранее известна область возможных начальных условий и эта область может быть весьма ограниченной. Формулируя задачу синтеза, будем стремиться к некоторой идеальной системе. Эта система не должна иметь ошибок при воспроизведении входных сигналов, т.е. должна быть идеальной как следящая.
Она также должна обеспечивать минимальную Глава 3. Оптимальные по быс одействию САУ 509 длительность переходных процессов. Такую идеальную систему часто очень трудно реализовать на практике. Однако весьма важно иметь представление о принципиальной возможности построения такой системы. Рассмотрим линейный объект управления, движение которого задавтся уравнением УМ1+а„,у1" 1+...+а,у'+псу=хи, (3.1) где а, и )г ()г > О) — некоторые константы, у — регулируемая величина, и — управление. На управление и наложено ограничение 1и1< А. (3.2) В любой САР ошибка УО где уе — входное воздействие.
Если имеет место идеальное слежение, то у(г) - =ус(г) . (3.3) Из (З.З) следует, что У01(Г) ж уо'(Г) (3.4) при любом 1. Если в начальный момент г = 0 не выполняется хотя бы одно из условий (3.4) при ! < л, то соблюдение равенства (3.3) при г > 0 невозможно даже теоретически. Действительно, скачкообразное изменение координаты у(г) или ей производной г('у/сФ' при 1 < и недопустимо, т.к. тогда старшая производная г1"у1 г(г" будет содержать дельта-функцию, т.е. левая часть уравнения (3.1) окажется неограниченно большой, а это невозможно, т.к.
в силу (3.2) правая часть уравнения (3.1) ограничена. Поэтому в данном случае в системе должен быть переходный процесс. Таким образом, для того чтобы в системе, начиная с некоторого момента времени 0, имело место идеальное слежение, необходимо выполнение соотношений У(й)=уе(0), У01(й)=Уев'(й) 1=1 -1 Рассмотрим фазовое пространство с декартовыми координатами у,у',...,УМ П. изобРазим в этом пРостРанстве тРаектоРию Уа(г) = (Ус(г),Ус(г),...,У~; 0(е)), соответствующую входному сигналу уе(г) . Пусть в начальный момент г = 0 фазовая точка у(0) = (у(0), у'(О),.,., уы 0(0)) не совпадает с фазовой точкой ус(0) = (ус(0), уе(0),...
усы 0(0)) . Оптимальным 'называется такое движение (рис. 3.2), при котором фазовая точка у совмещается с фазовой точкой уа за минимально возможное время. Вместо введенного пространства на практике целесообразно рассматривать фазовое пространство ошибок с декартовыми координатами х = уе -у, х' = уе -у', ..., х1" 0 = ус1" 0-у1" ~1. В пространстве ошибок идеальному слежению соответствует начало координат. Оптимальным является такое движение, при котором фазовая точка х = (х,х',...,х " ~) переводится из начального состояния в начало координат за 'минимально возможное время (рис. 3.3). В силу неравенства (3.2), идеальное слежение возможно лишь за такими входными сигналами уе(г), которые удовлетворяют неравенству 1" уо +ал-1уо ~ь" "'а1уо+аоуо11<йА (3.5) и называются допустимыми. 510 Методы тео ии оптимального п веления.
Часть П1 /т /ст Рис. 3.2. К определению оптп мел ьно го движении Из соотношения х = ус -у выразим у и подставим в (3.1): а(» ссот = л" Уо 'с -)Уо " а)уо с'оуо (и) (л-)) ь (л) (е-1) или х(") + а„, х(" ') + ... + а, х' + пох = — /си о /'(с), (3.6) где ./(С) = Уо + а -)Уо + " + а)уо + аоуо. Если входное воздействие задано, то /(с) — известная функция времени. с(сх нг Рис. 3.3. К определению оптимального движении В соответствии со сказанным выше, для построения оптимальной системы необходимо найти закон управления, который обеспечивает перевод фазовой точки х =(х,х',...,х(" ')) системы (3.6) из произвольного начального состояния в начало координат за минимально возможное время. В решении указанной задачи большую помощь может оказать теорема о числе переключений (см. 2.3). 3 2.2.
Синтез ОптимАльнОГО УпРАВлениЯ Будем сначала предполагать, что в качестве задающих воздействий выбирается такой подкласс функций, для которого у'(с) = О. Для объекта у" = /си таким подклассом будут, например, функции 51! Глава 3. Оптимальные по быс одействию САУ Уо(г) = 8зг+ Яо где я, и яо — произвольные числа. Вообще, если входной сигнал представляет собой многочлен с произвольными коэффициентами, то он принадлежит к указанному подклассу в том случае, когда степень многочлена меньше порядка астатизма объекта управления.
Для рассматриваемого подкласса входных воздействий уравнение (3.6) имеет вид Х~ ~+а„,Х~" ~+...4-аХ'ч-аок=-йи. (3.7) Предположим, что уравнение (3.7) удовлетворяет теореме о числе переключений. Тогда любую идущую в начале координат траекторию х(г) можно разбить на участки, каждый из которых характеризуется управлением А либо -А. Совокупность всевозможных идущих в начало координат оптимальных траекторий заполняет все фазовое пространство. Таким образом, каждой точке фазового пространства Х ставится в соответствие некоторый знак управления, а все фазовое пространство разбивается на две области, одна из которых характеризуется управлением и = А, а другая — управлением и = -А.
Границу, разделяющую эти области, обозначим о и будем называть поверхностью переключения. Синтез оптимального управления сводится к построению в фазовом пространстве поверхности переключения. Будем сначала предполагать, что п=3. Выпишем уравнение х" + азх" + а х'+ аох = -Аи . (3.8) В соответствии с теоремой о числе переключений оптимальная траектория х(г) в этом случае разбивается на три участка, на которых знаки управления чередуются. Так как управления принимают значения А, -А, то в начало координат фазовая точка может попасть либо с управлением и = А, либо с управлением и = — А .
Предположим, что на заключительном участке и = А . Существует единственная траектория, которая является решением уравнения (3.8) при и = А и проходит через начало координат. Обозначим эту траекторию Т.,' (рис. 3.4). Рве 3.4. Графики фазовых траекторий Если на заключительном участке и = -А, то соответствующую траекторию обозначим Е,", Объединениелиний Ц и Т,; обозначим Тз; (, = ц' () ц" . 512 Методы тео ии оптимального п авления. Часть РН Таким образом, заключительный участок любой оптимальной траектории обязательно лежит на линии Ез . Если на заключительном участке и = А, то на участке, предшествующем заключительному, и = -А . Конец предпоследнего участка оптимальной траектории в этом случае лежит на линии Е,'.
Конечной точкой предпоследнего участка может быть любая точка линии Е,'. Совокупность траекторий, примыкающих с управлением и = — А к линии Е,', обозначим Ез (один штрих означает управление и = А, два штриха — управление и = -А ). Если на заключительном участке оптимальной траектории и = — А, то предпоследний участок характеризуется управлением л = А, причем конец предпоследнего участка лежит на линии Е~'. Совокупность траекторий, примыкающих с управлением и=А к линии Е;,обозначим Ез.
Пусть Ез =Е~ЦЕз. Ясно, что совокупность Ез представляет собой поверхность в трехмерном фазовом пространстве. Покажем, что Ез является поверхностью переключения, т.е. 1., = о . Для этого рассмотрим множество возможных первых участков оптимальной траектории. Совокупность траекторий, примыкающих с управлением и = А к полуповерхностн (поверхность с краем) Ез, обозначим Е~, совокупность траекторий, примыкающих с управлением и = — А к полуповерхности Ез, обозначим Ез.