Диссертация (785777), страница 36
Текст из файла (страница 36)
Другими словами, должно выполняться соотношениеe = kx(t) xm (t)k + kx_ (t) x_ m (t)k ";(4.16)e – ошибка воспроизведения требуемого движения, определяемая как взвешенная сумманорм разности между реализуемым движением x(t); x_ (t) и эталонным движением xm (t); x_ m (t);" > 0 – требуемая точность воспроизведения эталонного движения.
В идеальном вариантеe(t) = 0, т.е.x_ (t) = x_ m (t):(4.17)где5. Суть рассматриваемого метода можно пояснить на примере системы первого порядка саддитивно входящим управлением:x_ = f (x) + g (x)u;194(4.18)Согласно принципам обратной динамики, управление для системы (4.18) следует выбиратьтак, чтобы свести данную систему к видуe = xmx_ (t) = x_ m (t), или, в терминах ошибки слеженияx, получаем соотношение e_ = 0. Легко показать, что для решения данной задачинеобходимо задать закон управления в видеu(x; x_ m ) =1(x_g (x) mf (x)):(4.19)Справедливость этого утверждения можно проверить непосредственной подстановкой управления (4.19) в уравнение (4.18). Такая операция приводит к получению искомого соотношения(4.17) для идеального варианта управления системой.6.
Из приведенных рассуждений следует, что соотношение (4.17) будет выполняться, тоесть управляемая система будет точно следовать заданной траектории, если удовлетворяютсяследующие условия:математическая модель (4.18) точно соответствует объекту управления;совпадают начальные условия для рассматриваемой ДС и для ЭМ, т. е.x(0) = xm (0);отсутствуют возмущения.Перечисленные условия, однако, на практике обычно не выполняются, поэтому из-занеучтенных факторов, влияющих на поведение реальной системы, а также из-за приближенного знания функцийf (x) и g (x) ошибка слежения будет расти со временем. Чтобы предот-вратить такой рост ошибки, то есть парировать неопределенность и неточность априорнойинформации, необходимо скорректировать модель (4.17) таким образом, чтобы траекториясистемы (4.18) «притягивалась» бы к эталонной траектории, т.е.
чтобы выполнялось соотношение (4.16). Это может быть сделано введением в соотношение (4.17) дополнительногочлена, компенсирующего ошибку слежения:x_ = x_ m + K (xmx):(4.20)В этом случаеe_ = Ke:(4.21)Чтобы перейти от соотношения (4.17) к соотношению (4.20), необходимо соответственноизменить закон управления, придав ему следующую формуu(x; xm ; x_ m ) =1(x_g (x) m195f (x) + K (xmx)):(4.22)4.3.1.2 Структурная реализация подхода к управлению на основе метода обратнойзадачи динамики1. Для высокоманевренного самолета (например, для самолета F-16), рассматриваемогокак один из важных примеров объекта управления, характерна нелинейность аэродинамических характеристик во всем рабочем диапазоне, а также зависимость эффективности органовуправления от ориентации ЛА относительно обтекающего его потока, а характеристик устойчивости данного летательного аппарата — от углов отклонения органов управления. В связис этим, аддитивная форма математической модели (4.18), удобная для синтеза закона управления, не может быть использована и ее необходимо заменить моделью более общего вида:x_ = f (x; u):(4.23)Поскольку вместо соотношения (4.20) в случае системы (4.23) следует использовать соотношение видаx_ = f (x; u(x; xm ; x_ m )) = x_ m + K (xmто выразить искомую управляющую функциюx);(4.24)u(x; xm ; x_ m ) из данного уравнения аналитиче-ски и точно уже не представляется возможным.
В связи с этим отыскивается приближенноерешение, основанное на том, что функция u(x; xm ; x_ m ) аппроксимируется многослойной нейросетью прямого распространения (называемой нейроконтроллером) с помощью процедурыобучения, стандартной для сетей такого вида.СлагаемоеK (xmx), как отмечалось выше, парирует действия возмущений и уменьша-ет ошибку слежения, т. е.
оно является в определенном смысле стабилизирующим. Однакоэффективность применения данного средства в значительной степени зависит от точностимодели (4.18) и от качества приближения управленияu(x; xm ; x_ m ) нейроконтроллером, чтоотрицательно сказывается на робастности системы управления.2. Чтобы обеспечить требуемую робастность системы, можно для системы общего вида(4.23) вернуться к форме закона управленияu(x; x_ m ), принятой для системы (4.18) с ад-дитивным управлением, но с компенсирующей составляющей, отделенной от неизвестныхфункций. Это возможно, если функцияg (x) знакопостоянна при всех допустимых x и диапа-зон ее изменения не слишком велик.
Такая ситуация характерна для управления движениемЛА на докритических режимах. Управление в этом случае определяется в зависимости отпредполагаемого вида функцийf (x) и g (x), то есть от их оценок fb(x) и gb(x), следующим196образомu(x; xm ; x_ m ) =1(x_g(x) mbfb(x)) + K (xmx);(4.25)а преобразованная система принимает вид:g (x)x_ =x_ + f (x)g(x) mbВ таком случае даже при fb(x)e_ =g (x) bf (x) + g (x) K (xmg (x)bx):(4.26)= f (x) и gb(x) = g (x) уравнение ошибки выглядит какg (x)Ke, т.е. оно становится нелинейным. Потенциальная точность управления приэтом несколько снижается, однако значительно возрастает робастность системы в целом: ком-x) всегда работает на уменьшение ошибки слежения вне зависимости отточности оценок fb(x) и bg(x), а робастность самого компенсатора может быть обеспеченапенсаторK (xmприданием ему достаточного запаса устойчивости.Чтобы подчеркнуть различия между этими двумя формами компенсации, можно назватьвариант включения компенсирующего слагаемого в (4.22) «внутренней компенсацией», а вариант в выражении (4.25) — «внешней компенсацией».Для объекта управления общего вида (4.23), если управляющая функция представленанейроконтроллером, использование внешней компенсации в процессе адаптации и перенастройки позволяет добиться компромисса между робастными и адаптивными свойствами системы.3.
Структурная организация всей системы показана на рис. 4.11. Нейроконтроллер вырабатывает управляющий сигнал точного слежения за эталонной траекторией, а динамическийкомпенсатор корректирует в сторону уменьшения отклонение em реальной траектории от эталонной. Желаемая траектория xm ; x_ m обычно вырабатывается эталонной моделью в зависимости от задающего сигнала r (t).Функция управленияuNN (x; x_ m ) для системы, показанной на рис. 4.11, удовлетворяетуравнениюx_ = f (x; uNN (x; x_ m )) = x_ m ;(4.27)а на вход объекта поступает суммарное управлениеu = uNN + uC ;(4.28)где uC – дополнительный управляющий сигнал, вырабатываемый в компенсирующем контуре.Учет в законе управления сигналов xm ; x_ m дает возможность улучшить характеристикисистемы на различных частотах.
При этом желаемая траектория xm требуется для придания197xНейроконтроллерuN NẋmrЭталоннаямодельẋm++emxm−КомпенсаторuC+uОбъектуправленияxxРИС. 4.11. Структурная схема системы управления по принципу обратной динамики:— задающее воздействие; xmr (t)(t), x_ m (t) — выходы эталонной модели; x(t) — выход объ-(t) — расхождение между выходами объекта управления и эталонноймодели; u(t) — управление, подаваемое на вход ОУ; uNN (t) — управляющий сигнал отнейроконтроллера; uC (t) — управляющий сигнал от компенсатораекта управления; "mсистеме робастности и хорошего качества на малых частотах, поскольку компенсирующийконтур представляет собой следящую систему с большим значением коэффициента усиленияв обратной связи.
Учет производной желаемой траектории x_ m при адекватной настройке нейроконтроллера позволяет устранить или значительно уменьшить ошибку слежения на среднихи, в определенной степени, на больших частотах.4. Метод обратной динамики обладает существенным преимуществом по сравнению сранее рассмотренной схемой с эталонной моделью: все три составляющие, показанные нарис. 4.11 (эталонная модель, нейроконтроллер и компенсатор) являются в значительной степени самостоятельными элементами, их можно изменять независимо друг от друга.
В противоположность этому, в схеме адаптивного управления с ЭМ эталонная модель и компенсаторвзаимозависимы, их параметры варьировать можно только согласованно, что может существенно затруднить синтез требуемого закона управления.4.3.2 Адаптивное управление с инверсной моделью4.3.2.1 Схема адаптивного управления с инверсной моделью1. Как отмечалось в предыдущем разделе, наряду с дальнейшим совершенствованием схемс ЭМ и ПМ, осуществляемой за счет привлечения более мощных средств НС-моделирования,представляется целесообразным также расширить перечень рассматриваемых схем адаптивного управления.
Наряду с рассмотренной выше схемой на основе метода обратной задачи198ξ(t)r(t)+Фильтрg(t)ИнверснаяНС-модельобъектаu(t)Объектуправленияy(t)ПрямаяНС-модельобъектаyb(t)−−+u(t)εm (t)РИС. 4.12. Структурная схема системы управления с прямой и инверсной НС-моделямиr(t) — задающее воздействие; (t) — возмущающее воздействие; g(t)— сигнал на выходе фильтра; u(t) — управление; y (t) — выход объекта управления; yb(t)— выход нейросетевой модели объекта управления; "m (t) — расхождение между выходамиобъекта управления:объекта управления и НС-моделидинамики, еще один из очевидных кандидатов на включение в такой расширенный перечень— это схема с инверсной моделью (ИМ) [53, 54, 82].Схему управления с ИМ можно представить в двух вариантах: неадаптивном и адаптивном, точно так же, как это имеет место и для схем управления с ЭМ и ПМ.2.
Неадаптивная схема управления с ИМ (рис. 4.12), известная в теории управления каксистема с косвенным измерением возмущений, исследовалась на устойчивость и робастностьпри управлении нелинейными объектами и продемонстрировала возможность достижениявысокого качества управления.Помимо инверсной НС-модели, в состав систем управления с ИМ входит также и прямаяНС-модель объекта управления (это точно такая же модель объекта, которая входила в составсистем управления с ЭМ и ПМ).При соответствующем выборе операторов для элементов системы (т.
е. фильтра, прямойy (t) воспроизводит входной (задающий) сигналg (t) с желаемой динамикой и не зависит от возмущений (t), приведенных к выходу объектаи инверсной модели) выходная переменнаяуправления.AЭто возможно, если инверсная модель объекта управления реализует инверсный оператор1 , а прямая модель — прямой оператор A объекта управления. Для достижения желаемойдинамики системы в ее состав вводится фильтр, реализующий оператор вида AF = Ae 1 Ab ;199e 1 — реализация инверсной моделью точного инверсного оператора A 1 ; Ae — реализациягде AA. В этом случае сигнал r(t) воспроизводитсяна выходе объекта без искажений, т.
е. y (t) r (t) и не зависит от возмущения (t), эквивалентного возмущению (t) и приведенного ко входу объекта.прямой моделью точного прямого оператораЕсли прямая и инверсная модели объекта управления реализованы точно, т. е. еслиAe 1 = A 1 и Ab = A;тогдаy (t) = AF r(t) "m (t) :Вход и выход системы в рассматриваемом случае связаны операторным соотношением y (t) = L 1 AF Ae 1 A r(t); L = 1 + AF Ae 1 AAF Ae 1 Ab3. В системе управления с ИМ показанной на рис.