Диссертация (785777), страница 12
Текст из файла (страница 12)
Традиционно при рассмотрении адаптивных систем [51, 54–56] неполное знание параметров и характеристик объекта управления, а также условий его функционирования трактуется как их принадлежность к некоторому классу , который определяется через факторы55неопределенности, существенные для рассматриваемой ДС.Например, факторы неопределенности, связанные с задачей управления ЛА, можно определить через следующие три множества параметров:W = W1 W2 : : : Wp ;V = V1 V2 : : : Vq ;(1.34) = 1 2 : : : r ;Wi , Vj , k — области изменения значений величин wi (определяют возможные значенияпараметров ЛА), vj (определяют возможные значения характеристик ЛА), k (определяютгдевозможные значения параметров атмосферы и атмосферных воздействий), соответственно,т. е.wi 2 Wi ; Wi = [wimin ; wimax ℄; i = 1; 2; : : : ; p;vj 2 Vj ; Vj = [vjmin ; vjmax ℄; j = 1; 2; : : : ; q;(1.35) 2 k ; k = [kmin ; kmax ℄; k = 1; 2; : : : ; r:Конкретное сочетание параметровwi , vj , k образует кортеж !s длины p + q + r!s = hw1 ; : : : ; wp; v1 ; : : : ; vq ; 1; : : : ; r i; s = 1; 2; : : : ; p q r:(1.36)Все возможные сочетания значений факторов неопределенности, характеризующих задачууправления полетом ЛА, образуют совокупностьмножествW, V , =W V кортежей !s как декартово произведение ; !s 2 (1.37)e , если не все кортежи !s являются допустимыми.
Для другихили же как подмножество видов ДС факторы неопределенности и их возможные сочетания определяются аналогичнымобразом.Имея в виду это определение условий функционирования рассматриваемой ДС, задачаадаптивного управления в традиционной постановке формулируется следующим образом: регулятор будет адаптивным в классе , если он спустя конечное время Ta , называемое временем адаптации, обеспечит выполнение цели управления.1.7.3 Варианты схем адаптивного управления1. Как уже отмечалось, система управления считается адаптивной, если в ней текущаяинформация о состоянии системы используется не только для выработки управляющего воз56действия (как это имеет место в обычных, неадаптивных, системах), но также и для изменения(корректировки) алгоритма управления. В общем виде структуру адаптивной системы можнопредставить так, как это показано на рис.
1.3. Из него видно, что корректирующее воздействие (t) для регулятора вырабатывается с помощью механизма адаптации, использующего в качестве входной информации значения задающего воздействия r (t), управления u(t), выходаобъекта y (t), а также дополнительную информацию «внешнего» характера (); 2 , которую следует учитывать при выработке корректирующего воздействия (например, скорость ивысота полета летательного аппарата в задаче управления его угловым движением).2.
Возможны различные частные варианты данной схемы, отличающиеся друг от другасоставом входной информации, используемой при выработке корректирующего воздействия (t). Один из таких вариантов состоит в том, что корректировка осуществляется только на основе «внешней» информации (); 2 ; он именуется программированием коэффициентоврегулятора (GS-подходом). Принципиальное отличие данного подхода (рис. 1.4) от полноговарианта адаптационной схемы (рис. 1.3) состоит в том, что в GS-подходе значения корректирующих воздействий как функция от() должны быть вычислены заранее (off-line), послечего данная функция используется в неизменном виде в процессе управления объектом. Вполном варианте адаптационной схемы алгоритм корректировки перестает быть неизменным,он уточняется непосредственно (on-line) в ходе работы системы.y(t)r(t)Регуляторu(t)Объектуправленияy(t)ξ(t)u(t)Механизмадаптацииy(t)ψ(λ)РИС.
1.3. Схема управляемой системы с подстраиваемым законом управления, реализуе-(t) — задающее воздействие; u(t) — управление; y(t) — выход объектауправления; (t) — корректирующее воздействие для регулятора; (); 2 — допол-мым регулятором: rнительная информация, которую следует учитывать при выработке корректирующего воздействия (например, скорость и высота полета летательного аппарата в задаче управленияего угловым движением)57y(t)Регуляторr(t)u(t)Объектуправленияy(t)ξ(t)Механизмадаптацииψ(λ)РИС. 1.4. Схема корректировки параметров закона управления, реализуемого регуляторомr(t) — зада (t) — коррек-по схеме с программированием его коэффициентов (GS — Gain Scheduling):y(t) — выход объекта управления;тирующее воздействие для регулятора; (); 2 — информация, на основании которойющее воздействие;u(t)— управление;осуществляется выработка корректирующего воздействияНесмотря на ограниченные адаптационные возможности GS-подхода, он довольно частоиспользуется на практике.
Например, именно по такой схеме было организовано управлениеиспытательными полетами экспериментального гиперзвукового ЛА X-43 [45].3. Схемы адаптивного управления принято разделять на два основных вида: прямое адаптивное управление и непрямое адаптивное управление [51, 57–62, 66, 70].Схемы прямого адаптивного управления часто основываются на использовании некоторойэталонной модели (ЭМ), задающей требуемый характер поведения рассматриваемой системы 24 . Структура таких систем показана на рис. 1.5. В системах прямого адаптивного управления параметры регулятора (t) корректируются по алгоритму, реализуемому законом адаптации, который вычисляет значения производной _ (t) или разности (t+ 1) (t). Этовычисление основывается непосредственно на значении ошибки слежения "(t) = y (t) ym (t).В системах непрямого адаптивного управления, структура которых показана на рис.
1.6,параметры регулятора (t) вычисляются с помощью уравнения связи (отображения видаbp (t)! (t)) на основании оценок bp(t) для параметров объекта p(t). Оценки bp (t) выра-батываются оперативно, в процессе функционирования объекта, путем вычисления значения_производной bp (t) или разности bp (t + 1)bp (t).В обеих схемах адаптивного управления, прямой и непрямой, основная идея состоит в24Цель управления при этом состоит в том, чтобы поведение ДС максимально приблизить к поведению,определяемому эталонной моделью. Корректировка цели управления, упоминавшаяся в разд.
1.7.1.4, можетбыть осуществлена в данном случае заменой одной ЭМ на другую, имеющейся в составе ДС.58r(t)Эталоннаямодельym (t)θc (t)u(t)r(t)y(t)РегуляторΨ(r, y, θc )−Законадаптацииθ̇c (t))ε(t)+y(t)u(t)y(t)ОбъектF(u, y)r(t) — задающее воздействие; u(t) —управление; y (t) — выход объекта управления; ym (t) — выход эталонной модели; (t) —корректируемые параметры регулятора; "(t) = y (t) ym (t) — расхождение между выходамиРИС. 1.5.
Прямая схема адаптивного управления:объекта и эталонной моделиУравнениясвязиθbp → θcθbp (t)Оцениваниепараметровθḃp (t)u(t)θc (t)r(t)y(t)РегуляторΨ(r, y, θc )u(t)ОбъектF(u, θp )РИС. 1.6. Непрямая схема адаптивного управления:управление;y(t)y(t)— выход объекта управления; pr(t)y(t)— задающее воздействие;u(t)—(t) — оцениваемые параметры объекта;bp (t) — оценка параметров объекта; (t) — корректируемые параметры регуляторатом, что идеальные значения параметров регулятора (при прямом адаптивном управлении)или объекта (при непрямом адаптивном управлении) используются так, как если бы это былипараметры реального регулятора или объекта, соответственно. Вследствие того, что реальные значения указанных параметров неизбежно отличаются от идеальных, возникает ошибка,ухудшающая качество управления. Один из подходов к компенсации этой ошибки излагаетсяниже.
Он состоит в том, чтобы данную ошибку трактовать как возмущающее воздействие насистему и парировать это воздействие, вводя в систему компенсирующий контур.591.7.4 Роль моделей в проблеме адаптивного управления1. Критически важную роль моделей при решении задач, связанных с адаптивными ДС,можно проиллюстрировать на двух примерах, приводимых ниже.
Подробное рассмотрениеэтого вопроса будет проведено в разд. 4.На рис. 1.7 показана общая схема нейросетевого адаптивного управления с эталонной моделью (MRAC — Model Reference Adaptive Control). В данном случае роль НС-модели объектасостоит в том чтобы обеспечить преобразование измеряемой ошибки на выходе системы вошибку на выходе нейроконтроллера, значение которой необходимо для корректировки параметров этого контроллера.2. Второй пример роли модели в адаптивном управлении ДС показан на рис.
1.8, гдепредставлена общая схема нейросетевого адаптивного прогнозирующего управления (MPC— Model Predictive Control). В данном случае точная и быстродействующая модель объектанеобходима для того, чтобы прогнозировать поведение объекта при различных управляющихвоздействиях с тем, чтобы выбрать управление, наилучшее для данных конкретных условий.3. Итак, при решении задач, связанных с адаптивными системами, ключевую роль играютмодели объектов. На использовании этих моделей основано решение ряда важнейших подза+yэмЭталоннаямодель−+eНС-модельобъектаКомпенсаторybεm−uдопrypНейроконтроллерeu+Объектуправленияu+ypypεmРИС.
1.7. Общая схема нейросетевого адаптивного управления с эталонной моделью: ue—управление на выходе нейроконтроллера,uдоп— добавочное управление от компенсатора,u — результирующее управление, yp — выход объекта управления, yb — выход нейросетевоймодели объекта управления; yэм — выход эталонной модели; " — расхождение междувыходами объекта управления и эталонной модели; "m — расхождение между выходамиобъекта управления и НС-модели; r — задающее воздействие60Эталоннаямодельyэм (t)e(t) +Компенсаторyэм (t + ∆t)r(t)Алгоритмоптимизацииu∗ (t)−+ uдоп (t)+Объектуправленияu(t)yp (t)yb(t + ∆t)НС-модельобъектаyb(t + ∆t)yb(t)РИС.