Диссертация (785777), страница 35
Текст из файла (страница 35)
Схема нейросетевого адаптивного прогнозирующего управления. Здесь обозначено:u— управление на выходе алгоритма оптимизации,от компенсатора,uuдоп— добавочное управление— результирующее управление, yp — выход объекта управления, yb— выход нейросетевой модели объекта управления;yэм— выход эталонной модели;расхождение между выходами объекта управления и эталонной модели;r"—— задающеевоздействиегде T — длина интервала прогноза.Отсутствие в критерии слагаемого управления позволяет делать на каждом шаге всегоодну итерацию методом Гаусса-Ньютона (благодаря тому, что в критерии качества ошибкойявляется отклонение траектории модели объекта от эталонной (eзначения (e = y=yyb), а не от заданногоy^) ).Таким образом, здесь выполняется минимизация отклонения поведения НС-модели от ЭМне по параметрам нейроконтроллера (их тут нет вообще), а непосредственно по управлениюна интервале прогноза.
Чтобы применять эффективные методы оптимизации, необходимо вычислить динамический якобиан по управлению:2ek+266 u6 k+166 ek+36Ju = 66 uk+166664 ek+T3ek+2ek+27:::uk+2uk+T 1 777ek+3ek+3 77:::uk+2uk+T 1 777(4.10)777ek+T 5ek+T:::uk+1 uk+2uk+T 1Это делается с помощью метода обратного распространения ошибки во времени (BPTT —188r(t)Эталоннаямодельym (t)Компенсатор−uдоп (t)r(t)ym (t)ε(t)+u∗ (t)Алгоритмоптимизацииby(t)+u(t)Σyp (t)ОбъектуправленияΣ+u∗ (t)a3 (t)TDLLW3,2Σ1LW4,3n3 (t)b3f31by(t)n4 (t)Σf4b4189yp (t)TDLLW3,4НС-модельобъектауправленияРИС. 4.9.
Структурная схема нейросетевой реализации адаптивного управления с прогнозирующей моделью: TDL — линия задержки;IW — матрица синаптических весов связей между входным и первым обрабатывающим слоем НС; LW — матрица синаптическихвесов связей между обрабатывающими слоями НС;b— набор смещений слоя НС;f— набор активационных функций слоя НС; — набор сумматоров слоя НС; n(t) — набор скалярных выходов сумматоров; a(t) — набор скалярных выходов активационныхфункций; r (t) — задающий сигнал; yp (t) — выход объекта управления; yb(t) — выход НС-модели; ym (t) — выход эталонной модели;u (t) — управление, вырабатываемое алгоритмом оптимизации; uдоп (t) — добавочное управление от компенсатора; u(t) — управление,поступающее на вход объекта; "(t) = yp (t) ym (t) — расхождение между выходами объекта и эталонной моделиBack Propagation Through Time) для замкнутой нейросетевой модели.Метод Гаусса-Ньютона очень похож на метод Левенберга-Марквардта, отличается толькотем, что коэффициент в нем не меняется, он выбирается экспериментально для решаемойзадачи:un+1 = un + (JuT Ju + E ) 1 JuT e:(4.11)С учетом сказанного, вычисление управления на каждом шаге интегрирования производится в следующей последовательности:1.
Построение желаемого поведения на интервале прогноза. Для этого ЭМ просчитываетсяна этом интервале при постоянном задающем сигнале (задающий сигнал rk+1 : : : rk+T 1=rk : за неимением более изощренных вариантов, предположим самое простое — последнее доступное значение этого сигнала).2. Прогноз проведения объекта управления по его НС-модели на несколько шагов вперед. Начальными условиями для модели являются эталонная траектория и предыдущиезначения управления, полученные с помощью такого контроллера.3. Определение вектора ошибки следования, вычисление якобиана ошибки для каждогомомента времени по управлению в каждый момент времени.4. Корректировка вектора управления любым оптимизационным методом (в данном случаеметодом Гаусса-Ньютона).
Пункты 2–4 представляют собой одну итерацию оптимизационной процедуры, выполняемой до разумного уменьшения ошибки прогноза.5. В качестве управления (в реальный объект) на следующем шаге (процедура оптимизации занимает часть шага) берется первое управление на интервале прогноза (т. е. uk+1 ).Этим же значением заполняется весь вектор начального приближения управления наследующем шаге.4.2.3 Адаптивное управление с прогнозирующей моделью применительнок угловому движению ЛАПоведение ЛА под управлением системы с прогнозирующей моделью в значительной степени подобно его поведению под управлением системы с эталонной моделью.Для оценки эффективности алгоритма адаптивного управления с ПМ была проведенонесколько серий вычислительных экспериментов. Вначале выполнялось тестирования алгоритма с ПМ для ступенчатого задающего сигнала по углу атаки.
Требовалось синтезировать190закон управления продольным угловым движением перспективного ГЗЛА X-43, который позволял бы обеспечить высокую точность стабилизации требуемого угла атаки, определяемого входным задающим сигналом при различных сочетаниях числа Маха и высоты полета,характерных для данного ЛА.
На рис. 4.10 приведен пример результатов из данной серии,расширенный набор этих результатов дается на рис. А.46–А.54. Из полученных результатоввидно, что законы управления, синтезированные с привлечением механизмов адаптации сПМ, обеспечивают достаточно высокое качество управления. А именно, для всех исследованных режимов полета ошибка отслеживания заданного угла атаки при резком его изменениина величину до12Æ не превышала0:27Æ, а в ряде случаев падала до 0:08Æ . После то-го, как завершался переход к новому значению угла атаки, значение ошибки отслеживанияснижалось практически во всех случаях до(0:01Æ 0:02Æ). Приведенные результаты пока-зывают также характер работы органа продольного управления ГЗЛА (элевонов), требуемогодля реализации синтезированного закона управления, путем сопоставления значений командного сигнала, поступающего на вход привода элевонов, с углом отклонения элевонов.
Крометого, анализируя данные по скорости отклонения элевонов, требуемой для реализации полученного закона управления, можно выявить требования к приводам элевонов. Из результатоввычислительных экспериментов следует, что требуемая скорость отклонения элевонов лежитв пределах50 Æ/с.Эти данные можно сравнить с результатами для ГЗЛА X-43 (полет с числом Маха M= 6),которые приведены на рис.
А.55, где показана работа системы в условиях отсутствия отказов иповреждений при более сложном (случайном) характере задающего воздействия. На рис. А.56демонстрируется работоспособность рассматриваемой системы в условиях двух последовательных отказов, влияющих на динамику ГЗЛА. Эти отказы вызвали смещение центровкина 5% назад в момент времениt = 30 с, а затем 30% уменьшение эффективности органауправления при t = 60 с.Аналогичные вычислительные эксперименты применительно к адаптивной системе управления с прогнозирующей моделью были выполнены для маневренного самолета F-16 (результаты приведены на рис.
А.57, А.58 и А.59), а также для БПЛА (работа системы управления сПМ в штатном режиме — см. рис. А.60 и А.61, при возникновении отказв — см. рис. А.62.Выводы, которые следуют из результатов вычислительных экспериментов, представленных в данном разделе, в целом аналогичны тем, что были сделаны для систем с эталонноймоделью. А именно, в подавляющем большинстве случаев адаптивная нейросетевая систе191РИС.
4.10. Результаты вычислительного эксперимента для системы управления с прогнозирующей моделью применительно к перспективному ГЗЛА при ступенчатом задающемсигнале по углу атаки (режим полетаM= 5, H = 28 км). Обозначения: — угол ата-ки, град; e — ошибка отслеживания заданного угла атаки, град;тангажа, град/с;!z— угловая скорость— командный сигнал привода («сигнал») и угол отклонения элевонов(«положение»), град;;d=dt — угловая скорость отклонения элевонов, град/с; t — время, с192ма управления, структура которой представлена на рис.
4.8, успешно справляется со своимизадачами, в том числе и при возникновении отказных ситуаций.Сопоставление схем адаптивного управления с эталонной моделью и с прогнозирующеймоделью не позволяет отдать предпочтение ни одной из них. У каждой из них есть свои положительные и отрицательные свойства. Окончательное решение в пользу какой-либо однойиз этих схем можно сделать лишь применительно к конкретной решаемой прикладной задаче,после проведения достаточно обширной серии вычислительных экспериментов.4.3 Адаптивное управление с обратной динамикой и инверсной моделью4.3.1 Адаптивное управления на основе метода обратной задачи динамики4.3.1.1 Общая схема подхода к управлению на основе метода обратной задачидинамики1.
Результаты вычислительных экспериментов, осуществленных для адаптивных систем сэталонной моделью (ЭМ) и с прогнозирующей моделью (ПМ), представленные, соответственно, в разд. 4.1.5 и 4.2.3, показывают, что в ряде случаев они не вполне отвечают предъявляемым требованиям по качеству управления. В связи с этим, в рассмотрение была введена ещеодна схема адаптивного управления, а именно, схема, построенная на базе метода обратнойзадачи динамики (ОД), которая в ряде случаев превосходит схемы управления с ЭМ и ПМ.2. Обратными задачами динамики принято называть такие задачи, в которых для заданного объекта требуется найти закон управления, обеспечивающий реализацию некоторогопредписанного движения этого объекта [67–70].Концепция обратной задачи динамики управляемых систем первоначально возникла в рамках механики, а затем была распространена и на системы других классов.Введем эту концепцию на примере динамической системы (ДС), движение которой описывается уравнением видаm x + f (x; x_ ) = F (t);(4.12)m — масса системы; переменные x(t); x_ (t) характеризуют положение системы и скоростьее движения в каждый момент времени t 0; F (t) — сила, действующая на систему.где>3.
Для управляемой динамической системы можно сформулировать два класса задач. Взадачах первого класса считается известной математическая модель ДС вида (4.12), а также193состояние ДС в начальный момент времени:x(0) = x0 ; x_ (0) = x_ 0 :Сила(4.13)F (t) в (4.12) задана. Требуется найти траекторию движения системы, т.е. значения ве-личинx(t); x_ (t); t> 0:(4.14)Решение сформулированной задачи сводится к интегрированию дифференциального уравнения (4.12) с начальными условиями (4.13).В задачах второго класса, так же как и в задачах первого класса, математическая модельДС (4.12), а также начальные условия (4.13) считаются известными.
Кроме того, задаетсятребуемая траектория движения рассматриваемой системыx(t) = xm (t); x_ (t) = x_ m (t); t> 0:(4.15)Требуется найти силу F (t), обеспечивающую реализацию движения (4.15).4. Задачи сформулированных двух классов прямо противоположны по содержанию. Ихпринято именовать, соответственно, прямыми задачами динамики и обратными задачами динамики.ЕслиF (t) в (4.12) представляет собой управляющее воздействие на ДС, то обратнуюзадачу динамики можно трактовать как задачу синтеза такого алгоритма управления, прикотором ДС обладает требуемыми динамическими свойствами.Целью управления при этом является реализация такого движения ДС, которое воспроизводило бы с требуемой точностью некоторое желаемое движение xm (t); x_ m (t);t> 0, задавае-мое с помощью эталонной модели (ЭМ).