Диссертация (785777), страница 32
Текст из файла (страница 32)
Таким образом порядок настройки нейроконтроллера будет следующим:1. Установка начальных условий на эталонной траектории. Обычно под начальные условияпросто отводятся первые несколько точек сегмента.172Neurocontroller with plant and NN model (training version)15NN model1050−505101520253035404550ObjectRefModel0510152025303540455015Plant1050−5(a)Comparison of errors with plant and NN modelNN model10.50−0.5051015202530354045503035404550eα=α−αrm1Plant0.50−0.50510152025(b)РИС. 4.4. Характеристики работы нейроконтроллера при использовании его с реальнымобъектом управления и с НС-моделью (ГЗЛА X-43, режим полетаM= 6): (a) сравне-ние характеристик; (b) величины ошибок отслеживания задающего сигнала. Обозначения:Plant, Object — объект управления, NNModel — НС-модель, e=rm — ошибка отсле-живания как разность между значениями угла атаки для объекта управления и эталонноймодели1732. Просчет объединенной сети на этом сегменте (определение поведения объекта управления при текущих параметрах нейроконтроллера), определение ошибки следования ЭМ,вычисление якобиана этой ошибки по параметрам нейроконтроллера.3.
Корректировка параметров на текущем сегменте с использованием уравнений фильтраКалмана.В режиме реального времени нейроконтроллер обучается по такой же схеме, но с некоторыми отличиями:1. Последовательные сегменты представляют собой скользящий интервал (обычно 50 точек — 0.5 с). Однако параметры обновляются не на каждом шаге моделирования (0.01с), а каждую 0.1 с.2. Одновременно учится и НС-модель, а поэтому меняются параметры модельной подсетив объединенной системе.Следует отметить, что нейроконтроллер учится управлять не самим объектом, а его моделью, поэтому, если НС-модель не обладает требуемой точностью, то качество управлениябудет неудовлетворительным.Модель не может быть абсолютно точной, так как нейросетевой подход в своей основе дает приближенные решения.
Следовательно, с помощью такого «чистого» подхода невозможнодобиться точного управления (точного следования ЭМ).Этот результат показан на рис. 4.4. Для сравнения на этом же рисунке показана работанейроконтроллера с тем объектом, которому он обучался (НС-модель). Видно, что точностьработы НК с реальным объектом несколько снижается, что свидетельствует о наличии уклонения поведения реального объекта от поведения его НС-модели. Способ повышения точностиработы НК в данной ситуации рассматривается в следующем разделе.4.1.3 Компенсирующий контур в схеме адаптивного управления с эталонноймодельюОшибки и неточность нейросетевой модели можно интерпретировать как возмущения,приводящие к отклонению траектории реального объекта от эталонной траектории.
Для уменьшения ошибки следования можно воспользоваться компенсатором (управление непосредственно по ошибке) — ему все равно какова природа возмущений и он очень хорошо встраивается в схему с эталонной моделью.174PlantRefModelMRAC with compensatorα, deg105005101520253035404505101520253035404550051015202530354045500510152025t, sec3035404550e , deg0.2α0−0.2αref, deg1050−5φact, deg100−10РИС. 4.5. Результаты вычислительного эксперимента для системы управления с эталонноймоделью и компенсатором (ГЗЛА X-43, режим полетаM= 6). Обозначения: — уголатаки, град.; e — ошибка отслеживания заданного угла атаки, град.;сигнал по углу атаки, град.;atref— задающий— командный сигнал для привода элевонов, град.;время, с; Plant — объект управления; RefModel — эталонная модель175t—PlantRefModelMRAC without compensatorα, deg1050051015202530354045051015202530354045051015202530354045500510152025t, sec3035404550e , deg0.5α0−0.5αref, deg1050−5φact, deg100−10РИС.
4.6. Результаты вычислительного эксперимента для системы управления с эталонноймоделью и без компенсатора (ГЗЛА X-43, режим полетаM= 6). Обозначения: — уголатаки, град.; e — ошибка отслеживания заданного угла атаки, град.;сигнал по углу атаки, град.;atref— задающий— командный сигнал для привода элевонов, град.;время, с; Plant — объект управления; RefModel — эталонная модель176t—В простейшем случае компенсатор (ПД-компенсатор) реализует через дополнительнуюобратную связь закон управления вида [61] (см. также рис.
4.1 и 4.8):'доп = Kp e + Kd e;_(4.7)e = yэм y — ошибка следования ЭМ, yэм . В системе управления компенсатор дискретизирован, e_ вычисляется как конечная разность.гдеНесмотря на простоту, компенсирующий контур снижает ошибку следования примерно напорядок. Сопоставить эффект от применения компенсатора можно по данным, приведеннымдля случая ГЗЛА на рис.
4.5 (компенсатор используется) и на рис. 4.6 (компенсатор не используется). Более сложный случай иллюстрируется с помощью рис. А.3 и А.4, где показановлияние компенсатора при возникновении отказной ситуации, которая привела к смещениюцентровки на 5% назад в момент времениt = 20 с.Можно использовать также интегральный компенсатор, представляющий собой фильтрвида [61]:Wкомп =Wэм1(p + 1)n m(4.8);1где n — порядок числителя передаточной функции ЭМ, m — порядок ее знаменателя; —произвольная константа, настраиваемый вручную параметр контура компенсации (обратнопропорциональна коэффициенту усиления).Применение интегрального компенсатора позволяет избавиться от установившейся ошибки, при этом будут полностью подавляться постоянные возмущения.
Это видно, например, изрис. А.5 (см. Приложение А): когда возмущение, вызванное внешним воздействием, затухает,ошибка системы близка к нулю.Однако в неустановившемся режиме интегральный компенсатор работает точно так же,как и ПД-компенсатор (см. рис. А.6 — без отказов, а также рис. А.7 — при возникновении отказной ситуации), а поскольку установившиеся режимы для систем рассматриваемого классанехарактерны, то применительно к этим системам вполне можно обходиться более простымПД-компенсатором.4.1.4 Оценка влияния параметров эталонной модели на работоспособностьсинтезируемой системы управленияВыше отмечалось, что требуемый характер поведения рассматриваемой системы в проведенных исследованиях определялся с использованием эталонной модели (ЭМ). Как пока177зывает опыт вычислительных экспериментов, целесообразно выбирать ЭМ таким образом,чтобы определяемый ею характер желаемого поведения был бы достаточно близким к поведению реального объекта управления.
Если это условие не удовлетворяется, то контроллер, встремлении максимально приблизить характер поведения системы к желаемому, будет выдавать слишком большие значения командных сигналов для приводов органов управления, чтоможет привести к существенному ухудшению качества регулирования.С учетом этих соображений, в разд. 4.4.2.1 для рассматриваемых схем адаптивного управления была введена эталонная модель, представляющая собой последовательное соединениеапериодического и колебательного звеньев:Wэм =2!эм2 ):(Tпр p + 1)(p2 + 2эм !эм p + !эмПараметрами данной эталонной модели являются собственная частота!эм , коэффициентотносительного демпфирования эм и постоянная времени «префильтра» Tпр .
Формально апериодическое звено в ЭМ не является префильтром, но выполняет такую его функцию, каксглаживание резких сигналов, поступающих на привод. Данная структура эталонной моделибыла выбрана исходя из следующих соображений:1. Переходные процессы в угловом продольном движении являются колебательными (система нелинейных дифференциальных уравнений, описывающая продольное угловоедвижение самолета, имеет второй порядок), поэтому основу эталонной модели составляет колебательное звено.2. Под объектом управления понимается самолет с приводом органа управления, поэтомучисто колебательная ЭМ недостижима для контроллера, так как следование ей требуеточень больших сигналов, поступающих на привод.
Чтобы этого избежать, в ЭМ введеноапериодическое звено, играющее роль префильтра.3. Параметры ЭМ выбраны исходя из ее достижимости для объекта с контроллером, атакже с учетом потребного диапазона отклонения рулей.Величина коэффициента относительного демпфирования эм в ЭМ экспериментально былавыбрана равной 0.8, чтобы добиться компромисса между отсутствием перерегулирования изатянутостью переходного процесса, реализуемого ЭМ.
Постоянная времени префильтраTпрбыла принята равной 0.05 с.Основным параметром ЭМ является частота!эм , которая определяет желаемое быстро-действие системы в целом. С физической точки зрения увеличить скорость реакции можно178только с помощью большего отклонения рулей в переходном режиме.Известно, что желаемое быстродействие системы выбирается на основе компромисса между скоростью реакции системы и скоростью отклонения рулей, что было продемонстрированов серии вычислительных экспериментов применительно к рассматриваемой нелинейной системе.Как уже отмечалось, желаемое качество управления в рассматриваемых схемах адаптивного управления задается с помощью ЭМ. Влияние желаемого быстродействия на расходрулей и на нагрузку на привод показано на примере схемы с эталонной моделью, результаты соответствующих вычислительных экспериментов представлены на рис.