Диссертация (785777), страница 39
Текст из файла (страница 39)
При управлении по выходукачество обучения снижается, появляются «выпавшие» интервалы с очень низкой точностью(ошибка по углу скольжения порядка 9–10 град).Судя по всему, эти «выпавшие» интервалы вызваны особенностями НС-модели, например, плохим обобщением в некоторых регионах (причиной чего, в свою очередь, являетсянедостаточно представительный набор данных для модели).Дополнительные тесты показали, что причинами такой неравномерной сходимости являются:более сложная функция ошибки, чем при управлении по состоянию;ограничения, присущие последовательным методам обучения;большие ошибки, характерные для НС-модели в ограниченных областях.Тесты, проведенные для случая с инверсной моделью, показывают, что получаемой системе присущи те же самые особенности (выпавшие сегменты), что и замкнутой системе собратной динамикой.
Это может говорить о недостаточной «гладкости» НС-модели по выходу.6. Анализ результатов, полученных в ходе вычислительных экспериментов, описанныхвыше, позволяет сделать следующие выводы:2111. При анализе возможностей компенсации перекрестных связей по углу скольжения видно, что движение рыскания является неуправляемым и возбуждается перекрестнымисвязями. Видно, что точность компенсации не везде высокая, что обусловлено двумяпричинами:(a) Угол скольжения выходит из области, в которой обучались контроллеры.(b) В ряде случаев не хватает рулей для точного следования эталонной траектории(например, на больших углах атаки и при значительных углах скольжения моментmx требует почти полного отклонения элеронов для его парирования).2.
В ряде случаев неудовлетворительным является качество управления по углу скольжения. Задающий сигнал по углу скольжения нулевой ref= 0, но качество управленияиногда недостаточное. Здесь сказываются несколько причин:(a) Недостаточная эффективность руля направления для компенсации всех перекрестных связей (видно, что они усиливаются на больших положительных и отрицательных углах атаки).(b) Попытка заставить работать систему в более широкой области пространства состояний, чем она обучалась, либо просто недостаточное покрытие пространствасостояний.(c) Слишком большой коэффициент усиления в компенсаторе для , что приводит крелейному эффекту из-за ограниченного диапазона углов для руля направления(недостаточная устойчивость в большом).(d) Для разомкнутого НС-управления (инверсная модель) может проявляться взаимодействие различных каналов компенсатора при ограничении руля по одному изканалов и на определенных частотах задающего сигнала.(e) Для замкнутого НС-управления (обратная динамика) существенной, в основном,является недостаточная эффективность руля.
Если руль направления становитсяна упоры при частых перекладкахбольшой. Ошибки по!x ref , то величина ошибки по становится и по !x с замкнутым контроллером и компенсатором ока-зываются почти не взаимосвязаны.Плохое качество работы контроллера проявляется близко к границе диапазона обучения.Скорее всего некоторые области пространства состояний остались незаполненными при212обучении контроллера или модели, либо плотность данных недостаточна для хорошего значительно больше, когда ref = 0, чем прислучайном задающем сигнале по , потому что обучение специально при = 0 непроводилось, а при = 0 ошибки обобщения становятся более заметными.обобщения.
В частности, выбросов поГлавными причинами не всегда достаточного качества управления в канале рыскания являются:1. Недостаточная эффективность руля направления в сравнении с моментами от перекрестных связей. Некоторые перекрестные связи слишком велики, чтобы их устранить.2. Недостаточные обобщающие свойства нейроконтроллера в некоторых областях пространства состояний (проявляется в значительно меньшей степени, чем п.1), посколькууправляемая система является многомерной.В процессе обучения многомерной системы (модели или системы управления) на передний план выступает проблема данных (обучающих наборов), то есть становится проблематично вместить все вариации поведения системы в один фиксированный набор данных. Дляодномерных систем эта проблема не является настолько критичной, как это следует из эксперимента.Кроме того, в проводившихся экспериментах обучение НС-модели происходило в основном в пакетном режиме после генерации данных.
Помимо недостаточного объема данныхиграет роль забывание в многослойном персептроне. В данном случае уже реализовано (применительно к используемой архитектуре сетей) обучение нейросетевой модели и контроллерав режиме реального времени, с использованием новых поступающих данных для адаптациик изменению динамических свойств объекта управления.Обучение в последовательном режиме имеет гораздо менее жесткие ограничения на объем обучающих данных (если этот обучающий набор уже есть и фиксирован). Данные генерируются случайным образом (сигнал на рули или заданное движение), поэтому покрытиепространства состояний может быть неравномерным и неполным (особенно в многомерныхсистемах) внутри одной выборки.
Можно использовать несколько (достаточно много) разныхнаборов данных, последовательно используя их для обучения (обучение с фильтром Калманапозволяет это сделать).Самый простой вариант — использовать обучение в реальном времени (для модели и контроллера), запуская на исполнение математическую модель с включенной адаптацией до тех213пор, пока не будет достигнута приемлемая точность во всем пространстве состояний.
То естьимеет смысл последовательно уточнять НС-модель и закон управления именно в тех областяхпространства состояний, где фактически работает система.Однако, в силу недостатков алгоритмов адаптации, необходимо наличие предобученнойНС-модели и контроллера. Это связано с тем, что для адаптации нелинейной системы в данном случае используются линеаризованные алгоритмы (фильтр Калмана), которые хорошосходятся только в окрестности минимума функции ошибки (когда имеет право на существование сама линеаризация), то есть в данном случае адаптация ограничена дообучением, а обучение с нуля в режиме адаптации дает неприемлемые результаты, особенно для НС-модели.4.4 Адаптивное управление угловым движением ЛА в условиях неопределенности4.4.1 Влияние атмосферной турбулентности на работоспособностьадаптивной системы управления продольным движением самолетаОдин из вопросов, традиционно сложных для адаптивных систем управления, состоит вих способности противостоять внешним возмущающим воздействиям случайного характера.В данном разделе предпринимается попытка оценить, вначале применительно к адаптивным системам с эталонной моделью, насколько хорошо синтезированная система способнасправиться с возмущениями, в том числе и при возникновении отказных ситуаций.В качестве модели атмосферной турбулентности использовалась известная модель Драйдена, в том виде, как она описана в стандарте MIL-F-8785C и реализована в наборе Simulinkмодулей Aerospace Toolbox для системы Matlab.
Воздействие турбулентности проявляетсячерез добавочные компоненты для вертикальной скорости Vy и угловой скорости тангажа !z .Все результаты были получены для маневренного самолета F-16, для режима полета H=100 м и V = 600 км/ч. Они представлены на рис. А.99–А.110.При этом рассмотрены два случая:1. Возмущающее воздействие Vy;turb в диапазоне 10 м/с, !z;turb в диапазоне 0:2 град/с(рис.
А.99–А.104).2. Возмущающее воздействие: Vy;turb в диапазоне 20 м/с, !z;turb в диапазоне 2 град/с(рис. А.105–А.110).Для того, чтобы оценить влияние атмосферной турбулентности на характеристики управляемой системы, для каждого из рассматриваемых случаев просчитывалось два варианта: с214воздействием турбулентности и без нее.Во всех вариантах рассматривалось поведение системы при последовательном появлениидвух отказных ситуаций, введенных таким же образом, как это было сделано в разд. 4.1.5.Первая из них (t= 20 с) проявляется в смещении центровки на +10%, вторая (t = 50 с) — вуменьшении на 50% эффективности органа продольного управления самолетом.4.4.2 Адаптация к неопределенности в исходных данных1. Наличие неопределенностей в исходных данных приводит к тому, что нейросетевая модель и нейроконтроллер будут настроены неточно и эта неточность оказывает отрицательноевлияние на качество управления.В проведенных вычислительных экспериментах неточное знание динамики имитировалось тем, что на начало моделирования задавались НС-модель или НК, настроенные на другой режим полета.