Диссертация (785777), страница 37
Текст из файла (страница 37)
4.12, могут возникать проблемы устойчивости и робастности из-за недостаточно точной реализации прямой и инверсной моделейобъекта управления. Если объект управления нелинейный и многосвязный по своей природе,как это и имеет место в случае ЛА, аналитическое решение проблемы едва ли возможно, остается лишь путь вычислительного моделирования. Как показывает имеющийся опыт [138–140],по-настоящему эффективную реализацию прямой и инверсной моделей, пригодных по уровню достижимой ими точности к использованию в составе систем управления с ИМ, обеспечивает лишь нейросетевое моделирование или же нейронечеткое моделирование, когда аппаратискусственных нейронных сетей используется совместно с аппаратом нечеткой логики [37].Возможности системы управления со структурой, показанной на рис. 4.12, ограничиваются отсутствием обратных связей по воспроизводимой функции r (t).
Этого недостатка лишенасхема, представленная на рис. 4.13.Система управления, построенная по этой схеме, включает две динамически настраиваемые модели, прямую и инверсную. По указанным выше причинам обе эти модели наиболеецелесообразно реализовывать в классе динамически обучаемых НС-моделей. В алгоритмеобучения инверсной модели используются текущие измерения воспроизводимой (задающей)функции r (t) и выхода прямой модели объекта yb(t). Прямая модель выполняется также в видединамической сети, обучаемой по прогнозу ошибки "bm (t).200ξ(t)r(t)ε(t)+Фильтрg(t)ИнверснаяНС-модельобъектаu(t)Объектуправленияy(t)ПрямаяНС-модельобъектаyb(t)−θinvАлгоритмобученияu(t)+−yb(t)r(t)θdirАлгоритмобученияεm (t)РИС. 4.13. Структурная схема адаптивной системы управления с прямой и инверсной (t) — возмущающеевоздействие; g (t) — сигнал на выходе фильтра; u(t) — управление; y (t) — выход объектауправления; yb(t) — выход нейросетевой модели объекта управления; "m (t) — расхождениемежду выходами объекта управления и НС-модели; "(t) — расхождение между выходамиобъекта управления и задающим воздействие; dir и inv — параметры прямой и инверснойНС-моделями объекта управления:r(t)— задающее воздействие;модели объекта управления, соответственноПредельные динамические свойства рассматриваемой системы вытекают из следующихрассуждений.
Для обучения прямой модели ошибка определяется соотношением"bm (t) = y (t) yb(t) ! 0; при t> 0;так что y (t) ! yb(t).При настройке инверсной модели используется ошибка обучения"bm (t) = g (t) yb(t) ! 0; при t ! 1:Следовательно,y (t) ! g (t) и yb(t) ! g (t):Если A — оператор объекта управления, A — оператор инверсной модели, а Am — операторпрямой модели, то цепочка предельных переходов при обучении сетейyb(t) ! y (t) ! g (t) при t ! 1осуществляется тогда, когдаA = Am1 = A 1 :201В результате настройки, проведенной описываемым способом, получается инверсная модель объекта управления, которая выполняет в схеме изображенной на рис. 4.13, функциюадаптивного нейроконтроллера.
Адаптивность этой системы проявляется в том, что для ееструктурного синтеза требуется минимум априорной информации об объекте, кроме того,обе модели, прямая и инверсная (т. е. нейроконтроллер), подстраиваются непосредственно впроцессе функционирования системы при неконтролируемых изменениях динамики объектауправления.4. Схема адаптивного управления с инверсной моделью представляет безусловный интерес с точки зрения задач управления движением ЛА, если имеется возможность получитьдостаточно точные прямую и, особенно, инверсную модели объекта управления.
При этомследует учитывать, что динамика объекта может меняться резко и непредсказуемо непосредственно в полете, в частности, из-за отказов оборудования и повреждений конструкции. Следовательно, необходимо располагать не только средствами построения достаточно точныхИМ и ПМ на этапе структурного синтеза системы управления, но и средствами оперативнойкорректировки этих моделей непосредственно в ходе полета.4.3.2.2 Формирование инверсных моделейВажнейшим элементом схем управления, рассматриваемых в данном разделе, являетсяинверсная модель объекта управления.В рамках проводившихся исследований было рассмотрено несколько вариантов инверсныхмоделей, в том числе:1.
Составная инверсная модель, которая получается из схемы с обратной динамикой размыканием обратной связи. Входами в этом случае являются значения величин, описываемых эталонной моделью, т. е. x_ m (t) и xm (t).2. Составная инверсная модель, которая получается из схемы с эталонной моделью размыканием обратной связи (этот вариант предложен в [37]). Входами здесь будут задающийсигнал xref (t) и выход эталонной модели xm (t).3. «Обыкновенный» вариант инверсной модели.
На вход поступает только текущее состояние эталонной модели, и, в отличие от двух других вариантов, она не получается размыканием какого-либо контура. Входы в данном случае — это задержанный сигнал xm (t).Минимальное количество задержек — три, хотя этот вариант работал и с пятнадцатью202задержками. Преимуществом данного варианта является возможность получения инверсной модели в процессе статического обучения. Однако на практике возникает рядпроблем, описанных, например, в гл.
10 книги [63].Сравнительный анализ этих вариантов, который осуществлялся средствами компьютерного моделирования, показал, что для случая продольного короткопериодического движения онидают практически одинаковые результаты. Вариант 3 несколько дольше обучается в сравнении с остальными двумя, однако превосходит их по точности из-за того, что при статическомобучении алгоритм работает сразу со всей обучающей выборкой. В качестве основного вдальнейшем анализе был принят первый вариант.4.3.3 Адаптивное управление с обратной динамикой и инверсной моделью для случая углового движения ЛА4.3.3.1 Система с обратной динамикой для управления продольным угловым движением ЛАВ данном разделе представлены результаты вычислительных экспериментов для системыс обратной динамикой, полученные для частного случая управления продольным угловымдвижением самолета.
Случай полного (пространственного) движения будет рассмотрен ниже,в разд. 4.3.4.Эксперименты проводились для различных режимов полета, характеризуемых скоростьюH = 100 м для всех рассматривавшихся случаев, скорость полета принимала значения V = 300; 500; 700 км/ч. Во всех случаяхрешалась задача отслеживания заданного значения угла атаки . Соответствующие результатыи высотой полета. Высота полета была принята равноймоделирования, приведенные на рис. А.63–А.67, показывают, что качество управления, оцениваемое величиной ошибки отслеживания e заданного значения угла атаки ref , являетсявполне удовлетворительным при достаточно сложном характере изменения сигнала ref .На рис.
А.68 и А.69 показаны результаты аналогичных экспериментов для мини-БПЛАX-04.2034.3.3.2 Система с инверсной моделью для управления продольным угловым движением ЛАВ данном разделе представлены результаты вычислительных экспериментов для системыс инверсной моделью, полученные для частного случая управления продольным короткопериодическим движением самолета.Как и в случае системы с обратной динамикой, рассмотренном в предыдущем разделе,эксперименты проводились для различных режимов полета, характеризуемых скоростью ивысотой полета. Высота полета была принята равной H= 100 м для всех рассматривавшихсяслучаев, скорость полета принимала значения V = 300; 500; 700 км/ч.
Во всех случаях решалась задача отслеживания заданного значения угла атаки . Соответствующие результатымоделирования, приведенные на рис. А.70–А.74, показывают, что качество управления, оцениваемое величиной ошибки отслеживания e заданного значения угла атаки ref , являетсявполне удовлетворительным при достаточно сложном характере изменения сигнала ref .4.3.3.3 Сопоставление систем управления с обратной динамикой и с инверсной моделью для случая продольного углового движения ЛА1.
Результаты, представленные на рис. А.63–А.67 для системы с обратной динамикой (ОД)и на рис. А.70–А.74 для системы с инверсной моделью (ИМ), позволяют сделать следующиевыводы.1. Обе схемы требуют наличия компенсирующего контура.(a) В случае с ОД система пытается подобрать управление так, чтобы скорость изменения состояния x_ была приближенно равна эталонной x_ m . Из-за этой приближенности возникают ошибки, которые накапливаются во времени (интегрируются), еслиперейти от скоростиx_ к координате x.(b) ИМ работает по тому же принципу, но управление происходит по разомкнутомуциклу, поэтому стоило ожидать, что ошибка будет накапливаться быстрее.2.
На рис. А.66 и рис. А.73 сравнивается динамика ошибки для схем с ОД и с ИМ, хотяфактически можно говорить о двух вариантах одной и той же схемы, поскольку такимже переключением входа контроллера x ! xm получаются инверсные модели и в других204схемах. В случае управления по разомкнутому циклу ухудшается точность в переходном режиме, но зато значительно уменьшается ошибка в установившемся режиме. Хотянельзя явно записать уравнение ошибки для ИМ, можно качественно оценить причинынаблюдаемого характера поведения ошибки слежения для схем с ИМ и ОД:(a) Управление без обратной связи неявно предполагает, что объект всегда находится на эталонной траектории, независимо от его текущего положения.