Меркулов В.И., Дрогалин В.В. Авиационные системы радиоуправления. Том 1 (2003) (1151997), страница 11
Текст из файла (страница 11)
Оптимальное управление возможно лишь при оптимальной обработке информации о состоянии процессов и систем. Поэтому составной частью СТОУ является теория оптимального оценивания (ТОО) динамических процессов. Как правило, для оптимизации процесса управления недостаточно априорной информации о системах (особенно нестационарных). Поэтому еще одной важной составной частью СТОУ является аппарат теории оптимальной идентификации (ТОИ), который позволяет оптимально оценивать параметры, характеристики и условия функционирования РЭСУ по экспериментальным данным.
Необходимо подчеркнуть, что при решении некоторых частных задач алгоритмы ТОО и ТОИ могут играть самостоятельную роль без привлечения алгоритмов формирования сигналов управления. Для получения оптимальных оценок необходимо располагать определенным объемом априорных сведений.
К этим сведениям относятся: модели оцениваемого процесса и измерителей в виде систем дифференциальных, алгебраических или разностных уравнений; законы распределения и статистические характеристики возмущений оцениваемого и наблюдаемого процессов и начальных значений оцениваемых фазовых координат. При гауссовском законе распределений достаточно знать лишь математические олсидания и дисперсии.
В общем случае математический аппарат теории оценивания позволяет сформировать оценки, оптимальные по различным критериям: наименьших квадратов, минимума среднеквадратичных ошибок (СКО), максимального правдоподобия и максимальной апостериорной вероятности. При использовании пространства состояний широко употребительны алгоритмы формирования оценок, оптимальных по минимуму СКО. сйормирование таких оценок осуществляется на основе перечисленных выше априорных сведений и результатов измерений (наблюдений) хотя бы части оцениваемых фазовых координат.
Под наблюдениями или измерениями понимаются физические процессы (сигналы) на выходе тех или иных средств инструментального контроля (измерителей). Для РЭСУ наиболее важными наблюдениями являются сигналы высокой и промежуточной частот, а также видеосигналы, снимаемые с приемников или различного рода дискриминаторов. В современной ТОО можно выделить несколько направлений. При использовании аналоговых или дискретных моделей (2.3) — (2.6) соответственно используются аналоговые или дискретные алгоритмы оценивания. Если оцениваемые и измеряемые процессы аппроксимируются линейными уравнениями (2.3) — (2.6), то говорят о линейном оценивании.
Если хотя бы один из этих процессов описывается нелинейными уравнениями, то имеет место нелинейное оценивание. Процедура, когда оптсслсальная оцесска срорлсируетсл пепосредсчпвепссо на лгомепт палучсссин иэлссрепин (2.4), (2.б), паэсянастсн аптимсип,пад фильтраци- 47 ей. При формировании оценок на люл~енты времени, опережающие время поступления наблюдений, говорят об экстраполяции. Если оценки формируются на моменты времени, копюрые отстают от времени получения изл~ерений, то имеет место интерполяция. Следует подчеркнуть, что алгоритмы ТОО весьма чувствительны к отклонениям параметров моделей и условий функционирования, использованных при синтезе, от их действительных значений и условий.
При наличии таких несоответствий реальные показатели точности систем, синтезированных на основе алгоритмов ТОО, могут быть существенно хуже их расчетных, теоретических значений, Отмеченные недостатки также свидетельствуют о целесообразности применения алгоритмов ТОИ. Процессы и системы можно идентифицировать по целому ряду признаков [25, 49): классу моделей, в терминах которого они представлены; условиям существования процессов и функционирования систем; параметрам н показателям конкретных видов систем и процессов, включая и различного рода помехи, и т.д..
Последнее направление называется параметрической идентификацией. Для решения задач параметрической идентификации необходимо кроме той информации, которая используется в ТОО, еще иметь модели эволюций в пространстве состояний параметров и показателей идентифицируемых процессов и систем. Качество идентификации определяется степенью приближения оценок параметров и показателей процессов н систем к их действительным значениям.
Степень этого приближения можно оценивать по различным правилам [25). Одним из наиболее простых и удобных показателей оптимальности параметрической идентификации является минимум СКО оценивания параметров и показателей процессов и систем. Необходимо отметить, что достаточно часто оптимальная фильтрация фазовых координат и оптимальная идентификация систем используются совместно в рамках единого алгоритма оценивания [25]. Следует подчеркнуть, что алгоритмы теории оптимальной фильтрации [ТОФ) н ТОИ не отвечают на вопрос, какой ценой достигается минимум СКО оценивания фазовых координат и параметров систем. Следовательно, эти алгоритмы не учитывают ограничений используемых сигналов, которые практически всегда имеют место в реальной аппаратуре.
Поэтому их целесообразно использовать самостоятельно лишь при решении чисто информационных задач, не требующих значительных затрат энергии. 48 Для решения энергоезиник задач управления более нрисиособлены алгоритл~ы СТОУ, основанные на обеспечении экстремумов более сложных, чем минимум СКО, функционалов, например, таких, как (1.4) и (1.5). Оптимизация по таким критериям дает возможность получить РЭСУ совместно наилучшие как по точности, так и экономичности с учетом реальных ограничений быстродействия исполнительных органов, сигналов управления и расходуемой ими энергии. При этом можно сформировать алгоритмы управления, более приближенные к реальным условиям функционирования, чем алгоритмы, полученные на основе других принципов.
Меньшая чувствительность алгоритмов СТОУ к отклонению условий функционирования от номинальных требует меньшей доработки синтезированных РЭСУ в процессе их ввода в серийное производство. Кроме того, алгоритмы СТОУ позволяют еще на стадии проектирования (на стадии разработки исходных моделей) достаточно просто учесть свойства узлов и устройств, которые заведомо войдут в состав синтезируемой РЭСУ (например, привод антенны БРЛС).
Эта особенность алгоритмов СТОУ делает их более приспособленными к современному стандартизированному и унифицированному производству. Для синтеза РЭСУ на основе математического аппарата СТОУ необходимо наряду с априорной информацией, которая используется в ТОО, учесть ограничения, накладываемые на систему, и выбрать конкретный вид минимизируемого функционала качества. В практике синтеза систем управления наиболее широко применяются различные модификации функционала Летова-Калмана (!.4), локального функционала (1.5) и функционала обобщенной работы [29]. В зависимости от способов получения законов управления различают алгоритмы, синтезированные на основе принципа максимума Понтрягина [29] и на основе метода динамического программирования Беллмана.
Принцип максимума дает возможность получить алгоритмы управления, используя методы вариационного исчисления. Метод динамического программирования позволяет синтезировать закон управления, опираясь на сформулированный Беллманом принцип оптимальности [48], вытекающий из рациональных физических соображений.
Необходимо отметить, что при использовании одинаковых исходных моделей и функционалов качества оба способа приводят к получению идентичных алгоритмов. Основное внимание будем уделять алгоритмам синтеза оптимальных РЭСУ, основанным на линейных моделях процессов, исполнительных 49 органов и измерителей, Это обусловлено меньшим объемом требуемых математических выкладок, большей простотой и наглядностью полученных алгоритмов, а также возможностью применения для их исследования хорошо разработанных методов анализа линейных систем.
2.1.1. ПОСТАНОВКА ЗАДАЧИ СИНТЕЗА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ При описании общих подходов к синтезу оптимальных систем управления в пространстве состояний было отмечено, что СТОУ используется при наличии ограничений на проектируемую систему. Поясним этот тезис более подробно. Обычно в пространстве состояний полагается заданным описание информационного процесса вектором х и результатов наблюдения его компонент — вектором х.
При этом функция х(1) описывает фазовую траекторию, которую и необходимо восстановить (оценить) по результатам наблюдений вектора х. Никаких ограничений на синтезируемую систему, которая оптимальным образом будет формировать эту оценку, не накладывается. При этом часто предполагается, что априорно задана некоторая часть системы, на вход которой подаются сигналы управления ц(1), а на выходе этой системы необходимо воспроизвести искомую траекторию х(1). Процесс на выходе системы управления будем обозначать хт (управляемая траектория).
Структура системы управления полагается заданной и описывается в пространстве состояний соответствующим уравнением, например линейным ху (1) — $'у (1)ху (1)+ В г 11)ц(1 )+ ~„(1) (2.7) Здесь: г„— динамическая матрица состояния; В, — матрица эффективности управления; ц(1) — г-мерный вектор сигналов управления (г<п), подаваемых на вход системы управления, „— вектор дополнительных (неконтролируемых) случайных возмущений, который обычно описывают белым гауссовским шумом с нулевым математическим ожиданием и матрицей односторонних спектральных плотностей Сг В общем случае размерность вектора х„отлична от размерности вектора х, т.е, система управления воспроизводит не все координаты искомой траектории х(1), а только часть из них.
В целях большей физической наглядности будем полагать сначала, что размерности указанных векторов совпадают. Так как в теории оптимального управления принято говорить о траекториях в пространстве состояний, то процесс х(1) часто называют 50 требуемой траекторией и обозначают х,(ь). Поэтому здесь и далее также будем использовать это обозначение. Тогда соответствующее уравнение, описывающее требуемую траекторию в пространстве состояний, представим в виде х,[1) = К,(1)х,[1)+~,(1). (2.8) где: Е, — динамическая матрица состояния; ~, — вектор белых гауссовских шумов с нулевым математическим ожиданием и матрицей односторонних спектральных плотностей С,. Многовариантность описания процедур задачи оптимального управления приводит к чрезвычайному разнообразию ее постановок [34]. Ниже будет использована одна из самых несложных, позволяющая получить наиболее простые алгоритмы формирования управляющих сигналов.