Канащенков А.И., Меркулов В.И. Авиационные системы радиоуправления. Том 1 (2003) (1151993), страница 11
Текст из файла (страница 11)
Одним из наиболее простых и удобных показателей оптимальности параметрической идентификации является минимум СКО оценивания параметров и показателей процессов и систем. Необходимо отметить, что достаточно часто оптимальная фильтрация фазовых координат и оптимальная идентификация систем используются совместно в рамках единого алгоритма оценивания [25].
Следует подчеркнуть, что алгоритмы теории оптимальной фильтрации [ТОФ) н ТОИ не отвечают на вопрос, какой ценой достигается минимум СКО оценивания фазовых координат и параметров систем. Следовательно, эти алгоритмы не учитывают ограничений используемых сигналов, которые практически всегда имеют место в реальной аппаратуре. Поэтому их целесообразно использовать самостоятельно лишь при решении чисто информационных задач, не требующих значительных затрат энергии. 48 Для решения энергоезиник задач управления более нрисиособлены алгоритл~ы СТОУ, основанные на обеспечении экстремумов более сложных, чем минимум СКО, функционалов, например, таких, как (1.4) и (1.5).
Оптимизация по таким критериям дает возможность получить РЭСУ совместно наилучшие как по точности, так и экономичности с учетом реальных ограничений быстродействия исполнительных органов, сигналов управления и расходуемой ими энергии. При этом можно сформировать алгоритмы управления, более приближенные к реальным условиям функционирования, чем алгоритмы, полученные на основе других принципов.
Меньшая чувствительность алгоритмов СТОУ к отклонению условий функционирования от номинальных требует меньшей доработки синтезированных РЭСУ в процессе их ввода в серийное производство. Кроме того, алгоритмы СТОУ позволяют еще на стадии проектирования (на стадии разработки исходных моделей) достаточно просто учесть свойства узлов и устройств, которые заведомо войдут в состав синтезируемой РЭСУ (например, привод антенны БРЛС). Эта особенность алгоритмов СТОУ делает их более приспособленными к современному стандартизированному и унифицированному производству. Для синтеза РЭСУ на основе математического аппарата СТОУ необходимо наряду с априорной информацией, которая используется в ТОО, учесть ограничения, накладываемые на систему, и выбрать конкретный вид минимизируемого функционала качества.
В практике синтеза систем управления наиболее широко применяются различные модификации функционала Летова-Калмана (!.4), локального функционала (1.5) и функционала обобщенной работы [29]. В зависимости от способов получения законов управления различают алгоритмы, синтезированные на основе принципа максимума Понтрягина [29] и на основе метода динамического программирования Беллмана.
Принцип максимума дает возможность получить алгоритмы управления, используя методы вариационного исчисления. Метод динамического программирования позволяет синтезировать закон управления, опираясь на сформулированный Беллманом принцип оптимальности [48], вытекающий из рациональных физических соображений. Необходимо отметить, что при использовании одинаковых исходных моделей и функционалов качества оба способа приводят к получению идентичных алгоритмов. Основное внимание будем уделять алгоритмам синтеза оптимальных РЭСУ, основанным на линейных моделях процессов, исполнительных 49 органов и измерителей, Это обусловлено меньшим объемом требуемых математических выкладок, большей простотой и наглядностью полученных алгоритмов, а также возможностью применения для их исследования хорошо разработанных методов анализа линейных систем.
2.1.1. ПОСТАНОВКА ЗАДАЧИ СИНТЕЗА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ При описании общих подходов к синтезу оптимальных систем управления в пространстве состояний было отмечено, что СТОУ используется при наличии ограничений на проектируемую систему. Поясним этот тезис более подробно. Обычно в пространстве состояний полагается заданным описание информационного процесса вектором х и результатов наблюдения его компонент — вектором х.
При этом функция х(1) описывает фазовую траекторию, которую и необходимо восстановить (оценить) по результатам наблюдений вектора х. Никаких ограничений на синтезируемую систему, которая оптимальным образом будет формировать эту оценку, не накладывается. При этом часто предполагается, что априорно задана некоторая часть системы, на вход которой подаются сигналы управления ц(1), а на выходе этой системы необходимо воспроизвести искомую траекторию х(1). Процесс на выходе системы управления будем обозначать хт (управляемая траектория).
Структура системы управления полагается заданной и описывается в пространстве состояний соответствующим уравнением, например линейным ху (1) — $'у (1)ху (1)+ В г 11)ц(1 )+ ~„(1) (2.7) Здесь: г„— динамическая матрица состояния; В, — матрица эффективности управления; ц(1) — г-мерный вектор сигналов управления (г<п), подаваемых на вход системы управления, „— вектор дополнительных (неконтролируемых) случайных возмущений, который обычно описывают белым гауссовским шумом с нулевым математическим ожиданием и матрицей односторонних спектральных плотностей Сг В общем случае размерность вектора х„отлична от размерности вектора х, т.е, система управления воспроизводит не все координаты искомой траектории х(1), а только часть из них. В целях большей физической наглядности будем полагать сначала, что размерности указанных векторов совпадают.
Так как в теории оптимального управления принято говорить о траекториях в пространстве состояний, то процесс х(1) часто называют 50 требуемой траекторией и обозначают х,(ь). Поэтому здесь и далее также будем использовать это обозначение. Тогда соответствующее уравнение, описывающее требуемую траекторию в пространстве состояний, представим в виде х,[1) = К,(1)х,[1)+~,(1).
(2.8) где: Е, — динамическая матрица состояния; ~, — вектор белых гауссовских шумов с нулевым математическим ожиданием и матрицей односторонних спектральных плотностей С,. Многовариантность описания процедур задачи оптимального управления приводит к чрезвычайному разнообразию ее постановок [34]. Ниже будет использована одна из самых несложных, позволяющая получить наиболее простые алгоритмы формирования управляющих сигналов. Эта задача горл>улируется следу>ои)ип образолн по результатаи наблюдений х(~) (струкн>уру которы мы определил< позже) всех или некоторых колтонент хч(с) и х (з) выбирал> вектори управлений п(с) необгодиь>о >вилучшим (оптииальньлл>) образом на выходе системы управления сформировать управляемую траектори>о х„(г).
Возможные критерии оптимальности описаны в п.1,4.2. Рассмотрим, например, критерий Летова-Калмана (1.4). Из физических соображений понятно, что, задав ограничения на структуру выбираемого (синтезируемого) вектора х„, мы ограничиваем возможности выбора наилучшей системы, а, следовательно, характеристики выбранной системы будут «не лучшеп (а в общем случае хуже), чем у системы, которая выбирается (синтезируется) без ограничений. Поэтому, задав структуру системы управления (2.7) мы заведомо идем на ухудшение потенциальных показателей качества.
Более того, если в системе управления имеют место дополнительные возмущения (шумы Р,„), которые отсутствовали при решении задачи оптимальной фильтрации, то это приведет к дополнительному ухудшению потенциальной точности. Необходимо, однако, подчеркнуть, что использование (2.7) дает возможность еще на стадии проектирования учесть ограничения на динамические свойства исполнительных органов, которые заведомо войдут в состав системы. Обычно в качестве заданной части рассматриваются исполнительные органы.
Их динамические свойства (быстродействие) учитываются в (2.7) коэффициентами матриц Е„и В„. Огриничения на управля>ои1ие сигналы накладываются в виде одного из трех условий: 51 (2.9) ) М~ц'(1)Кц(1) ~)1 <)т. о Неравенство (2.9) означает, что мгновенные значения и1 каждого сигнала управления не должны превышать допустимого значения 1)„„„.
Неравенство (2.10) ограничивает мощность сигналов управления с учетом важности отдельных его составляющих и, для системы в целом. Количественно степень важности различных сигналов управления определяется коэффициентами кй матрицы К. Условие (2.11) ограничивает «взвешенную» энергию, затрачиваемую сигналами управления за все время управления 1,. Эти дополнительные ограничения приводят к ухудшению потенциальной точности слежения за требуемой фазовой траекторией.
Вместе с тем следует отметить, что в ряде приложений реальная точность систем, синтезированных по алгоритмам СТОУ, оказывается лучше, чем у аналогичных систем, синтезированных по алгоритмам оптимальной фильтрации. Обусловлено это, прежде всего тем, что уже на стадии проектирования можно учесть реальные ограничения, которые часто имеют место в практике эксплуатации, и которые не учитываются теорией оптимальной фильтрации. Отмеченные выше положения справедливы и для более общего случая, когда размерность векторов х, и х„не совпадают.