Пупков К.А., Коньков В.Г. - Интеллектуальные исследования (Современнаяя теория управления) (1072100), страница 9
Текст из файла (страница 9)
Для расчета регулятора необходимо располагать не столько текущей информацией об объекте и воздействиях (как это необходимо на этапе непосредственного управления), сколько о законе ее изменения в процессе будущей работы системы. Для этого составляется математическая модель объекта, воздействий, а также цели. Понятие выхода возникло в связи с функционированием объекта, а в связи с его описанием возникло понятие состояние объекта x(t) .
Выходные координаты в силу определения должны были бы быть представлены реальными, доступными потребителю процессами, что обычно и удается обеспечить с помощью измерителя. Правда, часто измерения (в силу специфики работы измерителя) представляют некоторую функцию h от выхода и от возмущений (в силу влияния среды на процесс измерения): h(o(t), w(t)), детальнее - ,
(см. ниже).
Неизвестное, обычно, состояние имеет принципиальную возможность быть вычисленным устройством “наблюдатель” по известным измерениям и известной модели объекта с некоторой точностью (результат вычисления называется поэтому оценка состояния , если объект с измерителем обладают свойством “наблюдаемость”. Цель управления принципиально может быть достигнута, если управляющих координат достаточно, чтобы привести объект к любому требуемому его состоянию - если объект обладает свойством “управляемость”. О достижимости цели управления свидетельствует возможность достигнуть любого именно состояния (а не выхода) в виду того, что состояние как математическое понятие, веденное специально для полного представления объекта, является более адекватным этой задаче, чем инженерное понятие выход.
Для обеспечения управляемости к исходным управляющим воздействиям могут быть добавлены новые управляющие факторы
, а для удобства реализации процесса управления к регулирующим органам могут быть подведены соответствующие приводы. Исходный объект совместно с приводом и измерителем будем рассматривать как объект управления.
Влияние неадекватности соответствующей математической модели объекту, потребителю и среде приводит к тому, что созданный регулятор работает не в тех условиях, для которых он рассчитывался ( (t) несколько отличается от нужного бы
(t)) поэтому он должен быть робастным (его выход
(t)) - сохраняющим работоспособность в этой ситуации, т.е. обеспечивающим Ц(
(t)) Ц(
(t)).
Характеристика, выражающая степень достижения цели с помощью данного управления - показатель эффективности управления (u) или обратная ей - функция потерь
(u). Робастность, обычно, достигается ценой некоторого уменьшения эффективности системы
J( (t) ) > J(
(t)).
Имея в своем составе динамическую экспертную систему (ДЭС) [8], ИСУ обладает возможностью в процессе ее работы уточнять модель СУ. Поэтому, являясь по своей природе адаптивной, она, казалось бы, устраняет причину, по которой ей нужно быть робастной, однако, на первых порах ее функционирования, когда информации еще нет (или ее мало), ИСУ находится в условиях сильной неопределенности, в связи с чем она должна быть изначально робастной.
Таким образом, ИСУ - есть изначально робастная с конструктивно предусмотренной возможностью к адаптации (чтобы уменьшать J) СУ, и, следовательно, методы синтеза робастных систем (и метод на основе -теории, как один из них) - методы ее расчета. ИСУ и компоненты, относящиеся к ее расчету, представлены информационной блок-схемой (рис 14).
Оптимальный регулятор, когда это возможно, строят на основе принципа разделения (в силу громоздкости решаемой исходной проблемы), согласно которому регулятор состоит из оптимального наблюдателя и оптимального формирователя позиционного (определяемого состоянием системы) закона управления. Тогда , где считается
- выход оптимального наблюдателя.
.
Известно, что управляемость объекта, справедливая для модели объекта, означая принципиальную возможность получить любое его состояние, позволяет добиваться этого с помощью разных законов изменения управляющего сигнала. Т.о., алгоритм работы формирователя не единственный. Устраняет эту неоднозначность оптимизация формирователя либо на основе принципов вариационного исчисления, либо динамического программирования, сводящихся к необходимости решения нелинейного матричного дифференциального уравнения, типа Риккати [15]. Если достаточно располагать управлением, обеспечивающим оптимальность только в установившемся режиме, то формирователь может быть получен с помощью решения алгебраического уравнения Риккати (он в этом случае окажется стационарным).
Рис.14
В аналогичных отношениях находятся понятие наблюдаемости объекта и получение оценки его состояния. Кроме этого неоднозначно могут быть заданы модель цели и модель регулятора. Каждая из этих неопределенностей при соблюдении некоторых условий может быть раскрыта в оптимальном регуляторе с помощью решения соответствующего уравнения Риккати, всего которых таким образом, может оказаться четыре. Название известного в - теории метода построения оптимального регулятора “на основе 2-Риккати подхода” и является следствием указанного 4-Риккати подхода, когда в задаче присутствовали только первые две из рассмотренных неопределенностей. Проиллюстрировать справедливость этого положения во всем объеме можно на примере задачи смешанной
-оптимизации [107].
Цель, преследуемую использованием -оптимального регулятора, можно интерпретировать как обеспечение успешной работы системы при самых неблагоприятных (из возможных) воздействиях. Но в силу этого движение системы с таким регулятором (например, летательного аппарата [15]) оказывается “некомфортным” и при “хороших” воздействиях. Последний недостаток отсутствует в системах с
-оптимальным (LQG) регулятором, однако, он гораздо менее эффективен в условиях неблагоприятных воздействий. Введение смешанного
-регулятора имеет цель объединить достоинства двух рассмотренных регуляторов.
В работе [107] рассматривается, правда, достаточно скромная по степени смешенности из указанных выше смешенных проблем. Обсудим ее.
Пусть в системе Рис.15 измерения представляют непосредственно координаты выхода, причем часть из них
используется в регуляторе (
=y(t)), а часть
состоящая из двух векторов
и
, используется как-то по-другому (например: для оценки качества управления). Некоторые компоненты выхода могут принимать участие и в векторе y(t) и z(t). Тогда объекту соответствует структурная схема
Рис.15.
где объект G(s) и регулятор K(s) описываются в пространстве состояния, соответственно
(87)
(88)
Матрицы из описания замкнутой системы
нетрудно получить [14].
Передаточная функция системы Рис.15 от w(t) к обозначается
, от w(t) к
-
, а от w(t) к z(t)
|||| -
-норма; ||||
-
-норма [17].
В [14] доказана теорема, дающая необходимые условия для расчета регулятора, обеспечивающего
|| ||
< и ||
||
< J(
,Y),
где J( ,Y) легко формируемая функция, которая является верхней границей два-нормы
, причем эта граница такова, что она соответствует
[J(
,Y) - ||
||
]; взаимосвязь сигналов формируемых передаточными функциями, 2 и - нормы которых здесь участвуют, может регулироваться только через компоненту, определяющую влияние на них сигналов u(t):
, (89)
, > 0 - скаляры. Здесь Y - неотрицательно определенная матрица, являющаяся решением уравнения Риккати
(90)
Видно, что изменение весов критериев - компонентов в смешенной задаче происходит через практически очень узкий канал - только изменением в соответствии с соотношением (89). Этот факт, однако, не мешает этой задаче быть удобной базой для теоретического исследования влияния на результат ее решения изменения цели (выраженной через критерий), т.к. в [15] показано, что изменением эта смешанная задача может быть превращена как в задачу , так и в задачу
- оптимизации.
Теорема. Если , и они таковы, что ||
||
< и ||
||
< J(
,Y), где J(
,Y) обеспечивает
[J(
,Y) - ||
||
] для системы (87), (88) у которой
,
, то существуют неотрицательно определенные матрицы Q, P,
такие, что с их помощью может быть найден регулятор (88)
где ,
(91)
= { : Y 0,
- асимптотически устойчива,
управляема и наблюдаема},
и матрицы эти - есть решения трех уравнений Риккати
(92)
(93)
(94)
Здесь при этом
Из соотношений теоремы видно, что все члены, входящие в уравнения Риккати, за исключением Q, P, , известны (т.к. в данной работе - задаваемая постоянная), следовательно, неопределенность в цели устранена, но не оптимально, а произвольным выбором , поэтому после решения трех уравнений Риккати приходим ко вполне определенному регулятору. Если допустить неопределенность в выборе модели регулятора (выбирать Q и
неоднозначно - в соответствии с (91)), то уравнения (92) и (94) для Q и
не потребуются, и задача сведется к решению двух уравнений Риккати ((91) и (93)). Если же в условиях теоремы потребуется оптимально убрать неопределенность цели (тогда нужно тоже определять и матрица S станет также неизвестной), тогда потребуется решать четыре уравнения Риккати (90), (92)-(94), что и требовалось проиллюстрировать. Принцип разделения здесь не выполняется , т.к. все уравнения Риккати взаимозависимы.
В заключение следует отметить, что первые два из указанных четырех типов неопределенности приводят к необходимости решения, как уже об этом говорилось, двух уравнений Риккати. А вот третий и четвертый типы неопределенностей в зависимости от их глубины (например, неопределенность модели регулятора состоит в том, что R выражается через Q, ,
, а не через Q,
, как в рассмотренном примере, и т.п. ) могут привести и к большему (чем еще два ) числу уравнений Риккати. Поэтому, может быть имеет смысл говорить не о 4-Риккати подходе, а о четырех типах причин, приводящих к уравнению Риккати.
-
Комбинирование робастного и адаптивного управления
с помощью интеллектуальных систем.