Радиоавтоматика - Коновалов Г.Ф. Москва, 1990 (1000004), страница 41
Текст из файла (страница 41)
Их можно разделить на два основ- ных класса: системы с постоянной настройкой (без адаптации) и адаптивные системы. Системы с постоянной настройкой в зависимости от вида критерия оптимальности подразделяются на: системы оптимальные по быстродействию, где критерием оптимальности является минимум длительности переходного процесса; системы оптимальные по точности, в которых критерий оптимальности — минимум ошибки или минимум какой-либо функции от ошибки. Адаптивные системы в зависимости от способа адаптации делятся на: экстремальные, в которых достигается режим, соответствующий экстремуму статической характеристики объекта управления, положение и значение которого неизвестны; самонастраивающиеся, в которых требуемый оптимальный режим работы обеспечивается за счет автоматической настройки параметров системы; обучающие, в которых оптимальный режим работы достигается в результате анализа и накопления информации о процессах в системе и автоматическом изменении ее структуры и параметров в зависимости от накопленного опыта.
Примерами адаптивных систем РА являются адаптивный пеленгатор РЛС, система управления антенной фазированной решеткой. $13.2. ПРИНЦИПЫ ПОСТРОЕНИЯ ОПТИМАЛЬНЫХ СИСТЕМ Синтез оптимальных систем, как отмечалось в $7.1, начинается с выбора критерия оптимальности, общей формой которого является следующий квадратичный функционал: где Е(1) — 'вектор ошибки; 0(1) — вектор управления.
Матрицы квадратичных форм Г, Ч, С1 определяются выражениями 2б4 описывается векторным дифференциальным уравнением вида б(!) =. Аб(!) + В() В у(г) =С б(!), (13,3) где б('!) — выходной вектор объекта управления. Критерий оптимальности имеет вид У = — Г(бт(!) Уб(!) +()тф(ИЗ(Г)) й (13 4) 2,) о где б(Г) = — Е((), так как входной вектор равен нулю, В критерии (13.4) по сравнению с (13.1) отсутствует первое слагаемое, так как при Т=ао оценка конечного состояния не имеет смысла. Кроме того, верхний предел интегрирования в (13.4) равен бесконечности.
При этом можно гарантировать, что после окончания переходного процесса достигнутое нулевое состояние будет сохране- но. Для решения оптимальной задачи стабилизации ис- пользуем лринцип максилутиа Понтрягина, согласно ко- торому оптимальный вектор управления соответствует максимуму скалярной функции Гамильтона, определяе- мой выражением П = — — (б'(!) Уб(!) + ()'«) <В(!)) + б'(!) Р(г). (13.8) Подставив уравнение (13.3) в (13.5), найдем что г! (бт(г)1Гб(г) ! 1)т(!)(10(Г)1 ! (Аб(!) ! 2 + В() (!))т Р (Г) (13.6) В последних двух выражениях через Р!'г) обозначен вспомогательный вектор, являющийся решением вектор- ного дифференциального уравнения Р(!) = — —, дН (13.7) дб 83 Производную вектора состояния определим нз (!3.5) б(Е) = — .
си (13.8) дР (!) Систему дифференциальных уравнений (13.7) н (13.8) называют канонической. Исследование функции (13.6) на максимум относи- тельно вектора управления позволяет определить опти- мальное управление Ц (1) = Я вЂ” л Вт Р (1). (13.9) Из (13.9) следует, что для вычисления оптимального управления нужно найти вектор Р1л). Для этого необхо. димо решить каноническую свстему уравнений (13,7) и (13.8), началылыми условиями для которой являются начальное состояние объекта управления 6(0) и конеч. ное значение Р(оо) =О. Вычислив Р(Г), найдем оптимальное управление как функцию времени, которое предварительно должно быть рассчитано и запомнено, после чего оно может быть подано иа объект управления.
Очевидно, что при таком способе управления получается разомкнутая система со всеми присущими ей недостатками. Поэтому следует получить оптимальное управление через вектор переменных состояния $1(г) = =ЦС(1)), Для этого необходимо вектор Р(1) выразить через С1'г): Р(1) = — КС(1). (13.10) Матрица усиления К удовлетворяет следующему матричному уравнению: Ч+ КА+ АгК вЂ” КЗК = О, (13.11) Вг)-~ Вт Подставив (13.10) в формулу (13.9), определим $/(Е) = — (а ' Вг КС(1). (13,12) На рис.
13.1 показана структурная схема оптимальной си- и Йр) стемы стабилизации, Система лннейна, так как на вектор й с с) управления не наложено никаких ограничений. Определение матрицы К по д (13.11) сводится к решению системы нелинейных алгебраи- Рис. !Зд. Структурная схе. ческихуравнений. Так как К вЂ” ма оптимальной системы симметричная матрица, то чнс- стааилиаации ло уравнений равно 0,5п(п+ + 1), где и — порядок вектора состояния. Из найденных решений следует отобрать только то, при котором матрица К является положительно определенной.
Для вычисления элементов матрицы К могут быть использованы ЭВМ„на которых следует решить матрич- ное уравнение Риккати: К (!) = У+К (() А + Аг К (!) — К (!) ЗК (Г) (13.13) с граничными условиями К(Т) =О, где время Т выбрано достаточном большим. Если момент времени Т принять начальным, а К(Т) — начальным условием, то матрица К определяется как асимптотическое решение уравнения Риккати при уменьшении времени. Для того чтобы получить решение уравнения Риккати, соответствующее увеличению времени, вводят переменную т=Т вЂ” 6 Тогда уравнение (13.13) принимает вид К (т) = У + К (т) А )- Аг К (т) — К (т) ~К (т) .
Это уравнение решается на ЭВМ с начальным условием К(О) =О. При достаточно большом Т установившееся значение К(т) позволяет найти элементы матрицы К, Рассмотрим синтез оптимальной системы слежения, качество работы которой оценивается функционалом / ~ (Ег(!) УЕ(!) .+ Нт(!)(НУ(!)] О! (13 14) о где Е(!) =Х(!) — У(!) — вектор ошибки; ХЯ вЂ” входной вектор.
Объект управления описывается уравнением (13.3), оптимальное управление в задаче слежения определяется выражением (13.9), в котором вспомогательный вектор Р(!) зависит не только от вектора состояния объекта управления, но и от входного вектора: Р(!) = — КС (!) + Х (!), (! 3.15) где Е(!) — неизвестный вектор, являющийся решением уравнения Х(!) = (КЗ вЂ” Аг) Х(!) + УХ(!), (13 16) Так как Х(!) известен, то уравнение (13.16) может быть решено при граничных условиях Е(оо) =Х(оо) =О. Для входных сигналов, ие удовлетворяющих этим граничным условиям, решение оптимальной задачи слежения не найдено.
Для определения вектора Е(!) в системе должно быть предусмотрено специальное вычислительное устройство, этот вектор можно рассчитать заранее и поместить в память выхислителя. 268 Пример 13.1, Определить алгоритм оптимального управления для системы, передаточная функция объекта управления которой йуо(р) = -ЬоУ(Р+а~Ро). ТакУю пеРедаточнУю фУнкцию имеет, напРнмеР, Разомннутая система ФАПЧ без фильтра нижних частот. решение, Данной передаточной фуннции соответствует система уравнений в пространстве состояний; Уг(П Ыо(П! й~ (1) = — а, а, (г) + Ьо и (г) . Критерий оптимальности со = — ( )И()+н~()+~" ()1 ~.
1 Танин образом, в рассматриваемой системе А = [б' ' 1; В = [ 1; С [~ ~; 4[К ~1; (1 = р. Б соответствии с уравнением (13.12) оптимальное управление имеет вид и (П = ( Ьзг йг (О + доз Ыз (Г) ) Ьо(Ч Элементы матрицы усиления в последнем выражении определим иэ решения системы алгебраических уравнений, которая получается из уравнения (13.11): Передаточная функция оптимальной системы стабилизации Ьо)уо (Р) ! + Ьо (Ьзг + Ью Р) тле Ьо=йо/р Найдем оптимальное управление для задачи слежения при входном сигнале х(г) 1(г) — 1(1 — т). Оптимальное управление определя.
ется выражениями (!3.9) и (13.15): и(Г) =-(Ьгй (1)+Ь К (1)1 — +З (1) Ь Ьо '7 Ч Параметр хэ(1) рассчитан я соответствии с (13.15) из следующей системы уравнений: з (1) = ьохз (г) ьгггч+хо (1»1 аз (1) = хз (1) + тйзз Ьоур аг) зз (г) + аэъ ( ) ' где х,(1) = 1(1 — Т); хз(1) х~(1) =О. На рис. !3.2 показана структурная схема спроектированной сис. темы, для вычисления хз(Г) которой включено вычислительное устРойство. Передаточную функцию этого устройства определим иэ последней системы уравнений: 269 ! !рд(р) =— р'+ с! р+ с, гда с,=п,— амаоущ са=ймавур 2 хуг! Рис. !Зхй Структурная схема оптимальной сн.
стоим второго порядка В оптимальных системах стабилизации и слежения, рассмотренных ранее, полагали, что вектор состояния объекта управления полностью известен, т. е. его можно измерить с помощью соответствующих датчиков. В действительности это нереально. Обычно можно измерить только часть переменных состояния или какое. либо пх сочетание, при этом измерения содержат случайные ошибки. Кроме того, сама система, как правило, подвер>кена воздействию случайных возмущений. Таким образом, для формирования оптимального управления необходимо предварительно оценить вектор состояния, что может быть сделано при построении математической модели объекта управления.
Для объекта управления, описываемого уравнениями (13.3) оценку состояния можно осуществить в соответствии с математической моделью л л С (!) = ЛС (!) + Ви (У), (13. 17) л где 6(!) — оценка вектора состояния л Если начальные значения векторов С (О) и С(0) рав- л ны, то в любой момент времени 6!1) =С(1). Однако точное значение 6 (О) получить невозможно, поэтому оценка л 6(1) по модели (13.!7) дает большие ошибки, Для устра. пения этого недостатка на вход оценнвателя состояния кроме сигнала У(1) подают сигнал рассогласования ук(у) — СгС(т), а вместо уравнения (13,17) используют уравнение л л л С (Г) = А С И) + 1.
[7 (() — Сг С (Г)[ + ВБ (Г) (13.18) или л л С(г) — [А — [Хг! С(1)+ [Л(г)+ Вй/(1), (13.19) где [.— вектор усиления оценивателя размером пХт; и1 — размерность выходного вектора. Составляющие вектора Е выбирают такими, чтобы л 1пп [С Я вЂ” С (г)[ = О. (13,20) Если собственные значения матрицы [А — ЕСт) в (!3.20) выбрать так, чтобы пх вещественные части были отрицательными, то при любых начальных значениях л С (О) обеспечивается выполнение (13.20). После того как найдена оценка вектора состояния объекта управления, можно испольэовать алгоритм управления, полученный в задачах оптимальной стабилизации и слежения. На рис.
13.3 показана полная структурная схема оптимальной системы стабилизации с сценива- Рис. 13.3. Полная структурная схема оптимальной системы стабилизации 271 телем вектора состояния и обратной связью. Оценива. тель построен в соответствии с уравнением (13.18). Сравнение этого уравнения с (!1.58) показывает, что оцениватель — это оптимальный фильтр Калмана, харак. теристики которого зависят от динамических свойств объекта управления и помех, но не зависят от критерия оптимальности системы управления. Оценка состояния и оптимальное управление по квадратичному функционалу (13.4) представляет собой двойственную дуальную задачу.
Если одна из них решена, то в соответствии с принципом дуальности нетрудно решить и другую. Поэтому при решении задач фильтрации и детерминированного управления могут использоваться одни и те же программы для ЭВМ. й 13.3. АДАПТИВНЫЕ СИСТЕМЫ Проектирование систем РА при неопределенности изменения внешних условий (характеристик объектов управления и внешних воздействий) приводит к необходимости использования адаптивных систем, в которых для достижения оптимального критерия качества работы и поддержания его на этом уровне согласно измерениям внешних условий изменяются параметры и структурная схема системы, В результате система как бы приспосаб- $ ливается к изменению внешних условий, при этом сохраняя оптимальный режим работы.