Канащенков А.И., Меркулов В.И. Авиационные системы радиоуправления. Том 1 (2003) (1151993), страница 16
Текст из файла (страница 16)
Последнее обстоятельство позволяет существенно упростить процедуру использования (3,24) на практике. Назначение различных штрафов Ь, и ()~ на текущую и конечную точность позволяет реализовать различные ошибки на разных этапах работы РЗСУ и тем самым обеспечить требуемую точность в конце управления при весьма малых текущих затратах энергии.
Если в (2.13) имеют место возмущения 9„, которые поддаются оптимальный по минимуму функционала (1.4) Летова-Калмана. Необходимо отметить, что при существенно меньшем числе уравнений, необходимых для решения (3.25)-(3.28), этот алгоритм требует решения более сложной краевой задачи. Отмеченное усложнение вызвано необходимостью решения в обратном времени еще и уравнения (3.27). В дискретном времени уравнения состояния и наблюдений имеют вид (2.20), (2.21), а критерий Летова-Калмана описывается соотношением (2.22).
Для задач дискретного управления также справедлива теорема разделения и синтез стохастической систему управления распадается на синтез оптимального детерминированного управления и синтез системы фильтрации (формирования оценок вектора состояния). Аналогично тому, как это сделано выше, используя дискретные уравнения Веллмана 148) можно получить алгоритм оптимального дискретного управления ц()с-1) = -Н((с-1),()с-1), (3.29) где Н()с — 1)=[К+В'()с — 1)Р(1с)В(1с — 1)) 'В'(1с — 1)Р()с)Ф()с,)с — 1); (3.30) ха (1с ) = Ф()с, 1с — 1)х(1с — 1)+ В(1с — 1)ц(1с — 1); (3.31) х(1с) — оптимальная оценка; Р(1с) — матрица, удовлетворяющая уравнению Р(1с — 1) = Ф(1с, (с-1)Р(1с)Ф(1с, 1с — 1)— — $ ', (1с — 1) [1ь + В'(1с — 1)Р(1с)В(1с — 1)]1.| ()с — 1) „(3.32) с граничным условием Р()с,.)=9ь (3.33) Для соотношений (3.29)-(З.ЗЗ) имеют смысл все выводы, полученные в процессе анализа уравнений (3.22)-(3.24).
3.3. АЛГОРИТМЫ УПРАВЛЕНИЯ, ОПТИМАЛЬНЫЕ ПО ЛОКАЛЬНОМУ КРИТЕРИЮ Суть решаемой задачи состоит в том, что для системы (2.13) при наличии измерений (2.16) необходимо найти вектор ц сигналов управления, оптимальный по минимуму локального функционала качества (1.5). Поскольку (1.5) представляет частный случай функционала (1.4) при Ь=О и Ь=й то закон изменения ц описывается обшей формулой (3.24). Обратим внимание на то, что в (1.5) каждый момент времени с 72 соответствует моменту („ возможного окончания управления. Тогда матрица Р в (3.24) будет определяться граничным условием (3.23): ('11„=1 = ©(. (3.34) Подставляя (2.15), (3,12) и (3.34) в (3.24), получаем = — к'вч(=-к'~(, в'1[ ](."(=кзвч1(.1,1.(335( (х„3 Аналогичным образом для дискретных систем (2.20) при наличии наблюдений (2.21) в процессе минимизации функционала 1 = х'(1с)() (х(1с) + ц'(1с)Кц(1с) (3.36) можно сформировать сигналы управления [33) ц(й-1) =-К(й-1)х(й-1); (3.37) К()с — 1) = [К+ В" (1с — 1Щ(В()с — 1)1 В'(1с — 1)Ф" (1с,1с — 1)9(.
(3.38) Используя (3.38) в (3.37) с учетом (2.20,а), (3.12) можно получить ц()с — 1) = [К+ В~ ()с — 1)(;~В„()с — 1)~ В'„(1с — 1)(;~( зс зс [Ф„()с, 1с — 1)х,(1с — 1) — Ф„(1с, 1с — 1)х (1с — 1)]. (3.39) 73 С учетом особенностей вычисления матриц Р=О( для (3.35) и (3.37) — (3.39) справедливы выводы, сделанные для (3.24) и (3.29), но с некоторыми уточнениями и дополнениями. Оптимальная РЭСУ представляет собой систему с отрицательными обратными связями (ООС) по всем управляемым координатам хн (1 = 1, и ). Это свидетельствует о ее высокой устойчивости и малой чувствительности к точности выдерживания параметров и смене условий функционирования.
Сигнал управления определяется не просто состоянием системы, а и текущей ошибкой х, — х управления. Отсутствие необходимости громоздких расчетов матрицы Р, имевших место в (3.22)-(3.24) и (3.29)-(3.33), выгодно отличает (3.35) и (3.39), делая процедуру их вычисления чрезвычайно простой и широко применимой на практике. Однако, при утрате детерминированных связей, обусловленных учетом в (3.22) и (3.32) матриц Р и Ф, законы (3.35) и (3.39) оказываются менее адаптивными к условиям применения. Кроме того, минимизация функционалов (1.5) и (3.36) на каждый текущий момент времени предполагает худшую экономичность (3.35) и (3.39) по сравнению с (3.24) и (3.29). 3.4. УЧЕТ ИЗМЕРЯЕМЫХ ВОЗМУЩЕНИЙ ПРИ ЛОКАЛЬНОЙ ОПТИМИЗАЦИИ ДИСКРЕТНЫХ СИСТЕМ В ряде практических задач возникает необходимость учета в законе управления измеряемых возмущений, действующих на сиитезируемую РЭСУ.
Следует отметить, что существующие алгоритмы учета таких возмущений в законе управления дискретной системой достаточно сложны, поскольку либо требуют расширения исходного вектора состояния путем включения в его состав учитываемых возмущений [48], либо приводит к усложнению решения двухточечной краевой задачи [29].
Ниже приведен закон управления линейной дискретной системой, оптимальный по минимуму локального функционала качества, в котором учитываются измеряемые возмущения без расширения вектора состояния. В мател~атическом плане задача формулируется следующим образом. Для дискретной системы х (1с) =Ф„(]с,1с — 1)х (1с — 1)+В„(1с — 1)п()с)+Р, „(1с — 1)+Р, (1с — 1), (3.40) предназначенной для отработки процесса (3.41) х,(1с) = Ф,(1с, 1с — 1)х,(1с — 1)+ Р,(]с — 1), необходимо найти вектор и сигналов управления, оптимальный по минимуму локального функционала 1=М([А,х,()с)-Азхз()с)Щ[А„х„([с)-А„хз(]с)]+и'()с-1)Кц(]с-1)). (3.42) В соотношениях (3.40) — (3.42): х, и х, — векторы управляемых и требуемых координат размерности и, и и соответственно; Ф„и Ф,— переходные матрицы состояния; „— матрица эффективности управления; ~„„— вектор измеряемых (известных) возмущений; ~„и г„— векторы неизмеряемых гауссовских возмущений с известными матрицами дисперсий; А, и А„— матрицы соответствующих размеров, уравнивающие в функционале размерность векторов х, и х,; Π— неотрицательно определенная матрица штрафов за точность приближения х„к х,; К— положительно определенная матрица штрафов за экономичность.
В соответствии с выводами теоремы статистической эквивалентности (п. 2.1.3) при линейных исходных моделях с гауссовскими шума- 74 ми и квадратичных функционалах качества статистический регулятор эквивалентен детерминированному при условии замены в нем фазовых координат их оптимальными оценками. Тогда, подставив (3.40) и (3.41) в (3.42), при условии г,,=0 и г„=0, получим; 1= [ [А,Ф,(1с,1с-!)х,(1с-!)-А„(Ф хг()с-1)+В„п(1с-1)+ ~ „«()с-1))) 'Ох к[А,Ф,()с,)с-1)х,(1с-1)-А„(Ф„хз()с-1)+Втц(Е-1)+ Ц п,(1с-1)))+ -ьц'()с-1)Кц($с-!)). 1= х„" Ф', А,'.ЯА Ф х,— х„' Ф' А„" 9А Ф х,— ц' В„" А' ОА Ф х,— + гФт Ат(~АВ Вт А~(УАВ Ч~~ Ат()» В +Г'„, А'„9АД„„+ц Кп =1~ — и' В'„А' ЯА Ф х„ц'В„" А' »~АгФгх,,— + ~'„„А' ОА,В„ц+ц" В'„А' 9А„~,„+ц'Кц, (3.43) где 1, представляет сумму всех слагаемых, не содержаших ц.
Найдем условие минимума (3.43), продифференцировав его по ц' и приравняв результат дифференцирования нулю: — В" А„'9А,Ф,х, В' А'„ЯА„Ф„х„— В„" А" ЯА,,Ф,х,+ +ВуАу()АуФ„х„+2ВуАу()АуВуц+ВуАу()Аг~з+ +В'А„'9А Г„„+2Кц = — 2 В„' А'„9А,Ф,х„+2 В„" А' ЯА„Ф„х„+ +2 В "А'ОА„В„и+2 В'А"„(~А„~„„+2Кц=О; [ВуАуЯАуВу+К)цВтАт()[А~ФХАуФуху Ау~ у! 75 Опустив для простоты зависимость векторов и матриц от номера шага дискретизации будем иметь: Подставляя в полученное соотношение формулу (3.41) получим ц(1с-1)=[ В'„А'„0А „В„+К)' В'„А'Я х х[Аххч(1с) — Аз[Фз()с,)с — 1)хз()с — 1)+ 5 „„(1с — 1)] ). (3.44) Полученный детерминированный закон управления (3.44) будет справедлив и для статических систем (3.40), (3.41) при условии замены в нем фазовых координат оптимальными оценками (п. 2.1.3).
Тогда и(/с — 1) = (3.45) = Ц,, [Авхв(й) — А, '[Фх(/с, А — !)х (/с — 1) ч-Р, ч(/с -1))), где Н„= [В~А'„(1А„В„+ К~ В'„А'„Я . Анализ (3.45) и (3.46) позволяет сделать следующие заключения. Сигнал управления пропорциональный ошибке (3.46) А., х, (1с)-А,(Ф„(1с,1с-1) х„()с-1)+ Р, „„(1с-! )) с точностью до слагаемого б, „„совпадает с (3.39). В полученном сигнале управления достаточно просто учитываются измеряемые возмущения. При этом не требуется расширять вектор состояния и решать сложную двухточечную краевую задачу.
3.5. ОПТИМИЗАЦИЯ КОЭФФИЦИЕНТОВ ШТРАФОВ ФУНКЦИОНАЛА КАЧЕСТВА 3.5.1. ОПТИМИЗАцИя КОЭФФИЦИЕНТОВ ШТРАФОВ ФРНКПИОНАЛА КАЧЕСТВА ДЛЯ АНАЛОГОВЫХ СИСТЕМ 76 Выбор конкретных значений коэффициентов матриц штрафов за точность слежения и сигналы управления — одна из наиболее сложных' задач синтеза РЭСУ на основе алгоритмов СТОУ. На практике обычно используют элтирические способы нахождения коэффициентов штрафов, ниибояее известный из которых основан на принципе равнопрочности [2Ц.
Смысл этого способа состоит в том, что произведения квадратов максимально допустимых ошибок (либо дисперсий) на соответствующие коэффициенты штрафов полагаются одинаковыми для всех координат. Задаваясь максимально допустимыми ошибками (дисперсиями) и одним из коэффициентов штрафов, можно предварительно оценить значения коэффициентов штрафов по другим координатам. Аналогично можно вычис- лить и коэффициенты штрафов за сигналы управления. Полученные таким способом коэффициенты штрафов затем уточняются в процессе имитационного моделирования синтезированной РЭСУ по результатам контроля ошибок слежения и сигналов управления. Использование эмпирических способов, эффективность которых во многом зависит от опыта и интуиции проектировщика, как правило, позволяет методом проб и ошибок подобрать коэффициенты штрафов, обеспечивающие функционирование РЭСУ с приемлемой точностью.
Однако в такой ситуации никогда нет уверенности в том, что выбрано наилучшее сочетание коэффициентов. Сложность задачи эмпирического выбора коэффициентов штрафов усугубляется тем, что изменение штрафа по какой-либо фазовой координате приводит не только к изменению точности других, функционально связанных с ней координат, но и к изменению сигналов управления. В свою очередь, изменение штрафов за сигналы управления влияет не только на сами сигналы управления, но и на точность функционирования РЭСУ.