Лекция №12 Основы синтеза РСКУ (Лекция №12 "Основы синтеза РСКУ")
Описание файла
PDF-файл из архива "Лекция №12 "Основы синтеза РСКУ"", который расположен в категории "". Всё это находится в предмете "основы теории и техники радиосистем и комплексов управления (рску)" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст из PDF
ОСНОВЫ ТЕОРИИ И ТЕХНИКИ РАДИОСИСТЕМ И КОМПЛЕКСОВ УПРАВЛЕНИЯЛЕКЦИЯ №12 Основы синтеза РСКУ.1.2.3.4.Учебные вопросыОбщие сведения о методах синтеза РСКУ.Исходные данные для синтеза РСКУ в пространстве состояния.Основы оптимизации РСКУ.РСКУ, оптимальные по терминальному и локальному интегральному квадратичнымкритериямЛитература1. Авиационные системы радиоуправления: учебник для военных и гражданских ВУЗов инаучно-исследовательских организаций.
/ Меркулов В.И., Чернов В.С., Гандурин В.А., Дрогалин В.В.,Савельев А.Н. Под ред. В.И. Меркулова. – М.: Изд. ВВИА им. проф. Н.Е. Жуковского, 2008 – 423 с.2. Авиационные системы радиоуправления. Т1. Принципы построения системрадиоуправления. Основы синтеза и анализа / Под ред. А.И. Канащенкова и В.И.Меркулова. – М.:«Радиотехника», 2003. – 192 с.3. Коновалов Г.В. Радиоавтоматика. – М.: Радиотехника, 2003.4. Востриков А.С., Французова Г.А.. Теория автоматического регулирования: Учебноепособие.- М.: Высш.
Школа, 2004.- 365.5. Чураков Е.П. Оптимальные и адаптивные системы: Учеб.пособие для вузов. – М.:Энергоатомиздат, 1987.6. Радиоавтоматика: Учеб. Пособие для студ. Вузов спец. “Радиотехника”/ В.А.Бесекерский,А.А.Елисеев, А.В.Небылов и др.; Под ред. В.А.Бесекерского. – М.: Высш. Школа.
1985.11 Общие сведения о методах синтеза РСКУОбщие требования к РСиКУ:• высокая точность;• устойчивость;• низкая чувствительность к изменению условий функционирования;• экономичность.Основные ограничения при выполнении требований:• информационные;• вычислительные;• энергетические (экономичность – малые отклонения от требуемой траектории);• временные (быстродействие);• ресурсные (материальные, временные, людские/квалификационные).Задача синтеза - получение алгоритмов(оптимальных) в том или ином смысле.функционированияРСКУнаилучшихГруппы методов синтеза:• эмпирические;• классические;• современные (в пространстве состояния).2Алгоритм управления – закон управления, учитывающий, наряду с ошибкамиуправления, характеристики управляемой системы/комплекса.U ( t ) = K ( t ) ⋅ ∆X ( t ) ,(1)где K ( t )) - сложный коэффициент, содержащий характеристики системы/комплекса;∆X ( t ) - ошибки управления, которые необходимо измерять или оценивать.Вид коэффициента K ( t )) - теория и алгоритмы оптимального управления.Алгоритм оценивания – формирует оптимальные оценки, как правило, по минимумуСКО на основании непосредственных измерений некоторых фазовых координат.Виды оценивания (по моменту формирования оценок по отношению к поступающимизмерениям):• фильтрация (на момент поступления измерений);• экстраполяция (опережая измерения);• интерполяция (отставая от измерений).Для формирования сигналов управления в реальном масштабе времени оценки X̂ ( t )процесса X ( t ) - теория и алгоритмы оптимальной фильтрации.Задачи оценивания фазовых координат решаются в условиях изменения параметров самой системы/комплекса, а также при изменении самих условий функционирования – теория и алгоритмы оптимальной идентификации параметров.32 Исходные данные для синтеза РСКУ в пространстве состоянияУравнение состояния объекта управления:Xɺ У ( t ) = FУ ( t ) XУ ( t ) + BУ ( t )U ( t ) + ξУ ( t )где X У ( t )FУ ( t )(2)- вектор управляемых параметров размерностью (n1 x 1) с элементами x yi ( t ) ;- динамическая матрица размерностью (n1 x n1), элементы которой отображают динамические свойства устройств формирования x yi ( t ) ;U( t )BУ ( t )- вектор управления, содержащий r ≤ n1 составляющих;ξУ ( t )- вектор возмущений типа белых шумов с n1 компонентами, равным нулю ма-- матрица интенсивности управления размерностью n1 x r;тематическим ожиданием и с заданной матрицей Gξу односторонних спектральных и взаимных спектральных плотностей.4Уравнение требуемого состояния объекта управления:Xɺ Т ( t ) = FТ ( t ) XТ ( t ) + ξТ ( t ) ,где XТ ( t )FТ ( t )ξТ ( t )(3)- вектор требуемых (отслеживаемых) параметров состояния размерностью(n2 x 1) с элементами xТi ( t ) ;- динамическая матрица размерностью (n2 x n2), элементы которой отображают динамические свойства отслеживаемого процесса;- вектор возмущений типа белых шумов с n2 компонентами, равным нулю математическим ожиданием и с заданной матрицей GξТ односторонних спектральных и взаимных спектральных плотностей.Уравнение состояния обобщенного объекта управления: Xɺ T FT О1 XT O3 GTɺ = ⋅ + ⋅U + XУ О2 FУ XУ BУ О5Xɺ ( t ) = F ( t ) X ( t ) + B( t )U ( t ) + ξ ( t ) ,О4 ξT ⋅ ;GУ ξУ (4)(5)X FT О1 O3 GTξT ξX = ;B = ;где F = GX = ;О2 FУ BУ О5ξУ О1 ...О5 − нулевые матрицы соответствующих размеров.О4 ;GУ 5Ограничения на управляющие сигналы:• на мгновенные значения каждого сигнала управленияj = 1,r ;u j ( t ) ≤ U Доп j ,•(6)на взвешенную мощность сигналов управления с учетом их важности для системы в целом{}M U T ( t )KUT ( t ) ≤ ρ И ( t ) ;•(7)на взвешенную затраченную энергию за все время управленияtk∫ {}M UT ( t )KUT ( t ) dt ≤ µ ;(8)0Уравнение наблюдения:Z ( t ) = H ( t ) X ( t ) + ξИ ( t ) ,[где Z ( t ) = z1 ( t ), z1 ( t ),… ,zm ( t )(9)]T- вектор измерений (наблюдений) контролируемых пе-ременных размерностью (m x 1);H ( t ) - матрица связи обобщенного n-мерного вектора состояния с m-мерным векторомнаблюдений размерностью (m x n);ξ И ( t ) - m-мерный вектор центрированных гауссовских шумов измерений с известной матрицей GИ односторонних спектральных плотностей.6Функционал качества Летова-Калмана (терминальный, интегральный):{I = M [ XT ( t K ) − XУ ( tK )] Т Q [ XT ( tK ) − XУ ( t K )] +tk∫tk∫+ [ XT ( t ) − XУ ( t )] Т L [ XT ( t ) − XУ ( t )]dt + U Т ( t )KU( t )dt ;0(10)0где XT и X У – соответственно nТ - и nу - мерные (nТ + nу = n) векторы требуемых иуправляемых фазовых координат РСКУ в текущие моменты времени t и в момент tкокончания управления;U – r - мерный вектор сигналов управления (r ≤ n);L и Q – неотрицательно определенные матрицы штрафов за текущую точностьXT ( t ) − XУ ( t ) и конечную (терминальную) точность XT ( tK ) − XУ ( t K ) ;K – положительно определенная матрица штрафов за величину сигналов управления;M – символ математического ожидания при условии, что имеются результаты измерения хотя бы части фазовых координат XT и XУ .• 1-ое слагаемое – средняя взвешенная дисперсия конечных ошибок управления;• 2-ое слагаемое – интегральная взвешенная квадратичная оценка ошибок управления за все время управления;• 3-ое слагаемое – взвешенная энергия, затраченная на управление (экономичность)за все время работы.7Обобщенный показатель качества Летова-Калмана при несовпадении размерностивекторов XT и XУ :I =M{Т AТ XТ ( tk ) − Ay X y ( tk ) Q1 AТ XТ ( tk ) − Ay X y ( tk ) ++ AТ XT ( t ) − Ay Xy ( t ) L AТ XТ ( t ) − Ay Xy ( t ) dt + U (t )KU(t )dt ,00где матрицы AТ и Aу уравнивают размерности векторов XT и XУ .tкtкT∫∫Т(11)tк TTTI = M X ( tk ) Q1 X ( tk ) + X ( t ) L1 X ( t ) + U ( t )KU( t ) dt ,0∫FT O1где F =,O2 FyL1 =ATT LAT−ATT LAy−ATy LAуAТy LAyO3B=,By,ξТξx =,ξyGTG=O5O4,Gy(12)Q1 =ATT QAT−ATT QAy−ATy QATATy QAy,О1 - О5 – нулевые матрицы соответствующей размерности.8Локальный интегральный квадратичный функционал качестваtkI = M [ XT ( t ) − XУ ( t )] Т Q [ XT ( t ) − XУ ( t )] + U Т ( t )KU( t )dt 0∫••(13)1-ое слагаемое – средняя взвешенная дисперсия текущих ошибок управления;2-ое слагаемое – взвешенная энергия, затраченная на управление (экономичность)за все время работы.Метод Летова-Калмана является наиболее сложным, но наиболее экономичным и, какправило, наиболее точным, так как в нем наиболее полно учитывают все ограничения ифункциональные связи.Локальный метод:• наиболее прост, но наименее экономичен;• при простых исходных моделях (при минимальных взаимных связях) реализует высокую точность;• при моделях с взаимными связями фазовых координат точность ухудшается, так какне используются взаимные связи динамической матрицы F.Структура алгоритма оптимального управления зависит от функционала качества, применяемого в соответствующем критерии, а также от метода решения оптимизационнойзадачи.93 Основы оптимизации РСКУПринцип оптимальности Бэллмана – независимо от исходного состояния оптимизируемой системы все последующие сигналы управления должны быть оптимальными поотношению к состояниям, возникающим в результате воздействия предыдущих управлений.tkРисунок 1min I = Φ K [ X ( t K ),U ( t K ),t K ] + ∫ ΦT [ X ( t ),U ( t ),t ]dt , (14)0где Φ Т [ • ] и Φ K [ • ] - обобщенные выражения подынтегральных (текущих) и терминального (конечного) членов интегрального квадратичного функционала качества.Управление U ( t ) должно минимизировать интегральный квадратичный функционал I налюбом интервале [ τ , tK ] , где 0 ≤ τ ≤ tКФункция Беллмана - функционал, минимизированный выбором U на произвольномучастке [τ, tk]tkS [ X (τ ),τ ] = min Φ K [ X ( t K ),U ( t K ),t K ] + ΦT [ X ( t ),U ( t ),t ]dt .{U ( t )}0[τ ,t K ] (15)Граничное условие при τ = tk S x ( tk ) ,tk = Фk x ( tk ) ,u ( tk ) ,tk .(16)∫10Метод динамического программирования:•при допущении о детерминированных моделях состояния и точных измерениях всех фазовых координат;•существование функции S[x(τ),τ] Беллмана указывает на наличие управления, минимизирующего интегральный квадратичный функционал качества;•функция X(t) является решением системы уравнений состояния на интервале [τ, tk],определяется ее начальным состоянием x(τ) и управлением U(t) при τ < t ≤ tk;•оптимальное управление минимизирует функционал качества, устраняя зависимостьправой части функции Бэллмана от вектора управления U, предопределяет зависимость только от аргументов x(τ) и τ;••определяет управление, минимизирующее функционал качества при граничномусловии функции Бэллмана;∂ S x ( t ) ,t ∂ S x ( t ) ,t Tɺуравнение Бэллмана −= min ФT x ( t ) ,u ( t ) ,t + x ( t )∂t{u(t )} ∂ xT (t ) (17)зависит от вида минимизируемого функционала качества и модели ООУ;•в общем виде решение возможно лишь для линейных моделей и квадратичныхфункционалов.114 РСКУ, оптимальные по терминальному и локальному интегральному квадратичным критериям4.1 РСКУ, оптимальные по критерию Летова-КалманаЛинейное уравнение состояния:Xɺ ( t ) = F ( t ) X ( t ) + B( t )U ( t ) + ξ X ( t ) ,Линейное уравнение наблюдения: Z ( t ) = H ( t ) X ( t ) + ξИ ( t ) ,(18)(19)Интегральный квадратичный функционал качества:{I = M [ XT ( t K ) − XУ ( tK )] Т Q [ XT ( tK ) − XУ ( t K )] +tk∫tk∫+ [ XT ( t ) − XУ ( t )] Т L [ XT ( t ) − XУ ( t )]dt + U Т ( t )KU( t )dt ;00Критерий эффективности: min I .Оптимальный алгоритм управления:(20)(21)U ( t ) = −K −1 BT P ( t ) X̂ ;(22)Ковариационная матрица ошибок управления – решение уравнения Риккати:Pɺ ( t ) = −L1 − F( t )P ( t ) − P( t )F T ( t ) + P ( t )B( t )K −1BT ( t )P ( t ) ;(23)•граничное условие в момент окончания управления P ( t K ) = Q1 .(24)•X̂ - оценки фазовых координат (результаты фильтрации фазовых координат).12Выводы:1) при стационарных исходных моделях в состав оптимальной РСиКУ входят лишьфильтр и регулятор (управитель);2) при нестационарной модели состояния в состав системы управления должны входить: оптимальный фильтр, формирующий оценки xˆ = M {x Z } фазовых координат для (21);оптимальный идентификатор, вычисляющий оценки параметров исходных моделейˆ = M {G } , Hˆ = M {F } и Bˆ = M {B } , Gˆ = M {H } , и оптимальный регулятор, формирующийFZZZZзакон управления uОПТ ( t ) (21);3) формируемый сигнал управления (21) зависит от состояния системы x̂ , её способности воспринимать сигналы управления (определяется матрицей B), штрафов (матрица K) засигналы управления и весовой матрицы P;4) чем больше штраф за управление (матрица K), тем меньше сигналы u и тем экономичней система, но тем менее она точна (малые значения u вызывают в уравнении состоянии малые значения x̂ , а соответственно и малые целенаправленные изменения x);5) если система хорошо воспринимает сигналы управления u (матрица B имеет большие коэффициенты), то имеет смысл делать их большими (будут иметь место большиезначения оценок состояния x̂ и система будет быстро изменять свое состояние x);6) если же коэффициенты матрицы В малы, то не следует использовать большие сигналы управления (это приведет к неоправданно большим расходам энергии при очень ма13лом выигрыше в точности);7) коэффициенты матрицы P совокупным образом учитывают в (18) штрафы за текущую точность и экономичность, определяемые матрицами L1 и K, детерминированные связи и эффективность сигналов управления, обусловленные матрицами F и B (изменениештрафа ℓ1ii за точность функционирования по какой-либо координате xi приводит к изменению точности и по другим, функционально связанным с xi координатам), происходящие приэтом изменения матрицы Р приводят к изменению сигналов управления, а соответственно иэкономичности системы.Специфика алгоритма оптимального управления1) коэффициенты матрицы Р вычисляются в обратном времени от tk к t в процессе решения уравнения Риккати, а для оптимальных управляющих сигналов (21) они используются в прямом времени;2) назначение различных штрафов L1 и Q1 на текущую и конечную точность позволяетреализовать различные ошибки на разных этапах работы РСиКУ и обеспечить требуемуюточность в конце управления при весьма малых текущих затратах энергии;3) сложность регулятора, обусловленная числом уравнений, которые нужно решить дляопределения матрицы Р, существенно превышает сложность самой оптимизируемой системы;4) незначительное увеличение размерности в уравнении состояния приводит к неадекватному увеличению числа уравнений, которые нужно решать в процессе вычисления матрицы P (явление «проклятия размерности»);145) для стационарных систем матрицу Р, определяемую только априорными сведениями, можно вычислить заранее и существенно упростить процедуру оптимизации на практике.Теорема разделения или статистической эквивалентностиДля линейных моделей состояния и наблюдения в условиях гауссовских возмущений ξхи ξи и при оптимизации систем по квадратичным функционалам качества (условия применения):• алгоритм функционирования статистического регулятора, учитывающего влияниевозмущений ξх и ξи аналогичен (статистически эквивалентен) алгоритму функционированиядетерминированного регулятора, полученному для ситуации, когда ξх = 0 и ξи = 0, при условии замены в последнем фазовых координат x и параметров системы F, B, H их оптимальными оценками x̂ и F̂ , B̂ и Ĥ ;• алгоритмы оценивания и управления можно синтезировать независимо (раздельно,последовательно);• оптимальный регулятор представляет собой последовательное соединение оптимального линейного фильтра для оценки состояния и детерминированного оптимальногорегулятора.15Особенности применения теоремы для нелинейных систем:• не имеет строгого доказательства;• при больших соотношениях сигнал-шум (при точных измерениях) многомерная нелинейная система также может быть разделена на фильтр и регулятор;• текущая оптимальная оценка состояния определяется нелинейным фильтром, приближенное решение задачи раздельного синтеза тем точнее, чем выше точность оценивания.!!! Применение теоремы разделения и необязательность синтеза алгоритмовидентификации для многих РСиКУ создают предпосылки для упрощения процедуры синтеза.Эти выводы распространяются и на синтез РСиКУ на основе нелинейных моделей xт, xуи z.164.2 РСКУ, оптимальные по локальному критериюXɺ ( t ) = F ( t ) X ( t ) + B( t )U ( t ) + ξ X ( t ) ,Линейное уравнение наблюдения: Z ( t ) = H ( t ) X ( t ) + ξИ ( t ) ,Линейное уравнение состояния:(25)(26)Интегральный квадратичный функционал качества:tkI = M [ XT ( t ) − XУ ( t )] Т Q [ XT ( t ) − XУ ( t )] + U Т ( t )KU( t )dt ;0Критерий эффективности: min I .Оптимальный алгоритм управления: U ( t ) = −K −1 BT P ( t ) X̂ ;∫с учетом• граничного условия для матрицы P ( tк ) = Q1 ;(27)(28)(29)(30)• векторов и матриц обобщенного уравнения состояния и локального функционалакачества xT O3 Q −Q B=;Q =; x = ;1By−QQ x у ˆ = −K 03u = −K B x-1 T-1BTуˆT Q −Q x-1 T ˆT − xˆ у .=KBу Q x −Q Q x ˆ у (31)17Выводы:1) оптимальные РСиКУ представляет собой систему (комплекс) с отрицательными обратными связями (ООС) по всем управляемым координатам хуi ( i = 1,n ), что обеспечиваетее высокую устойчивость, малую чувствительность к точности выдерживания параметров исмене условий функционирования;2) сигнал управления определяется не просто состоянием системы, а текущей ошибˆT − xˆ у;кой между управляемыми и требуемыми компонентами вектора состояния x3) отсутствие необходимости громоздких расчетов матрицы Р выгодно отличает алгоритм, делая процедуру его вычисления чрезвычайно простой и широко применимой напрактике;4) однако, при утрате детерминированных связей, обусловленных учетом матрицы F,закон управления оказываются менее адаптивными к условиям применения;5) минимизация функционала качества на каждый текущий момент времени предполагает худшую экономичность по сравнению с оптимизацией управления по функционалуЛетова-Калмана с учетом терминального члена.18.