Автореферат (Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии), страница 4
Описание файла
Файл "Автореферат" внутри архива находится в папке "Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии". PDF-файл из архива "Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 4 страницы из PDF
В связи с этим опишем класс допустимых стратегий вида (3.25) и несколько видоизменим постановку задачи оптимизации.∞Определение 3.4. Через обозначим множество процессов () =( (, ·), (·)), где функция () вида (3.25) измерима по Борелю на пространстве—14— , а (, ·) – борелевская вероятностная мера состояния системы (3.20) в момент ∈ [0, +∞), удовлетворяющих условиям:1) процесс () является обобщенным решением уравнения Фоккера-ПланкаКолмогорова, при этом тождество (2.9) из работы Хрусталева М.М.1 вдоль траектории (, ·) должно выполняться не только для финитных дважды непрерывнодифференцируемых функций (), но и для любых линейно-квадратичных функцийот ;2) функция (, ·) имеет математическое ожидание () и матрицу ковариаций Γ(), непрерывно дифференцируемые при всех ∈ [0, +∞);3) начальная мера 0* = (0, ·) выбирается любой, удовлетворяющей условию2) при = 0;4) определен функционал( (·)) = lim ( ) = limгде1( ) =2∫︁ ∫︁inf →+∞ ∈[,+∞) →+∞( ),(3.27)(T + 2T T + T ) (, ),0 а (, ·) – сужение функции (, ·) на интервал [0, ], < +∞.На множестве ∞ необходимо минимизировать функционал (3.27), принимающий значения из интервала [0, +∞] (допускаются бесконечные значения).∞Теорема 3.6.
Пусть процесс () = ( (, ·), (·)) из множества , где (·)стратегия вида (3.26), удовлетворяет условиям:1. набор параметров (, ) стратегии (·) принадлежит множеству Λ ;2. справедливы равенстваΠ1 = − 0 −∑︁T ∑︁T− + ( + ) = 0,T=1T(3.28)=1Π2 = − T 0 −∑︁∑︁1TT − T ( + ) = 0,=1(3.29)=1где матрицы , удовлетворяют уравнениям (3.17), (3.18) соответственно.Тогда:а) процесс () минимизирует функционал (3.27) на множестве ∞ ;б) любой другой процесс ˜ () = (˜ (, ·), (·)) из множества ∞ , использующий ту же стратегию управления (), что и процесс (), также минимизируетфункционал (3.27) на ∞ , и значения критерия на процессах ˜ () и () совпадают;в) оптимальное значение критерия вычисляется по формуле( (·)) = lim ( ) = →+∞1 ХрусталевМ.М.0T 11 ∑︁T + ,+22(3.30)=1Условия равновесия по Нэшу в стохастических дифференциальных играх при неполной ин-формации о состоянии I.
Достаточные условия равновесия // Изв. РАН. ТиСУ. — 1995. N 6. — С. 194–208.—15—где , определяются равенствами (3.23).г) уравнения (3.28), (3.29) разрешимы относительно параметров регулятора и∑︁∑︁TTT−1 + T + 0 )), + ) (=(=1=1∑︁∑︁T1T−1T ); + ) (0 +=(=1=1д) условия (3.28), (3.29) гарантируют выполнение необходимых условий оптимальности (3.22).Результат б) теоремы 3.6, в частности, означает, что оптимальное значениекритерия (3.30) не зависит от начального условия 0 (·) и самого реализовавшегосяпроцесса изменения меры (, ·), и полностью определяется оптимальной стратегией(·).
В равенстве (3.30) фигурирует обычный предел в отличие от нижнего пределав (3.27). Это означает, что оптимальный процесс () обладает свойством эргодичности. Но этот процесс является наилучшим по критерию (3.27) не только средипроцессов обладающих эргодичностью, но и среди неэргодичных.В отличие от теоремы 3.3, в которой даются необходимые условия оптимальности регулятора вида (3.21) среди линейных, теорема 2.6 дает достаточные условияоптимальности такого регулятора полной обратной связи в классе нелинейных весьма общего вида.На основе полученных необходимых условий разработан градиентный численный метод синтеза оптимальной системы, который был опробован на рядемодельных примеров, приведенных в диссертационной работе. А также рассмотрена прикладная задача стабилизации движения беспилотного летательного аппарата,относящаяся к авиационно-космическому комплексу.Пример 3.1. Рассмотрим горизонтальное движение центра масс самолетав вертикальной плоскости при наличии ветровых возмущений.
Введем следующиеобозначения: – скорость самолета относительно земли; – угол наклона траектории; ℎ – высота полета; , – соответственно горизонтальная и вертикальнаясоставляющие скорости ветра; – угол атаки; – тяга. В результате линеаризации в окрестности номинальной траектории с учетом исходных данных для БПЛАAerosonde получим систему линейных уравнений в приращениях:⎛⎛⎞⎛⎞ ⎞−0.09 −9.81 04.870.0800⎠ ∆ + ⎝4.57 3 × 10−4 ⎠ ⎠ +∆ = ⎝⎝ 0.02032 000⎛⎞−0.09 −0.15 (︂ )︂+ ⎝−0.02 −0.14⎠ .00Здесь ∆ = (∆, ∆, ∆ℎ)T – вектор состояния летательного аппарата, =(∆, ∆ )T – управление. Ветровые воздействия задаются модифицированнымиформирующими фильтрами типа Драйдена, в частности выражение для име-—16—ет вид = , = −( + ) − 1 − 2 + 3 ,где , = 1, 3 – независимые стандартные винеровские процессы; , – параметры модели ветра; , , – коэффициенты при винеровских процессах.
В отличие от классического фильтра Драйдена, представляющего собой линейную стохастическую систему, модифицированный фильтр содержит слагаемые, отражающиенеопределенность самой модели формирующего фильтра (квазилинейная система).Рисунок 1. Приращение высоты ∆ℎ, м.Рисунок 2. Приращение угла наклона траектории ∆, град.Итак, движение БПЛА с учетом ветрового воздействия описывается системой уравнений, где = (∆, ∆, ∆ℎ, , 1 , , 2 )T – вектор состояния. Полученная система является квазилинейной, так как коэффициенты диффузии линейнозависят от части компонент вектора состояния.
Доступна измерению и может бытьиспользована при управлении лишь часть компонент вектора состояния, а именнокомпоненты ∆, ∆, ∆ℎ.Было найдено оптимальное управление согласно разработанной теории иоптимальное управление без учета ветрового воздействия в соответствии теориейАКОР. Было произведено их сравнение в стохастической задаче. На рисунках 1, 2представлены отклонение высоты и отклонение угла наклона траектории от номинальных значений (1 – оптимальная стратегия стохастической системы, 2 – оптимальная стратегия детерминированной системы).—17—Значение критерия, подсчитанное по формуле (3.16), для летовского регулятора составило 5.04, а для оптимального регулятора стохастической системы – 2.23.приводятся полученные достаточные условия второго порядка в задаче оптимизации облика квазилинейной стохастической системы.Рассматривалась квазилинейная стохастическая система вида (3.12) с квадратичным усредненным по времени критерием (3.15).
В третьей главе работы былаисследована устойчивость рассматриваемой системы, проведены уравнения для предельных значений первого (3.13) и второго центрального (3.14) моментов, подсчи¯ , гдетано значение (3.16) критерия при фиксированном векторном параметре = матрицы и находятся из уравнений (3.17), (3.18).Было показано, что критерий есть дважды дифференцируемая функция конечного числа переменных, и выписан функционал ЛагранжаВ четвертой главе1 () = ¯ + [ΨΓ∞ ] + Θ∞ ,2совпадающий с исходным критерием (3.15) при любых и в силу выполненияограниченийΘ=T0∑︁T + = 0,(4.31)T + 0T + = 0,(4.32)+ 0 +=1TΨ = 0 +∑︁=1которые подменяют исходное ограничение (3.12), а ¯ определяется выражением (3.16).При фиксированных значениях , c учетом (3.16), (4.31), (4.32) выражениедля компонент матрицы вторых производных в поставленной задаче имеет вид⃒[︂ 2]︂ 2 ¯1 Ψ ∞ Ψ Γ∞ Ψ Γ∞ 2 () ⃒⃒=+ Γ +++ ⃒=¯ 2 2 Θ ∞ Θ ∞ Θ ∞+ ++. (4.33)Частные производные ∞ / , Γ∞ / находятся дифференцированиемпо из уравнений (3.13), (3.14) соответственно.
Первые и вторые производные для¯ , Ψ, Θ находятся из уравнений (3.16), (4.31), (4.32).Зная выражение для компонент второй производной критерия и используя,например, критерий Сильвестра, легко установить наличие или отсутствие локального минимума.Проверка достаточных условий продемонстрирована на модельных примерахв случае полной информации о состоянии системы и случае информационных ограничений.подведены основные итоги данной работы, сформулированырезультаты, представляемые к защите.В заключении—18—Исследования, проведенные в диссертационной работе, могут быть продолжены в следующих направлениях: для квазилинейных систем предполагается исследовать подробно задачи оптимизации в случае неточных измерений доступных наблюдению компонент вектора состояния, использования фильтра заданной размерностис совместной оптимизацией регулятора и фильтра (теорема разделения для квазилинейных систем не справедлива), обобщить полученные результаты для случая информационных ограничений, когда каждая компонента вектора управления можетзависеть от своего индивидуального состава компонент вектора состояния.ОСНОВНЫЕ РЕЗУЛЬТАТЫ, ВЫНОСИМЫЕ НА ЗАЩИТУ1.
Получены и доказаны необходимые условия оптимальности линейного регулятора в задаче оптимизации линейной стохастической системы, функционирующей на неограниченном интервале времени, при неполной информации о состоянии. [2, 5, 9].2. Введено новое понятие вполне возмущаемости стохастической системы, получен критерий вполне возмущаемости для линейных систем и установлена связьотсутствия этого свойства с неединственностью оптимального процесса [2, 11].3. Получены и доказаны необходимые условия оптимальности квазилинейнойстохастической системы, функционирующей на неограниченном интервале времени,матрицы которой зависят от подлежащего выбору векторного параметра, – задачеоптимизации облика системы [3, 6].4. Выполнена конкретизация полученных необходимых условий для управляемой по выходу стохастической системы, системы обладающей свойством симметриии системы с ПИД-регулятором [3, 7].5.
В задаче синтеза оптимальной стратегии управления квазилинейной стохастической системой в случае полной информации о состоянии предложен специальный критерий оптимальности, допускающий неэргодичность допустимых процессовуправления, и получены необходимые условия оптимальности стратегии, обеспечивающей эргодичность оптимального процесса [3, 15].6. Получены условия второго порядка в задаче оптимизации облика квазилинейных стохастических систем [12].7. Разработаны вычислительные алгоритмы синтеза оптимальной стратегииуправления в задачах оптимизации линейной стохастической системы, облика системы и квазилинейной управляемой по выходу стохастической системы [2, 3, 8, 10].8.
Решены прикладные задачи оптимальной стабилизации ориентацииспутника с гибким стержнем, движения беспилотного летательного аппарата внеспокойной атмосфере [1, 3, 4, 13, 14].Публикации в журналах перечня ВАК1.Простой алгоритм стабилизации ориентацииспутника с гибким стержнем // Электронный журнал «Труды МАИ».
— 2012.№55.2. Хрусталев М.М., Халина А.С. Синтез оптимальных регуляторов линейныхстохастических систем при неполной информации о состоянии. Необходимыеусловия и численные методы // Автоматика и телемеханика. — 2014. № 11. —C. 70–87.Хрусталев М.М., Халина А.С.—19—3.Оптимизация облика и стабилизация управляемых квазилинейных стохастических систем, функционирующих нанеограниченном интервале времени // Изв. РАН. ТиСУ. — 2017. № 1. (принятак публикации).Халина А.С., Хрусталев М.М.Программа для ЭВМ4.Оптимальное управление малым беспилотным летательнымаппаратом в неспокойной атмосфере // Свидетельство о государственнойрегистрации программы для ЭВМ № 20166114945 от 12 мая 2016 г.ХалинаА.С.Публикации в других изданиях5.Матричный метод сопряженных направлений решения уравнения Ляпунова и Сильвестра. Проблемыустойчивости и управления.
Сборник научных статей, посвященный 80-летиюакадемика Владимира Мефодьевича Матросова. — М.:Физматлит, 2013. — С.380–394.6. Хрусталев М.М., Халина А.С. Условия стабилизируемости и оптимальностиквазилинейных стохастических систем при неполной обратной связи нанеограниченном интервале времени // Труды XII Всероссийского совещанияпо проблемам управления (ВСПУ-2014). — М.:ИПУ РАН, 2014. — С. 1126–1134.7. ХрусталевМ.М.,ХалинаА.С.Пропорционально-интегральнодифференциальный (ПИД) регулятор в задаче стабилизации квазилинейнойстохастической системы // XII Международная конференция «Устойчивостьи колебания нелинейных систем управления» (конференция Пятницкого).