Диссертация (Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии)
Описание файла
Файл "Диссертация" внутри архива находится в папке "Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии". PDF-файл из архива "Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст из PDF
ОглавлениеСписок основных обозначений4Введение61Синтез оптимальных стохастических систем на неограниченном интервале времени1.11.21.31.41.5217Описание управляемой стохастической системы . . . . . . . .Обобщенное уравнение Фоккера-Планка-Колмогорова . . . .Достаточные условия стабильности стохастической системы .Метод функций Ляпунова-Лагранжа, функционал ЛагранжаВыводы по главе 1 . . . .
. . . . . . . . . . . . . . . . . . . . ...............................Синтез оптимальных регуляторов линейных стохастических системпри неполной информации о состоянии2.12.22.32.42.52.631818202124Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Экстремальная стабилизирующая стратегия . . . . . . .
. . . . . . . .Необходимые условия оптимальности линейного регулятора . . . . . .Вполне возмущаемость системы. Вопрос о единственности оптимального регулятора . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2.4.1 Пример . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Численные методы и моделирование . . . . . . .
. . . . . . . . . . . .2.5.1 Простой алгоритм синтеза оптимальных регуляторов линейныхстохастических систем . . . . . . . . . . . . . . . . . . . . . . .2.5.2 Градиентный численный метод синтеза оптимальных регуляторов линейных стохастических систем . . . . . . . . . . . . . . .2.5.3 Модельный пример. Сравнение численных методов . . . . . . .2.5.4 Стабилизация ориентации спутника с гибким стержнем . . . .Выводы по главе 1 . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . .25. 26. 27. 29. 35. 38. 38. 39....40414245Оптимизация облика и стабилизация квазилинейных стохастическихсистем при неполной информации о состоянии3.13.246Описание динамической системы. Постановка задачи . . . . . . . . . .
. 47Анализ устойчивости и стабилизируемости . . . . . . . . . . . . . . . . . 4823.33.43.53.63.73.83.94Оптимизация облика квазилинейной стохастической системы. Необходимые условия оптимальности . . . . . . . . . . . . . . . . . . . . . . . .Управляемая по выходу система . . . . . . . . . . . . . . . . . . . . . . .3.4.1 Симметрическая управляемая по выходу система . . .
. . . . . .Система с пропорционально-интегрально-дифференциальным регулятором . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3.5.1 Пример . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Управляемая система в случае полной информации о векторе состоянияЧисленный метод и моделирование . . . . . . .
. . . . . . . . . . . . . .3.7.1 Алгоритм синтеза оптимальных регуляторов квазилинейныхстохастических систем . . . . . . . . . . . . . . . . . . . . . . . .3.7.2 Модельный пример . . . . . . . . . . . . . . . . . . . . . . . . . .Оптимальная стабилизация движения беспилотного летательного аппарата (БПЛА) в неспокойной атмосфере . . . .
. . . . . . . . . . . . .3.8.1 Описание модели движения БПЛА . . . . . . . . . . . . . . . . .3.8.2 Моделирование ветра . . . . . . . . . . . . . . . . . . . . . . . . .3.8.3 Результаты моделирования . . . . . . . . . . . . . . . . . . . . . .Выводы по главе 2 . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . .5559616465667373747575777879Условия второго порядка в задаче оптимизации квазилинейной стохастической системы834.14.284858587874.3Условия второго порядка . . . . . . . . . . . . . . . . . . . . . . . . . . .Моделирование . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . .4.2.1 Модельный пример. Полная информация о векторе состояния .4.2.2 Модельный пример. Неполная информация о векторе состоянияВыводы по главе 3 . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . .Заключение90Список литературы933Список основных обозначений – -мерное евклидово пространство;(·)T – операция транспонирования; = [0, 1 ] – интервал времени функционирования динамической системы, моментвремени 1 задан;0 ⊂ – множество нулевой меры Бореля из ; ∈ – вектор состояния; ∈ – вектор управления;() ∈ – стандартный винеровский процесс; ∈ Λ ⊂ – векторный параметр; (, ) – вероятностная мера, задающая распреденение случайного состояния вмомент времени ;0 () = (0, ) – заданное начальное распреденение вектора состояния ;(, ) – плотность вероятности состояния в момент времени ;0 () = (0, ) – заданная начальная плотность распределения вектора состояния; ⊂ – множеств, задающее геометрические ограничения на управление ; – множество, задающее информационные ограничения на управление ; – специально сконструированное [44, 45] пространство вероятностных мер (, );¯ – пополненное множество , представляющее собой банахово пространство; * ⊂ – множество абсолютно непрерывных относительно меры Лебега вероятностных мер (, ) (имеет плотность);0* ⊂ * ⊂ – заданное множество начальных распределений вероятностноймеры (, ); 2 – пространство дважды непрерывно дифференцируемых функций на ;40* – пространство дважды непрерывно дифференцируемых функций на , аннулирующихся вне некоторого шара в ;ℒ – множество допустимых матриц линейного регулятора = −, удовлетворяющего информационным ограничениям.5ВведениеВажной задачей системного анализа является разработка математических моделей, учитывающих воздействие на объект управления случайных факторов [6].Например, к числу факторов, действующих на движение летательного аппарата ватмосфере, можно отнести: внешние неточно известные силы, разброс аэродинамических характеристик и конструктивных параметров летательного аппарата, порывыветра, вариации плотности атмосферы, магнитного и гравитационного поля Землии др.
Для математического описания подобных систем часто используется стохастическое описание.В прикладных задачах линейные стохастические системы появляются как аппроксимация нелинейных в некоторой малой окрестности заданного движения. Ноесли, например, в нелинейном уравнении Ито линеаризовать коэффициенты сдвигаи диффузии, то в общем случае мы получим квазилинейную систему, а не линейную.Квазилинейные динамические стохастические системы отличаются от линейных тем,что в описывающем их уравнении Ито не только коэффициенты сноса, но и коэффициенты диффузии (коэффициенты при дифференциале винеровского процесса)зависят линейно от переменных состояния и управлений.Для задач стохастического оптимального управления традиционным является поиск минимума математического ожидания функционала [7, 18].
Однако, иногда рассматриваются и другие критерии [14, 36].Если время > 0 движения системы задано, то говорят о задачах управления наконечном интервале времени [0, ]. Также интересны задачи на бесконечном интервале времени. Примером является задача оптимальной стохастической стабилизации.Рассматриваемые в диссертации системы функционируют на неограниченном интервале времени, что упрощает исследование, как и в теории А.М.
Летова [13]. В связи с этим использование стандартного квадратичного критерия малосодержательно.6Если, например, критерий оптимальности представляет собой расход топлива илиэнергии на демпфирование отклонений от желаемого процесса, то на бесконечноминтервале времени этот расход будет бесконечным вследствие постоянного действияслучайных возмущений. Более содержателен критерий, представляющий собой расход величины, определяющей оптимальность процесса, в единицу времени. Такогорода критерий для систем с непрерывным временем, по-видимому, впервые был использован основателем кибернетики Н. Винером в задаче синтеза оптимальной передаточной функции из условия минимума среднеквадратичной ошибки [70].Большое внимание уделяется методам решения задач оптимизации динамическихсистем, позволяющим определять непрерывное управление либо как функцию отначальных условий и времени (программное управление) [25], либо как функциювремени и текущих фазовых координат системы (синтез управления) [4].Для детерминированных систем управления не имеет значения, какое управление – программное или с обратной связью – используется, так как знание управленияи начального состояния позволяет однозначно определить состояние системы в любой момент времени.
Наблюдение за текущим состоянием системы не дает новойинформации. В стохастических системах управления, т.е. в системах подверженныхслучайным воздействиях, по известным управлению и начальному состоянию предсказать ход протекания процесса невозможно, так как он зависит еще от случайныхвоздействий. И возможности управления такими системами существенно зависят оттой информации, которая может быть получена путем измерения и обработки выходной (наблюдаемой) переменной.
Поэтому стохастические оптимальные системыуправления должны быть замкнутыми, т.е. системами управления с обратной связью [7].В линейных стохастических системах с квадратичным критерием качества оптимальная детерминированная стратегия управления, полученная при отсутствиислучайных возмущений, при использовании полной обратной связи будет оптимальна и при действии случайных возмущений. Если же измерению и, соответственно,использованию при управлении доступна лишь часть компонент вектора состояния,ситуация изменяется.
Каждому составу доступных использованию компонент вектора состояния будет соответствовать своя стабилизирующая стратегия, зависящая от7характеристик возмущений. При некоторых сочетаниях доступных компонент задача может не иметь решения, так как даже детерминированная вполне управляемаяпо Калману система может быть нестабилизируемой при использовании неполнойобратной связи.Для описания динамической системы составляется ее математическая модель. Вреальной ситуации зачастую невозможно точно описать функционирующий технический объект, получать полную информацию о его динамике, возмущениях, действующих на него и т.д.
В результате возникает задача оптимизации с информационнымиограничениями.Существует обширный класс динамических систем, в которых информация о положении в фазовом пространстве является неполной и ограничена измерительнымустройством, которым располагает система. Возможности управления такими системами существенно зависят от той информации, которая может быть получена путемизмерения и обработки наблюдений. Также важным источником неполноты информации является запаздывание, вызванное временем, необходимого для проведениянаблюдений и обработки их результатов. Поэтому в теории управления стали развиваться направления, связанные с решением задач оптимизации динамических системв условиях неопределенности, например: управление пучками траекторий [16, 34];управление стохастическими системами [19, 20, 26, 46, 47, 63–65, 67, 71, 72];В диссертационной работе под управлением при неполной информации о состоянии системы понимается управление по части компонент вектора состояния.