Автореферат (Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии), страница 2
Описание файла
Файл "Автореферат" внутри архива находится в папке "Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии". PDF-файл из архива "Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 2 страницы из PDF
Основные результаты диссертации опубликованы в 3 научныхстатьях [1–3] в журналах, входящих в перечень ВАК, в 3 статьях [5–7] в различныхжурналах, сборниках и материалах конференций, в сборниках тезисов докладов конференций [8–15] на русском и английском языках. Общее число публикаций — 14.Зарегистрирована программа для ЭВМ [4].Структура и объём диссертации. Диссертация содержит введение, четыре главы основной части, заключение и список используемой литературы. Работаизложена на 101 странице, включая 16 рисунков, 1 таблицу и список литературы,содержащий 72 наименования.СоответствиедиссертациипаспортунаучнойспециальностиВ диссертации методы системного анализа применены для исследованиясложных технических систем, проведена разработка методов и алгоритмов решениязадач стабилизации и оптимального управления стохастическими динамическимисистемами.05.13.01.СОДЕРЖАНИЕ РАБОТЫдано обоснование актуальности выбранной автором темы диссертации, сформулирована цель работы, аргументирована её научная новизна ипрактическая ценность, проведен обзор известных методов оптимизации системуправления с учетом доступности информации об объекте управления.Рассматриваются линейные и квазилинейные стохастические системы, функционирующие на неограниченном интервале времени, при неполной информации осостоянии.
Квазилинейные динамические стохастические системы отличаются от линейных тем, что в описывающем их уравнении Ито не только коэффициенты сноса,но и коэффициенты диффузии (коэффициенты при дифференциале винеровскогопроцесса) зависят линейно от переменных состояния и управлений.Для решения поставленных в диссертационной работе задач использовалсяметод функций Ляпунова-Лагранжа, обобщающий метод функций Кротова В.Ф. настохастические системы. Этот метод наметился еще в ранних работах Хрусталева М.М.
при изучении проблемы оптимального управления частично наблюдаемымдиффузионным процессом и получил дальнейшее развитие в его работах по стохастическим дифференциальным играм с неполной информацией.Метод функций Ляпунова-Лагранжа состоит в использовании совокупностиВо введении—6—функций, аналогичных вектор-функциям Ляпунова в теории устойчивости. Но в рассматриваемом круге проблем эти функции играют двоякую ролью. С одной стороны,они, как и функции Ляпунова, подменяют проблему изучения поведения траекторий динамической системы изучением их поведения на этих траекториях.
С другой– они являются нелинейными нелокальными аналогами классических множителейЛагранжа, предназначенных для полного снятия ограничений.Важным результатом применения функций Ляпунова-Лагранжа являетсяснятие всех нелокальных ограничений, в том числе и информационных, и полная локализация условий равновесия – доведение их до совокупности уравнений (или неравенств) для этих функций и семейства конечномерных задач, решаемых в фиксированный момент времени локально в каждой точке пространства состояний, аналогично тому, как это делается в условиях принципа максимума Понтрягина Л.С.
илидинамического программирования для классической задачи оптимального управления.Рассматриваемые системы функционируют на неограниченном интервале времени, что упрощает исследование, как и в теории Летова А.М. В связи с этим использование стандартного квадратичного критерия малосодержательно. Если, например,критерий оптимальности представляет собой расход топлива или энергии на демпфирование отклонений от желаемого процесса, то на бесконечном интервале времениэтот расход будет бесконечным вследствие постоянного действия случайных возмущений.
Более содержателен критерий, характеризующий собой расход величины,определяющей оптимальность процесса, в единицу времени. Такого рода критерийдля систем с непрерывным временем, по-видимому, впервые был использован Н. Винером в задаче синтеза оптимальной передаточной функции из условия минимумасреднеквадратичной ошибки.Важную роль для получения условий оптимальности процессов управлениястохастическими системами на неограниченном интервале времени играет функционал Лагранжа, предложенный в работах Хрусталева М.М. Использование функционала Лагранжа дает возможность рассматривать вместо исходного критерия достаточное богатое многопараметрическое представление оптимизируемого функционала.Диссертационная работа представляет собой часть комплекса научных исследований, проводимых под руководством Хрусталева М.М., по созданию теориианалитического конструирования оптимальных регуляторов стохастических систем (АКОРСС) , аналога теории АКОР для детерминированных си-стем.для удобства изложения приводятся используемые результаты из работ Хрусталева М.М., адаптированные для рассматриваемых в диссертациизадач.В первой главерассматривается задача синтеза оптимальных регуляторовлинейных стохастических систем при неполной информации о состоянии.Пусть поведение модели объекта управления описывается линейным дифференциальным уравнением Ито видаВо второй главе = ( + ) + ,(2.1)—7—где = (1 , ..., )T ∈ – вектор состояния системы; = (1 , ..., )T ∈ –вектор управления; = (1 , ..., )T ∈ – стандартный винеровский процесс; ∈ [0, +∞) – время функционирования системы; , , – постоянные матрицыразмера ( × ), ( × ), ( × ) соответственно.Минимизируемый критерий оптимальности имеет вид∞11lim=2 →+∞ ∫︁ ∫︁ (, ) (, ),0 (2.2) (, ) = T + 2T + T где (, ) – неотрицательная квадратичная форма; , , – матрицы размера( × ), ( × ), ( × ) соответственно; – симметрическая, положительно определенная матрица.
Внутренний интеграл в (2.2) представляет собой математическоеожидание «мгновенных потерь». Вероятностная мера (, ·) задает распределениесостояния системы (2.1) в момент времени . Предполагается, что начальная плотность распределения 0 () = (0 , ) вектора состояния задана, гауссова и невырожденная.Измерению и, соответственно, использованию при управлении доступны невсе компоненты вектора состояния. Эти ограничения будем называть информационными. В общем случае каждая компонента вектора управления может зависетьлишь от своего, назначаемого априори, набора компонент вектора состояния .Используя достаточные условия равновесия по Нэшу, Хрусталевым М.М.
были получены локальные условия равновесия первого порядка, составляющие содержание метода Лагранжа. Однако, полученные условия не являются необходимымиусловиями оптимальности. Они представляют собой необходимые условия выполнения предположений теоремы, которая дает достаточные условия оптимальности.Экстремальной стабилизирующей стратегией называется (согласно терминологииработ Хрусталева М.М.) стратегия, удовлетворяющая этой линеаризации достаточных условий оптимальности.Хрусталевым М.М. было показано, что для линейных систем, функционирующих на неограниченном интервале времени, с квадратичным критерием методЛагранжа сводит проблему построения стратегии управления к решению системыматричных уравнений.
Хрусталевым М.М. была получена система уравнений для¯ , экстремальопределения экстремальной стабилизирующей стратегии ¯() = −ного значения критерия ¯ , вспомогательной матрицы размеров × , матрицымножителей Лагранжа , отвечающей за информационные ограничения, размеров × и ковариационной матрицы Γ∞ предельной плотности распределенияT ∞ −1¯¯() = (−(Γ ) /2).(2.3)Это следующая система уравнений:√︀¯ = 1/ (2) |Γ∞ |,(2.4)T¯ Γ∞ + Γ∞ T¯ + = 0,1¯ = ( T ),2(2.5)(2.6)—8—T¯¯T ¯¯T ¯ + T¯ + − − + = 0,¯ = −1 ( T + − (Γ∞ )−1 ).(2.7)(2.8)¯ , – симметрическая матрица. При этом в условиях (2.4)Здесь и далее ¯ = − и (2.8) предполагается, что определитель |Γ∞ | ̸= 0.
Равенство (2.4) – это условиенормировки предельной плотности (2.3).Если все компоненты стратегии управления ¯() зависят от одних и тех жекомпонент вектора , то матрица Лагранжа находится по следующему алгоритму.Строится диагональная информационная матрица Ω = (1 , ..., ), где = 0,если компонента вектора доступна измерению, и = 1, если не может бытьизмерена. Матрица задается равенством = ( T + )Ω(Ω(Γ∞ )−1 Ω + − Ω)−1 ,(2.9)где – единичная матрица размеров ×.
Если состав измерений различен для группкомпонент стратегии ¯(), то уравнения (2.8), (2.9) записываются для строк матриц¯ и , соответствующих каждой группе, с использованием своей информационнойматрицы Ω.¯ , где ¯ удовлеТеорема 2.1. [Хрусталев М.М.] Стратегия ¯() = −творяет информационным ограничениям, является экстремальной стабилизирующей стратегией управления, а экстремальное значение критерия (2.2) равно числу¯ ¯ и матрицы Γ∞ , ¯ , , , |Γ∞ | =¯ = ( T )/2, если величины ,̸ 0 удовле¯творяют системе уравнений (2.3)–(2.9) и матрица ¯ = − асимптотическиустойчива.Таким образом показано, что решением задачи АКОРСС является линейныйрегулятор.
Однако, этот вывод сделан исходя из линеаризованных достаточных условий оптимальности регулятора (метод Лагранжа) и, строго говоря, приведенныеусловия (2.3)-(2.9) не являются необходимыми условиями его оптимальности.В диссертационной работе постулируется, что допустимый класс стратегийуправления – это линейные регуляторы () неполной обратной связи удовлетворяющие информационным ограничениям → () = − : → ,(2.10)где – постоянная матрица размеров × . Формально наличие информационныхограничений состоит в том, что элементы , = 1, матрицы { } равны нулю,если компонента вектора состояния не может использоваться в управлении ().Множество таких допустимых матриц обозначим через ℒ.Показано, что критерий (2.2) есть дифференцируемая функция конечногочисла переменных – элементов матрицы . И в классе линейных регуляторов получены строгие необходимые условия оптимальности , приведенные в следующей теореме.¯Теорема 2.2.
Если матрица ¯ = − асимптотически устойчива и¯ оптимальный линейный регулятор, минимизирующий критерий ∞ ,¯() = −то выполнено условие⃒⃒∞¯ ∞ · ( − Ω) = 0,= (− − + )Γ· ( − Ω)⃒⃒¯=(2.11)—9—где - единичная матрица, матрицы Γ∞ и определяются двумя уравнениями Ляпунова (2.5), (2.7), а оптимальное значение критерия ¯ определяется равенством (2.6)Здесь Γ∞ – предельная матрица ковариаций, – матрица множителей Лагранжа.Также показано, что в случае невырожденной предельной (при → +∞)матрицы ковариаций Γ∞ полученные условия оптимальности совпадают с условиями (2.3)-(2.9).¯ ¯Теорема 2.3.