Диссертация (Вычислительные методы для задач достижимости и синтеза управлений в условиях нелинейности)
Описание файла
Файл "Диссертация" внутри архива находится в папке "Вычислительные методы для задач достижимости и синтеза управлений в условиях нелинейности". PDF-файл из архива "Вычислительные методы для задач достижимости и синтеза управлений в условиях нелинейности", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст из PDF
Московский Государственный Университет им. М. В. ЛомоносоваФакультет вычислительной математики и кибернетикиНа правах рукописиСиняков Владимир ВладимировичВычислительные методы для задачдостижимости и синтеза управлений вусловиях нелинейности01.01.07 — вычислительная математикаДиссертация на соискание ученой степеникандидата физико-математических наукНаучный руководитель — докторфизико-математических наук,академик РАНА.
Б. КуржанскийМосква, 2015 г.ОглавлениеВведение41 Задачи аппроксимации для нелинейных систем201.1 Постановка задач . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.2 Метод аппроксимации множеств достижимости. Принцип сравнения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . 251.3 Пример аппроксимации множества достижимости: динамическийуницикл . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311.4 Алгоритм глобальной билинеаризации . . . . . . . . . . . . . . . . 371.5 Схемы решения задач . . . . . .
. . . . . . . . . . . . . . . . . . . 391.5.1 Задача достижимости . . . . . . . . . . . . . . . . . . . . . 401.5.2 Задачи гарантированного оценивания . . . . . . . . . . . . 421.5.3 Задача синтеза управлений . . . . . . . . . . . . . . . . . . 442 Задача достижимости для билинейных систем управления452.1 Постановка задач . . . . . . .
. . . . . . . . . . . . . . . . . . . . . 452.2 Квадратичные аппроксимации множеств достижимости . . . . . . 482.2.1 Внешние аппроксимации . . . . . . . . . . . . . . . . . . . . 492.2.2 Внутренние аппроксимации . . . . . . . . . . . . . . . . . . 522.3 Кусочно-квадратичные аппроксимации множеств достижимости . 542.3.1 Внешние аппроксимации . . . . . . . . .
. . . . . . . . . . . 562.3.2 Внутренние аппроксимации . . . . . . . . . . . . . . . . . . 612.4 Внутренние аппроксимации с помощью положительно однородных функций . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 632.5 Примеры . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . 673 Задачи гарантированного оценивания и синтеза управлений длябилинейных систем773.1 Постановка задач гарантированного оценивания . . . . . . . . . . 773.2 Решение задачи с дискретными измерениями . . . . . . . . . . . . 803.3 Решение задачи с непрерывными измерениями . . . . .
. . . . . . 843.4 Пример: несвязное информационное множество двумерной билинейной системы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 883.5 Пример: определение ориентации объекта по неточным измерениям 89233.6 Задача синтеза управлений . . . . . . . . . . . . . . .
. . . . . . . 1033.7 Пример: задача синтеза для линейной системы с неопределенностью в матрице . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106Заключение109Литература110ВведениеАктуальность темы. Данная работа посвящена задачам достижимости,гарантированного оценивания и синтеза управлений для некоторых классов систем управления. Изучаемые управляемые системы описываются нелинейнымиобыкновенными дифференциальными уравнениями. Основное внимание в работе уделено классу билинейных по состоянию и управлению систем. Задачадостижимости заключается в построении множества достижимости, состоящего из всех точек, в которые можно попасть из заданного начального множества, используя допустимые управления, которые удовлетворяют так называемым “жестким” или геометрическим ограничениям.
В задаче гарантированногооценивания требуется найти информационное множество, которое состоит извсех точек, совместимых с поступающими в реальном времени измерениямии ограничениями на неопределенность в системе и начальном состоянии. Поступающие измерения представляют собой функцию от состояния системы иреализации помехи в уравнении измерений. Неопределенность в задачах гарантированного оценивания также удовлетворяет геометрическим ограничениям: значения неопределенных параметров в конкретный момент времени должно принадлежать определенным множествам в пространстве этих параметров.Множества достижимости и информационные множества являются составными частями решения других задач теории управления, в частности, задачи синтеза.
В исследуемых в данной работе задачах все рассмотрения производятсяна конечном отрезке времени. Важными понятиями в этих задачах являютсяпонятия трубки достижимости и информационной трубки, которые представляют собой многозначные отображения, значениями которых в фиксированныймомент времени t являются соответственно множества достижимости и информационные множества [67].К настоящему времени разработан ряд подходов к рассматриваемому кругузадач. Необходимо подчеркнуть, что решение этих задач, как правило, может45быть получено только численно и требует большого количества вычислений.Лишь в ряде исключительных случаев решение получено в виде явной формулы.Основным элементом многих таких вычислительных подходов является использование метода динамического программирования, разработанного Р.
Беллманом [1]. Этот метод заключается во введении вспомогательного объекта —функции цены, которая вычисляется как оптимальное значение соответствующего задаче функционала для каждой позиции системы. Позицией системыназывается пара объектов: момент времени и обобщенное состояние системы.Позиция выбирается таким образом, чтобы функция цены удовлетворяла полугрупповому свойству, которое также называется принципом оптимальности. Втаком случае функция цены является решением дифференциального уравненияв частных производных, которое называется уравнением Гамильтона-ЯкобиБеллмана (ГЯБ). Функция цены часто бывает не всюду гладкой и удовлетворяет уравнению ГЯБ только в точках дифференцируемости, поэтому возникаетнеобходимость использовать различные понятия обобщенных решений уравнения Беллмана.
Среди определений обобщенных решений можно выделить обобщенные решения С. Н. Кружкова [16] для выпуклого по импульсной переменной p гамильтониана H(t, x, p), вязкие решения [17, 24, 50], построенные припомощи метода исчезающей вязкости, вязкостные решения, введенные М. Г.Крэндаллом и П.-Л. Лионсом [46, 47], и минимаксные решения, введенные А.И. Субботиным [29, 30].
В случае непрерывной функции цены последние дваопределения эквивалентны.Одна группа численных методов, связанная с использованием метода характеристик для уравнений Гамильтона-Якоби, была развита в работах Н.Н.Субботиной [31, 32]. В рамках этого подхода функция цены в задаче достижимости (или в задаче синтеза) аппроксимируется на основе формул методахарактеристик.Другой подход к численному решению задачи достижимости заключается вдискретизации соответствующей функции цены по времени и/или по пространству. В частности, при дискретизации по времени уравнение Гамильтона-Якобизаменяется некоторым оператором, который переводит аппроксимацию решения в момент t в аппроксимацию решения в момент t + ∆t.
Решения в рамкахэтого подхода приведены в работах [6, 33, 34, 79], см. также книги [2, 30].6Третий вычислительный подход заключается в оценивании решений рассматриваемых задач множествами более простой формы. Эти оценки представляют собой внутренние или внешние аппроксимации искомых множеств.В работах А.Б. Куржанского [62, 64] был разработан аппарат эллипсоидального исчисления, в рамках которого для линейных систем строятся внешниеи внутренние оценки множеств достижимости в виде эллипсоидов (см. также[44, 76]). При этом объединение всех внутренних оценок, как и пересечение всехвнешних оценок, совпадает с точным множеством достижимости. Сходная теория для оценок в виде параллелотопов была позже построена в работах Е.К.Костоусовой [57, 59].Данный подход можно реализовать различными способами.
В указанныхвыше работах оценки получены индуктивным методом (также см. [38]). Другойспособ, называемый принципом сравнения для уравнений Гамильтона-Якоби,предложен в работе А.Б. Куржанского [22]. Он сводит задачу к нахождениюверхних и нижних оценок функции цены, которые конструируются путем оценивания гамильтониана в уравнении Гамильтона-Якоби-Беллмана. Этот способ,в частности, применен в работе [5].В данной работе также используется именно этот подход. Его применениеприводит к алгоритмам аппроксимации, в которых оценки задаются с помощью решений задач Коши для некоторых специально сконструированных систем обыкновенных дифференциальных уравнений.
Эти задачи Коши для различных оценок независимы друг от друга и решаются численно. Независимостьпозволяет при этом эффективно использовать параллельные вычисления. Полученные в результате наборы оценок могут быть использованы для построенияболее точных внешних и внутренних аппроксимаций искомых множеств с помощью операций пересечения и объединения.Имеются работы, в которых было получено точное аналитическое представление множеств достижимости для конкретных нелинейных управляемых систем (см., в частности, [25, 74]).Одними из ключевых понятий в теории гарантированного оценивания, разработанной А.Б. Куржанским [18, 19, 20, 21, 66], являются понятия информационного множества и информационного состояния системы, которые являютсяразличными вариантами формализации доступной к некоторому моменту времени информации о состоянии системы и связаны между собой определенными7соотношениями. Информационное множество оказывается решением соответствующего эволюционного уравнения [61], а информационное состояние, в зависимости от определения, является решением уравнения или вариационногонеравенства типа Гамильтона-Якоби [65, 66].