rpd000003080 (1012242), страница 9

Файл №1012242 rpd000003080 (161400 (24.05.05).С1 Прицельно-навигационные системы ЛА) 9 страницаrpd000003080 (1012242) страница 92017-06-172017-06-17СтудИзба

161400 (24.05.05).С1 Прицельно-навигационные системы ЛА

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла (страница 9)

(18.18)

Для приведенной выше дискретной стохастической системы выражение для функции будущих потерь принимает вид:

где

(18.19)

(18.20)

Ранее мы получили структуру оптимального управления для линейной дискретной системы:

Переходя к пределу при , получим решение исходной непрерывной задачи

(18.22)

(18.23)

(18.24)

(18.25)

Подход 2 предполагает непосредственное использование достаточных условий оптимальности для непрерывной системы.

Найдем коэффициенты сноса и диффузии для рассматриваемого марковского случайного процесса. По определению

(18.26)

Это следует из того, что

Определим теперь матрицу :

Поскольку

Получаем

. (18.27)

Тогда

(18.28)

Из условия минимума по управлению выражения в правой части находим структуру оптимального управления

(18.29)

Подставляя выражение для оптимального управления в уравнение для функции будущих потерь, имеем

(18.30)

Поскольку

(18.31)

Получим:

(18.32)

Отсюда следует:

(18.33)

(18.34)

С учетом (18.29)

То есть в обоих случаях мы получаем одно и тоже решение задачи оптимального управления для линейной стохастической системы.

ТЕМА 6.doc

Тема 6. Стохастические задачи синтеза оптимального управления по полной информации. Линейные дискретные системы, оптимизируемые по квадратичному критерию.

Для иллюстрации применения достаточных условий оптимальности рассмотрим задачу коррекции траектории движения летательного аппарата. Предполагается, что процесс коррекции описывается следующей моделью:

(17.1)

где вектор характеризует отклонение вектора состояния ЛА от расчетного перед проведением -ой коррекции; - корректирующее воздействие в момент ; - заданные матрицы; - центрированная случайная величина с заданной дисперсией , которая характеризует ошибки реализации управляющего (корректирующего) воздействия, пропорциональные величине этого воздействия (мультипликативное возмущение); - центрированный случайный вектор с корреляционной матрицей , который характеризует ошибки реализации управляющего воздействия, не зависящие от величины самого воздействия (аддитивное возмущение).

В качестве критерия оптимальности примем ожидаемое значение показателя, учитывающего энергетические затраты, необходимые для проведения коррекции, и конечную точность.

. (17.2)

Запишем рекуррентное соотношение для рассматриваемой задачи

(17.3)

Граничным условием для приведенного рекуррентного соотношения является следующее:

(17.4)

Запишем функцию будущих потерь для последнего момента управления

(17.5)

Раскроем математическое ожидание:

Учитывая, что - центрированные случайные величины, а - центрированные случайные векторы в окончательном виде получаем

(17.6)

Тогда выражение для функции будущих потерь примет вид

(17.7)

После проведения необходимых преобразований получим:

(17.8)

Здесь

(17.9)

(17.10)

Найдем минимум функции будущих потерь. Для этого воспользуемся необходимыми условиями экстремума:

Вычислим производную:

Откуда

(17.11)

Убедимся, что найденное управление доставляет минимум функции будущих потерь. Для этого вычислим :

Поскольку , а матрицы являются положительно-определенными ( - по условию задачи, а - в силу способа вычисления), то матрица также положительно-определенная, а значит, управление является оптимальным в смысле минимума функции будущих потерь.

С учетом полученного выражения (17.11) для оптимального управления для функции будущих потерь из (17.8) получаем:

, (17.12)

где

(17.13)

По индукции убеждаемся, что для любого шага функционирования динамической системы функция будущих потерь может быть представлена в виде:

(17.14)

Это выражение безусловно справедливо для шага , причем

Предположим, что приведенное выше выражение сохраняет свою структуру для любого шага , то есть

(17.15)

Тогда из (17.7) с учетом (17.15) следует справедливость выражений

(17.16)

(17.17)

Причем

При этом, закон оптимального управления имеет вид

Применяя к полученному управлению достаточные условия минимума (вычислив

убеждаемся, что это управление сохраняет свою оптимальность , если матрица - положительно определенная.

Таким образом, функция будущих потерь в задаче управления линейной дискретной системой с квадратичным критерием качества имеет квадратинцю структуру .

Матрица и коэффициент , входящие в выражение для функции будущих потерь определяются на основе рекуррентных выражений

при граничных условиях

Алгоритм оптимального управления является линейным по фазовым переменным. По форме он совпадает с ранее рассмотренным алгоритмов для детерминированной системы. Разница заключается в том, что коэффициент обратной связи, определяемый матрицей в данном случае зависит от статистических свойств мультипликативного возмущения . Если же это возмущение отсутствует, то есть , то матрица обратной связи определяется также, как и в детерминированном случае.

Иными словами при наличии только аддитивных возмущений алгоритм оптимального управления линейной стохастической системой полностью совпадает с алгоритмом оптимального управления детерминированной системой. Аддитивные возмущения оказывают влияние лишь на величину критерия оптимальности через параметр . Наличие же мультипликативного возмущения приводит к изменения самого оптимального управления (в данном случае структура зпкона управления не изменяется, но изменяются его параметры)

ТЕМА 2.doc

Тема 2. Достаточные условия оптимальности управления для случая непрерывной динамической системы. Принцип оптимальности Беллмана. Связь между динамическим программированием и принципом максимума

11.1. Достаточные условия оптимальности управления для случая непрерывной динамической системы. Принцип оптимальности Беллмана.

Перейдем теперь к решению задачи синтеза оптимального управления непрерывной динамической системой вида

, (11.1)

где - вектор ткущего состояния системы размера , - вектор управления размера , на который наложены ограничения ; - вектор-функция размера , время функционирования системы ограничено . В качестве критерия оптимальности как и в случае дискретной системы рассмотрим критерий общего вида:

(11.2)

Для того, чтобы воспользоваться ранее полученными результатами дискретизируем исходную непрерывную систему, для чего период функционирования системы разобьем на конечное число интервалов дискретизации .

Запишем разностные аналоги выражений (11.1), (11.2):

, (11.3)

(11.4)

Воспользуемся ранее полученными рекуррентными соотношениями для выше приведенных разностных аналогов:

(11.5)

Предположим, что функция будущих потерь для каждого шага является дифференцируемой. Разложим функцию в ряд Тейлора в окрестности точки

, (11.6)

где через обозначены члены более высокого порядка малости по сравнению с .

С учетом вышеприведенного разложения выражение для функции потерь примет вид

(11.7)

Поскольку функция явным образом от управления не зависит, справедлива запись

(11.8)

Перепишем последнее равенство в виде

(11.9)

Переходя к пределу при , получим выражение:

, (11.10)

которое называется уравнением Беллмана. Оно представляет собой уравнение в частных производных относительно функции будущих потерь . При решении этого уравнения необходимо имеет ввиду граничное условие

. (11.11)

Таким образом функция будущих потерь , равная по определению минимальному значению критерия при движении системы из состояния в момент времени ,

может быть определена как решение задачи Коши (11.10) для дифференциального уравнения в частных производных. Попутно из условия минимизации правой части определяется закон оптимального управления . Решение этой задачи возможно лишь численно. При этом рекуррентное соотношение (11.5) представляет собой один из алгоритмов приближенного решения.

11.2. Связь между динамическим программированием и принципом максимума.

Оказывается, что между функцией будущих потерь и сопряженным вектором в принципе максимума существует определенная связь. Проиллюстрируем эту связь на примере задачи Лагранжа вида:

Перейдем теперь к решению задачи синтеза оптимального управления непрерывной динамической системой вида

, ; .

(11.12)

Перепишем функцию Беллмана (11.10) в следующем виде:

(11.13)

и введем в рассмотрение вектор

(11.14)

где

(11.15)

и вектор-функцию

(11.16)

Введем в рассмотрение вектор

, (11.17)

где

(11.18)

С учетом введенных обозначений, компоненты вектора равны:

(11.19)

Тогда (11.13) можно представить в следующем виде:

, (11.20)

где аналог гамильтониана

(11.21)

В скалярной записи

(11.22)

Таким образом, мы пришли к формулировке принципа максимума.

Характеристики

Тип файла

Документ

Размер

2,27 Mb

Материал

161400 (24.05.05).С1 Прицельно-навигационные системы ЛА

Тип материала

Другое

Предмет

Вспомогательные материалы для первокурсников

Высшее учебное заведение

МАИ

Список файлов учебной работы

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.