rpd000003080 (1012242), страница 6

Файл №1012242 rpd000003080 (161400 (24.05.05).С1 Прицельно-навигационные системы ЛА) 6 страницаrpd000003080 (1012242) страница 62017-06-17СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 6)

Поскольку в выражение для функции будущих потерь входят неизвестные нам векторы состояния динамической системы, а не их измерения, то для вычисления математического ожидания необходимо знание условных плотностей:

- плотности, задающей распределение значений фазовых координат динамической системы в момент времени , при условии, что измерения , накопленные к этому моменту времени фиксированы.

плотности, задающей распределение измерений фазовых координат динамической системы в момент времени , при условии, что измерения , накопленные к этому моменту времени фиксированы.

Получение оценок указанных многомерных условных функций плотности чрезвычайно сложная задача, поскольку необходимо учитывать все прошлые и настоящие измерения .

Вычисление математического ожидания можно несколько упростить, если предположить существование некоторого вектора , называемого вектором достаточных координат дли статистик, который является функцией от вектора и удовлетворяет следующим требованиям:

  1. знание вектора достаточно для определения оптимального управления и функции будущих потерь . По-существу это означает, что плотность типа может быть представлена как ;

  2. информации о векторе достаточно для определения будущей эволюции динамической системы, то есть для моментов времени .

При наличии вектора , обладающего указанными свойствами рекуррентное соотношение (19.4) можно представить в виде:

(19.6)

причем краевое условие для этого рекуррентного соотношения сохраняется

.

Использование рекуррентного соотношения (19.6) вместо (19.4) позволяет упростить решение задачи синтеза оптимального управления, поскольку функция будущих потерь теперь зависит от вектора , размерность которого фиксирована для всех моментов времени, в отличие от вектора , размерность которого увеличивается с ростом шага .

С учетом введенного понятия достаточных координат исходная задача синтеза оптимального управления по неполной информации разделяется на две:

1) определение достаточных координат;

2) определение оптимального управления как функции достаточных координат.

Соответственно оптимальный регулятор, реализующий решение задачи синтеза, в этом случае состоит из двух блоков:

- блок обработки измерительной информации;

- блок оптимального управления.

Разработку этих блоков в общем случае необходимо проводить совместно, однако в некоторых случаях, например для линейных систем с аддитивными возмущениями и квадратичным критерием оптимальности справедлива теорема разделения, согласно которой задача определения достаточных координат может быть решена независимо от задачи синтеза собственно оптимального управления.

8.2 Оптимальное управление линейной дискретной системой при наличии аддитивных возмущений.

Рассмотрим задачу синтеза оптимального управления системой, описываемой линейным дискретным стохастическим уравнением с аддитивными возмущениями:

(19.7)

Будем считать, что на каждом шаге функционирования системы измерению доступен не сам вектор состояния , а вектор , связанный с вектором линейным уравнением измерений :

(19.8)

В качестве критерия оптимальности примем квадратичный критерий

(19.9)

где - заданные матрицы.

Предположим также, что - независимые гауссовские случайные векторы с характеристиками:

(19.10)

(19.11)

Прежде всего необходимо определить достаточные координаты в данной задаче. Для этого воспользуемся формулой Байеса и найдем апостериорную плотность вероятностей:

. (19.12)

В последнем выражении - измерение вектора в момент времени , а - все предшествующие измерения, накопленные к моменту времени

Введем следующие обозначения:

- апостериорное математическое ожидание вектора по измерениям ;

- корреляционная матрица вектора по измерениям .

- математическое ожидание вектора по измерениям ;

- корреляционная матрица вектора по измерениям .

По смыслу вектор есть ни что иное, как прогнозируемое на один шаг вперед значение вектора , - корреляционная матрица, характеризующая точность прогноза. Учитывая уравнение динамической системы (19.7) можно записать:

(19.13)

Раскрывая операцию математического ожидания в последнем выражении с учетом соотношения для , получим

(19.14)

По определению

(19.15)

(19.16)

Условную плотность , входящую в формулу Байеса (19.12), учитывая , что эта плотность – гауссовкая, можно записать в явном виде:

(19.17)

Кроме того, справедливы соотношения

(19.18)

(19.19)

С учетом этих соотношений условная плотность

(19.20)

Осталось найти плотность

Из модели измерителя (19.8), с учетом оценок для математического ожидания (19.13) и корреляционной матрицы (19.14) можно получить:

(19.21)

(19.22)

Поэтому,

(19.23)

Подставим полученные выражения для условных плотностей в формулу Байеса, в результате получим:

, (19.24)

где

(19.25)

Введем обозначения:

(19.26)

(19.27)

Кроме того, имеет место матричное тождество:

Тогда (19.25) можно записать в виде квадратичной формы:

(19.28)

С учетом этого условная плотность (19.24) примет вид:

(19.29)

Из последнего выражения следует, что вектор и матрица являются соответственно апостериорным математическим ожиданием и апостериорной корреляционной матрицей вектора при заданных измерениях . Соотношения (19.26),(19.27) известны как уравнения дискретного фильтра Калмана, в котором вектор дает оптимальную в смысле максимума апостериорной вероятности оценку вектора состояния динамической системы по всем прошлым и настоящим измерениям, а матрица характеризует точность этой оценки.

Из (19.27) и (19.14) следует, что корреляционная матрица не зависит от конкретных измерений и управлений. Она полностью определяется свойствами динамической системы и измерительного тракта (через матрицы ), а также статистическими характеристиками возмущений и погрешностей измерений. Это значит, что корреляционная матрица может быть рассчитана заранее. Это, в свою очередь, означает, что апостериорная плотность в любой момент времени полностью определяется вектором и может быть представлена в виде . Как следует из (19.13), (19.27), используя вектор можно описать и будущее состояние системы. Отсюда следует, что вектор является вектором достаточных координат в данной задаче.

Теперь можно перейти к синтезу оптимального управления как функции достаточных координат. Для этого преобразуем выражение (19.27) для вектора , представив (19.26) в следующем виде:

(19.30)

Подставим это выражение в (19.27), учитывая при этом выражение (19.13) для вектора :

(19.31)

где

(19.32)

С учетом (19.7), (19.8) последнее выражение может быть приведено к виду:

(19.33)

Последнее выражение позволяет конкретизировать статистические свойства вектора , в частности:

(19.34)

(19.35)

Итак, можно записать выражение, описывающее эволюцию достаточных координат:

, (19.36)

причем

(19.37)

. (19.38)

Воспользуемся рекуррентным соотношением метода динамического программирования:

(19.39)

Это выражение с точностью до обозначений повторяет рекуррентное соотношение для задачи синтеза оптимального управления по полной информации. Поэтому, используя ранее полученные выражения, запишем следующие соотношения для функции будущих потерь:

(19.40)

где

(19.41)

(19.42)

(19.43)

(19.44)

Оптимальное управление имеет структуру

(19.45)

Краевые условия для приведенных выше рекуррентных соотношений имеют вид

Таким образом, в линейных системах с квадратичным критерием оптимальности при аддитивных гауссовских возмущениях оптимальный стохастический регулятор представляет собой последовательное объединение:

  1. фильтра Калмана для получения вектора достаточных координат;

  2. устройства оптимального детерминированного управления.

Данный результат, известный в литературе под названием теоремы разделения , находит широкое применение для получения приближенного решения нелинейных задач, когда задачу синтеза оптимального управления при неполно1 информации разбивают на две задачи, решаемые независимо: задачу получения оптимальных оценок вектора фазовых координат и задачу определения оптимального управления по полным данным. Возможность подобного подхода обусловлена тем, что блок оптимальной оценки демонстрирует хорошую сходимость оценки к истинному вектору фазовых координат.

ТЕМА 10.doc

Тема 10. Минимаксные (игровые) задачи синтеза оптимального управления.

Все рассмотренные ранее задачи оптимального управления предполагали, что:

  1. возмущения вообще отсутствуют (детерминированные задачи оптимального управления);

  2. известны все статистические характеристики возмущений, действующие на динамическую систему в процессе управления (стохастические задачи оптимального управления).

Однако, достаточно часто в практических задачах, информация которой мы располагаем в процессе оптимизации управления оказывается неполной. Подобная ситуация возникает, например, тогда, когда статистические характеристики возмущений известны лишь с точностью до параметров. То есть известно, что возмущения являются гауссовскими, но величины математических ожиданий и дисперсии точно не известны, представления об этих характеристиках ограничены лишь допустимыми диапазонами их значений. В более тяжелых ситуациях статистические характеристики возмущений вообще неизвестны. Единственная информация о возмущениях ограничена тем, что их абсолютные значения не превосходят некоторых значений. Во всех этих случаях мы сталкиваемся с необходимостью решения задачи управления в условиях неопределенности.

Наиболее распространенной основой для решения задач управления в подобной ситуации является так называемый минимаксный (гарантирующий) подход. В рамках такого подхода оптимальным полагается управление которое доставляет минимум наибольшему (по всем возможным возмущениям) значению критерия. Значение критерия, соответствующее этому управлению называют гарантированным, а саму стратегию управления – гарантирующей.

Характеристики

Тип файла
Документ
Размер
2,27 Mb
Тип материала
Высшее учебное заведение

Список файлов учебной работы

Свежие статьи
Популярно сейчас
Зачем заказывать выполнение своего задания, если оно уже было выполнено много много раз? Его можно просто купить или даже скачать бесплатно на СтудИзбе. Найдите нужный учебный материал у нас!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6480
Авторов
на СтудИзбе
304
Средний доход
с одного платного файла
Обучение Подробнее