rpd000003080 (161400 (24.05.05).С1 Прицельно-навигационные системы ЛА), страница 7
Описание файла
Файл "rpd000003080" внутри архива находится в следующих папках: 161400 (24.05.05).С1 Прицельно-навигационные системы ЛА, 161400.С1. Документ из архива "161400 (24.05.05).С1 Прицельно-навигационные системы ЛА", который расположен в категории "". Всё это находится в предмете "вспомогательные материалы для первокурсников" из 1 семестр, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. Архив можно найти в разделе "остальное", в предмете "вспомогательные материалы для первокурсников" в общих файлах.
Онлайн просмотр документа "rpd000003080"
Текст 7 страницы из документа "rpd000003080"
В рамках минимаксной постановки мы рассматриваем задачу управления как игровую задачу, в которой присутствуют два игрока, преследующих разные цели. Первый игрок, отражающий интересы стороны, реализующей управления, стремится минимизировать критерий, а второй игрок, напротив, свои действия организует таким образом, чтобы максимизировать значение критерия.
Рассмотрим математическую постановку задачи. Пусть объектом управления является дискретная система, описываемая разностным уравнением вида:
Рассмотрим задачу синтеза оптимального управления системой:
где - вектор состояния системы в -ый момент времени. - вектор управления, отражающий интересы первого игрока, - вектор управления отражающий интересы второго игрока. В качестве критерия оптимальности будем рассматривать функцию конечного состояния
Будем полагать, что целью первого игрока является минимизация критерия, то есть последовательность управлений выбирается таким образом, чтобы обеспечить минимум критерия, напротив, последовательность управлений направлена на то, чтобы максимизировать критерий. При том будем полагать, что выбор управления каждым из игроков производится на каждом шаге, причем каждая сторона располагает полной информацией как о состоянии системы, так и о действиях противоположной стороны в момент времени, предшествующий моменту выбора управления.
Под гарантирующей стратегией управления будем понимать такую, для которой имеет место следующее значение критерия:
Введем в рассмотрение функцию будущих потерь вида:
которая, как и прежде, определяет наилучшее (в минимаксном смысле) значение критерия, которое может быть достигнуто при движении системы их состояния .
Очевидно, что определенная таким образом функция будущих потерь удовлетворяет следующему рекуррентному соотношению:
с граничным условием
Поскольку последовательность управлений найденная с помощью приведенной выше рекуррентной процедуры обеспечивает наилучшее значение критерия, совокупность условий при может рассматриваться как достаточные условия оптимальности при определении гарантирующей стратегии управления.
При использовании критерия более общего вида
рекуррентное соотношение для функции будущих потерь принимает вид:
ТЕМА 9.doc
Тема 9. Оптимальное управление линейной системой при наличии аддитивных возмущений. Непрерывный случай.
Рассмотренный ранее метод синтеза оптимального управления с использованием достаточных координат может быть обобщен и на случай управления непрерывными системами. В качестве примера рассмотрим задачу синтеза оптимального управления динамической системой при использовании интегро - терминального критерия качества.
Будем полагать, что вектор непосредственно не может быть измерен. Измерению доступен некоторый вектор , связанный с вектором линейным уравнением измерений :
где - вектор ошибок измерений.
В качестве критерия оптимальности примем математической ожидание взвешенной суммы энергетических затрат и характеристику конечной точности:
Будем считать, что - белые гауссовские шумы с характеристиками:
Наиболее просто решение сформулированной задачи может быть достигнуто путем предварительной дискретизации исходной непрерывной задачи и последующего использования результатов решения задачи синтеза оптимального управления для полученной дискретной системы.
Запишем дискретный аналог исходной задачи. Модель динамической системы в дискретном представлении описывается линейным дискретным стохастическим уравнением с аддитивными возмущениями:
Уравнение измерений в дискретном представлении имеет вид:
Дискретным аналогом критерия оптимальности является следующий
Здесь:
Полагаем, что - независимые гауссовские случайные векторы с характеристиками:
Замечание к выражению для корреляционных матриц векторов . Известно, что статистически эквивалентное представление белого шума с матрицей интенсивности в виде дискретной последовательности векторов достигается в том случае, когда для любого дискретного момента времени обеспечена следующая связь между корреляционной матрицей случайного вектора и матрицей интенсивности белого шума :
Однако, в нашем случае, учитывая необходимость обеспечения эквивалентности дифференциального и разностного уравнений , случайные векторы связаны со значениями соотношением . Поэтому, для обеспечения статистической эквивалентности непрерывного и дискретного белых шумов, связь между корреляционными матрицами случайных векторы и матрицами интенсивностей устанавливается следующим образом
Статистически эквивалентная дискретизация случайного процесса достигается при выполнении условий:
Воспользуемся ранее полученным выражением, описывающем эволюцию достаточных координат:
или
Учитывая ранее полученное выражение для корреляционной матрицы
с учетом проведенной дискретизации, имеем
Перепишем последнее выражение в более компактном виде:
где
Кроме того, учтем ранее установленную связь
Учитывая доказанное матричное тождество:
вышеприведенное выражение можно представить в виде
Подставляя в это равенство выражение для получим:
Откуда
Полученные дифференциальные уравнения для вектора и корреляционной матрицы есть ни что иное, как уравнения непрерывного линейного фильтра Калмана. Как и в дискретном случае апостериорная корреляционная матрица зависит только от модели динамической системы и модели измерений. Это обстоятельство позволяет заранее рассчитать элементы этой матрицы. То есть вектор можно рассматривать как вектор достаточных координат.
Для синтеза оптимального управления выполним дискретизацию функции будущих потерь:
где
Из приведенных выше выражений, выполнив все необходимые подстановки и преобразования, в пределе при получаем:
Граничными условиями для приведенных дифференциальных уравнений являются следующие:
Видим, что закон оптимального управления является линейным и по структуре совпадает с оптимальным детерминированным управлением. Иными словами, теорема разделения для линейных систем с аддитивными возмущениями квадратичным критерием качества справедлива как в дискретном, так и непрерывном случаях.
Синтезированная оптимальная система включает в себя два последовательных блока:
- блок получения достаточных координат (линейный непрерывный фильтр Калмана);
- блок оптимального управления с использованием достаточных коопрдинат.
ТЕМА 5.doc
Тема 5. Стохастические задачи синтеза оптимального управления по полной информации. Достаточные условия оптимальности при дискретном управлении.
Будем полагать, что динамическая система описывается разностным нелинейным уравнением вида:
где как и ранее - вектор состояния динамической системы на текущем шаге ее функционирования размера , - вектор управления размера ; - вектор случайных возмущений размера ; - вектор-функция, описывающая изменение состояния динамической системы в процессе функционирования. На каждом шаге функционирования динамической системы на управления накладываются ограничения . Будем считать, что случайные возмущения являются независимыми для различных моментов времени.
Поставим задачу определения для любого момента времени закона управления , который обеспечивает перевод системы (16.1) из начального состояния в конечное с минимальным значением критерия
Предположение о том, что начальное состояние динамической системы известно, не нарушает общности изложения, поскольку возможные случайные разбросы начальных условий могут быть учтены соответствующими компонентами вектора . В рамках принятых допущений процесс изменения состояния динамической системы с достаточной степенью достоверности может интерпретироваться как марковский случайный процесс.