rpd000003080 (1012242), страница 4
Текст из файла (страница 4)
где - операция осреднения по ошибке
, поскольку по определению функции
состояние
любое.
Раскрывая последнее выражение, имеем
где
Действуя аналогичным образом для шага , получаем
Покажем, что для любого произвольного шага справедливо выражение
или, раскрывая операцию математического ожидания, подобно тому, как мы делали это раньше, имеем
Для доказательства воспользуемся методом индукции. Предположим, чо это выражение выполняется на шаге , то есть
Ранее мы убедились, что данное выражение справедливо для , причем
Подставим выражение для функции в
Подставляя выражение и раскрывая выражение в правой части имеем:
Положим теперь
В результате получаем
Следовательно, справедливость подобного представления доказана.
Применяя соотношения
с краевыми условиями
где
для каждого шага управления находим
Поскольку по условию задачи начальное состояние - случайно, то осредняя
о
, получаем искомую зависимость дисперсии конечного промаха от
.
Варьируя параметр можно построить зависимость критерия
от
, используя которой находится интересующее нас значение весового коэффициента
ПЗ4.doc
Практическое занятие 5. Пример синтеза оптимального управления процессе коррекции траектории летательного аппарата.
Постановка задачи. Рассматривается задача оптимальной коррекции траектории летательного аппарата. В качестве математической модели процесса коррекции используется система линейных дискретных уравнений вида
где вектор характеризует отклонение вектора состояния ЛА от расчетного перед проведением
-ой коррекции;
- корректирующее воздействие в момент времени
; Матрицы
устанавливают связь векторов
,
с отклонением вектора состояния ЛА от требуемого значения перед проведением следующей коррекции. Предполагается, что на управления
ограничения не накладываются
В качестве критерия оптимальности используется квадратичный критерий
- заданные матрицы. Первое слагаемое в выражении для критерия характеризует энергетические затраты на проведение коррекции, второе – конечную точность.
Задача состоит в выборе такого алгоритма управления , при котором достигается минимум вышеприведенного критерия оптимальности.
Схема решения задачи. Для решения задачи воспользуемся достаточными условиями оптимальности, которые применительно к данной задаче приводят к следующему рекуррентному выражению для функции будущих потерь
Граничным условием для данного рекуррентного выражения является
Рассмотрим последний момент коррекции . Запишем выражение для функции будущих потерь для последнего момента коррекции:
Минимизируя последнее выражение по для различных
, найдем искомый закон управления
в момент коррекции
.
Это оптимальное управление должно удовлетворять необходимому условию:
Отсюда:
где
Поскольку матрица - положительно определенная, то найденное управление доставляет минимум функции будущих потерь, а значит, это управление является искомым.
Подставим найденное управление в выражение для функции будущих потерь и представим конечный результат в виде:
где
Учитывая выражения для ,
, последнее выражение можно переписать в идее:
Итак мы видим, что функция будущих потерь по своей структуре повторяет функцию будущих потерь
. Повторив все выполненные ранее действия для функции будущих потерь
можно убедиться в том, что и для шага
структура функции будущих потерь остается такой же. Это позволяет предположить, что для любого момента коррекции
функцию будущих потерь можно представить в виде:
Убедиться в этом можно, применяя метод индукции. Действительно предположим, что подобное представление функции будущих потерь справедливо для момента коррекции . Тогда, функция
должна удовлетворять условию
Отсюда находим искомое управление:
где
Матрица в этом выражении определяется рекуррентно на основе выражения
с граничным условием
Итак алгоритм оптимальной коррекции траектории движения ракеты является линейным. Матрица называется матицей коэффициентов обратной связи.
Вопросы для самостоятельной проработки:
Разработать алгоритм однопараметрической коррекции траектории движения ракеты, принимая в качестве модели и промаха скалярное уравнение:
Рассмотреть следующие варианты критериев оптимальности:
ПЗ6.doc
Практическое занятие 1 Пример синтеза оптимального по квадратичному критерию управления объектом, состоящим из апериодического и интегрирующего звеньев.
Постановка задачи. Рассматривается задача формирования оптимального закона управления непрерывной линейной системой вида
Критерий оптимальности имеет вид:
Введем следующие матричные обозначения
Тогда с учетом введенных обозначений модель динамической системы запишется в виде
Критерий оптимальности::
То есть в математической записи данная задача повторяет постановку задачи, рассмотренную в общем виде на прошлом занятии.
Схема решения. Напомним, схему синтеза управления линейной системой с квадратичным критерием качества при наличии ограничений на управление. Ранее мы убедились, что оптимальное управление можно искать из условия
Откуда непосредственно следует структура управления при наличии ограничений
Напомним , что сложность решения приведенного выше уравнения Беллмана в данном случае состоит в том, что для всего пространства фазовых переменных не существует единственного выражения для функции будущих потерь
. Действительно, с учетом полученной структуры управления, выражения для функции будущих потерь имеют вид:
Как и ранее обозначим через такую область фазового пространства
, при движении из любой точки которой управление
не выходит за границу допустимого, то есть в области
всюду выполняется условие
. В этом случае функция будущих потерь
может быть представлена в виде квадратичной формы
где матрица находится как результат решения матричного алгебраического уравнения:
В нашем случае в скалярной записи это уравнение принимает вид:
Раскрывая это выражение и решая его относительно элементов матицы , получаем
Следовательно, выражение для функции будущих потерь можно записать как
На прошлом занятии мы убедились, что управление в данной задаче имеет линейную структуру
где
То есть управление
Область в общем случае образована частью полосы, заключенной между двумя прямыми, которые описываются уравнениями:
Эта полоса совпадает с областью только в том случае, когда все траектории системы, начинающиеся в этой полосе, не выходят из нее. Для дальнейшего исследования границ области
запишем уравнения системы, подставив выражение для управления:
Далее запишем уравнение фазовых траекторий системы в плоскости :
Покажем, что фазовые траектории не имеют точек касания с прямыми . Это означает, что условие
не выполняется
В этом легко убедиться, действительно, на прямой
Равенство имеет место лишь на прямой
. Следовательно, вся полоса между прямым
является областью
. Определив область
и функцию
, попытаемся расширить решение для
на все пространство, обеспечив склеивание вдоль границ области.
Рассмотрим сначала область , для которой
. Ранее мы записали условие для функции будущих потерь
откуда имеем следующее выражение для функции будущих потерь , соответствующей области
:
или переходя к скалярной записи
Граничным условием, обеспечивающим склеивание значений функции будущих потерь на границе , является следующее:
Это, в свою очередь, приводит к выражению
Можно убедиться, что таким решением является следующее
Аналогично для функции (область
) имеем уравнение
при условии
В этом случае решение имеет вид:
Таким образом, окончательное решение задачи может быть записано в виде
ПЗ5.doc
Практическое занятие 2. Пример синтеза оптимального по квадратичному критерию управления линейной непрерывной системой.
Постановка задачи. Рассмотрим задачу формирования оптимального закона управления непрерывной линейной системой вида