rpd000003181 (1012244), страница 10
Текст из файла (страница 10)
Поскольку для оптимальной траектории
то
Интегрируя это выражение при начальном условии можно рассчитать вариацию траектории для любого момента времени
, в том числе и для конечного момента времени
. Но вариация
есть ни что иное, как вариация критерия
за счет игольчатой вариации управления. Так как оптимальное управление
должно обеспечивать минимальное значение критерия
, то при замене оптимального управления
любым другим (не оптимальным) управлением
, значение критерия может только увеличиваться.
Следовательно, необходимым условие оптимальности управления является выполнение неравенства
Перепишем это условие в виде:
Вектор называется сопряженным вектором, он имеет размерность, соответствующую размерности вектора
. В блочном виде сопряженный вектор может быть представлен как
Этот вектор будем выбирать таким образом, чтобы выполнялось условие:
Это, безусловно, выполняется, если
где
- сопряженный вектор, соответствующей вектору состояния
исходной динамической системы.
Поставим теперь задачу поиска такого вектора для которого выполняется условие:
Продифференцируем это условие по
Ранее мы получили выражение для производной вариации фазовой траектории
следовательно,
Это условие выполняется для сопряженного вектора , который является решением дифференциального уравнения вида
или
Итак, решив это уравнение (совместно с уравнением, описывающим динамическую систему) может быть определен вектор , для которого
Более того, как сформулированное выше необходимое условие оптимальности управления требует, чтобы в конечный момент времени выполнялось условие
Рассмотрим момент , для которого, как следует из вышеприведенных условий, также должно выполняться
Ранее мы получили выражение для вариации траектории на интервале вариации управления
Или, что то же самое,
Введем теперь функцию, называемую гамильтонианом
Так как момент , соответствующей игольчатой вариации управления может быть любым в интервале
, следовательно, необходимое условие оптимальности управления можно записать кк условие максимума гамильтониана
Из структуры гамильтониана очевидно следуют соотношения:
Эти равенство позволяют выразить через гамильтониан уравнения для фазового и сопряженного векторов:
Эта система дифференциальных уравнений, называемая канонической, интегрируется при следующих граничных условиях:
Таким образом, необходимое условие оптимальности (принцип Максимума Понтрягина) для задачи программирования оптимального управления заключается в существовании такого сопряженного вектора , который совместно с оптимальной фазовой траекторией
является решением канонической системы дифференциальных уравнений с указанными выше граничными условиями, а гамильтониан в каждый момент времени достигал своего максимального (по управлению) значения.
ТЕМА 11.doc
Тема 11. Необходимые условия оптимальности для непрерывных систем. Стохастический принцип максимума.
Ранее были получены условия оптимального управления для детерминированных систем в виде принципа максимума Понтрягина. Напомним основные соотношения детерминированного принципа максимума. Модель динамической системы имеет вид:
В общем случае используется интегро-терминальный критерий оптимальности вида
Применительно к задаче программирования оптимального управления для динамической системы (15.1) с критерием оптимальности (15.2) реализация принципа максимума опирается на следующие соотношения:
Гамильтониан
Условие оптимальности управления:
В вычислительном плане реализация приведенных необходимых условий оптимальности приводит к необходимости решения краевой задачи для канонической системы дифференциальных уравнений.
Приведенные выше необходимые условия оптимальности управления распространяются на случай, когда в модели динамической системы присутствуют случайные возмущения, то есть модель имеет вид
где - соответственно векторы состояния и управления, начальное состояние динамической системы задано,
- вектор функция, предполагаемая непрерывно-дифференцируемой по своим аргументам,
- случайный процесс с известными статистическими характеристиками.
В качестве критерия оптимальности в этом случае, как и в случае дискретной системы, выступает
Для получения необходимых условий оптимальности для рассматриваемой системы необходимо осуществить дискретизацию исходной непрерывной системы, применить необходимые условия оптимальности для полученной дискретной задачи и осуществить обратный предельный переход к непрерывному случаю. В результате приходим к следующим соотношениям, выражающим стохастический принцип максимума
Гамильтониан
Условие оптимальности управления:
Для задачи Майера (задачи управления конечным состоянием)
выражения (15.9) - (15.12), реализующие стохастический принцип максимума сохраняют свою силу. Различия заключаются в записи гамильтониана, который записывается в виде
Как следует из приведенных выше выражений особенностью стохастического принципа максимума является зависимость гамильтониана от случайных факторов, что чрезвычайно осложняет решение задачи по сравнению с детерминированным случаем. Если в детерминированной задаче реализация принципа максимума приводила к необходимости решения краевой задачи, о в данном случае не только решать краевую задачу для канонической системы дифференциальных уравнений, но одновременно выполнять статистическое усреднение значений гамильтониана по множеству реализаций случайного вектора в процессе максимизации гамильтониана.
ТЕМА 10.doc
Тема 10. Задачи оптимального управления при действии случайных возмущений. Необходимые условия оптимальности для дискретных систем
Все рассмотренные ранее задачи оптимального управления динамическими системами базировались на предположении о том, что их математическое описание может быть проведено с помощью детерминированных (непрерывных или дискретных) математических моделей. В реальных условиях на летательный аппарат действуют случайные возмущения, влияние которых необходимо учитывать.
Далее будут рассмотрены некоторые проблемы программирования и синтеза оптимального управления при действии случайных возмущений с известными статистическими характеристиками. Прежде всего сформулируем в подобной ситуации необходимые условия оптимальности для дискретных динамических систем.
Будем полагать, что динамическая система описывается разностным нелинейным уравнением вида:
где как и ранее - вектор состояния динамической системы на текущем шаге ее функционирования размера
,
- вектор управления размера
;
- вектор случайных возмущений;
- вектор-функция, описывающая изменение состояния динамической системы в процессе функционирования. На каждом шаге функционирования динамической системы на управления накладываются ограничения
.
Будем считать, что статистические характеристики случайных векторов полностью известны. Также положим, что начальное состояние динамической системы
известно, поскольку возможные случайные разбросы начальных условий могут быть учтены соответствующими компонентами вектора
.
Задача программирования оптимального управления, как и в случае детерминированной системы, заключается в определении последовательности , которая обеспечивает перевод системы (14.1) из начального состояния
в конечное
с минимальным значением некоторого критерия.
В процессе исследования задач программирования оптимального управления для детерминированных систем было показано, что задачи Больца и Лагранжа путем соответствующей замены переменных всегда могут быть сведены к задаче Майера управления конечным состоянием. То есть в качестве универсального критерия в детерминированных задачах оптимального управления можно использовать некоторую функцию конечного состояния . Однако, в условиях присутствия случайных факторов конечное состояние динамической системы является случайной величиной, а значит, и функция
также случайная величина. В этих условиях в качестве критерия оптимальности управления следует рассматривать некоторую статистическую характеристику этой случайной величины, например, ее математическое ожидание. Исходя из этого в качестве критерия оптимальности будем рассматривать критерий вида: