rpd000003061 (1012241), страница 9
Текст из файла (страница 9)
Тогда условие
будет выполняться для любого допустимого управления , отличного от оптимального
. Как и в случае детерминированного управления применим прием, известный как игольчатая вариация управления, полагая, что везде кроме шага с номером i , управление оптимальное:
Вариацию критерия можно выразить следующим образом:
То есть в скалярной записи вариация критерия
Поскольку мы рассматриваем игольчатую вариацию управления на единственном шаге с номером i, то
Тогда вариация критерия как результат игольчатой вариации управления
Для придания условиям оптимальности (14.8) более удобной для реализации формы раскроем производные , связав их с моделью динамической системы. Поскольку операции математического ожидания и дифференцирования перестановочны, можно записать:
Как и в детерминированном случае, повторив использованные там рассуждения, вектор можно записать через гамильтониан
где
Вектор - сопряженный вектор, определяемый на основе уравнения
с граничным условием
Подставляя (14.10) в (14.8), необходимые условия оптимальности для рассматриваемого случая можно представить в виде следующей системы неравенств:
Полученный результат обобщает необходимые условия оптимальности, рассмотренные ранее для детерминированных систем, на случай, когда в модели присутствуют случайные факторы. Принципиальная сложность применения необходимых условий оптимальности в данном случае состоит в том, что гамильтониан и сопряженный вектор являются случайными, что предполагает использование операций математического ожидания (статистического усреднения) по всем реализациям случайных факторов. Это требует привлечения методов статистического моделирования.
Как и для детерминированной задачи программирования оптимального управления выделим некоторые частные случаи.
1. Ограничения на управление отсутствуют . В этом случае с учетом (14.14) необходимые условия оптимальности принимают вид строгих равенств
2. Допустимые множества управлений на каждом шаге функционирования динамической системы являются выпуклыми, гамильтониан
является выпуклой функцией управления. Тогда условие
эквивалентно условию минимума гамильтониана. То есть, необходимое условие оптимальности при выполнении вышеприведенных условий приобретает вид:
Полученные необходимые условия оптимальности управления, как и в детерминированном случае, распространяются на критерий общего вида.
однако, выражение для гамильтониана теперь принимает вид
ТЕМА 3.doc
Тема 3. Необходимые условия оптимальности управления для случая непрерывной динамической системы. Принцип максимума Понтрягина
Задача оптимального управления применительно к непрерывной динамической системе формулируется следующим образом. Имеется динамическая система, описываемая системой дифференциальных уравнений вида:
где - вектор состояния динамической системы в текущий момент времени
размера
;
- вектор управления размера
;
- непрерывно-дифференцируемая вектор-функция, описывающая изменение состояния динамической системы в проце6ссе функционирования.
Область существования математической модели (1) задается с помощью условий: , где
- соответственно множества допустимых изменений состояния
и управления
. Условие
называется фазовым ограничением, а условие
- ограничением на управление. Интервал
задает время функционирования системы, причем конечный момент времени
может быть как фиксированным, так и свободным. В дальнейшем будем полагать, что начальное состояние динамической системы задано
.
Необходимо определить программу управления -зависимость , которая переводит систему (1) с учетом фазовых ограничений и ограничений на управление из начального состояния
в конечное
при минимальном значении функционала:
В зависимости от вида функций и
, участвующих в выражении для функционала качества (2) возможны следующие постановки задач оптимального управления:
1) Задача Больца возникает тогда, когда ,
;
2) Задача Майера имеет место, если ,
. Задача Майера известна как задача управления конечным состоянием.
3) Задача Лагранжа предполагает, что ,
.
Можно показать, что задача Больца и задача Лагранжа могут быть сведены к задаче Майера (задаче управления конечным состоянием).
Действительно, рассмотрим задачу Больца для непрерывной динамической системы
с критерием
Введем дополнительную скалярную переменную и расширенный вектор состояния, который определим следующим образом:
, где дополнительная переменная
определяется их условия
Запишем уравнение, описывающее состояние расширенной динамической системы с вектором состояния
где - вектор-функция размера
с компонентами
Критерий оптимальности применительно к расширенной динамической системе примет вид:
Таким образом, исходная задача Больца сведена к задаче Майера для расширенной системы.
Рассмотрим теперь Задачу Лагранжа для динамической системы
с критерием
Как и в предыдущем случае введем дополнительную скалярную переменную и расширенный вектор состояния, который определим следующим образом:
, где дополнительная переменная
как и раньше определяется из условия
Уравнение, описывающее состояние расширенной динамической системы с вектором состояния как и в предыдущем случае
где - вектор-функция размера
с компонентами
. Критерий оптимальности
применительно к расширенной динамической системе примет вид:
Таким образом, исходная задача Лагранжа также сведена к задаче управления конечным состоянием для расширенной системы.
Принцип максимума Понтрягина
Рассмотрим задачу управления для автономной системы без ограничений на фазовый вектор
с критерием оптимальности вида (задача Лагранжа)
Ранее было показано, что исходная задача Лагранжа сводится к задаче управления конечным состоянием для расширенной системы:
где - вектор-функция размера
с компонентами
.
Критерий оптимальности
Необходимо определить управление , доставляющее минимум критерия
.
Достаточно простое решение этой задачи было предложено Львом Семеновичем Понтрягиным и его учениками и известно как принцип максимума Понтрягина. Получим необходимые условия оптимальности управления в виде принципа максимума, полагая, что время управления фиксировано, а управление относится к классу кусочно-непрерывных функций, то есть
может иметь конечное число точек разрыва 1 рода. Пусть
- оптимальное управление для рассматриваемой задачи, а
- соответствующая фазовая траектория системы
Следуя рассуждениям Понтрягина, рассмотрим бесконечно малый промежуток времени и проварьируем управление
, заменив его на этом интервале величиной
, сохранив неизменным (оптимальным) вектор управления везде вне границ интервала
. Такая вариация управления называется игольчатой. Заметим, что не требуется, чтобы вариации
были бесконечно малыми величинами. Существенно только, чтобы они отвечали ограничениям
.
В результате произведенной вариации управления траектория при
будет отличаться от оптимальной
. Вычислим вызванное вариацией управления изменение фазовой траектории. Вариация траектории
в момент времени
с точностью до малых величин высшего порядка равна разности скоростей
, умноженной на промежуток времени
.
Так как
- бесконечно малая величина, значит вариация
- также малая величина . Вариация
является начальным значением для вариации траектории на интервале времени
. В силу этого, траектория
будет отличаться от оптимальной траектории
при
на бесконечно малую величину. Учитывая это, представим траекторию
в виде
. Поскольку управление
при
остается оптимальным ( это следует из определения игольчатой вариации), справедливо:
Разлагая праву часть в ряд Тейлора в окрестности оптимальной траектории имеем:
Поскольку для оптимальной траектории
то
Интегрируя это выражение при начальном условии можно рассчитать вариацию траектории для любого момента времени
, в том числе и для конечного момента времени
. Но вариация
есть ни что иное, как вариация критерия
за счет игольчатой вариации управления. Так как оптимальное управление
должно обеспечивать минимальное значение критерия
, то при замене оптимального управления
любым другим (не оптимальным) управлением
, значение критерия может только увеличиваться.
Следовательно, необходимым условие оптимальности управления является выполнение неравенства
Перепишем это условие в виде:
Вектор называется сопряженным вектором, он имеет размерность, соответствующую размерности вектора
. В блочном виде сопряженный вектор может быть представлен как