rpd000003181 (1012244), страница 9
Текст из файла (страница 9)
Следовательно, необходимые условия оптимальности управления с учетом введенного гамильтониана приобретают следующий вид:
С учетом введенного гамильтониана соотношения, определяющие вектор :
и уравнения, описывающие функционирование системы
могут быть представлены в виде канонической системы уравнений
Вектор , удовлетворяющий приведенной выше канонической системе уравнений называется сопряженным вектором.
Таким образом, необходимое условие оптимальности в задаче управления динамической системой
с целью минимизации критерия
заключается в выполнении на каждом шаге функционирования системы неравенств
с учетом связей
В некоторых важных для практических приложений случаях, необходимые условия оптимальности могут быть приведены к более конструктивному виду. В частности, если выполнены условия:
1) допустимые множества управлений на каждом шаге функционирования динамической системы являются выпуклыми.
Множество выпукло, если для любых двух точек, принадлежащих этому множеству, ему принадлежит и соединяющий их отрезок.
2) гамильтониан является выпуклой функцией управления
Тогда условие
эквивалентно условию минимума гамильтониана. То есть, необходимое условие оптимальности при выполнении вышеприведенных условий приобретает вид:
Приведенное условие известно как принцип минимума.
Замечание: если в рассматриваемой задаче критерий оптимальности определить как
то, повторив все приведенные выше выкладки, вместо условий минимума гамильтониана мы придем к традиционной записи условия оптимальности в виде принципа максимума
Итак мы сформулировали необходимое (а при выполнении указанных выше условий и достаточное) условие оптимальности управления дискретной системой. Это условие, к сожалению, не предлагает явного алгоритма получения оптимального управления. Более того, непосредственное использование этих условий для решения задач программирования оптимального управления может оказаться весьма затруднительным. Однако, существуют задачи, некоторые примеры которых будут рассмотрены ниже, для которых использование принципа минимума, позволяет достаточно просто получить решение. Практическая ценность принципа максимума в том, что он позволяет свести решение динамической задачи управления к существенно более простой статической (одношаговой) задаче математического программирования. Действительно, используя понятие гамильтониана задачу поиска оптимального управления можно сформулировать следующим образом:
Необходимо получить решение для сопряженной системы:
доставляющее минимум гамильтониана
Рассмотрим один из возможных способов поиска оптимального управления на основе принципа минимума:
-
зададим некоторое начальное приближение для управления
2) определим траекторию динамической системы для этого управления
3) «обратным ходом» определим значения сопряженного вектора вдоль траектории:
4) рассчитаем значения градиентов гамильтониана на каждом шаге:
5) получим новое приближение для управления, используя традиционный метод градиентного спуска
То есть приходим к процедуре рекуррентного уточнения программы управления. В одной из последующих лекций мы подробнее остановимся на анализе численных процедур получения оптимального управления на основе рассмотренного принципа максимума. Сейчас же попытаемся обобщить полученные результаты на критерий общего вида.
Получим выражение для гамильтониана применительно к этому критерию. Как и ранее воспользуемся методом игольчатой вариации управления, применение которого приводит к необходимым условиям оптимальности в виде неравенства
В отличие от ранее рассмотренной задачи управления конечным состоянием в этом случае
Ранее мы получили выражение для производной
Исходя из этого, определим гамильтониан как
нетрудно убедиться, что
а, следовательно, необходимые условия оптимальности сохраняют свой вид
При выполнении ранее упомянутых условий (выпуклость множеств допустимых управлений и гамильтониана) это необходимое условие превращается в условие минимума гамильтониана.
ТЕМА 3.doc
Тема 3. Необходимые условия оптимальности управления для случая непрерывной динамической системы. Принцип максимума Понтрягина
Задача оптимального управления применительно к непрерывной динамической системе формулируется следующим образом. Имеется динамическая система, описываемая системой дифференциальных уравнений вида:
где - вектор состояния динамической системы в текущий момент времени
размера
;
- вектор управления размера
;
- непрерывно-дифференцируемая вектор-функция, описывающая изменение состояния динамической системы в проце6ссе функционирования.
Область существования математической модели (1) задается с помощью условий: , где
- соответственно множества допустимых изменений состояния
и управления
. Условие
называется фазовым ограничением, а условие
- ограничением на управление. Интервал
задает время функционирования системы, причем конечный момент времени
может быть как фиксированным, так и свободным. В дальнейшем будем полагать, что начальное состояние динамической системы задано
.
Необходимо определить программу управления -зависимость , которая переводит систему (1) с учетом фазовых ограничений и ограничений на управление из начального состояния
в конечное
при минимальном значении функционала:
В зависимости от вида функций и
, участвующих в выражении для функционала качества (2) возможны следующие постановки задач оптимального управления:
1) Задача Больца возникает тогда, когда ,
;
2) Задача Майера имеет место, если ,
. Задача Майера известна как задача управления конечным состоянием.
3) Задача Лагранжа предполагает, что ,
.
Можно показать, что задача Больца и задача Лагранжа могут быть сведены к задаче Майера (задаче управления конечным состоянием).
Действительно, рассмотрим задачу Больца для непрерывной динамической системы
с критерием
Введем дополнительную скалярную переменную и расширенный вектор состояния, который определим следующим образом:
, где дополнительная переменная
определяется их условия
Запишем уравнение, описывающее состояние расширенной динамической системы с вектором состояния
где - вектор-функция размера
с компонентами
Критерий оптимальности применительно к расширенной динамической системе примет вид:
Таким образом, исходная задача Больца сведена к задаче Майера для расширенной системы.
Рассмотрим теперь Задачу Лагранжа для динамической системы
с критерием
Как и в предыдущем случае введем дополнительную скалярную переменную и расширенный вектор состояния, который определим следующим образом:
, где дополнительная переменная
как и раньше определяется из условия
Уравнение, описывающее состояние расширенной динамической системы с вектором состояния как и в предыдущем случае
где - вектор-функция размера
с компонентами
. Критерий оптимальности
применительно к расширенной динамической системе примет вид:
Таким образом, исходная задача Лагранжа также сведена к задаче управления конечным состоянием для расширенной системы.
Принцип максимума Понтрягина
Рассмотрим задачу управления для автономной системы без ограничений на фазовый вектор
с критерием оптимальности вида (задача Лагранжа)
Ранее было показано, что исходная задача Лагранжа сводится к задаче управления конечным состоянием для расширенной системы:
где - вектор-функция размера
с компонентами
.
Критерий оптимальности
Необходимо определить управление , доставляющее минимум критерия
.
Достаточно простое решение этой задачи было предложено Львом Семеновичем Понтрягиным и его учениками и известно как принцип максимума Понтрягина. Получим необходимые условия оптимальности управления в виде принципа максимума, полагая, что время управления фиксировано, а управление относится к классу кусочно-непрерывных функций, то есть
может иметь конечное число точек разрыва 1 рода. Пусть
- оптимальное управление для рассматриваемой задачи, а
- соответствующая фазовая траектория системы
Следуя рассуждениям Понтрягина, рассмотрим бесконечно малый промежуток времени и проварьируем управление
, заменив его на этом интервале величиной
, сохранив неизменным (оптимальным) вектор управления везде вне границ интервала
. Такая вариация управления называется игольчатой. Заметим, что не требуется, чтобы вариации
были бесконечно малыми величинами. Существенно только, чтобы они отвечали ограничениям
.
В результате произведенной вариации управления траектория при
будет отличаться от оптимальной
. Вычислим вызванное вариацией управления изменение фазовой траектории. Вариация траектории
в момент времени
с точностью до малых величин высшего порядка равна разности скоростей
, умноженной на промежуток времени
.
Так как
- бесконечно малая величина, значит вариация
- также малая величина . Вариация
является начальным значением для вариации траектории на интервале времени
. В силу этого, траектория
будет отличаться от оптимальной траектории
при
на бесконечно малую величину. Учитывая это, представим траекторию
в виде
. Поскольку управление
при
остается оптимальным ( это следует из определения игольчатой вариации), справедливо:
Разлагая праву часть в ряд Тейлора в окрестности оптимальной траектории имеем: