rpd000003181 (1012244), страница 13
Текст из файла (страница 13)
Необходимо определить управление , доставляющее минимум критерия
.
Достаточно простое решение этой задачи было предложено Львом Семеновичем Понтрягиным и его учениками и известно как принцип максимума Понтрягина. Получим необходимые условия оптимальности управления в виде принципа максимума, полагая, что время управления фиксировано, а управление относится к классу кусочно-непрерывных функций, то есть
может иметь конечное число точек разрыва 1 рода. Пусть
- оптимальное управление для рассматриваемой задачи, а
- соответствующая фазовая траектория системы
Следуя рассуждениям Понтрягина, рассмотрим бесконечно малый промежуток времени и проварьируем управление
, заменив его на этом интервале величиной
, сохранив неизменным (оптимальным) вектор управления везде вне границ интервала
. Такая вариация управления называется игольчатой. Заметим, что не требуется, чтобы вариации
были бесконечно малыми величинами. Существенно только, чтобы они отвечали ограничениям
.
В результате произведенной вариации управления траектория при
будет отличаться от оптимальной
. Вычислим вызванное вариацией управления изменение фазовой траектории. Вариация траектории
в момент времени
с точностью до малых величин высшего порядка равна разности скоростей
, умноженной на промежуток времени
.
Так как
- бесконечно малая величина, значит вариация
- также малая величина . Вариация
является начальным значением для вариации траектории на интервале времени
. В силу этого, траектория
будет отличаться от оптимальной траектории
при
на бесконечно малую величину. Учитывая это, представим траекторию
в виде
. Поскольку управление
при
остается оптимальным ( это следует из определения игольчатой вариации), справедливо:
Разлагая праву часть в ряд Тейлора в окрестности оптимальной траектории имеем:
Поскольку для оптимальной траектории
то
Интегрируя это выражение при начальном условии можно рассчитать вариацию траектории для любого момента времени
, в том числе и для конечного момента времени
. Но вариация
есть ни что иное, как вариация критерия
за счет игольчатой вариации управления. Так как оптимальное управление
должно обеспечивать минимальное значение критерия
, то при замене оптимального управления
любым другим (не оптимальным) управлением
, значение критерия может только увеличиваться.
Следовательно, необходимым условие оптимальности управления является выполнение неравенства
Перепишем это условие в виде:
Вектор называется сопряженным вектором, он имеет размерность, соответствующую размерности вектора
. В блочном виде сопряженный вектор может быть представлен как
Этот вектор будем выбирать таким образом, чтобы выполнялось условие:
Это, безусловно, выполняется, если
где
- сопряженный вектор, соответствующей вектору состояния
исходной динамической системы.
Поставим теперь задачу поиска такого вектора для которого выполняется условие:
Продифференцируем это условие по
Ранее мы получили выражение для производной вариации фазовой траектории
следовательно,
Это условие выполняется для сопряженного вектора , который является решением дифференциального уравнения вида
или
Итак, решив это уравнение (совместно с уравнением, описывающим динамическую систему) может быть определен вектор , для которого
Более того, как сформулированное выше необходимое условие оптимальности управления требует, чтобы в конечный момент времени выполнялось условие
Рассмотрим момент , для которого, как следует из вышеприведенных условий, также должно выполняться
Ранее мы получили выражение для вариации траектории на интервале вариации управления
Или, что то же самое,
Введем теперь функцию, называемую гамильтонианом
Так как момент , соответствующей игольчатой вариации управления может быть любым в интервале
, следовательно, необходимое условие оптимальности управления можно записать кк условие максимума гамильтониана
Из структуры гамильтониана очевидно следуют соотношения:
Эти равенство позволяют выразить через гамильтониан уравнения для фазового и сопряженного векторов:
Эта система дифференциальных уравнений, называемая канонической, интегрируется при следующих граничных условиях:
Таким образом, необходимое условие оптимальности (принцип Максимума Понтрягина) для задачи программирования оптимального управления заключается в существовании такого сопряженного вектора , который совместно с оптимальной фазовой траекторией
является решением канонической системы дифференциальных уравнений с указанными выше граничными условиями, а гамильтониан в каждый момент времени достигал своего максимального (по управлению) значения.
ТЕМА 4.doc
Тема 4. Свойства гамильтониана. Обобщение принципа максимума на задачу Лагранжа. Формулировка принципа максимума для задачи Больца.
4.1. Свойства гамильтониана.
Гамильтониан , составляющий основу принципа максимума, обладает рядом полезных свойств.
1. Всюду на оптимальной траектории гамильтониан является непрерывной функцией времени. То есть: - непрерывная функция
.
Для доказательства этого свойства прежде всего необходимо учесть, что зависимости, описывающие фазовый и сопряженный
векторы являются непрерывными функциями времени. Это непосредственно следует из того, что функция
по условию задачи полагается непрерывно-дифференцируемой функцией и
Управление также по условию задачи является кусочно-непрерывной функцией времени, для которой допускается наличие конечного числа точек разрыва 1-го рода. Следовательно, непрерывность гамильтониана очевидна для любого момента времени, не совпадающего с точками разрыва оптимального управления
. Покажем, что непрерывность гамильтониана сохраняется и в точках разрыва управления
. Пусть
- один из моментов времени, где управление
претерпевает разрыв.
Рассмотрим значение гамильтониана справа ( в момент ) и слева (в момент
) от точки разрыва.
Предположим теперь, что . Возможны случаи:
В первом случае:
Управление является оптимальным для момента времени
, но не является оптимальным для
. Поскольку в каждый момент времени на оптимальной траектории гамильтониан достигает своего максимума по управлению, то очевидно должно выполняться условие
что противоречит выдвинутому предположению.
Аналогичным образом устанавливается противоречие второго случая , который приводит к неравенству
также противоречащему условию максимума гамильтониана по управлению на оптимальной траектории.
Таким образом, оба предположения и
противоречивы, что и доказывает справедливость равенства
=
, а значит непрерывность гамильтониана,
2. Всюду на оптимальной траектории гамильтониан постоянен, то есть:
Для доказательства этого свойства рассмотрим некоторый интервал , на котором функция
непрерывна. Для любых моментов времени
в силу принципа максимума
поскольку управление будучи оптимальным для момента
не является таковым для момента
. Отсюда следует очевидное неравенство
так как
Следовательно,
Откуда, повторяя приведенные выше действия, имеем
Графически, полученные результаты отражает следующий рисунок
Отсюда следует, что . Поскольку ранее было показано, что
- непрерывная функция времени
, то
.
3. Если конечный момент времени не фиксирован, то есть - свободно, тогда:
Действительно, проварьируем управление в последний момент времени , изменив
на бесконечно малую величину
, сохранив при этом значение оптимального управления
В отличие от игольчатой вариации управления в данном случае имеет место временная вариация. Очевидно, что вариация траектории при этом
В процессе доказательства принципа максимума была показана справедливость неравенства
Значит
Так как на выбор не накладывается никаких условий, то есть
может быть как положительной так и отрицательной величиной, следовательно, единственное решение , при котором вышеприведенное условие выполняется независимо от знака
:
Ранее было доказано, что гамильтониан на всей оптимальной траектории постоянен, значит
4.2. Обобщение принципа максимума на задачу Лагранжа.
Итак, мы показали, что исходная задача оптимального управления в форме Лагранжа может быть сведена к задаче Майера (задаче правления конечным состоянием) путем перехода к расширенной динамической системе, изменение вектора состояния которой описывается уравнением
Здесь
Критерий оптимальности
Необходимые условия оптимальности для приведенной выше задачи через каноническую систему уравнений выражаются следующим образом
Эта система дифференциальных уравнений интегрируется при следующих граничных условиях:
Гамильтониан удовлетворяет условию оптимальности управления
Отталкиваясь от полученных ранее необходимых условий оптимальности управления для задачи Майера, сформулируем их для задачи Лагранжа:
Рассмотрим теперь Задачу Лагранжа для динамической системы