rpd000003061 (1012241), страница 10
Текст из файла (страница 10)
Этот вектор будем выбирать таким образом, чтобы выполнялось условие:
Это, безусловно, выполняется, если
где
- сопряженный вектор, соответствующей вектору состояния
исходной динамической системы.
Поставим теперь задачу поиска такого вектора для которого выполняется условие:
Продифференцируем это условие по
Ранее мы получили выражение для производной вариации фазовой траектории
следовательно,
Это условие выполняется для сопряженного вектора , который является решением дифференциального уравнения вида
или
Итак, решив это уравнение (совместно с уравнением, описывающим динамическую систему) может быть определен вектор , для которого
Более того, как сформулированное выше необходимое условие оптимальности управления требует, чтобы в конечный момент времени выполнялось условие
Рассмотрим момент , для которого, как следует из вышеприведенных условий, также должно выполняться
Ранее мы получили выражение для вариации траектории на интервале вариации управления
Или, что то же самое,
Введем теперь функцию, называемую гамильтонианом
Так как момент , соответствующей игольчатой вариации управления может быть любым в интервале
, следовательно, необходимое условие оптимальности управления можно записать кк условие максимума гамильтониана
Из структуры гамильтониана очевидно следуют соотношения:
Эти равенство позволяют выразить через гамильтониан уравнения для фазового и сопряженного векторов:
Эта система дифференциальных уравнений, называемая канонической, интегрируется при следующих граничных условиях:
Таким образом, необходимое условие оптимальности (принцип Максимума Понтрягина) для задачи программирования оптимального управления заключается в существовании такого сопряженного вектора , который совместно с оптимальной фазовой траекторией
является решением канонической системы дифференциальных уравнений с указанными выше граничными условиями, а гамильтониан в каждый момент времени достигал своего максимального (по управлению) значения.
ТЕМА 4.doc
Тема 4. Свойства гамильтониана. Обобщение принципа максимума на задачу Лагранжа. Формулировка принципа максимума для задачи Больца.
4.1. Свойства гамильтониана.
Гамильтониан , составляющий основу принципа максимума, обладает рядом полезных свойств.
1. Всюду на оптимальной траектории гамильтониан является непрерывной функцией времени. То есть: - непрерывная функция
.
Для доказательства этого свойства прежде всего необходимо учесть, что зависимости, описывающие фазовый и сопряженный
векторы являются непрерывными функциями времени. Это непосредственно следует из того, что функция
по условию задачи полагается непрерывно-дифференцируемой функцией и
Управление также по условию задачи является кусочно-непрерывной функцией времени, для которой допускается наличие конечного числа точек разрыва 1-го рода. Следовательно, непрерывность гамильтониана очевидна для любого момента времени, не совпадающего с точками разрыва оптимального управления
. Покажем, что непрерывность гамильтониана сохраняется и в точках разрыва управления
. Пусть
- один из моментов времени, где управление
претерпевает разрыв.
Рассмотрим значение гамильтониана справа ( в момент ) и слева (в момент
) от точки разрыва.
Предположим теперь, что . Возможны случаи:
В первом случае:
Управление является оптимальным для момента времени
, но не является оптимальным для
. Поскольку в каждый момент времени на оптимальной траектории гамильтониан достигает своего максимума по управлению, то очевидно должно выполняться условие
что противоречит выдвинутому предположению.
Аналогичным образом устанавливается противоречие второго случая , который приводит к неравенству
также противоречащему условию максимума гамильтониана по управлению на оптимальной траектории.
Таким образом, оба предположения и
противоречивы, что и доказывает справедливость равенства
=
, а значит непрерывность гамильтониана,
2. Всюду на оптимальной траектории гамильтониан постоянен, то есть:
Для доказательства этого свойства рассмотрим некоторый интервал , на котором функция
непрерывна. Для любых моментов времени
в силу принципа максимума
поскольку управление будучи оптимальным для момента
не является таковым для момента
. Отсюда следует очевидное неравенство
так как
Следовательно,
Откуда, повторяя приведенные выше действия, имеем
Графически, полученные результаты отражает следующий рисунок
Отсюда следует, что . Поскольку ранее было показано, что
- непрерывная функция времени
, то
.
3. Если конечный момент времени не фиксирован, то есть - свободно, тогда:
Действительно, проварьируем управление в последний момент времени , изменив
на бесконечно малую величину
, сохранив при этом значение оптимального управления
В отличие от игольчатой вариации управления в данном случае имеет место временная вариация. Очевидно, что вариация траектории при этом
В процессе доказательства принципа максимума была показана справедливость неравенства
Значит
Так как на выбор не накладывается никаких условий, то есть
может быть как положительной так и отрицательной величиной, следовательно, единственное решение , при котором вышеприведенное условие выполняется независимо от знака
:
Ранее было доказано, что гамильтониан на всей оптимальной траектории постоянен, значит
4.2. Обобщение принципа максимума на задачу Лагранжа.
Итак, мы показали, что исходная задача оптимального управления в форме Лагранжа может быть сведена к задаче Майера (задаче правления конечным состоянием) путем перехода к расширенной динамической системе, изменение вектора состояния которой описывается уравнением
Здесь
Критерий оптимальности
Необходимые условия оптимальности для приведенной выше задачи через каноническую систему уравнений выражаются следующим образом
Эта система дифференциальных уравнений интегрируется при следующих граничных условиях:
Гамильтониан удовлетворяет условию оптимальности управления
Отталкиваясь от полученных ранее необходимых условий оптимальности управления для задачи Майера, сформулируем их для задачи Лагранжа:
Рассмотрим теперь Задачу Лагранжа для динамической системы
с критерием
Придерживаясь ранее введенных обозначений для расширенной системы, запишем выражение для гамильтониана
Видим, что в выражение для гамильтониана переменная явным образом не входит, то есть
Следовательно
Поскольку , значит
, и выражение для гамильтониана примет вид
Иными словами, компоненты ,
не входят в выражение для гамильтониана. С учетом этого необходимые условия оптимальности для задачи Лагранжа примут вид:
Условие оптимальности управления:
Гамильтониан на оптимальной траектории принимает значения
, если конечный момент времени
- фиксирован.
, если конечный момент времени
- свободен.
4.3. Обобщение принципа максимума на задачу Больца.
В этом случае модель динамической системы имеет вид:
Критерий оптимальности
Последнее слагаемое в выражении для критерия учитывает конечное состояние системы, причем само конечное состояние не фиксировано (свободно).
Сведем эту задачу к задаче Лагранжа , записав критерий оптимальности в виде:
Легко убедиться, что эта запись повторяет исходный критерий, так как
Воспользуемся правилом дифференцирования неявной функции
Тогда критерий оптимальности в форме Лагранжа запишется как
Поскольку начальное состояние системы задано , следовательно, эту постоянную компоненту можно не учитывать в критерии оптимальности. Тогда, в окончательном виде имеем
Используя ранее полученное выражение для гамильтониана в задаче Лагранжа, имеем
Каноническая система уравнений принимает вид:
но поскольку конечное состояние не фиксировано (свободно), то есть
, конечное условие для сопряженного вектора
.
Условие оптимальности управления, как и ранее:
где гамильтониан на оптимальной траектории отвечает условиям:
, если конечный момент времени
- фиксирован.
, если конечный момент времени
- свободен.
Преобразуем приведенную выше каноническую систему уравнений. Для этого введем новый сопряженный вектор , связанный с исходным вектором
соотношением
и гамильтониан
Очевидна справедливость соотношения