rpd000003181 (1012244), страница 18
Текст из файла (страница 18)
В результате произведенной вариации управления траектория при
будет отличаться от оптимальной
. Определим вариацию траектории
,
, порожденную игольчатой вариацией управления. Разложим функцию
в ряд Тейлора в окрестности оптимальной траектории
:
Отсюда следует дифференциальное уравнение в приращениях
которое решается с начальными условиями
Последнее выражение следует из следующих соображений.
Поскольку на момент возникновения игольчатой вариации управления
, то
Так как - бесконечно малый интервал,
Поскольку в рассматриваемом случае траектория должна лежать на границе области допустимых состояний , то к уравнению для производной
необходимо добавить условия, связывающие вариации
. Это условие может быть получено из следующего соображения. Будем исходить из того, что оптимальная траектория лежит на границе области допустимых состояний. Выше было показано, что при этом должны выполняться условия
Для того, чтобы траектория , порожденная игольчатой вариацией управления
, в момент времени
оставалась на границе области допустимых состояний должно выполняться условие
Разложив функцию в ряд в окрестности оптимальной траектории, получим
Отсюда следует условие, связывающее вариации :
Умножим последнее равенство слева на матрицу размера
:
Это выражение эквивалентно
Сложим последнее выражение с выражением для , записанным в виде
Имеем:
Потребуем, чтобы матрица обеспечивала для любого момента времени
выполнение условия
Тогда уравнение для примет вид:
Используем прием, который применялся ранее в процессе вывода принципа максимума. Введем сопряженный вектор и потребуем, чтобы для этого вектора в любой момент времени
выполнялось условие
(Замечание: мы рассматриваем задачу с критерием оптимальности , следовательно любая вариация критерия в окрестности оптимального значения
или, что то же самое
)
В частности, для конечного момента времени
Отсюда следует, что
Продифференцируем выражение
получим
Подставляя сюда ранее полученное выражение для , имеем:
для того, чтобы это равенство выполнялось для любой вариации , должно выполняться
Отсюда
или
где - вектор размера
, определяемый как
.
Ранее мы определили сопряженный вектор из условия
которое справедливо для любого момента времени , в том числе и для момента времени
возникновения игольчатой вариации управления. Но, вариация траектории в результате игольчатой вариации управления, как было показано выше, определяется выражением
или
Как и ранее, введем гамильтониан
Тогда вышеприведенное неравенство можно рассматривать как условие гамильтониана по управлению
Поскольку момент , соответствующий вариации управления может быть любым
, то это условие можно распространить на любой момент времени, то есть
Каноническая система уравнений для определения оптимальной траектории и сопряженного вектора
в данном случае примет вид:
В последнем выражении для сопряженного вектора присутствует вектор размера
, который необходимо определить. В постановке задачи указывалось, что количество ограничений (размер вектора
) меньше, чем размер вектора управления
. Исходя из этого представим ранее записанное условие для матрицы
иначе
Этой записи - компоненты вектора управления, такие что
- вектор, размерность которого совпадает с размерностью вектора
, то есть вектор размера
,
Дальнейшие преобразования учитывают следующее обстоятельство. Вариации ,
, составляющие вариацию
, связаны с вариацией
траектории
соотношениями,
, типа
Поэтому компонент
вектора
можно выбирать произвольно, например,
. Тогда вышеприведенное условие, связывающее вариации управления с вариациями траектории можно переписать в виде
Для выполнения этого равенства при любой вариации достаточно задать матрицу
в виде
В соответствии с этим вектор будет равен:
или
Как и раньше, гамильтониан в данной задаче сохраняет свои свойства
Итак, для задачи Майера:
с критерием оптимальности
необходимые условия оптимальности определяются соотношениями:
1) каноническая система дифференциальных уравнений для определения оптимальной траектории:
где - вектор, составленный из любых
компонент вектора
, таких, что матрица
- неособенная (имеет отличный от 0 определитель),
- гамильтониан.
2) условие оптимальности управления
с учетом того, что
Для задачи Лагранжа:
с критерием оптимальности
необходимые условия оптимальности определяются соотношениями:
1) каноническая система дифференциальных уравнений для определения оптимальной траектории:
где - как и ранее, вектор, составленный из любых
компонент вектора
, таких, что матрица
- неособенная (имеет отличный от 0 определитель), гамильтониан
2) условие оптимальности управления
с учетом того, что
8.2. Ограничения в виде неравенств. Условия скачка.
Вернемся к исследованию автономной динамической системы общего вида:
где по прежнему - фазовый вектор размера
,
, где
– множество допустимых состояний, которое задано в виде
,
- вектор-функция размера
;
- вектор управления размера
, на который наложены ограничения
;
- вектор-функция размера
, время функционирования системы ограничено
.
Критерий оптимальности
Рассмотрим наиболее простой случай, когда оптимальная траектория выходит на границу области допустимых состояний, остается на ней течение интервала времени , а затем возвращается внутрь области допустимых состояний
Будем полагать, что управления представляют собой кусочно-непрерывные функции. Имеет место следующее свойство оптимальных управлений: каждый участок оптимальной траектории является оптимальным в смысле того же самого критерия оптимальности, рассматриваемого на данном участке. Действительно, критерий оптимальности можно представить в виде интеграла
Представим этот интеграл в виде трех слагаемых
Пусть - оптимальное управление на всем интервале
,
,
,
- оптимальные управления соответственно на интервалах
то есть
Покажем, что выполняется следующий принцип оптимальности:
а значит,
Действительно, если допустить что управление на каком-либо участке, например, на втором
не совпадает с оптимальным управлением
, тогда
и, как следствие,
, что противоречит смыслу
как оптимального управления.
В соответствии с изложенным выше принципом оптимальности на каждом участке оптимальной траектории должны выполняться необходимые условия оптимальности. В частности:
1) для участка выхода на ограничения необходимые условия оптимальности имеют вид
В результате использования необходимых условий оптимальности получим
2) для участка движения вдоль границы области допустимых состояний необходимые условия оптимальности имеют вид
где - вектор, составленный из любых
компонент вектора
, таких, что матрица
- неособенная (имеет отличный от 0 определитель),
- гамильтониан.
В результате использования необходимых условий оптимальности для данного участка получим
3) для участка схода с границы области допустимых состояний необходимые условия оптимальности приобретают вид
В результате использования необходимых условий оптимальности получим
Для того, чтобы на основе приведенных выше необходимых условий оптимальности найти оптимальное управление и рассчитать оптимальную траекторию динамической системы необходимо определить условия, которым должен удовлетворять сопряженный вектор в точках перехода с одного участка траектории на другой. В теории оптимального управления строго доказано, что для рассматриваемого случая имеют место следующие условия:
где - вектор размера
, значения которого определяются в процессе расчета оптимальной траектории.
Отсюда следует важная особенность задач с ограничениями в виде неравенств, которая проявляется в том, что сопряженный вектор претерпевает разрыв в момент выхода траектории на границу области допустимых состояний, поэтому условие, связывающее сопряженные векторы
и
называется условием скачка.
Версия: AAAAAARxgJE Код: 000003181