rpd000003061 (1012241), страница 15
Текст из файла (страница 15)
Допустим, что условие не выполняется. В этом случае процесс уточнения управления должен быть продолжен.
Для этого выразим вариацию критерия через сопряженный вектор и вариацию управления
. Умножим (9.15) на сопряженный вектор
, а уравнение (9.19) на
. Складывая эти уравнения, получаем
или
Откуда с учетом краевых условий , уравнения для вариации вектора состояния (9.15), и вариации критерия (9.17) находим
Если вариацию в последнем выражении выбирать в виде:
где , то мы автоматически обеспечиваем выполнение условия
. При этом выполнение второго условия
достигается соответствующим подбором параметра
.
ТЕМА 8.doc
Тема 8. Задачи оптимального управления с ограничениями на фазовый вектор. Оптимальные траектории, лежащие на границе области ограничений. Учет ограничений в виде неравенств, условие скачка.
Во всех ранее рассмотренных задачах предполагалось, что никаких ограничений на фазовый вектор не накладывается, ограничения накладываются лишь на управление. Рассмотрим задачу, в которой присутствуют оба ограничения.
Рассмотрим автономную динамическую систему общего вида:
где
- фазовый вектор размера
,
, где
– множество допустимых состояний, которое задано в виде
,
- вектор-функция размера
;
- вектор управления размера
, на который наложены ограничения
;
- вектор-функция размера
, время функционирования системы ограничено
.
Ранее было показано, что задачи Лагранжа и Больца путем соответствующей замены переменных всегда могут быть сведены к задаче Майера (задаче управления конечным состоянием). Поэтому в качестве критерия оптимальности будем рассматривать функцию конечного состояния
где - некоторая скалярная функция конечного состояния динамической системы. Рассмотрим сначала случай, когда оптимальная траектория лежит на границе области допустимых состояний, то есть имеет место условие
.
8.1. Оптимальные траектории, лежащие на границе области ограничений.
Необходимо найти управление , которое обеспечивает перевод динамической системы из некоторого начального состояния
в конечное
вдоль ограничения
с минимумом критерия
. Введем вектор размера
,определяемый на основе соотношения
Для того, чтобы траектория динамической системы во все моменты времени
лежала на границе ограничений необходимо и достаточно, чтобы выполнялись следующие условия:
Действительно, первое из этих условий означает, что начальная точка траектории лежит на границе области . Второе, что вектор скорости
в каждый момент времени ориентирован в направлении касательной к границе
.
Для получения необходимых условий оптимальности управления в рассматриваемой задаче, как и прежде, воспользуемся игольчатой вариацией управления на интервале , где
- бесконечно малый интервал времени
,
- оптимальное управление.
u(t)=u*(t)+u(t)
В результате произведенной вариации управления траектория при
будет отличаться от оптимальной
. Определим вариацию траектории
,
, порожденную игольчатой вариацией управления. Разложим функцию
в ряд Тейлора в окрестности оптимальной траектории
:
Отсюда следует дифференциальное уравнение в приращениях
которое решается с начальными условиями
Последнее выражение следует из следующих соображений.
Поскольку на момент возникновения игольчатой вариации управления
, то
Так как - бесконечно малый интервал,
Поскольку в рассматриваемом случае траектория должна лежать на границе области допустимых состояний , то к уравнению для производной
необходимо добавить условия, связывающие вариации
. Это условие может быть получено из следующего соображения. Будем исходить из того, что оптимальная траектория лежит на границе области допустимых состояний. Выше было показано, что при этом должны выполняться условия
Для того, чтобы траектория , порожденная игольчатой вариацией управления
, в момент времени
оставалась на границе области допустимых состояний должно выполняться условие
Разложив функцию в ряд в окрестности оптимальной траектории, получим
Отсюда следует условие, связывающее вариации :
Умножим последнее равенство слева на матрицу размера
:
Это выражение эквивалентно
Сложим последнее выражение с выражением для , записанным в виде
Имеем:
Потребуем, чтобы матрица обеспечивала для любого момента времени
выполнение условия
Тогда уравнение для примет вид:
Используем прием, который применялся ранее в процессе вывода принципа максимума. Введем сопряженный вектор и потребуем, чтобы для этого вектора в любой момент времени
выполнялось условие
(Замечание: мы рассматриваем задачу с критерием оптимальности , следовательно любая вариация критерия в окрестности оптимального значения
или, что то же самое
)
В частности, для конечного момента времени
Отсюда следует, что
Продифференцируем выражение
получим
Подставляя сюда ранее полученное выражение для , имеем:
для того, чтобы это равенство выполнялось для любой вариации , должно выполняться
Отсюда
или
где - вектор размера
, определяемый как
.
Ранее мы определили сопряженный вектор из условия
которое справедливо для любого момента времени , в том числе и для момента времени
возникновения игольчатой вариации управления. Но, вариация траектории в результате игольчатой вариации управления, как было показано выше, определяется выражением
или
Как и ранее, введем гамильтониан
Тогда вышеприведенное неравенство можно рассматривать как условие гамильтониана по управлению
Поскольку момент , соответствующий вариации управления может быть любым
, то это условие можно распространить на любой момент времени, то есть
Каноническая система уравнений для определения оптимальной траектории и сопряженного вектора
в данном случае примет вид:
В последнем выражении для сопряженного вектора присутствует вектор размера
, который необходимо определить. В постановке задачи указывалось, что количество ограничений (размер вектора
) меньше, чем размер вектора управления
. Исходя из этого представим ранее записанное условие для матрицы
иначе
Этой записи - компоненты вектора управления, такие что
- вектор, размерность которого совпадает с размерностью вектора
, то есть вектор размера
,
Дальнейшие преобразования учитывают следующее обстоятельство. Вариации ,
, составляющие вариацию
, связаны с вариацией
траектории
соотношениями,
, типа
Поэтому компонент
вектора
можно выбирать произвольно, например,
. Тогда вышеприведенное условие, связывающее вариации управления с вариациями траектории можно переписать в виде
Для выполнения этого равенства при любой вариации достаточно задать матрицу
в виде
В соответствии с этим вектор будет равен:
или
Как и раньше, гамильтониан в данной задаче сохраняет свои свойства
Итак, для задачи Майера:
с критерием оптимальности
необходимые условия оптимальности определяются соотношениями:
1) каноническая система дифференциальных уравнений для определения оптимальной траектории:
где - вектор, составленный из любых
компонент вектора
, таких, что матрица
- неособенная (имеет отличный от 0 определитель),
- гамильтониан.
2) условие оптимальности управления
с учетом того, что
Для задачи Лагранжа:
с критерием оптимальности
необходимые условия оптимальности определяются соотношениями:
1) каноническая система дифференциальных уравнений для определения оптимальной траектории:
где - как и ранее, вектор, составленный из любых
компонент вектора
, таких, что матрица
- неособенная (имеет отличный от 0 определитель), гамильтониан
2) условие оптимальности управления
с учетом того, что
8.2. Ограничения в виде неравенств. Условия скачка.
Вернемся к исследованию автономной динамической системы общего вида:
где по прежнему - фазовый вектор размера
,
, где
– множество допустимых состояний, которое задано в виде
,
- вектор-функция размера
;
- вектор управления размера
, на который наложены ограничения
;
- вектор-функция размера
, время функционирования системы ограничено
.
Критерий оптимальности
Рассмотрим наиболее простой случай, когда оптимальная траектория выходит на границу области допустимых состояний, остается на ней течение интервала времени , а затем возвращается внутрь области допустимых состояний
Будем полагать, что управления представляют собой кусочно-непрерывные функции. Имеет место следующее свойство оптимальных управлений: каждый участок оптимальной траектории является оптимальным в смысле того же самого критерия оптимальности, рассматриваемого на данном участке. Действительно, критерий оптимальности можно представить в виде интеграла
Представим этот интеграл в виде трех слагаемых