rpd000003181 (1012244), страница 15
Текст из файла (страница 15)
где
- матрицы размеров
,
соответственно
, конечный момент
- фиксирован (задан),
.
Критерий оптимальности имеет вид:
Здесь
положительно определенные матрицы размеров
,
. То есть для любых векторов
,
выполняются условия
Для определения оптимального управления воспользуемся необходимыми условиями оптимальности. Запишем гамильтониан
где - сопряженный вектор размера
.
Оптимальное управление будем искать из условия максимума гамильтониана. Поскольку гамильтониан является вогнутой функцией управления, точка экстремума этой функции будет точкой максимума. Точку экстремума определим из условий
Отсюда находим
В выражение для управления входит сопряженный вектор . Для его определения запишем каноническую систему дифференциальных уравнений.
Решить эту систему линейных дифференциальных уравнений можно, если воспользоваться понятием фундаментальной матрицы. Введем блочный вектор
блочную матрицу
Тогда каноническую систему дифференциальных уравнений можно представить в виде:
То есть имеем систему однородных линейных дифференциальных уравнений, Известно, что решение подобной системы может быть выражено через фундаментальную матрицу следующим образом:
Фундаментальная матрица определяется путем решения матричного дифференциального уравнения
с начальными условиями
где - единичная матрица размера
. В нашем случае
. Представим фундаментальную матрицу в блочном виде:
С учетом блочного представления фундаментальной матрицы решение канонической системы дифференциальных уравнений можно представить в виде:
Из первого уравнения для конечного момента времени , учитывая, что
,
имеем:
При этом предполагается, что обратная матица существует. С учетом полученного результата
В окончательном виде приходим к следующему выражению для оптимального управления:
Мы получили оптимальное управление линейной динамической системой с квадратичным критерием в виде программы, то есть в виде функции времени . Рассмотрим теперь решение задачи синтеза оптимального управления для линейной динамической системы с квадратичным критерием, целью которой является получение управления как функции фазовых координат
6.2. Задача синтеза оптимального управления.
Рассмотрим линейную динамическую систему
где
- матрицы размеров
,
соответственно
, конечный момент
- фиксирован (задан).
Задача заключается в отыскании управления, обеспечивающего минимум критерия:
Здесь
- матрицы соответствующих размеров, зависящие от времени;
- положительно определенные матрицы размеров.
Итак, в отличие от рассмотренного ранее случая, здесь в выражении для критерия присутствует компонента, отражающая конечное состояние системы. То есть речь идет о решении задачи Больца. Ранее мы показали, что структура гамильтониана для задачи Больца совпадает со структурой гамильтониана для задачи Лагранжа. Различия связаны с определением граничного условия для сопряженного вектора. Учитывая, что структура гамильтониана в данном случае такая же, как и в ранее рассмотренном, выражение для оптимального управления сохраняет свою силу
Структура канонической системы дифференциальных уравнений такая же как и в предыдущем примере, но граничные условия для сопряженного вектора будут другими
Как и ранее, выразим решение канонической системы дифференциальных уравнений через элементы фундаментальной матрицы
Это решение связывает конечное состояние системы с текущим
. Поскольку
, получим
Из этого равенство непосредственно следует:
Обозначим
Тогда
С учетом полученной зависимости можно записать управление, как функцию текущего состояния динамической системы
Устройство, обеспечивающее практическую реализацию полученного управления имеет следующую структуру
ТЕМА 9.doc
Тема 9. Численные методы программирования оптимального управления.
Принцип максимума, теоретические основы которого рассмотрены ранее, к сожалению, не предлагает явного алгоритма получения оптимального управления. Более того, непосредственное использование условий принципа максимума для решения задач программирования оптимального управления может оказаться весьма затруднительным. Однако, практическая ценность принципа максимума в том, что он позволяет свести решение динамической задачи управления к существенно более простой статической (одношаговой) задаче математического программирования.
9.1. Сведение задачи программирования оптимального управления к задаче математического программирования.
Как и ранее рассматривается автономная динамическая система общего вида:
где
- фазовый вектор размера
,
- вектор управления размера
, на который наложены ограничения
;
- вектор-функция размера
, время функционирования системы ограничено
.
Учитывая, что задачи Лагранжа и Больца путем соответствующей замены переменных всегда могут быть сведены к задаче Майера (задаче управления конечным состоянием). Поэтому в качестве критерия оптимальности будем рассматривать функцию конечного состояния
где - некоторая скалярная функция конечного состояния динамической системы.
Применительно к рассматриваемой задаче принцип максимума приводит к следующему условию оптимальности управления:
Реализация этого условия позволяет определить структуру управления, то есть установить для каждого момента времени на оптимальной траектории связь вектора управления с вектором состояния динамической системы и сопряженным вектором, то есть связь типа
Если такая связь установлена, для построения оптимальной траектории динамической системы используется каноническая система дифференциальных уравнений:
Практическая трудность решения канонической системы дифференциальных уравнений состоит в том, что краевые условия для вектора состояния динамической системы (вектор ) заданы на левом конце траектории, а для сопряженного вектора на правом конце. Если бы мы имели значения сопряженного вектора
на левом конце траектории (в начальный момент времени) то решение канонической системы не вызвало бы никаких затруднений. Достаточно было бы проинтегрировать каноническую систему дифференциальных уравнений, определяя на каждом шаге оптимальное управление из условия максимума гамильтониана. Проблема, следовательно, состоит в том, чтобы подобрать сопряженный вектор
таким образом, чтобы на правом конце траектории удовлетворялось краевое условие для сопряженного вектора
.
Введем в рассмотрение вектор невязок:
который зависит от . Поэтому краевая задача для канонической системы дифференциальных уравнений сводится к отысканию решения уравнения
для решения которого можно использовать любой численный метод решения систем нелинейных алгебраических уравнений, например метод Ньютона. Проблема состоит в том, что зависимость задана не явно, а через каноническую систему дифференциальных уравнений. Это обстоятельство значительно усложняет процесс получения решения. Например, для реализации метода Ньютона необходимо знать матрицу частных производных
, для вычисления элементов которой необходимо многократно интегрировать каноническую систему, варьируя значения
. Поэтому, данный метод целесообразно применять, когда известно достаточно хорошее приближение для
.
Задачу отыскания решения уравнения
можно существенно упростить, если использовать целевую функцию вида:
где - некоторая положительно определенная матрица. Из приведенного выражения очевидно следует, что минимум функции
равняется 0 при
. Поэтому, минимизируя
по
, мы тем самым решаем краевую задачу.
9.2. Методы решения задач программирования оптимального управления со свободным концом.
Для решения задач со свободным концом в настоящее время разработаны эффективные приближенные методы. Они опираются на следующее свойство задач подобного класса. Для получения точного решения задачи оптимизации управления динамической системой, если она линейна по фазовому вектору, а на правый конец траектории не наложено ограничений , достаточно решить две задачи Коши.
Рассмотрим эти приближенные методы более подробно.
9.2.1. Случай линейной системы.
Необходимо найти управление системой