rpd000003061 (1012241), страница 4
Текст из файла (страница 4)
Тогда модель движения запишется как:
Граничные условия
На управление наложены ограничения:
Критерий оптимальности
Составим гамильтониан для данной задачи. Поскольку данная задача представляет собой задачу Майера (задачу управления конечным состоянием) выражение для гамильтониана имеет вид:
Из условия максимума гамильтониана по управлению находим структуру оптимального управления:
Каноническая система уравнений имеет вид:
Замечание. Краевые условия для сопряженного вектора следуют из рассмотренного ранее принципа максимума для задачи Майера, который мы записали для расширенной динамической системы вида , где расширенный вектор
, а критерий оптимальности
. Для задачи Майера в подобной постановке были получены краевые условия для сопряженного вектора
В рассматриваемом случае в качестве дополнительной переменной выступает переменная
, а вектор
объединяет компоненты
,
. Отсюда, во-первых, следует, что
, а, поскольку, конечные условия по переменным
,
заданы, граничные значения
не фиксированы.
Итак, имеем краевую задачу, для которой в начальный момент времени заданы компоненты
,
,
, а в конечный момент
- компоненты
,
,
Для определения неизвестного времени спуска используем свойство гамильтониана, состоящее в том, что гамильтониан на оптимальной траектории при условии, что время
не фиксировано равен 0.
Воспользуемся необходимыми условиями оптимальности. Начнем с вопроса существования особого управления (случая ), то есть ситуации, когда оптимальное управление не может быть определено с помощью принципа максимума.
Будем рассуждать от противного. Допустим, что на некотором конечном интервале функция
. Тогда для всех
имеет место
. Запишем выражение для
:
Отсюда следует, что для любого момента времени
. Но из канонической системы дифференциальных уравнений следует, что
для всех
, следовательно,
для всех
. Это , в свою очередь, приводит к условию
(
) для всех
, и, как следствие,
для всех
.
Тогда из условия
следует
Вернемся к выражению для функции , записав его для конечного момента времени:
что противоречит исходному предположению .
Итак, мы убедились, что , а значит, особого управления в рассматриваемой задаче не существует. Поэтому, оптимальное управление имеет структуру:
Подобная структура управления означает, что в момент изменения знака функции происходит мгновенное переключение тяги двигателя с максимального ежима на минимальный . Проанализируем характер поведения функции
. Для этого воспользуемся ранее полученным выражением
где , а
для любого
. Следовательно, производная
знака не меняет , то есть функция
- монотонная. Возможны 4 случая.
Из соображений здравого смысла ясно, что только в первом и четвертом случаях возможно решение, так как только в этих случаях моменту, предшествующему соприкосновению ЛА с поверхностью соответствует отличное от нуля управление (что обязательно должно выполняться, поскольку необходимо обеспечить мягкую посадку с нулевой вертикальной скоростью). Так как первый четвертый вариант включает в себя как частный случай первый (при ), достаточно рассмотреть только его. То есть программа оптимального управления заключается в том, что до некоторого момента времени
управление отсутствует (
-двигатель выключен), а начиная с момента
управление равно максимальному значению (двигатель работает в режиме максимальной тяги). Это и есть оптимальный режим работы, обеспечивающий минимальный расход топлива.
Все, что нам неизвестно - момент переключения управления и время движения
. Для этого нет необходимости решать всю каноническую систему дифференциальных уравнений, достаточно проинтегрировать уравнения движения ЛА при оптимальной структуре управления.
То есть
Решим теперь дифференциальное уравнение для компоненты .
Для вычисления конечного значения проинтегрируем последнее уравнение
Вычислив последний интеграл, получим явную аналитическую зависимость
Учитывая краевые условия
получим систему двух нелинейных алгебраических уравнений относительно неизвестных :
Определив тем самым определим оптимальное упрвление.
Оптимизация программы проведения однопараметрической коррекции траектории ЛА
Постановка задачи. Рассмотрим задачу коррекции траектории ЛА по некоторому скалярному параметру (задачу однопараметрической коррекции) с целью минимизации конечной ошибки. Пусть - скалярная переменная, представляющая величину ошибки (промаха) по выбранному параметру траектории. Обозначим
- промах, прогнозируемый в момент
совершения коррекции;
- величина корректирующего воздействия,
- заданный коэффициент влияния
-го корректирующего воздействия на конечный промах. Тогда в качестве математической модели процесса коррекции можно рассмотреть следующую скалярную дискретную модель
количество корректирующих воздействий фиксировано . Предполагается, что начальный (до выполнения программы коррекции) прогнозируемый промах
известен.
Необходимо определить такую последовательность корректирующих воздействий , которая при располагаемых энергетических возможностях обеспечит минимум конечного промаха
. Ограничение по энергетическим затратам на проведение коррекции учитываются в виде неравенства следующего вида
Для того, чтобы учесть энергетические ограничения на проведение коррекции будем использовать критерий следующего вида
где - некоторая неотрицательная константа, которую в дальнейшем будем определять из условия
Таким образом имеем задачу программирования оптимального управления вида
Заметим, что в данном случае ограничения на управления в отельные моменты коррекции отсутствуют.
Итак, имеет место задача программирования оптимального управления для линейной дискретной динамической системы с критерием оптимальности общего вида. Ранее было получено выражение для гамильтониана задаче управления динамической системой
С критерием вида
Применительно к рассматриваемой задаче гамильтониан записывается как
Условием оптимальности управления является минимум гамильтониана
Воспользуемся необходимым условием экстремума
Поскольку в данном случае гамильтониан является выпуклой функцией управления, стационарная точка, определяемая на основе необходимых условий экстремума, является точкой минимума.
Откуда
Определим значение сопряженной переменной
То есть
С учетом этого
Воспользоваться приведенным выражением для оптимального управления затруднительно, поскольку по условию задачи конечный промах не задан (он должен быть минимизирован). Однако, это выражение определяет структуру управления. Подставим выражение для оптимального управления в модельт динамической системы
Имеем:
По индукции получаем:
Решив это уравнение находим:
С учетом этого выражение для оптимального управления принимает вид:
Неизвестный параметр определим из условия
Разрешив полученное алгебраическое квадратное уравнение относительно неизвестного найдем оптимальное управление, удовлетворяющее энергетическим ограничениям.
ПЗ2.doc
Практическое занятие 2. Пример решения задачи об оптимальном по быстродействию управлении линейной динамической системой с постоянными коэффициентами .
Рассмотрим линейную динамическую систему, которая описывается моделью следующего вида:
где - компоненты вектора состояния (фазовые переменные) системы,
- скалярное управление. На управление наложены ограничения
. Требуется перевести систему из заданного начального состояния
в конечное
за минимальное время. То есть критерий оптимальности в данном случае
Для решения задачи воспользуемся необходимыми условиями оптимальности. Прежде всего составим гамильтониан.
Оптимальное управление ищем из условия максимума гамильтониана. Поскольку функция линейна по управлению, структура оптимального управления задается условием
то есть
Если имеет место вырожденная задача, которая не может быть решена с помощью принципа максимума. Запишем каноническую систему дифференциальных уравнений
Отсюда находим решение для компонент ,
сопряженного вектора
Следовательно, оптимальное управление имеет структуру
Задача не вырожденная , то есть . Действительно, предположим, что для некоторого момента времени имеет место вырожденный случай
. Но в этом случае,
, а значит гамильтониан
. Последнее равенство противоречит доказанному свойству гамильтониана, поскольку имеет место задача со свободным концом (конечный момент времени
не фиксирован), а значит на оптимальной траектории
.
Таким образом, оптимальное управление в рассматриваемой задаче всегда существует, имеет кусочно-постоянную структуру, причем количество переключений управлений в соответствии с теоремой Фельдбаума не более одного (поскольку размерность фазового вектора равна 2). Следовательно, возможны только 4 варианта управления
Для того, чтобы понять, какой из этих вариантов управления обеспечивает решение задачи оптимального быстродействия, представим уравнения для переменных состояния в виде: