rpd000003181 (1012244), страница 11
Текст из файла (страница 11)
В соответствии с определением математического ожидания в развернутом виде выражение (14.2) можно представить следующим образом:
где - плотность распределения вероятностей случайного вектора
; множество
- множество реализаций случайного вектора
.
Получим необходимые условия оптимальности управления в данной задаче, применяя схему рассуждений, использованную ранее в процессе исследования детерминированных систем. Будем полагать, что на конечное состояние системы влияют управляющие воздействия на каждом шаге функционирования системы и возмущения
, то есть
В данной записи - блочный вектор, компонентами которого являются векторы управления на каждом шаге функционирования ДС, то есть
,
- блочный вектор с компонентами
, отражающими влияние случайных возмущений на каждом шаге функционирования.
Если - оптимальное управление (оптимальная последовательность управлений), доставляющая минимум критерия
, то:
Тогда условие
будет выполняться для любого допустимого управления , отличного от оптимального
. Как и в случае детерминированного управления применим прием, известный как игольчатая вариация управления, полагая, что везде кроме шага с номером i , управление оптимальное:
Вариацию критерия можно выразить следующим образом:
То есть в скалярной записи вариация критерия
Поскольку мы рассматриваем игольчатую вариацию управления на единственном шаге с номером i, то
Тогда вариация критерия как результат игольчатой вариации управления
Для придания условиям оптимальности (14.8) более удобной для реализации формы раскроем производные , связав их с моделью динамической системы. Поскольку операции математического ожидания и дифференцирования перестановочны, можно записать:
Как и в детерминированном случае, повторив использованные там рассуждения, вектор можно записать через гамильтониан
где
Вектор - сопряженный вектор, определяемый на основе уравнения
с граничным условием
Подставляя (14.10) в (14.8), необходимые условия оптимальности для рассматриваемого случая можно представить в виде следующей системы неравенств:
Полученный результат обобщает необходимые условия оптимальности, рассмотренные ранее для детерминированных систем, на случай, когда в модели присутствуют случайные факторы. Принципиальная сложность применения необходимых условий оптимальности в данном случае состоит в том, что гамильтониан и сопряженный вектор являются случайными, что предполагает использование операций математического ожидания (статистического усреднения) по всем реализациям случайных факторов. Это требует привлечения методов статистического моделирования.
Как и для детерминированной задачи программирования оптимального управления выделим некоторые частные случаи.
1. Ограничения на управление отсутствуют . В этом случае с учетом (14.14) необходимые условия оптимальности принимают вид строгих равенств
2. Допустимые множества управлений на каждом шаге функционирования динамической системы являются выпуклыми, гамильтониан
является выпуклой функцией управления. Тогда условие
эквивалентно условию минимума гамильтониана. То есть, необходимое условие оптимальности при выполнении вышеприведенных условий приобретает вид:
Полученные необходимые условия оптимальности управления, как и в детерминированном случае, распространяются на критерий общего вида.
однако, выражение для гамильтониана теперь принимает вид
ТЕМА 2.doc
Тема 2. Программирование оптимального управления детерминированными динамическими системами Необходимые условия оптимальности управления для случая дискретной динамической системы. Принцип минимума (максимума).
Рассмотрение дискретных систем в настоящее время приобретает все большее значение в связи с широким использованием средств вычислительной техники в процессе управления динамическими системами (ДС), предполагающих потактовую обработку информации.
Постановка задачи. Рассматривается задача программирования оптимального управления динамической системой, описываемой разносным уравнением вида:
где - вектор состояния динамической системы на текущем шаге ее функционирования размера
((индекс
в (2.1) указывает на конкретный шаг функционирования )
- вектор управления размера
;
- непрерывно-дифференцируемая вектор-функция, описывающая изменение состояния динамической системы в процессе функционирования. Предполагается, что начальное состояния ДС (вектор
), число шагов
заданы, а конечное состояние системы (вектор
) не фиксировано (свободно). На каждом шаге функционирования ДС на управления накладываются ограничения
.
Поскольку речь идет о получении оптимального управления необходимо выбрать критерий оптимальности управления. Наиболее распространенными в практических задачах являются следующие критерии оптимальности:
Подобный критерий может использоваться в тех случаях, когда искомое оптимальное управление должно обеспечивать выполнение требований к конечному состоянию ДС с учетом суммарных затрат на управление.
При использовании критерия такого вида управление будет находиться с учетом суммарных затрат на управление
Задачи программирования управления с таким критерием известны как задачи управления конечным состояние. В этом случае качество управления оценивается с точки зрения выполнения требований к конечному состоянию ДС.
Можно показать что задачи оптимизации управления с критериями вида (2.2),(2.3) всегда могут быть сведены к задаче управления конечным состоянием с критерием вида (2.4).
Рассмотрим задачу программирования оптимального управления для системы (2.1) с критерием оптимальности (2.2):
Введем новый расширенный вектор состояния , где компонента
определяется на основе модели
с начальным условием
. Очевидно, что конечное значение
. Тогда критерий оптимальности
с учетом перехода к расширенному вектору
может быть записан как
Таким образом, исходная задача оптимизации управления ДС с вектором состояния и критерием оптимальности общего вида сведена к задаче управления конечным состоянием динамической системы с расширенным вектором состояния
.
Аналогичным образом можно убедиться в том, что задача программирования оптимального управления для системы (2.1) с критерием оптимальности (2.3) также водится к задаче управления конечным состоянием
Учитывая проведенный анализ в дальнейшем, не ограничивая общность изложения, будем искать оптимальное управление для системы
из условия минимума критерия
полагая при этом, что начальное состояние и число шагов
заданы, а конечное состояние
- свободно.
Очевидно, что конечное состояние системы зависит от выбора управляющих воздействий на каждом шаге, то есть
В данной записи - блочный вектор, компонентами которого являются векторы управления на каждом шаге функционирования ДС, то есть
Если - оптимальное управление (оптимальная последовательность управлений), доставляющая минимум критерия
:
тогда условие
будет выполняться для любого допустимого управления , отличного от оптимального
Применим прием, известный как игольчатая вариация управления, полагая, что везде кроме шага с номером i , управление оптимальное:
Вариацию критерия можно выразить следующим образом:
То есть в скалярной записи вариация критерия
Поскольку мы рассматриваем игольчатую вариацию управления на единственном шаге с номером i, то
Тогда вариация критерия как результат игольчатой вариации управления
Приведенное условие справедливо для любого шага, а значит, может рассматриваться как необходимое условие оптимальности управления. Иными словами, если последовательность управлений - оптимальная, то для любого шага i функционирования системы любая допустимая вариация управления
должна удовлетворять вышеприведенному условию.
К сожалению, приведенное необходимое условие оптимальности выражено в достаточно общем виде и не предлагает практического инструмента для определения оптимального управления. Проблема заключается в том, что критерий являющийся функцией конечного состояния, явным образом не зависит от управления
на шаге i. То есть непосредственное вычисление производной
для проверки необходимого условия оптимальности невозможно. Связь критерия оптимальности
с управлением
не явная, она устанавливается через последовательность следующих соотношений: