rpd000003181 (1012244), страница 8
Текст из файла (страница 8)
В результате перехода к функционалу качества имеем детерминированную задачу непрерывного оптимального управления, допускающую постановку как в виде задачи программирования оптимального управления, так и в виде задачи синтеза оптимального управления, упомянутых ранее.
Дискретные задачи оптимального управления динамическими системами. В этом случае изменение вектора состояния динамической системы в процессе функционирования описывается системой разностных уравнений. Среди дискретных задач ОУ также выделяют детерминированные и стохастические задачи.
Детерминированные дискретные задачи оптимального управления динамическими системами используют модель функционирования динамической системы следующего вида
где - шаги функционирования динамической системы;
- вектор состояния динамической системы,
;
- вектор управления. То есть в отличие от непрерывной системы, способной изменять свое состояние в любой произвольный момент времени, дискретная система изменяет свое состояния только в фиксированные моменты времени, число которых конечно (счетно). Для детерминированных дискретных задач также возможны постановки задач программирования и синтеза оптимального управления.
Детерминированная задача программирования оптимального управления предполагает отыскание такой последовательности управлений ,
, которая доставляет экстремум функционала качества следующего вида:
Детерминированная задача синтеза оптимального управления предполагает отыскание на каждом шаге функционирования динамической системы управлений ,
в зависимости от вектора состояния системы, таких которые доставляют экстремум вышеприведенного функционала качества.
Стохастические дискретные задачи оптимального управления динамическими системами используют модель функционирования динамической системы следующего вида
где - вектор случайных возмущений.
Для стохастических задач оптимального управления также могут быть сформулированы задачи программирования и синтеза оптимального управления, которые могут быть сведены к детерминированным задачам путем перехода к функционалу качества
Все ранее рассматриваемые постановки задач оптимального управления динамическими системами опирались на предположение о том, что в процессе управления измерению доступен вектор состояния динамической системы . Подобные задачи управления называются задачами управления по полным данным. Однако, на практике распространены ситуации, когда измерению доступен не сам вектор состояния динамической системы
, а некоторый вектор
, связанный с вектором состояния некоторым соотношением
где - в общем случае вектор ошибок измерений. В подобном случае возникает задача оптимального управления (в детерминированной и стохастической постановке) по неполным данным.
Мы рассмотрели классификацию динамических задач оптимального управления, отражающую их многообразие. Обсуждение методов решения всех перечисленных задач оптимизации требует достаточно большого объема времени. Поэтому в рамках нашего курса мы ограничимся лишь детерминированными задачами оптимального управления по полным данным.
ТЕМА 2.doc
Тема 2. Программирование оптимального управления детерминированными динамическими системами Необходимые условия оптимальности управления для случая дискретной динамической системы. Принцип минимума (максимума).
Рассмотрение дискретных систем в настоящее время приобретает все большее значение в связи с широким использованием средств вычислительной техники в процессе управления динамическими системами (ДС), предполагающих потактовую обработку информации.
Постановка задачи. Рассматривается задача программирования оптимального управления динамической системой, описываемой разносным уравнением вида:
где - вектор состояния динамической системы на текущем шаге ее функционирования размера
((индекс
в (2.1) указывает на конкретный шаг функционирования )
- вектор управления размера
;
- непрерывно-дифференцируемая вектор-функция, описывающая изменение состояния динамической системы в процессе функционирования. Предполагается, что начальное состояния ДС (вектор
), число шагов
заданы, а конечное состояние системы (вектор
) не фиксировано (свободно). На каждом шаге функционирования ДС на управления накладываются ограничения
.
Поскольку речь идет о получении оптимального управления необходимо выбрать критерий оптимальности управления. Наиболее распространенными в практических задачах являются следующие критерии оптимальности:
Подобный критерий может использоваться в тех случаях, когда искомое оптимальное управление должно обеспечивать выполнение требований к конечному состоянию ДС с учетом суммарных затрат на управление.
При использовании критерия такого вида управление будет находиться с учетом суммарных затрат на управление
Задачи программирования управления с таким критерием известны как задачи управления конечным состояние. В этом случае качество управления оценивается с точки зрения выполнения требований к конечному состоянию ДС.
Можно показать что задачи оптимизации управления с критериями вида (2.2),(2.3) всегда могут быть сведены к задаче управления конечным состоянием с критерием вида (2.4).
Рассмотрим задачу программирования оптимального управления для системы (2.1) с критерием оптимальности (2.2):
Введем новый расширенный вектор состояния , где компонента
определяется на основе модели
с начальным условием
. Очевидно, что конечное значение
. Тогда критерий оптимальности
с учетом перехода к расширенному вектору
может быть записан как
Таким образом, исходная задача оптимизации управления ДС с вектором состояния и критерием оптимальности общего вида сведена к задаче управления конечным состоянием динамической системы с расширенным вектором состояния
.
Аналогичным образом можно убедиться в том, что задача программирования оптимального управления для системы (2.1) с критерием оптимальности (2.3) также водится к задаче управления конечным состоянием
Учитывая проведенный анализ в дальнейшем, не ограничивая общность изложения, будем искать оптимальное управление для системы
из условия минимума критерия
полагая при этом, что начальное состояние и число шагов
заданы, а конечное состояние
- свободно.
Очевидно, что конечное состояние системы зависит от выбора управляющих воздействий на каждом шаге, то есть
В данной записи - блочный вектор, компонентами которого являются векторы управления на каждом шаге функционирования ДС, то есть
Если - оптимальное управление (оптимальная последовательность управлений), доставляющая минимум критерия
:
тогда условие
будет выполняться для любого допустимого управления , отличного от оптимального
Применим прием, известный как игольчатая вариация управления, полагая, что везде кроме шага с номером i , управление оптимальное:
Вариацию критерия можно выразить следующим образом:
То есть в скалярной записи вариация критерия
Поскольку мы рассматриваем игольчатую вариацию управления на единственном шаге с номером i, то
Тогда вариация критерия как результат игольчатой вариации управления
Приведенное условие справедливо для любого шага, а значит, может рассматриваться как необходимое условие оптимальности управления. Иными словами, если последовательность управлений - оптимальная, то для любого шага i функционирования системы любая допустимая вариация управления
должна удовлетворять вышеприведенному условию.
К сожалению, приведенное необходимое условие оптимальности выражено в достаточно общем виде и не предлагает практического инструмента для определения оптимального управления. Проблема заключается в том, что критерий являющийся функцией конечного состояния, явным образом не зависит от управления
на шаге i. То есть непосредственное вычисление производной
для проверки необходимого условия оптимальности невозможно. Связь критерия оптимальности
с управлением
не явная, она устанавливается через последовательность следующих соотношений:
……………………………….
Тогда, используя правило дифференцирования неявной функции можно записать:
или
Перепишем последнее равенство в виде
Введем вектор , определяемый на основе следующего рекуррентного выражения
Потребуем, чтобы для вектора выполнялось следующее краевое условие
Следуя введенному определению вектора , вычислим его значение на шаге i+1.
……………………………………
Подставим значения в выражение для
Видим, что с учетом определения вектора
Введем теперь скалярную функцию, называемую гамильтониан (функция Гамильтона), которую определим как:
Легко убедиться, что