183675 (743612), страница 6
Текст из файла (страница 6)
1) Существуют элемент и число
, при которых
и
при всех
.
2) Существуют последовательность элементов множества М и число
, удовлетворяющее условиям
,
и
при всех
.
Данная теорема имеет важное значение для понимания сущности задачи оптимизации по двум причинам. Во-первых, она говорит о том, что постановка задачи об отыскании наименьшего (наибольшего) значения ограниченного снизу (сверху) функционала имеет смысл. Во-вторых, она объясняет природу решения такой задачи. А именно: решением будет либо определенный элемент множества М, минимизирующий (максимизирующий) функционал
, либо последовательность
элементов множества М, являющаяся минимизирующей (максимизирующей) последовательностью. В первом случае можно говорить о точном решении задачи, а во втором - о приближенном.
Задачи оптимизации управляемых процессов (оптимального управления) являются частными по отношению к сформулированной выше общей задаче оптимизации. Рассмотрим постанову задач оптимального управления.
Введем некоторые понятия.
Важнейшими из них являются понятия состояния системы и управления. Будем рассматривать системы, состояние которых может быть в любой момент времени определено вектором х n-мерного пространства с координатами
. Пространство Х будем называть пространством состояний системы.
Так как система изменяется во времени, то ее поведение можно описать последовательностью состояний. Такую последовательность системы называют ее траекторией.
Переменная t (называется аргументом процесса) может быть некоторым отрезком числовой прямой ( ) или отрезком натурального ряда (
). В первом случае процесс, происходящий в системе, называется непрерывным, во втором случае - многошаговым, а системы - соответственно непрерывными и дискретными.
Изменение состояния системы, т. е. процесс в ней, может происходить в результате управляющих воздействий. Будем рассматривать системы, управляющие воздействия в которых моделируются с помощью элементов r-мерного пространства U:
,
.
Управляющие воздействия могут задаваться в виде функций от t, т.е.
.
На допустимые состояния системы и управления
могут быть наложены ограничения. Рассмотрим множество троек
- совокупность
- мерных векторов в пространстве
. Тогда ограничения на состояние системы и управление в самом общем случае могут быть записаны в виде
,
где - некоторая область (подмножество) рассматриваемого
- мерного пространства. Ограничения на величины
,
в каждый фиксированный момент времени t могут быть заданы и в виде
,
где Vt - сечение множества V при заданном значении t.
Пару функций назовем процессом. Между функциями
имеется связь: как только задано управление
системой, последовательность ее состояний (траектория системы)
определяется однозначно. Связь между
и
моделируется по-разному в зависимости от того, является система непрерывной или дискретной.
Для непрерывных систем модели процессов задаются системой дифференциальных уравнений вида
,
или в векторной форме
. (4.2.1)
Пусть задано состояние, в котором система находилась в начальный момент . Для простоты этот момент примем равным нулю, а момент окончания процесса
- равным Т. Тогда аргумент процесса t изменяется в пределах
, а начальным состоянием системы будет вектор
, (4.2.2)
где - начальное значение i-й координаты вектора состояния системы.
Проанализируем, каким образом модель отражает связь между управлениями и состоянием системы, изменяющимся под их воздействием. Пусть на промежутке задано управление
. Подставляя его в правую часть системы (4.2.3), получим
(4.2.3)
Имеем систему дифференциальных уравнений относительно неизвестной функции . Решая ее с учетом начальных условий (4.2.2), получим
. Это решение и есть траектория, отвечающая заданному управлению
.
Модель дискретной управляемой системы имеет вид системы рекуррентных уравнений:
,
.
В векторной форме эту модель можно записать в виде
,
(4.2.4)
Здесь t принимает значение . Начальное значение
будем считать известным.
В дискретной системе, как и в непрерывной, задание управляющих воздействий при
позволяет однозначно определить отвечающую им траекторию системы. При подстановке значения u(t) в правую часть (4.2.4) получаем систему уравнений, которая позволяет при известном значении состояния
в момент времени t определить состояние
в следующий момент времени. Так как в начальный момент
состояние
известно, то, подставив его в правую часть (4.2.4), получим
.
Подставляя затем найденное значение и
в (4.2.4), так же найдем значение
. Продолжая этот процесс, через Т шагов получим последнее искомое значение
.
Таким образом, и в дискретном случае уравнения модели (4.2.4) позволяют однозначно определить траекторию системы , если задано управление
.
Следовательно, процесс должен удовлетворять следующим ограничениям:
1) при всех
;
2) Пара удовлетворяет системе уравнений процесса:
а) системе (4.2.1) в непрерывном случае при ;
б) системе (4.2.4) в дискретном случае при ;
3) Заданы начальные условия (4.2.2);
4) В непрерывном случае на функции ,
накладываются некоторые дополнительные ограничения, связанные с применимостью употребляемых здесь математических записей. Функцию
будем считать кусочно-непрерывной, а вектор-функцию
- непрерывной и кусочно-дифференцируемой.
Процессы , удовлетворяющие условиям 1) – 4), будем называть допустимыми. Таким образом, допустимый процесс - это управляющие воздействия
и соответствующая им траектория системы
, удовлетворяющие перечисленным ограничениям.
Для постановки оптимизационной задачи необходимо ввести в рассмотрение функционал F, заданный на множестве М. Задача оптимального управления будет состоять в выборе элемента множества M, на котором функционал F достигает минимального значения. Такой процесс называют оптимальным процессом, управление
- оптимальным управлением, а траекторию
оптимальной траекторией.
Функционал F, заданный на множестве допустимых процессов, описывает цель, согласно которой оптимизируется процесс.
В задачах оптимального управления для непрерывных систем будем рассматривать функционалы следующего вида:
, (4.2.5)
где ;
- заданные функции. Выражение (4.2.5) позволяет вычислить для каждого допустимого процесса
определенное значение и тем самым задать функционал на множестве допустимых процессов. Для этого необходимо подставить x(t),
вместо аргументов функции
, которая становится функцией времени, после чего вычислить ее интеграл. Затем к значению интеграла прибавляем значение функции
при
.
Функционал состоит из двух частей:
и
. Первое из этих слагаемых оценивает качество процесса на
на всем промежутке
, второе слагаемое - качество конечного состояния системы. Иногда в задачах оптимального управления конечное состояние системы
задается. В этом случае второе слагаемое функционала (4.2.5) есть величина постоянная и, следовательно, не влияет на его минимизацию. Такие задачи называются задачами с фиксированным правым концом траектории.
Для задач оптимизации в дискретных системах функционал имеет вид
. (4.2.6)
К функционалу (4.2.6) относятся все замечания и комментарии, сделанные к функционалу (4.2.5).
Таким образом задача оптимизации управляемых процессов сводится к постановке задачи о минимуме функционала (4.2.5) в непрерывном и (4.2.6) в дискретном случае на множестве М допустимых процессов , удовлетворяющих ограничениям 1)-4).
Эта задача может решаться в двух вариантах:
1. Определить оптимальный процесс , чтобы
;
2. Определить минимизирующую последовательность , чтобы
.
В теории оптимального управления термины «состояние» и «управление» имеют содержательный смысл. Он заключается в том, что, задавая управление , мы задаем и траекторию процесса
, а изменяя управляющие воздействия
- «управляем» процессом.
Из условия можно выделить ограничения на состояние и управление:
,
, (4.2.7)
где - проекция множества
на пространство X;
- сечение множества
при данном
В задачах оптимального управления область возможных состояний часто является постоянной или совпадает со всем пространством, а область
возможных управлений не зависит от x. Эти предположения выполняются в большом числе практических случаев, что упрощает решение задачи.