Лекции по ОУ (1050564), страница 14
Текст из файла (страница 14)
РЕШЕНИЕ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯС ПОМОЩЬЮ ДОСТАТОЧНЫХ УСЛОВИЙОПТИМАЛЬНОСТИ (МЕТОД КРОТОВА)При решении задач оптимального управления методами, основанными нанеобходимых условиях оптимальности, естественно возникает вопрос: будут лина самом деле оптимальными найденные управления и соответствующие траектории. Такой вопрос, как уже говорилось в п. 3.2, встает при решении краевойзадачи принципа максимума, поскольку принцип максимума является необходимым условием оптимальности. Если же метод решения опирается на достаточные условия оптимальности, то он гарантирует, что полученный результатдействительно будет решением задачи.
Далее остановимся на изложении метода, предложенного В.Ф. Кротовым.5.1. Достаточные условия оптимальностиРассмотрим задачу оптимального управления:dx= f ( x(t ), u (t ), t ) , t ∈ [t 0 ,t1 ],dtx(t 0 ) = x0 ,(x(t ), u (t ) ) ∈ V (t ) , t ∈ [t 0 ,t1 ],t1J ( x, u ) =∫f0(x(t ), u (t ), t ) dt + g 0 (x(t1 ) ) → min .(5.1.1)(5.1.2)(5.1.3)(5.1.4)t0Здесь t 0 , t1 – заданные моменты времени, ∀t x(t ) ∈ E n , u (t ) ∈ E m , функцияf та же, что в п.1.3, f 0 , g 0 – непрерывные скалярные функции, V (t ) – заданныепри каждом t множества n + m -мерного пространства.
Будем предполагать, чтоуправления u (t ) – кусочно-непрерывные функции, заданные на отрезке [t 0 ,t1 ] .83Обозначим множество допустимых пар через D – это те пары ( x, u ) , в которыхуправление u = u (t ) и соответствующая траектория x = x(t ) удовлетворяют условиям (5.1.1) – (5.1.3), причем функция x(t ) непрерывная и кусочно-гладкая на[t 0 ,t1 ] .
Множество пар ( x, u ) , удовлетворяющих условию (5.1.3), обозначим через V .Пусть K ( x, t ) – функция n + 1 -переменной, имеющая непрерывные частные производные. Определим вспомогательную функцию:⎛ ∂K ( x, t )⎞ ∂K ( x, t ), f ( x, u , t ) ⎟ +R ( x, u , t ) = ⎜− f 0 ( x, u , t ) ,∂t⎝ ∂x⎠(5.1.5)где∂K ⎛ ∂K ∂K∂K= ⎜⎜,K,,∂x ⎝ ∂x1 ∂x 2∂x nT⎞⎟⎟ .⎠Лемма 5.1.1. Пусть K ( x, t ) – любая функция n + 1 -переменной, имеющаянепрерывные частные производные. Если пара (x, u ) допустима, то значениефункционала (5.1.4) на этой паре может быть представлено в видеt1J ( x, u ) = − R( x(t ), u (t ), t ) dt + K ( x(t1 ), t1 ) −K ( x(t 0 ), t 0 ) + g 0 ( x(t1 ) ) .∫(5.1.6)t0Доказательство.
Пусть пара ( x, u ) ∈ D . Тогда функция x = x(t ) удовлетворяет системе (5.1.1). Учитывая это, подсчитаем производную функции K ( x(t ), t ) по t :d⎛ ∂K ( x(t ), t )⎞ ∂K ( x(t ), t )K ( x(t ), t ) = ⎜=, x& (t) ⎟ +dt∂x∂t⎝⎠⎞ ∂K ( x(t ), t )⎛ ∂K ( x(t ), t )=⎜, f ( x(t ), u (t ), t )⎟ +.∂x∂t⎠⎝Отсюда для ( x, u ) ∈ D получим представление функции R :R( x(t ), u (t ), t ) =dK ( x(t ), t ) − f 0 ( x(t ), u (t ), t ) .dtПроинтегрируем полученное равенство:t1∫t0t1t1dR( x(t ), u (t ), t ) dt =K ( x(t ), t )dt − f 0 ( x(t ), u (t ), t ) dt =dttt∫∫00t1= K ( x(t1 ), t1 ) − K ( x (t0 ), t0 ) −∫ f (x(t ), u (t ), t )dt .0t0Следовательно,84t1∫ft0t10(x(t ), u (t ), t ) dt = − ∫ R(x(t ), u (t ), t ) dt + K ( x(t1 ), t1 ) − K ( x(t 0 ), t 0 ) .t0Отсюда и из (5.1.4) следует формула (5.1.6).
Лемма доказана.Введем в рассмотрение функцию r ( x) = K ( x, t ) + g 0 ( x) . С помощью этойфункции представление (5.1.6) функционала J на допустимых парах можно записать в следующем виде:t1J ( x, u ) = − R( x(t ), u (t ), t ) dt + r ( x(t1 ) ) − K ( x(t 0 ), t 0 ) .∫(5.1.7)t0Будем рассматривать функцию R( x(t ), u (t ), t ) при каждом фиксированномt . Это будет функция n + m переменных. Рассмотрим минимум этой функциипо всем ( x(t ), u (t ) ) ∈V (t ) .Лемма 5.1.2.
Если при всех t ∈ [t 0 ,t1 ] функция R( x(t ), u (t ), t ) достигаетминимума по ( x(t ), u (t ), t ) ∈ V (t ) на ( xˆ (t ), uˆ (t ) ) , т. е.∀tmin( x (t ), u ( t ) )∈V ( t )R( x(t ), u (t ), t ) = R( xˆ (t ), uˆ (t ), t ) ,(5.1.8)то пара ( xˆ , uˆ ) доставляет минимум интегральному функционалу на множестве V :t1min( x , u )∈V∀tt1∫ R(x(t ), u(t ), t )dt = ∫ R(xˆ(t ), uˆ(t ), t )dt .t0t0Доказательство. Возьмем произвольную(x(t ), u (t ) ) ∈ V (t ) и, согласно (5.1.8),∀t(5.1.9)пару( x, u ) ∈ V .ТогдаR( x(t ), u (t ), t ) ≥ R( xˆ (t ), uˆ (t ), t ) .По свойству определенного интеграла отсюда будем иметьt1t1∫ R(x(t ), u(t ), t )dt ≥ ∫ R(xˆ(t ), uˆ(t ), t )dt .t0(5.1.10)t0Из (5.1.8) следует, что ∀t ( xˆ (t ), uˆ (t ) ) ∈ V (t ) .
Значит, пара ( xˆ , uˆ ) ∈ V , и неравенство (5.1.10) означает, что справедлива формула (5.1.9), так как ( x, u ) – произвольная пара из множества V . Лемма доказана.При каждом t ∈ [t 0 ,t1 ] множество V (t ) – это подмножество пространстваE n × E m . Обозначим через V x (t ) – проекцию этого множества на пространствоEn.85Теорема 5.1.1. (Достаточные условия оптимальности).
Пусть существует функция K ( x, t ) , имеющая непрерывные частные производные, и пусть существует допустимая пара ( xˆ , uˆ ) такая, что:10)20)max( x (t ), u ( t ) )∈V (t )R( x(t ), u (t ), t ) = R( xˆ (t ), uˆ (t ), t ) ∀t ∈ (t 0 , t1 ) ,min r ( x) = r ( xˆ (t1 ) ) .x∈Vx ( t1 )Тогда пара ( xˆ (t ), uˆ (t ) ) является оптимальной для задачи (5.1.1) – (5.1.4).Доказательство. Из условия 10 теоремы будем иметь∀t ∈ (t0 , t1 )min[− R(x(t ), u (t ), t )] = − R(xˆ (t ), uˆ (t ), t ) .( x (t ), u ( t ) )∈V ( t )Тогда по лемме 5.1.2t1t1min (− R( x(t ), u (t ), t )) dt = (− R( xˆ (t ), uˆ (t ), t )) dt .( x , u )∈V∫∫t0t0Отсюда для произвольной допустимой пары ( x, u ) ∈ D получим:t1t1− R( x(t ), u (t ), t ) dt ≥ − R( xˆ (t ), uˆ (t ), t ) dt .∫∫t0(5.1.11)t0Кроме того, если ( x, u ) ∈ D , то ∀tx(t ) ∈ V x (t ) .
Поэтому из условия 2 0 следуетr ( x(t ) ) ≥ r ( xˆ (t1 ) ) .(5.1.12)Из представления функционала (5.1.7) и оценок (5.1.11), (5.1.12) получим:t1J ( x, u ) ≥ − R( xˆ (t ), uˆ (t ), t ) dt + r ( xˆ (t1 ) ) − K ( x(t 0 ), t 0 ) = J ( xˆ , uˆ ) .∫t0Последнее равенство следует из того, что по условию пара ( xˆ , uˆ ) допустима и,следовательно, для нее справедливо представление (5.1.7).Итак, для произвольной допустимой пары ( x, u ) получили неравенствоJ ( x, u ) ≥ J ( xˆ, uˆ ) .
Значит, ( xˆ , uˆ ) – оптимальная пара. Теорема доказана.Определение 5.1.1. Функция K ( x, t ) , имеющая непрерывные частныепроизводные, для которой выполняются условия 10 , 2 0 теоремы 5.5.1, называется функцией Кротова.До сих пор предполагалось, что критерий качества достигает своего минимума на допустимых управлениях. Если же минимум критерия качества недостигается, то в этом случае, как говорилось в п. 2.1, встает задача построенияминимизирующей последовательности.
При практическом решении задачи86(5.1.1), (5.1.4) с использованием тех или иных приближенных методов минимизации мы обычно получаем некоторую последовательность пар ( xk , uk ) , на которой значения функционала J ( x, u ) убывают. При этом возникает вопрос, является ли построенная последовательность минимизирующей. Для проверкиэтого факта может быть использована следующая теорема, обобщающая теорему 5.5.1.Теорема 5.1.2. (Обобщенная теорема о достаточных условиях оптимальности). Пусть существует функция K ( x, t ) , имеющая непрерывные частныепроизводные, и пусть существует последовательность допустимых пар{( xk , uk )}∞k =1 таких, что выполняются условия:t101 )lim R(xk (t ), u k (t ), t ) ) dt =k →∞∫t0t1∫(t0supx ( t ), u ( t ) )∈V ( t )R( x(t ), u (t ), t ) ) dt ,lim r ( xk (t1 ) ) = inf r ( x) .20 )k →∞x∈V x ( t1 )Тогда последовательность {( xk , u k )}k =1 является минимизирующей для функционала J ( x, u ) .Доказательство. Согласно определению минимизирующей последовательности нужно доказать:∞lim J ( xk , u k ) = inf J ( x, u ) = J * , ( x, u ) ∈ D .k →∞(5.1.13)Возьмем произвольную допустимую пару ( x, u ) .
Для этой пары и функции K ( x, t ) из условия теоремы справедливо представление (5.1.7) функционала J ( x, u ) . Аналогично для каждой пары ( xk , uk ) из последовательности и тойже функции K ( x, t ) справедливо представление (5.1.7). Поэтому можно записать:t1J ( x, u ) − J ( xk , uk ) = − R( x(t ), u (t ), t ) dt + r ( x(t1 ) ) − K ( x(t0 ), t0 ) +∫t0t1+ R( xk (t ), uk (t ), t ) ) dt − r ( xk (t1 ) ) + K ( xk (t0 ), t0 ) .∫t0Переходя в этом равенстве к пределу по k → ∞ и используя условия 10 , 2 0 , получим:t1⎡⎤J ( x, u ) − lim J ( xk , uk ) = − ⎢ R( x(t ), u (t ), t ) −supR( x(t ), u (t ), t )⎥ dt +k →∞( x ( t ), u ( t ) )∈V ( t )⎦t0 ⎣∫87+ r ( x(t1 ) ) − inf r ( x) .x∈Vx ( t1 )ОтсюдаJ ( x, u ) − lim J ( xk , uk ) ≥ 0 .K →∞Таким образом, при любых ( x, u ) ∈ D J ( x, u ) ≥ lim J ( xk , uk ) .
Следоваk →∞тельно, это неравенство верно и для нижней грани, т. е.:J * = inf J ( x, u ) ≥ lim J ( xk , uk ) .( x , u )∈Dk →∞(5.1.14)С другой стороны, по свойству нижней грани для любой допустимой пары, в частности для ( xk , uk ) , будем иметьJ ( xk , u k ) ≥ inf J ( x, u ) = J * .( x , u )∈DПерейдем в этом неравенстве к пределу по k → ∞ . Получим:lim J ( xk , uk ) ≥ J * .k →∞(5.1.15)Из (5.1.14), (5.1.15) вытекает равенство (5.1.13). Теорема доказана.5.2.
Решение задачи, линейной по управлениюПрименим изложенную теорию к решению одномерной задачи, линейнойпо управлению:dx= P ( x, t ) + Q( x, t ) u (t ), t ∈ [0, T ] ,dtx(0) = x0 ,x(T ) = x1 ,TJ ( x, u ) =∫ [P0]( x, t ) + Q 0 ( x, t ) u dt → min ,(5.2.1)(5.2.2)(5.2.3)(5.2.4)0где x(t ), u (t ) – скалярные функции, функции P( x, t ), Q( x, t ), P 0 ( x, t ), Q 0 ( x, t ) –дважды непрерывно дифференцируемые, причем Q( x, t ) ≠ 0 .
В данном случаемножество V(t) определяется следующим образом:⎫⎧( x0 , u ), u ∈ R, t = 0⎪⎪V (t ) = ⎨( x, u ), x, u ∈ R, 0 < t < T ⎬ .⎪⎪( x , u ), u ∈ R, t = T⎭⎩ 1За допустимые управления будем принимать кусочно-непрерывные функции.88Функция R ( x, u , t ) , определенная формулой (5.1.5), для данной задачи будет иметь видR ( x, u , t ) =∂K ( x, t )[P( x, t ) + Q( x, t )u ] + ∂K ( x, t ) − P 0 ( x, t ) − Q 0 ( x, t )u .∂x∂t(5.2.5)Найдем функцию Кротова, т.е. такую непрерывно-дифференцируемуюфункцию K ( x, t ) , при которой функция R( x, u , t ) достигает максимума при каждом t ∈ [0, T ] на паре ( xˆ (t ), uˆ (t )) , удовлетворяющей (5.2.1) – (5.2.3).
Это будетозначать, что существует K ( x, t ) и существует допустимая пара ( xˆ , uˆ ) , при которых выполняется условие 10 теоремы 5.1.1. Следовательно, эта пара оптимальна, так как условие 2 0 выполняется тривиально в силу закрепленного правого конца. Будем подбирать функцию K ( x, t ) . Предположим, что K ( x, t ) такова, что R ( x, u , t ) не зависит от u . Согласно (5.2.5) это означает:∂K ( x, t )Q ( x, t ) − Q 0 ( x, t ) = 0 .(5.2.6)∂xНайдем функцию K ( x, t ) , удовлетворяющую уравнению (5.2.6).