1612726855-66ce2678ed92310585f0bb1a36623206 (828576), страница 19
Текст из файла (страница 19)
Следовательно, если x* (t ) есть решение задачи (11), топри условии, x (t ) Î L0 , функция, определяемая соотношением (12), должнаиметь минимум в точке нуль. В итоге получаем необходимое условие экстремумаj ¢(0) = dJ ( x* (×), x (×)) = 0 , для всех x (×) Î L0 .(13)Первый этап вывода закончен.Второй этап состоит в преобразовании выражения для первой вариациина пространстве L0 посредством интегрирования по частям. Делают это двумя способами: следуя Лагранжу, когда интегрируют по частям второе слагаемое, и, следуя Дюбуа-Раймону, когда интегрируют первое слагаемое. Преобразование по Лагранжу предполагает дополнительное условие гладкости, аименно, допущение, что функция p(t ) = Lx& x* ( t ) является непрерывно дифференцируемой.
При этом дополнительном предположении проинтегрируем101по частям второе слагаемое в выражении для первой вариации при условии,что x (×) Î L0 . Получим:t1dJ ( x* (×), x (×)) = ò a (t ) x (t ) dt ,(14)t0гдеöæ da (t ) = q(t ) - p& (t ) = ç - Lx& + L x ÷ x* ( t ) .øè dtПриведем теперь преобразование первой вариации по Дюбуа-Раймону.Для этого проинтегрируем по частям первое слагаемое на пространстве L0 :t1t1 æ t1öæ t1öç q(t ) dt ÷x ( t ) = ç q(t ) dt ÷x& (t ) dtqtxtdtd()()=òò çòòòç÷÷t0t0t0 è tøètøи получим, что выражение для первой вариации имеет следующий вид:t1t1dJ ( x* (×), x (×)) = ò b( t ) x& ( t ) dt ,(15)t0гдеt1t1ttb(t ) = ò q(t ) dt + p (t ) = ò Lx x* (t ) dt + Lx& x* ( t ) .Переходим к третьему этапу вывода уравнения Эйлера.Лемма 1 (Лагранжа).
Пусть функция a (t ) непрерывна на отрезке [t0 , t1 ] .Предположим, что для любой непрерывно дифференцируемой функции x (t ) ,обращающейся в нуль на концах отрезка [t0 , t1 ] , выполнено равенствоt1ò a (t ) x(t ) dt = 0 ,t0тогда a(t ) º 0 .Доказательство. В силу непрерывности функции a (t ) достаточно проверить, что a (t ) º 0 во внутренних точках отрезка [t0 , t1 ] .
Предположим, что внекоторой внутренней точке отрезка t значение a (t ) ¹ 0 . Без ограниченияобщности можно считать, что a (t ) > 0 . Выберем e > 0 столь малым, чтобы, содной стороны, отрезок D 0 = [t - e ,t + e ] целиком лежал внутри отрезка[t0 , t1 ] , а с другой стороны, чтобы на этом отрезке функция a (t ) была большенекоторого положительного числа a . Возьмем теперь любую неотрицатель-102ную, но не тождественно равную нулю финитную функцию из C1 ([t0 , t1 ]) сносителем в D 0 . Например, в качестве такой функции можно взятьì(t - t + e ) 2 (t - t - e ) 2 , t Î D0 ,~x ( t ) = x~(t,t , e ) = í0, t Ï D0 .îПрименив теорему о среднем из интегрального исчисления, получим:t1~~~ò a (t ) x (t ) dt = ò a(t ) x (t ) dt ³ a ò x (t ) dt > 0 ,t0D0D0что противоречит условиям леммы. ▄Завершим вывод уравнения Эйлера по Лагранжу.
На первом этапе былоустановлено, что если x* (t ) – решение задачи (1), то выполнено равенство(13). На втором этапе было показано, что на подпространстве L0 первая вариация при дополнительном предположении представима в виде (14). Сопоставив эти два факта с леммой Лагранжа, приходим к выводу, что если x* ( t )есть решение задачи (11), то должно выполняться соотношениеdæ döç - L x& + L x ÷ x* ( t ) = - L x& (t, x* (t ), x&* (t )) + L x (t , x* ( t ), x&* ( t )) = 0 ,dtè dtøназываемое уравнением Эйлера задачи (11) в форме Лагранжа.Отметим,чтопривыводеиспользовалисьвариации~~x (t ,=l ) x* ( t ) + lx (t ,t , e ) экстремали x* ( t ) по направлению x ( t,t , e ) .Для того чтобы вывести то же самое уравнение по Дюбуа-Раймону докажем следующую лемму.Лемма 2 (Дюбуа-Раймона).
Пусть функция b(t ) непрерывна на отрезке[t0 , t1 ] . Предположим, что для любой непрерывной функции v (t ) , в среднемравной нулю, выполнено равенствоt1ò b(t )v(t ) dt = 0 .t0Тогда b(t ) = b0 = const .Доказательство. Напомним, что функция v (t ) называется в среднем равной нулю, еслиt1ò v(t ) dt = 0 .t0Допустим, что заключение леммы неверно. Тогда должны найтись две точкиt 1 и t 2 , лежащие внутри отрезка [t0 , t1 ] , для которых b(t 1 ) ¹ b(t 2 ) , скажем,t 1 < t 2 и b(t 1) > b(t 2 ) . Выберем e > 0 столь малым, чтобы интервалыD1 = [t 1 - e ,t 1 + e ] и D 2 = [t 2 - e ,t 2 + e ]103не пересекались друг с другом, лежали внутри отрезка [t0 , t1 ] , и при этом выполнялось неравенство:b1 = min b(t ) > max b( t ) = b 2 .tÎD1tÎD 2Очевидно, что этого можно добиться.
Рассмотрим теперь любую непрерывную функцию v~(t ) , которая вне множества D1 U D 2 равна нулю, на D1 неотрицательна и не тождественно равна нулю, а на D 2 принимает значения противоположного знака. В качестве примера нужной функции можно взятьì (t - t 1 + e ) 2 ( -t + t 1 + e ) 2 , t Î D1 ,ïv~(t ) = v~(t ,t 1 ,t 2 , e ) = í - (t - t 2 + e ) 2 ( -t + t 2 + e ) 2 , t Î D2 ,ï0,t Î [t0 , t1 ] \ ( D1 U D2 ).îСнова по теореме о среднем получимt1~~~~ò b(t )v (t ) dt = ò b(t )v (t ) dt + ò b(t )v (t ) dt ³( b1 - b 2 ) ò v (t ) dt > 0.D1t0D2D1Противоречие с условием доказывает лемму.
▄Сопоставив соотношения (13) и (15) с леммой Дюбуа-Раймона, получаем,что если x* (t ) является решением задачи (11), то должно выполняться соотношениеt1ò q(t ) dt + p(t ) º c0 ,tили, подробнее,t1ò Lx (t , x* (t ), x&* (t )) dt + Lx& (t , x* ( t ), x&* ( t )) = c0 .tЭто соотношение называют уравнением Эйлера в форме Дюбуа-Раймона.Первое слагаемое в последнем соотношении можно продифференцировать,откуда вытекает, что и второе слагаемое является непрерывно дифференцируемым.Итак, приходим к следующему утверждению.Следствие 1. Пусть в задаче (11) лагранжиан L непрерывно дифференцируем в некоторой области U Ì R 3 такой, что ей принадлежат точки(t , x* (t ), x&* (t )) , t Î [t0 , t1 ] , где x* (×) ÎC 1([t0 , t1 ]) . Для того чтобы функцияx* ( t ) доставляла слабый локальный минимум в задаче (11), необходимо,чтобы было выполнено уравнение Эйлера в форме Лагранжа:d- L x& ( t, x* (t ), x&* (t )) + L x (t , x* (t ), x&* (t )) = 0 .(16)dt104Функции x* ( t ) , вдоль которых выполнено уравнение Эйлера, называютсяэкстремалями.Приведем несколько частных случаев, когда у уравнения Эйлера имеютсяинтегралы.Следствие 2.
Если функция L не зависит от x& , то для экстремальностиx* (t ) необходимо, чтобы было выполнено соотношениеL x ( t , x * ( t )) = 0 , t Î [t0 , t1 ] .Следствие 3. Если функция L не зависит от x , то уравнение Эйлера допускает интеграл импульса:p(t ) = L x& (t , x&* (t )) º p0 = const .Следствие 4. Если функция L не зависит от t , то уравнение Эйлера допускает интеграл энергии:H ( t ) = p(t ) x&* (t ) - L( x* (t ), x&* ( t )) = Lx& ( x* ( t ), x&* (t )) x&* (t ) - L( x* (t ), x&* (t )) º H 0 = const .Следствия 1 и 2 непосредственно вытекают из (16). Для доказательстваdHи, воспользовавшись (16), показать,следствия 3 надо взять производнуюdtчто она равна нулю.105ГЛАВА 6ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯВ середине прошлого века в вариационном исчислении появился новыйкласс экстремальных задач – задачи оптимального управления.
Одно из отличий этих задач от задач классического вариационного исчисления – наличиепеременных, которые не обладают необходимой гладкостью и могут бытьразрывными. Необходимое условие экстремума для задач этого класса имеетсущественно иную форму в сравнении с классическими уравнениями Эйлераи Лагранжа. В качестве обязательного условия в решение задачи оптимального управления входит решение вспомогательной задачи на максимум. Отсюдаи возникло название этого необходимого условия экстремума – принцип максимума.§ 1. Постановка задачи оптимального управленияСодержательно задачу оптимального управления можно сформулироватьследующим образом. В фазовом пространстве R n заданы две точки x0 и x1 ,являющиеся, соответственно, начальным и конечным положением объектауправления.
В качестве объекта управления рассмотрим самолет. А в качестве фазового вектора, определяющего положение самолета в фазовом пространстве, возьмем вектор, компонентами которого являются скорости и координаты, однозначно характеризующие положение самолета в пространствеи времени. У самолета имеются органы управления – «рули». Управляя «рулями», мы управляем движением самолета. Если важно время, за которое самолет переходит из начального положения в конечное, то необходимо найтиуправление, которое реализует этот переход за минимальное время.Естественно под управлением понимать функцию, которая задает положение «рулей» в каждый момент времени t , где t0 £ t £ t1 и x(t0 ) = x0 ,x(t1 ) = x1 .
Будем считать, что значения любого управления принадлежат области управления U , которая является подмножеством пространства R r .Управление u (t ) ÎU , t0 £ t £ t1 , является допустимым, если функция u (t )кусочно-непрерывна, то есть имеет конечное число точек разрыва первогорода. Для определенности предполагаем, что в точке разрыва t существуютконечные пределы u (t + 0) , u (t - 0) и u (t ) = u (t - 0) , а также, что управление непрерывно на концах отрезка t0 , t1 .Далее считаем, что закон движения фазовой точки (самолета или объектауправления) и закон воздействия управления («рулей») записывается в видесистемы дифференциальных уравнений:dxi= f i ( x, u ), i = 1,..., n,dt106или в векторной формеdx= f ( x, u ) ,(1)dtгде функции f i непрерывны по переменным x и u , непрерывно дифференцируемы по переменной x .