XV Ванько В.И., Ермошина О.В., Кувыркин Г.Н. Вариационное исчисление и оптимальное управление (1081425), страница 18
Текст из файла (страница 18)
Пример 5.4. Исследуем на экстремум функционал *См., например: Гельфанд И.М., Фомин С.В. 5.4. Сильный экстремум определенный на множестве функций д Е С'[О!Ь]! удовлетворяющих краевым условиям д(0) = О, д(Ь) = да (Ь > О, да > 0). Уран!!ение Эйлера исследуемого функционала,7~д) имеет вид (3(д')2) = О, или д'дн = О. Оно распадается на два дифференциальных уравнения д' = 0 и д'! = О, которые несложно решить. Общее решение уравнения можно записать в виде д = С!х+ Сз. Выбрав среди экстремалей те, которые удовлетворяют левому краевому условию д(0) = О, получим однопараметрическое семейство д(х,С) = Сх функций, среди которых единственная функция д*(х) = (дь/Ь)х удовлетворяет и правому краевому условию. Выясним., является ли функция д*(х) точкой экстремума для функционала 1~!А. Отметим, что эта функция вклк!чается в поле экстремалей, так как через любук> точку (х! д) из первого квадранта плоскости проходит единственная экстремаль семейства д = Сх.
В качестве области Р! в которой задано поле экстремалсй, можно взять область ~(х! д): х > О, д > О). Через точку (х! д) из области Р проходит экстремаль д(х) = = (д/х)х, для которой д (хь) = д/х. Значит, функция наклона поля эксгпремаяей имеет вид р(х,д) = д/х. Составим функцию Вейерштрасса! учитывая вид ин!пееранта /(х,д,д') = (д')з: Е(хь,д,р,!/) = Ях,д,д') — /~х,д,р) — (д' — р)М, Ьх,д,р) = ( !)3, 3 ( ! )(З э) (, ! )(( !)2+ ! + 2 О 2) = (д' — р)з(д'+ 2р).
Первый сомножитель (у~ — р)Я в функции Вейсрштрасса на знак не влияет, так что нужно проверить на знак функцию !р(х,д,у') = д'+ 2р(х,д) = д'+ 2д/х,. На исследуемой функции д = (дь/Ь)х имеем !р(х. д, д') = (дь/Ь) + 2(дь/Ь) > О. Это же неравенство сохраняется и в ближайшей окрестности графика этой функции, например, при д > 0 и д' > О. Значит, функция д'(х) доставляет функционалу слабый экстремум.
В то же время видно, что, каковы бы ни были х и д, выбором переменного 144 5. ДОстАтОчные УслОВиЯ экстРемУА1А р' функции Вейерштрасса можно придать как положительное, так и отрицательное значение. Следовательно, функция у*(х) не является точкой сильного экстремума функционала /[у].
Приведенный пример достаточно прост, и исследование функции Вейерштрасса не потребовало особых усилий. В более сложных случаях задача исследования функции Вейерштрасса может оказаться не такой элементарной. Тогда могут быть полезны другие, более простые достаточные условия, из которых вытекает знакопостоянство функции Вейерштрасса. Если функция ~(х,у,р') дважды непрерывно дифференцируема, то к ней можно применить формулу Тейлора Дх, у., у') = ~(х, д,р) + (у' — р) ~„'~ (х, у.,р) + ~," „(х, у, д), 2 где е =р+и(у' — р), О ( и( 1.
Значит, Ь' — р)я „ Е[х,р.р,й = 1„''„(х,р,Ч), 2 и знак функции Вейерштрасса определяется величиной ~„",„, в некоторой точке (х,у,д). Таким образом, если ~'„',„, > О всюду в области определения функции Т', то функция Вейерштрасса сохраняет знак и любая экстремаль, удовлетворяющая краевым условиям, является точкой сильного экстремума функционала. В более сложных случаях необходимо проверять знак /'„",~, в таких точках (х, у, у'), для которых точка (х, у) близка к графику исследуемой функции у*(х), а р' произвольно. Если при указанных условиях Т"",, сохраняет знак, то у" (х) является точкой сильного экстремума. Наконец, если Я„, сохраняет знак в точках (х, у, .у'), близких к (х, у*(х), (у')'(х)), т.е.
для функций, близких к р" (х) по норме ]] ]]см то у'(х) будет точкой слабого экстремума функционала. Условие ~у~у~(х,р.,р) )О или ~;,~у~(х,я,р) (О 145 5.4. Сильный экетРЕмум Пример 5.5. Исследуем на экстремум функционал определенный на множестве функций у(х) Е С' ~0, Ь), удоаяетворяющих краевым условиям у(0) = О, у(э) = уь (э, уь > 0). Рассматриваемый функционал отличается лишь постоянным множителем от функционала задачи о брахисгнохроне (см. пример 1.2). Его экстремали параметрически задаются в следующем виде (см. пример 2.7): < х = С1 (Π— а1п 0), у = С1(1 — сов О), (5.19) причем, каковы бы ни были значения б > 0 и уь > О, через точку (6., уь) проходит единственная экстремаль (см.
пример 2.7). Это значит, что в области О=1(х, у): х > О, у > О) задано поле экстремалей, а любая зкстремаль рассматриваемого семейства оказывается включенной в это поле. Однако записать функцию наклона аналитическим выражением не удается, так как нужно решать трансцендентное уравнение.
Но можно проверить усиленное условие Лежандра. Имеем Таким образом, единственная функция, которая параметриче- ски задается системой (5.19) и удовлетворяет поставленным краевым условиям, доставляет сильный минимум рассматрива- емому функционалу. знакопостоянства производной ~,",„, называют усиленным условием Леэсандра. 146 а достйтичнык,уСлОвия ЭкстркмЛ~А Вопросы и задачи 5.1. Проверьте, выполнено ли условие .Якоби для экстремали функционала проходящей через точки А(0, 0) и В(Ь, 0). Предполагается, что Ь~ ( +-,') . 5.2. Покажите, что для функционала ,7(д1 = 1(х,д )((х, в где т дважды непрерывно дифференцируема; т,"... ~ 0; д(х) Е Е С([а,Ь), каждая экстрсмаль может быть включена в поле экстремалей. 5.3. Для следук>щих функционалов проверьте, включены ли экстремали, удовлетворяющие заданным краевым условиям, в поле зкстремалей; б) (д')з(Кх, д10) = О, д(Ь) = с (с > 0); а в) 6(д) 1+(д')з(Ех., д(0) =д„, .д(Ь) =д(, (Ь(у) >0); о Вопросы и заду)пи 147 1 ) 1(о(у')' — (у)') у, 'у(о) =о, у(р) = .
( о). О 5.4. Докажите, что для функционала Орп('4 Р(р)= 1 (уя-(у')1)у О при краевых условиях у10) = О, д~ — ~ = О экстремаль у1х) = О /5п'~ не является точкой экстремума. 5.5. Исследуйте на экстремум следующие функционалы, определенные на множестве непрерывно дифференцируемых функций, удовлетворяющих заданным краевым условиям: )У((у)',-туу — ~тур)у*, По)=ору( )=о( ро); а 2 б) у'11+х~р')дт, у11) = 3, у(2) = 5; 1 тт,) 4 ° ) ( (ту'- (У)'-:-оу)уе, у(о) = -т, у( )4) = о; О 1 ) 1 ((у)р р ус рту ") у, р(о) = т(ру р(т) = (т(3) 1 О т(Р4 д) ) (ур — (у') +бр ~ 2 )р „у(о) =о, у( )р) =1; О ) 1(р' -(у")' — р) р*, р(о) = , у(т) = О 148 а.
ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУ31А 5.6. Исследуйте на экстремум функционал в зависимости от значения параметра е. 5.7. Покажите, что в вариационной задаче экстремаль у(т) = 0 доставляет слабый минимум функционалу Л[у1. Доставляет ли эта экстремаль сильный минимум функционалу 1~у~? 6. ВАРИАЦИОННЫЕ МЕТОДЫ В ОПТИМАЛЬНОМ УПРАВЛЕНИИ Аппарат классического вариационного исчисления при всей своей фундаментальности не позволяет найти решения целого ряда вариационных задач, важных в различных отраслях техники. Вторая часть книги посвящена методам решения вариационных задач неклассического типа.
Начнем с описания основных классов таких задач, которые будем называть задачами оптимальноео управления. 6.1. Постановка задачи оптимального управления 1. Управляемый обч ент (управляемая система) это некоторая машина, модель, прибор, процесс, конструкция и т.п., снабженная „рулями". Манипулируя „рулями" (в допустимых пределах, т.е. с учетом имеющихся ресурсов управления), мы тем самым определяем поведение, движение объекта, управляем им. Слово „руль" взято в кавычки., поскольку под,, рулем" понимается нс обязательно устройство, соответствующее общепринятому значению этого слова, а любой фактор, дающий нам возможность влиять на движение объекта.
Так у автомобиля два „руля": „баранка" и акселератор, а ресурсы управления характеризуются максимально возможным углом поворота колес и мощностью двигателя. Если в качестве управляемого объекта рассматривать технологический процесс проведения химической реакции, то роль „рулей" могут играть состав ингредиентов, количоство катализатора, поддерживаемая температура и другие факторы, от которых зависит течение реакции.
152 6. ВЛРИАЦИОННЫЕ МЕТОДЫ Будем считать, что управляемый объект нам дан, так что известны и ресурсы управления, и закон движения, устанавливающий для выбранного правила манипулирования .,рулями" эволюцию состояния объекта. Речь идет только об объектах, движение которых (при заданых начальных условиях) вполне точно и однозначно определяется выбором положения „рулей" в каждый момент времени.
Такие объекты называют детперминированными, при их изучении никакие „случайности" во внимание не принимаются. Следует учитывать, что часто наши возможности управлять объектом лимитируются не только ресурсами управления, но и тем, что в процессе движения об~сит нс должен попадать в состояние, физически недоступное или недопустимое с точки зрения конкретных условий эксплутации объекта. Например, при работе электрической системы нельзя допускать перегрева мотора; осуществляя маневр судна, необходимо учитывать пшрину фарватера и т.д.
Подчеркнем, что такого рода ограничения на состояние объекта совершенно не зависят от свойств самого объекта и являются дополнительными, диктуются условиями конкретной задачи. Имея дело с управляемым объектом, мы всегда стремимся так манипулировать „рулями", чтобы, исходя из определенного начального состояния, достичь некоторого желаемого состояния, т.е.
роализовать стоящук> перед нами цель управления. Если, скажем, речь идет о запуске спутника, то нужно рассчитать режим работы двигателей ракеты-носителя, который обеспечит доставку спутника на желаемую орбиту. Как начальное состояние объекта, так и цель управления зависят от рассматриваемой прикладной задачи. Как правило, существует бесконечное число способов управлять объектом так., чтобы добиться желаемого результата.
В связи с этим и возникает задача не просто как-то реализовать цель управления, а найти тот способ управления, который в определенном смысле является наилучшим, оптимальным. Конечно, для этого мы должны располагать критерием на- 153 6. К Поссаяовкл задачи оптимального управления чеслпва, позволяющим судить о том, какой способ управления лучше, а какой хуже. Этот критерий также свой в каждой конкретной задаче.
Так, при управлении электроприводом естественно стараться обеспечить отработку искомых величин за минимальное время, расчет графика полета самолета из одного пункта в другой преследует достижение наименьшей себестоимости и т.д. Такова в общих чертах задача оптимаяьноео управления. Перейдем к ее математическому описанию. 2. Будем рассматривать объект, состояние которого в фиксированный момент времени описывается набором из и чисел хм ..., х„фазовых координат (или фазовых переменных ~ЧШ)). Эти числа удобно считать компонентами фазового т вектора 1,фазовоео состояния) х = (хм ..., х„) . Таким образом, состояние объекта в каждый момент времени можно изобразить точкой (элементом) и-мерного арифметического пространства К", называемого ф зовым пространством объекта ~Ъ'ПЦ.
Например, в случае механического объекта с конечным числом степеней свободы фазовый вектор х составляют из обобщенных координат вм ..., аь и обобщенных импульсов рм ", ры Движение объекта проявляется в том, что его фазовые координаты меняются с течением времени 1, т.е. фазовый вектор является вектор-функцией независимого переменного 1. При движении объекта фазовая (изображающая) точка х(ь) = (х1(1), ..., х„(ь) ) описывает в фазовом пространстве кривую фазовую траекторию (ф зовую кривую). Обычно фазовые координаты объекта являются „инерционными" переменными.