Алексеев В.М., Тихомиров В.М., Фомин С.В. - Оптимальное управление (1050536), страница 50
Текст из файла (страница 50)
), и ( ) = й ( ), ! = 1, Ь = О, ! . Переходим к расшифровке условий (1). При дифференцировании функции У мы будем иметь в виду, что первый и третий члены формулы (б) п. 4.1.2 образуют функционал Больца, производная которого дается формулой (3) того же пункта, а второй член является суперпозицией оператора дифференциальной связи и линейного отображения т!( ) — ~йт(!) ~!(!), и его производная Ь получается поэтому интегрированием формулы (4) п. 4.1.2 по Й (!). А) С т а ц и о н а р н о с т ь п о х ( ).
Дифференцируя .У по х( ), получаем в соответствии с (1а), что при всех Ь( ) бС'(А, К") имеет место равенство г» О=У=.[) ~Ь( И= 1 ХЯ,„(!)Ь(!)а+ г»=а ь + ) ~Ь (!) (Ь(!) — у„(Г) Ь(!))+1,,Ь (1,) +!»Ь (1,). (2) Ь Рассмотрим сначала случай 1, ) г,. Согласно обобщенной лемме Дюбуа-Реймона из (2) следует, что функция т ( ) абсолютно непрерывна на Ь, а ее производная р( )»» =»'( ) непрерывна на б всюду, кроме, быть может, тбчек !» и !о где она имеет пределы слева и справа, и выполняются соотношения (2) — (4) и.
4.1.3, которые ЗЗЗ применительно к нашей ситуации означают, что ~п ФФ ==р(()Чх(1)+Х~т ",~(1) 2~)Л'(() (3) при (чь1„1„р(а)=р(р)=0, где а и (1 — концы Ь, н что р К + О) — р Д вЂ” О) = 1... р (т, + О) — р К вЂ” О) = 1, (4) ,(здесь 7,7; — характеристическая функция, равная 1 на 11„(Д и 0 вне этого отрезка). Из уравнения (3) видно, что р( ) удовлетворяет однородному линейному дифференциальному уравнению на полуинтервалах (а, 1,) и (1„ Я.
Поскольку она обращается в нуль в концах а и этих полуинтервалов, по теореме единственности п. 2.5 3 р (1) = 0 на Л' ~~(„1Д и р (К, — 0) =- р (К, + 0) =- О. Обозначим теперь через р( ) решение уравнения (7а) п. 4.1.1, совпадающее на интервале (~„, 1,) с р(.) (в этом интервале уравнения (7а) п. 4.1.1 и (3) тождественны). Поскольку (7а) линейно, решение р( ) определено на всем Ь и принадлежит С'(Л, К"') (п. 2.5 4).
Для этого решения р(1,)=р((,+0) и р(1,)=р(1„— 0), а так как р(1,— О) =0 н р(1, +0)=0, то (4) превращается в условие (8а) п. 4.1.1. Таким образом, для р( ) условия стационарности (7) и (8) (или (7а) и (8а)) из п. 4.!.1 справедливы. При 1, ~ Г, мы вместо (3) получим уравнение г(рФ = — р Я 'р Я вЂ” ~р, 71 Я Х 7 1;. (1). г=а решение р( ) которого равно нулю на ра, К,) и (К„Я. В этом случае надо обозначить через р( ) то решение уравнения (7а) п.
4.1.1, которое совпадает с ( — 1) р( ) на ((„~,), после чего условия (7), (8) п. 4.1.1 будут выполнены. Наконец, при Г, = (, мы снова можем воспользоваться обобщенной леммой Дюбуа-реймона, 'йо теперь уже т'(г)=р(1)=0 всюду на Ь, кроме, быть может, точки 1, =-(„где должно еще выполняться условие р(С,+0) — рД вЂ” 0) =У„,.+У„,=О. Отсюда Х„,+Е„,= О, Беря 309 в качестве р( ) то решение уравнения (7а) п. 4.1.1, для которого р (1,)=1„„мы снова ~убеждаемся в том, что условия (?), (З) п. 4.1.1 выполнены. Б) Стадион ар ность по и( ).
Дифференцируя .У по и(*) и учитывая, что т( ° ) абсолютно непрерывна, а ее производная р ( ) = т' ( ° ) отлична от нуля лишь в интервале (1„1,), а в этом интервале совпадает с р( ), имеем Так как это равенство имеет место при всех о(.) ~ ~С(Л, К"), то, снова сославшись на единственность в теореме Рисса (п.
2.1.9), мы получаем Х~А.(1) — р(1) р,(1)=О, что совпадает с уравнением (9а), а следовательно, и с условием (9) п.4.1.1. В) Стационарность по 1„. Поскольку .У(х( ), й( ), 1„1,; ...) —.2'(х( ), и( ), 1„1,; ...) = =~дт(1) (х(1) — ~р(1, х(1), й(1)»вЂ” Ь вЂ” ~ р(1) (х(1) — ~р(1, х(1), й(г))) 01=в О, то производные этих двух функций по 1» в точке $=(х(.), й( ), 1„1,) совпадают, а так как имеет место равенство .9', = О, то выполняется и условие (10) п. 4.!.1. 4.1.5. Задача со старшими производными. Уравнение Эйлера в Пуассона.
Снова зафиксируем замкнутый отрезок Л~ К и будем рассматривать пространство В,=С (Л, 1(")хКхв, элементами которого являются тройки $=(х( ° ), 1„1,), где функция х( ): Л вЂ” К' непрерывно днфференцируема до порядка з включительно; 1„1, Е 1п1Л. Говоря о задаче со старшими производными (в классическом вариационном исчислении), будем иметь в виду экстремальную 310 задачу У,($)- ех1г; У,($)~~0, 1=1, ..., т, где у, ($) = 1 1, (1, х (Г),, хьо я) Н+ и +ф,(т„х((„),, х"-"(1,), 1о х(1,),, х"-"(1,)) ~2) в пространстве Е,.
При этом в (1), (2) ),: 'е' й, ф,: Яг — -й, ~'=О, 1... т, 1/ и Ю' — открытые множества в пространствах Йх(й")'+' и ЙХ(й")'Мйх(й")' соответственно, ), и ф, по крайней мере непрерывны. Тройка я=(х( ), 1,. 1,)ЕБ, является допустимой в задаче (1), (2), если К х(1),, х'м(1))~Р, (~Ь и (йи х(1,), ..., х~ -п(1.), 1„х(1,), ..., х"-*>(1,))~йг. Допустимую тройку я = (х ( ), 1м 1,) мы называем 1локальпым) решением задачи (1), (2), если она доставляет функционалу У, локальный экстремум в пространстве Е„т.
е. если существует такое е > О, что для всех допустимых $=(х( ), 1„1,), для которых И вЂ” 61з, < е ее 1 à — Е ! С е, й = О, 1; 1х — х( )!~ю<а и ~ < е, выполняется одно из неравенств: УеД))РОД) в слу. чае минимума и У,($) (У,ф) в случае максимума. Покажем, что задача со старшими производными (1), (2) сводится к „задаче Лагранжа. С этой целью обозначим х=(х„..., х,) Е(йч)', х( )=(х( ), х( ), ...,х"-"( )), и( )=х"'( ), р( )=(р,( ), ..., р,( )). Тогда задача (1), (2) приобретает следующий стандарт- ный вид задачи п.
4.1.1: ~1о(1, х(1), иЯ) "1+Фе(т„х(1,) Г„х(1,))- ех1г, (1') ь ) 1, (1, х (1), и (1)) й( + ф (1„х (1,), 1„х (1,)) ~ ~О, ы 1=1, ..., т, (2') х =хе+„ /=1, ..., з — 1, х,=и (3). 31! с функцией Лагранжа .У(х( ), и(.), 1„1,; р( ), Х, Х,)=) Есй+1, (4) где Е(1, х, х, и)= ~~~, 'ХД(1, х, и)+ 1=о о -! + ~ р~(1)(х,— х,оо)+ро(1)(х,— и) (5) 1=1 и 1((о хо хоо о хо' "о т„хм «о ~ х(*")= = ~~.", Л1фс (Ю„х„х„..., х," ", („х„х„..., хи ").
(6) о=о Перефразируя на этот случай теорему и, 4.1.2, по- лучаем необходимое условие экстремума. Теорема. Лусть функции ),: У вЂ” К, 1=0, 1, ..., т, и их частные производные по х, ..., х<о> не- прерывны в открьотом множестве Уо=К1с(Кч)о+", а функции ф,: %' — К, 1=0, 1, ..., т, непрерывно диф- ференцируемы в открытом множестве Ф'~ 11 х((чо)о х Хйх(йо)о, и пусть х( )ЕСо(11, 11о), 1„11~(и(о та- ковы, что (т, х(г), ..., х'о'(1))с)', тра; ((о, х((о), х" о(1о), (м х(У,), ..., х" "'(1,)) ~97. Если $=(х( ), 1„1,) является локальным решением за. дачи (1), (2), то найдутся множители Лагранжа: Х,) О в задаче на минимум и ~~0 в задаче на максимум, р(.)=-(р,(.), ..., р,(.))~С (Л, (1()-),).=().....„)..), не равные нулю одновременно и такие, что: а) выполнены условия стационарности функции Лаг- ранжа: ПО Х( ) (,Ух(1=0, .Уо(.1= 0) р,(1) =1„(1, х(1), ..., х"'(1)), р,(1)=,Р„-, (1, (1), ", У" (1)) — Р,- (1).
1=2,'..., з, (?) 0 = 1',о> (1, х ~1),, хсо (1)) — р, (1) р,(1„)=( — 1)'1„» и, у=О, 1; 312 2з+т неизвестных. Для их определения мы используем 2з краевых условий (для закрепленных концов) и еще т условий получаем нз условий дополняющей ножесткости и неравенств (1) и (10) (проверьте', что всего из них можно извлечь ровно т равенств). Аналогично можно проверить, что и в общем случае число уравнений, которые дает теорема, совпадает с числом неизвестных.
2 4.2. Принцип максимума Понтрягина 4.2.1. Постановка задачи оптимального управления, Экстремальная задача, которой посвящен этот параграф, по форме почти совпадает с задачей Лагранжа (1) — (3) п. 4.1.1. Здесь мы встретимся с тем же функционалом, той же дифференциальной связью и с теми же ограничениями типа неравенств, что и раньше. Отличие новой задачи состоит в том, что в ее формулировке явно выделено ограничение на управление вида и (1) Е П, где П вЂ некотор топологическое пространства. На первый взгляд это не прибавляет ничего нового и даже выглядит менее общим.
Действительно, в задаче Лагранжа мы имели дело с условием (1, х(1), и(1)) Е 'г', которому должны были удовлетворять допустимые процессы. В частном случае, беря г'=бхй, мы расщепляем это условие на два: (1, х(1)) Еб и и(1) ~ П. Однако разделение переменных на фазовые и управление, и выделение ограничений на управление оказалось весьма знаменательным. Вместе с ним выделилась и новая ветвь в теории экстремальных задач, быстро завоевавшая популярность среди прикладников своими возможностями применительно к практическим задачам и позволившая по-новому взглянуть и на классическую теорию.
Чем же все это было вызвано? В первую очередь необходимостью исследования задач технического содержания. Разделение фазовых переменных и управления и их связь при помощи дифференциального уравнения— обычная модель для процесса, развивающегося по законам природы (дифференциальное уравнение!), но испытывающего воздействие человека, управляющего этим процессом в соответствии со своими целями и стремящегося сделать его в каком-то смысле оптимальным. Теперь ясно, что ограничения на управления вида и(1) ЕП свя- 314 заны с ограниченными возможностями воздействовать иа процесс (скажем, с ограниченностью диапазона поворота рулей управляемого аппарата). Если принять за П открытое множество в К', то ничего нового мы действительно не получим. Однако в технических и иных прикладных задачах множество П ие обязано быть открытым. Зачастую управление может быть даже просто дискретным (включено — выключена).