Л.Э. Эльсгольц - Дифференциальные уравнения и вариационное исчисление (1118006), страница 47
Текст из файла (страница 47)
Линейным функционалом называется функционал Е. (у(х)), уловлетворяющий следующим условкям: Е. (су (х)] = сЕ. (у (х)), где с — произвольная постоянная и Е (у,(х) + У2(х)) = = Е (У, (х)) + Е (Ут (х)) г33 МЕТОД ВАРИАЦИИ В ЗАДАЧАХ С НВПОДВИЖНЫМИ ГРАНИЦАМИ гГЛ. 6 б.
Если приращение функшю- нала Л о = о [у (х) + Ьу] — О [у (х)1 Итак, вариация функционала — зело главная, линейная но он!ношению и Ьу, масть лрираи(ения функционали. При исследовании функционалов вариация и~рвет такую же роль, какую играет дифференциал при исследовании функций. Можно дать и лругое, почти зквивалентное, опрелеление лифференциала функции и вариации функционала. Рассмотрим значение функции т (х+аЛх) при фиксированном х и Лх н изменяющихся значениях параметра и. При а = [ получим приращенное значение функции т (х + Лх), при а = О получим исходное зна !ение функции ~(х).
Нетрудно проверить, что прои!!Водная от т(х+цЛх) по а при а=О равна дифференциалу функции ):(х) в точке х Действительно, по правилу дифференцирования сложной функции д — у (х + ц Лх) [„о = (' ( х + а Лх) Лх [ =о = у' (х) Лх = дт' (х). Точно так же для функции нескольких переменных У(Х1 Хг ' '' Хо) можно получить лифференциал путем лифференцировання г'(х1+аЛхн хг+ аЛхо, ..., хо+ аЛхв) по а, полагая аатем а= О. Действительно, ге(х1'+РЛх1, хо+ аЛхг...
х +аЛхо)[о=о = 7 Лх =лгт', %ч др !=1 И для функционалов вила о [у(х)] или более сложных, зависящих о! нескольких неизвестных функций или от функций нескольких 5. Если приращение фуннцни Л г = у'(х+ Лх) — г" (х) моокет быть представлено в виде Лг'=А(х)ЛХ+[)(х, Лх) Лх, 1'де А (х) не зависит от Лх, а Р (х, Лх) — ь О при Лх — ь О, то функция называется дифференцируемой, а линейная по отношенню к Лх часть прирзщенит! — А(х)Лх называется дифференциалом функции н обозначается с(т'.
Разделив на Лх и переходя к пределу при Лх -+ О, получим, что А(х) = = /'(х), и, слеловательно, дт = Г'(х)Лх. можно прелставить в виде Ло= О [у(х), Ьу]+ + [У(у(х), Ьу) п1ах [Ьу [, где б [у (х), Ьу[ — линейный по огношенню к Ьу функцнопзл, !пах] Ьу [ — максимальное значение [Ьу[ и [)(у(х), Ьу)-1.0 при шах[бу[ — ьО, то линейная по отношению к Ьу часть приращения функционала, т. е. !.
[у (х), Ьу], называется вариацией фунгецио. нала и обозначается Ьо. 289 вкяилция и ее своиствл переменных, можно определить вариацию как производную от функционала о [у(х)-[-ибу] по а при а=О. Действительно, если функционал имеет вариацию в смысле главной линейной части приращения, то его приращение имеет вид Ьо = о [у (х) + а бу] — о ! у (х)] = б (у.
ц бу) + [) (у, а бу) ! а ! щах [ бу ]. Производная от о[у+ а бу! по а прн и=О равна йи . ло й(у,абу)+!)[у(х), аду]!и[гпах[ду! ло.эо аи очно и ц-ьо а ь'(у,иду) . 11[у(х), абу]!а!тгх]еу! а.ьо и о ьо а так как в силу линейности (. (у, а бу) = пА (у, бу), а 8 [у (х), аду! ! и ! гоах ! Ьу ! !ип У ' У! ' У =1нпй[у(х),абу]щах [бу[=0, о-ьо а цьо 6. Лифференциал функции 7 (х) равен д — „7'(х+ аЛх)]о=о. 6. Вариация функционала о[у(х)! равна д д о[У(л)+абу1]ц=о.
Оиределение. Функционал о1у(х)] достигает на кривой у=уо(х) максимума, если значения функционала о[у(х)! на любой близкой к у=уз(х) кривой не больше, чем о]уо(х)], то есть Ли=о[у(х)1 — о[уз(х)] < О. Вели Ло ~ О, причем Ло= 0 только нри у (х) = уо(х), то говорят, что на кривойу = у,(х) достигается строгий максиму.н. Лналогнчно определяется кривая у = уо(х), на которой реализуется лгинимум. В этом случае Ло)~О для всех кривых, близких к кривой у=уо(х).
7. Теорема. Если функционал о]у(х)], амеюьций вариацию, достигает максимума 7. Теорзма. Если дифференцируемая функция 7(х) достигает максимума или 19 л, з, злелгольц потому что [)[у(х), абу) — ьО при а-ьО. Итак, если существует вариация в смысле главной линейной части приращения функционала, то существует н вариация в смысле производной по параметру при начальном значении параметра, и оба эти определения эквивалентны, Второе определение вариации несколько шире первого, так как существуют примеры функционалов, из приращения которых нельзя выделить главной линейной части, но вариация в смысле второго определения существует. ййб мвтод влэнапнн в задачах с нвподвижнымн гилннплмн 1гл.ь или минимума при у=уз(х). гдв у(х) — внутренняя точка области определения функционала, та при у=уз(х), бо=О.
минимума ва внутреннвд льачке х=х, области определения функции, та в втой точ- ке ') а может принимать в окрестности точки а О как положительные, так и отрицательные значения, так' как уь(х) †внутренн точка области определенна функционала Доказательство теоремы д л я функционалов. Г[ри фиксированных уэ(х) и Ьу о [уз(х) + абу[ = ф(а) является функцией а, которая при а=О, по предположению, достигает максимума или минимума, следовательно, проиаводная ц~'(0) = 0*), илн — о [у,(х) + а Ьу[ ! = О, да О 1а=з т. е. Ьо= О.
Итак, на кривых, на которых достигается экстремум функционала, его вариация равна нулю. Г[онятие экстремума функционала нуждается в уточнении. Говоря о максимуме илн минимуме, точнее, об относительном максимуме или минимуме, мы пьянели в виду наибольшее или наименьшее значение функционала только по отношению к значениям функционала на близких кривых. Но, как было указано выше, близость кривых может быть понимаема различно, поэтому в определении максимума или минимума надо указывать, какого порядка близость имеется в виду. Если функционал о[у(х)[ достигает на кривой у=уз(х) максимума или минимума по отношению ко всем кривым, для которых модуль разности у(х) — у,(х) мал, т. е. по отношению к кривым, близким к у=уз(х) в смысле близости нулевого порядка, то максимум илн минимум называется сильным.
Если же функционал о [у(х)[ достигает на кривой у = уе(х) максимул|а или минимума лишь по отношению к кривым у=у(х), близким к у=уз(х) в смысле близости первого порядка, т. е. по отношению 'к кривым, близким к у=уз(х) не только по ординатам, но и по направлениям касательных, то максимум или минимум называется слабым. Очевидно, что если на кривой у =уэ(х) достигается сильный максимум (илн минимум), то подавно достигается и слабый. так как если кривая близка к у=уз(х) в смысле близости первого порядка.
то она близка и в смысле близости нулевого порядка. Однако возможно, что на кривой у = уз(х) достигается слабый максимум (минимум) и в то же время не достигается сильный максимум (минимум), т. е. среди кривых у=у(х), близких к у=у,(х) как по ординатам, так и по направлению касательных, может не быть таких, для ко- ВАРИАция н вв свойства йп торых о[у(х)] ) о]уе(х)] (в случае минимума о]у(х)] ч. о[уз(х)]). а среди кривых у=у(х), близких только по ординатам, но.уже не близких по направлению касательных, могут найтись и такие, для которых о[у(х)] > о[уз(х)] (в случае минимума о[у(х)) ( о]у„(х)]). Различие между сильным и слабым экстремумом не будет иметь существенного значения при выводе основного необходимого условия экстремума, но оно будет весьма существенно в главе 8 при изучении достаточных условий экстремума.
Заметим еще, что если на кривой у = ув(х) достигается экстремум, д ! д то нетолько — о[ус(х)+абу) ~ =О, но и — о[у(х, а)]~ =О. да е где у(х, а) — любое семейство допустимых кривых, причем при а=О и при а=! функция у(х, а) должна соответственно превращаться в у„(х) и у,(х)+Ьу. Действительно, о]у(х, а)] является функцией а, так как задание аопределяет кривую семейства у=у(х, а), а значит, определяет и значение функционала о [у(х, а)]. Эта функция, по предположению, достигает экстремума при а=О, следовательно, производная втой функции обращается в нуль при а=Оч). д Итак, — о ]у(х, а)[! = О, однако эта производная, вообще да 1а 0 говоря, уже не будет совпадать с вариацией функционала, но будет, как показано выше, обращаться в нуль' одновременно с Ьо на кривых, реализующих экстремум функционала. Все определения этого параграфа и основная теорема (стр.
289) почти без всякого изменения переносятся на функционалы, зависящие от нескольких неизвестных функций о[у,(х), уя(х), ..., у„(х)] или зависящие от одной или нескольких функций многих переменных о[я(хп х...., х„)], Ф ]х1 (хо хт, ..., хл), яэ (хп хэ..., хл)..., ха (хи хж, Хя)] Например, вариация Ьп функционала о[я(х. у)] может быть определена или как главная линейная по отношению к Ьг часть приращения Ьо == о [з (х, у) + Ьг] — о [г (х, у)], или как производная по параметру при начальном значении ") Предполагается, что а может лринимать любые близкие к а= О зна- да [э (х, а)] ~ чения и ' ~ существует. иа ' ~,=ч 19' — но ~г (х, у) + абг1( да н=е причем если при г = г (х, у) функционал о достигает экстремума, то при г=г(х, у) вариация бо=О, так как о(г(х, у)+абг) является функцией а, которая при а = О, по предположению, достигает экстремума и. следовательно, производная от этой функции д по а при а=О обращается в нуль, —.-о(г(х, у)+абг] = О дн ~н=е или бо=О.
Э 2. Уравнение Эйлера Исследуем на экстремум функционал к, о (у(х)1 = ~ г (х, у(х), у'(х))лкх. к. (6.1) причем граничные точки допустимых кривых аакреплены: у(хн) =уз и у(х,) = у, (рис. 6.3). Функцию В'(х, у, у') будем считать трижды лифференцируемой. Мы уже знаем, что необходимым условием экстремума является обращение в нуль вариации функционала. Покажем теперь, как применяется эта основная теорема к 9 рассматриваемому функционалу, В причем мы еще раз повторим предыдущее рассуждение применительл но к функционалу (6.1).
Предположим, что экстремум достигается на дважды дифференцируемой кривой у = у(х) (требуя лишь существования производных первого О гк Хк порядка у допустимых кривых, можно иным методом доказать, что у кривой, реализующей экстреРнс. 6.3. мум, существует и вторая производная). Возьмем какую-нибудь близкую к у = у(х) допустимую кривую у = у(х) и включим кривые у = у (х) и у = у (х) в однопараметрическое семейство кривых у(х, а) = у(х)+а(у(х) — у(х)); прн а=О получим кривую у=у(х), при а=1 имеем у=у(х) 292 метод вавилции в задачах о неподвижными геаницлми (гл.
а параметра уяаэнениг эплеРА % 21 (рис. 6.4). Как мы уже знаем, разность у(х) — у(х) называется вариацией функции у(х) н обозначается Ьу. Вариация Ьу в вариационных задачах играет роль, аналогичную роли приращения независимого переменного Ьх з задачах на исследование экстремумов функций у(х). Вариация функции Ьу=у(х) †у (х) является функцией х. Эту функцию можно дифференцировать один нли несколько раз, причем (Ьу)' = у'(х) — у'(х) =Ьу', г.
е. производная вариации равна вариации производной, и аналогично (Ьу)л = у" (х) — у" (х) = Ьу", (Ьу)пн = уыч (х) — урч (х) = Ьу<а>. Итак, рассмотрим семейство у=у(х, а), где у(х, а)=у(х)+ + абу, содержащее при а=О кривую, нз которой достигается экстремум, а при а=1 — некоторую близкую допустимую кри- У вую — так нааызаемую кривую 'ч' сравнения. .Ф' Если рассматривать значения функционала л к, о(у(х)) = / Е (х, у, у')пх ж 2' только на кривых семейства О у = у (х, а).
то функционал превращается в функцию а: Рис. 6.4. о ! у (х, а)1 = р (а), так как значение параметра а определяет кривую семейства у = у(х, а) и тем самым определяет и значение функционала о(у(х, а)). Эта функция <р(а) достигает своего экстремума прн а=О, так как при а = О получаем у = у(х), и функционал, по предположению, достигает экстремума по сравнению с любой близкой аопустимой кривой н, в частности, по отношению к блиаким кривым семейства у = у (х.
а). Необходимым условием экстремума функции ф (а) при а= О, как известно, является обращение в нуль ее производной при а = О: ф'(О) =О. Так как к, ~р(а) = ~ Р(х, у(х, а), у„'(х, а)) с(х, 20а метод вявилцин в задачах с неподвижными геаиицами [гл.а то ~р'(а) = / '[Ру — у(х, а)+ Р'„~, у'(х, а)[с[х. где — Р (х, у (х, а), у'(х, а)), †, Р (х, у(х, а), у'(х, а)), ду' или, так как ~,„ у (~. а)= д [у (х) + абу[ = бу д д — у'(х, а)=,д [у'(х)+абу'[=Ьу', получим к, гр'(а)= ~ [Р„(х, у(х, а), у'(х, а))бу+ «О + Р'„(х, у(х, а), у'(х, а))бу'[ах; ~р'(0)= ~ [Рт(х, у(х), у'(х))Ьу+ Рг (х, у(х), у'(х))бу'[Пх.