В.А. Ильин, В.А. Садовничий, Бл.Х. Сендов - Математический анализ (PDF) (1108882), страница 104
Текст из файла (страница 104)
..., ! ' и (1", (2", ..., Г ", состояпгие из чисел, одновременно не рав;ных нулю, и такие, что Ф((! (г, ... 1е ) )О Ф((1о, !г ) . ° ., ! ) <О. (12 79) Положив й; = ', й; =- ' „(12.80) Ут(г,') +(г,') + „. +(1')* ' ' У(!',) +(1",) + ... +(1„")* :и учитывая, что из определения (12.71) квадратичной формы сра.зу же вытекает, что Ф(й,', й,', ...,Ь')= (!')г ! (!')г ! (!')г ( 1 2 ° ° ° т)~ Ф(Ь1, Ьг, °,Ьк) = „.
„Ф(21. (2 ° - ! ) (11)г + ((2)3 + ... + (!" )* мы получим (в силу ( 1 2.79) ) неравенства ( 1 2. 78), причем из соотношений (12.80) сразу же вытекают равенства (12.77). Зафиксируем две совокупности переменных Ь!', Ьг', ..., й ' и Ь1", йг", -, й ", удовлетворяющие соотношениям (12.77) и (12.78), и докажем, что для любого р)0 найдутся две точки М'(х1', хг', ... ..., х ') н М" (х1", хг", ..., х ") пространства Е'" такие, что 1р(М Мо) =р(М . Мо) =р, причем Х; — Хг Х,.
— Хг о " о ' =й;, ' ' =Ь1 для всех!=-1, 2, ..., пг. Р Р (12.81) В самом деле, положив для любого р>0 и для каждого номера 1 х,'=х12+рй;, х1"=х12+рй,", 6!В $6. Локальный экстремум мы удовлетворим соотношениям (12.81), причем в силу равенств (12.77) будут справедливы равенства р (М, М ) — )/ (х, — хо) + (х — хе) + .. + (х — хо )' = = р У(Ь!)э+ (йт)э+...
+ (й')э = р, р (М, М,) — )/ (х, — хо)'+ (х — хо)'+ ... + (х — х' )" = Теперь уже нетрудно убедиться в том, что для случая, когда второй дифференциал (12.69), (12.70) представляет собой знакопеременную квадратичную форму, функция и=)(М) не имеет экстремума в точке Мо. Записывая для функции и=1(М) разложение в окрестности точки Мо по формуле Тейлора с остаточным членом в форме Пеано и беря зто разложение в указанных выше точках М' и М", мы получим вместо (12.75) следующие два разложения: ~(М') — ~(М,) = — ~)! ~~)!ам (х',— х',.') (хь — хо) + о(р'), (12.82) !=1 ь=! э! э! 7 (М") — 7(М„) = — ~~ ~)~ ам(х,".— хо) (х" — хе)+ о(р'), (12 83» 1=! ь=! справедливые для всех достаточно малых р>0.
Подставляя в зти разложения значения (х — х!о) и (х," — х!о)' из равенств (12.81) и учитывая, что о(р') =р'а(р), где а(р)- 9 при р- О, мы придадим разложениям (12.82) и (12.83) следующий вид: 1(М') — 1(Ме) = ре ~ — ~~>~ ~~ а!Дйд+ а(р)~, !=1 л=! ) (М") — ~(М,) = р' ~ — ), ~ а!ьй;йь+ а (р) ~ . ь=! ь=! Последние два соотношения можно также переписать в виде 1(М') — 1(Ме)=рэ~ — Ф(Ь!, йт,...,Й~)+а(р), (12.82е) 7(М") — 7(Ме)=р ~ — Ф(Ь|, Ьт,...,Ии)+а(р)~. (12.83ьр Гл. 12.
Функцнн нескольких переменных Учитывая соотношения (12.78) и тот факт, что величины нй(йг', йх', ..., й,') >О и Ф(йг", Ья", -, й ") <О не зависят от р, и вспоминая, что р=р(М', Ме) р(М", Мв), мы получим из соотношений (12.82*) и (12.83»), что для достаточно малого р>0 справедливы неравенства 1(М') >)(Мо) н 1(М») <)(Мв), которые и доказывают отсутствие экстремума в точке Ме. Теорема 12.16 полностью доказана. Замечание. Если второй дифференциал два раза дифференцируемой в данной стационарной точке Мо функции и=1(М)- представляет собой в этой точке квазизнакоопределенную квадратичцлую форму, то нельзя сказать ничего определенного о наличии или отсутствии в этой точке локального экстремума.
Так,,например, у каждой нз двух функций и1=х'+уэ и ив= =х»+у' второй дифференциал в стационарной точке Мо(0, 0) тождественно равен нулю (т. е. представляет собой квазизнакоопгределеиную квадратичную форму), но только одна вторая из указанных двух функций имеет в этой точке локальный экстремум. Для решения вопроса о локальном экстремуме для случая, когда второй дифференциал представляет собой квазизнакоопределенную 'квадратичную форму, следует привлечь дифференциалы более .высоких порядков, но это выходит за рамки нашего курса. Пример. Найти точки локального экстремума функции трех Ч1ЕРЕМЕННЫХ '(12.84) и =Ххв+ у'+ ха+ 2у+ 2х, где Х вЂ” вещественное число, отличное от нуля.
ди ди ди Так как — = 2Хх, — = 2у+ 2, — = 22+ 2, то единстнендх ду дг н1ой стационарной точкой является точка Мо(0, — 1, 1). Далее очевидно, что второй дифференциал в этой точке имеет анд с(ви( м, = 2Х (г(х)в+ 2 (с(у)е+ 2 (Ыл)в. При Х>0 второй дифференциал в точке Мо представляет собой положительно определенную квадратичную форму», и потому гфункция (12.84) имеет в точке Мо(0, — 1, — 1) локальный минимум. При 1<0 указанный второй дифференциал представляет собой :знакоперемеиную квадратичную форму *', и потому функция (12.84) не имеет локального экстремума в точке Мо .
3. Случай функции двух переменных. На практике часто встре'чается задача об экстремуме функции двух переменных и=1(х,у). * Ибо этот второй днфференцнал принимает строго положнтельные вначенгня прн дх, с1у н егг, одновременно не равных нулвг. " Ибо прн Л<0 этот второй дифференциал положителен нрн ух=о, ну=!, Юг=1 н отрицателен прн дх-1, ду О, дг О. $6.
Локальный экстремум В этом пункте мы приведем результаты, относящиеся к этому случаю. дни д'и дни Пусть частные производные —, —, — в некоторой точдхэ ' дхду дуэ ке Мо(хо, уо) обозначены символами а1ь ань аы соответственно. Справедливо следующее Утверждение. Пусть функция двух переменных и=1(х, у) один раз дифференцируема в окрестности точки Мо и два раза дифференцируема в самой точке Мо, и пусть Мо является стационарной точкой. Тогда если в точке Ме выполнено условие аыаат — а,тт>0, то функция и=у'(х, у) имеет в точке Мо локальный экстремум (максимум при ам<0 и минимум при аы>0).
Если же в точке Мо а„ат,— а1тэ<0, то функция и=)(х, у) не илгеет в этой точке локального экстремума *. До к аз а т ель с та о. Справедливость первой части утверждения непосредственно вытекает нз теоремы 12.16 и критерия Сильвестра знакоопределенности квадратичной формы, ибо А1— - аы, Ат=аыатт — апт. Докажем вторую часть утверждения.
Итак, пусть в точке Мо спРаведливо неРавенство амата — а т<0. Докажем, что в этом слУ- чае второй дифференциал с(ти в точке Мо представляет собой знакопеременную форму. Рассмотрим сначала случай аыФО. Используя введенные выше обозначения р = У(х — х,) + (у — у,)', Ь,==, Ь,=— а х — "е . У вЂ” Уо Р Р получим следующее выражение для второю дифференциала: 2 2 а~и1м,= Рэ ~1~ ~агьйгйь — — Р'(аыЬ1+ 2атэйьЬ + а,Ьт) =- се=! = — ((амЬ, + атвйэ) + (а„а„— ам) ЬД. Р э т 2 аы Легко, проверить, что при Ь1=1, Ьт=О и при Ь,= Уат +а1 Ь, == " дифференциал йаи'1м, имеет разные знаки, т.
е, Унты+ а'„ является знакопеременной формой, и поэтому согласно теореме 12.!6 функция не имеет в точке Мо локального экстремума. ' Случай аыам — а*1н=б требует дополнительного исследования. ** При этом Р может быть как угодно малой величиной. Условие йР+Ьэт — — 1 выполнено, 1т Знн. 72 б14 Гл. 12. Функции нескольких переменных РассмотРим тепеРь слУчай ам=О. Тогда изУсловиЯанах — а~ох< <О вытекает, что ам~О. Следовательно, так же как и выше, имеем А'и'1и,=р'И,(2а„И,+ а„И,). (12.85) Пусть Й~ФО и величина Йх столь мала (из условия ЙР+Йхз=1 следует, что такой выбор И~ и Йх возможен), что выражение (2амИ,+ажйх) сохраняет знак величины 2амйь Тогда из формулы (12.85) вытекает, что йки1м, имеет разные знаки при Йх>0 я И,<0, т. е.
функция и=1" (х, у) не имеет локального экстремума в точке Мо. Утверждение полностью доказано. 3 а меч а н не. Требование Я(Мо) )0 (соответственно дЧ(Мо) ~ <0) является необходимым условием локального минимума (максимума) в точке Мо дважды дифференцируелгой в этой точке функции 1(М). В с а м о м д е л е, пусть ради определенности 1(М) имеет в точке Мо локальный минимум, но условие йх1(Мо) ~0 не выполнено.
Тогда найдутся Йь Йь ..., Й такие, что д'1(М,) = ~)1~ ф д' (М,) Йой,< О. дх,дхь ~=! ь=! Рассмотрим функциЮ г(1) =1(х,о+1Йь ..., х о+(Й„), заведомо определенную при всех 1, достаточно малых по модулю. Функция с (1) обязана иметь локальный минимум в точке 1=0, чему противоречит условие Рм(0) =д21(МО) <О. ДОПОЛНЕНИЕ 1 Градиентный метод поиска экстремума сильно выпуклой функции В этом дополнении излагается теория широко применяемого на практике градиентного метода поиска экстремума сильно выпуклой функции.
Идея этого метода чрезвычайно проста. Для приближенного отыскания точки минимума функции тн переменных используется тот факт, что градиент этой функции имеет направление, совпадающее с направлением наибольшего возрастания этой функции. Значит, вектор — пгаб((х,) в каждой точке хо= = (х~', хзо, ..., х о) направлен в сторону наибольшего убоявания функции 1(х). Это дает основание ожидать, что если, отправляясь от некоторого нулевого приближения хо=(х~', хзо, ..., хо ) мы построим Й-е приближение хо=(х~ь, хть, ..., х ь) по рекуррентной формуле хкм=хь — а дгаЩхь), 515 Дополнение ! то при достаточно малом положительном а последовательность точек (ха) сойдется к точке минимума функции 1(х).