Г.И. Архипов, В.А. Садовничий, В.Н. Чубариков - Лекции по математическому анализу (1108924), страница 52
Текст из файла (страница 52)
Теорема 2 доказана. Згз С л е д с т в и е. Теоремы Юнга я Шварца имеют место арн и > 2. Д о и а з а а! е л ь с вт в а. Надо зафиксировать все переменные, кроме х„,х„и применить доказанные теоремы к получившимся функциям. Определение. Функция г(х) называется дважды дифференпируемой в точке, есля все первые производные днфференцнруемы. Вообще, функция 7(х) называется и раз дифференпдруема, есл» все частные проязводные (и' — 1)-го порядка являются дяфференцнруемымн функцнямн. Т е о р е м а 3 (достаточное условие дифференцируемостн). Для того чтобы функцяя г(х) была и раз дяфференцнруема в точке, достаточно, чтобы все частные производные порядка п были непрерывны в этой точке.
Д о к а з а вт е л ь с вт в о проводнтся по индукцяи. С л е д с т в и е (из теоремы Юнга). Если функция у(х) является и раз дяфференцнруемоя, то смешанные частные производные до порядка п не завясят от порядка, в котором производятся дифференцирование. Д о к а з а вт е л ь с в! в о получается иццукцией из теоремы Юнга. у 7. ДИФФЕРЕНЦИАЛЫ ВЫСШИХ ПОРЯДКОВ. ФОРМУЛА ТЕЙЛОРА ' Пусть функция г(х) дважды дифференцируема в точке х = а. Зафиксируем приращение !(х = Ь.
Тогда получим новую функпию у(х) = у(х, И), определяемую выражением у(х) = Фх) = ).Ь,— дУ(х) эгы Это дифференцируемая функция в точке х = а, и ее дифференциал равен ду(х) = ~ — !зх„ ду(а) дх„ т.е. вэ! = г"'г"'ьь„! (~~~*>)/ Положим теперь Ь, = Ьх, = Их,. Тогда получим «( 7'(х) = ~~! ~~а — Мха!ах,. дгУ(х) а=1 а=1 Это выражение называется вторым дифференциалом функции ('(х) в точке й = а..
Аналогично определяется дифференциал аа г(х) порядка й: аа"У(Х) = ~~! ~~а НХа...ИХа. ь " ' " д'У(х) а=1 а=1 Очевидно, это выражение можно символически записать так: аа к а(~у(Х) = ~~! дХ, — у(а), !а=! где для получения развернутого выражения надо формально возвести выражение в скобках в степень как многочлен, 'считая символы Их„~ — как бы независимыми переменными, а затем к числителю д выражения а — х — справа приписать Г(а). Отметим, что айаг(х) при г ) 2, вообще говоря, не обладает свойством инвариантностн, т.е. если, скажем, вместо дх, в выражение для озу(х) подставить первые дифференциалы ау!,($) функций х, = 1оа(2), то получится выражение, которое уже не будет вторым дифференциалом. Действительно, если Ь(г) = у(!7(1)), то И Ь(() — ЕЕ д д ИУ.Ф. +Ед Ы У' дгу ду' г а=1 а =1 а=1 Здесь мы воспользовались тем, что НО ЕСЛИ 27а(Г) — ЛИНЕЙНЫЕ ФУНКЦИИ, т.Е.
2,®=Лц,+Л,,!,+ "+Л„,Г„, то 0~27, = 0 и инвариантность второго дифференциала все же имеет место. Аналогичное утверждение справедливо и для третьего дифференциала и т.д. В силу етого, например, если х = а+ Ге и д(1) = у(а+2е), то Г~(а+Ге)~а о —— йд(2Иа о =д('1(б)(д!) т.е. функция д(а) является 1 раз дифференцируемой. Воспользуемся последним замечанием для вывода формулы Тейлора для функции от а переменных.
327 Т е о р е и 'и 1 (формула Тейлора с остаточным членом в форме Пеано). Пусть фулицня у(х) двфференцируема 1 раз в точке х = а. Тогда при х, стремящемся к а, справедлива следующая формула Дх) = Р(й) + т(х), где 2' 1 + — д~/(а)~„~, т(х) = о((х — а)~). Д и к а з а т е л ь с гв е о. Применим метод математической индукции по параметру 1. При х = 1 утверждение теоремы следует из определения дифференциала функции. Предположим теперь, что 1 > 1. Из условия теоремы вытекает, что функция т(х) в некоторой окрестности У точки х = а имеет все производные до порядка (х — 1) включительно.
Кроме того, в точке а сама функция и все ее частные производные до Й-го порядка включительно равны нулю. Далее, пусть х Е У н Ьх = и — а. Тогда имеем т(х) = т(х) — т(а) = т(а+ Ьх) — т(а) = Р1 + + Р„, где при а = 1,...,п величины Р, определены равенствами Р, = т(а1 '+ Ьхы..., а, + Ьх„а,+ы..., аь)— — т(а!+ ~ахи...,аэ-1+ ~Ххах-1 аю,...,ап) = я(аа + ~Ьхэ) я(аэ) Отсюда, применяя формулу Лагранжа к каждой величине Р„при некоторых с, с условием 0 ( с, ( 1 получим Р, = у' (а, + С,Ьх,)Ьх, = т' (а+ 6,)Ьх,, где 6, = (Ьхм..., Ьх, ь ~,Ьх„ОИ..., 0).
Следовательно, т(х) = т' (а+ 6~)Ьх1+ + т' (а+ 6„)Ьх„, Заметим, что точка а+ 6, Е У для каждого а = 1,...,и. Поэтому к частным производным в правой части последнего равенства можно применить предположение индукции с заменой значения параметра Й на й — 1. Тогда при всех а от 1 до и будем иметь т' (а+ 6,) = о(/х — а/ ). Отсюда следует, что т(х) = о(!х — а!~). Теорема 1 доказана. 328 Т е о р е м а 2 (формула Тейлора с остаточным членом в форме Лагранжа). Пусть функция Дх) имеет (1с+ 1)-й дифференциал для любого х Е О(а,е), где е — некоторое положительное число.
Тогда для любой точки 6 Е О(а,е) существует точка с = а+В(б — а), 0 < 0 < 1, такая, что У(а) = У(а) + ~ и' ((а) 1ь+1 с(-) ,м=х-а ( + ')' лх=ь-а Я о к а з а ш е л ь с т е о. ПУсть с(1) = Да -1.1(б — а)) Тогда по формуле Тейлора для одной переменной с остаточным членом в форме Лагранжа имеем й'(О) й1"1(б) й1"+П(й) й(1) = (О) + П + + , + где 0 < В < 1 — ' некоторая постоянная. Поскольку справедливы равенства подставляя их в предыдущее соотношение, получим утверждение те- оремы. Теорема 2 доказана. Замечание. Подчеркнем разницу в условиях существования формулы Тейлора с остаточными членами в форме Пеано и Лагранжа (теоремы 1 и 2). Она состоит в том, что в первом случае к-кратная дифференцируемость функции Дх) предполагается только в точке х = а, в то время как во втором случае требуется (к+ 1)-кратная дифференцируемость ее в окрестности О(а,е).
Обратим внимание на то, что в случае функции одной переменной Й-кратная дифференцируемость ее в точке х = а обеспечивает (1 — 1)-кратную дифференцируемость в окрестности, в кратном же случае это условие дает существование в этой окрестности только частных производных до (к — 1)-го порядка включительно. Лекция 24 $8. ПРИЛОЖЕНИЕ ФОРМУЛЫ ТЕЙЛОРА. ЛОКАЛЬНЫЙ ЭКСТРЕМУМ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ Определение точка локального экстремума для функции многих переменных дословно совпадает с аналогичным понятием для функции одной переменной, и, вообще, дли функций, определенных в любом метрвческом пространстве, только е-окрестность точки, в которой функция имеет экстремум, определяегся соответствующей метрикой. Определение 1.
Точка а б И" называется точкой строгого локального максимума функции Дх), если существует г-окрестиость 0(а,е) точке а такая, что для любой точки х ф а и й б 0(а,г) имеем неравенство 1(х) < У(а)' если у(х) < У(а), то гочка а — точка нестрогого максимума; если у(х) > ~(а), то точка а — точка строгого минимума; если у(х) > Да), то точка а — точка нестрогого минимума. Строгяе локальные максимумы и минимумы в точке называются локальными экстремумами в точке,.а нестрогие — нестрогими локальными экстремумами в точке. Т е о р е м а 1 (необходимое условие экстремума). Если а— точка локального экстремума (нестрогого) функции Г(х) и существует дифференциал ау(х) ее в этой точке, то для любого приращения Ьх имеем 4(х)( = О, или кгаб У(х)( а — — О.
Д о к а з а щ е л ь с ю е о. Очевидно, достаточно доказать, что при а = 1,...,п выполняются равенства Рассмотрим функцию у(1) = Да+1е,), где е, — направлиющнй век- тор оси Ох,. Тогда ясно, что й(8) имеет в нуле точку локального экстремума, откуда й'(О) = О. Но так как = й'(О) = О, дУ(а) дх, то это доказывает утверждение теоремы 1.
Определение 2. Точка а, в которой градиент функции /(х) обра- щается в О, называется стационарной точкой функции у(х). Заметим, что второй дифференциал азу(х) функции у(х) в точ- ке й = а.6 и» является квадратичной формой от п переменных »х1 ° ° »х». ззе Определение 3. Стационарная точка а функцни Дх) называется регулярной, если в этой точке существует второй дифференциал пади), и он является невырожденной квадратичной формой от переменнык Ихп..., цх„, т.е, определитель матрицы этой квадратичной формы отличен от нуля. Перейдем теперь к выводу достаточного условия экстремума функции.
Т е о р е м а 2 (достаточное условие экстремума). Пусть а есть регулярная стационарная тбчка функции у(х), т.е. дифференциал этой функции в точке а обращается в нуль и существует второй дифференциал в этой точке с невырожденной квадратичной формой от переменных Ихп..., Их„. Тогда 1) если в этой точке цэДх) является положительно определенной квадратичной формой, то в точке й = а функция Дх) имеет локальный минимум; 2) если пэу(х) — отрицательно определена, то а — точка локального максямума; 2) есля я~у(х) является неопределенной формой, то точка а не является точкой локального экстремума.
До ка з а т ел ь с те о. Рассмотрим пункт 1). Обозначим через А матрицу квадратичной формы пзДх) от переменных Ьх„э = 1,...,и, а через Я(а) — множество точек и Е 1к" с условием ~Ьх( = 1. Множество о'(а) ограничено и является замкнутым, так как совпадает со своей границей дЯ(а), и поэтому содержит эту границу. Следовательно, Я(а) — компакт, а потому на множестве Я(а) второй дифференциал как функции от приращения Ьх достигает своего минимума т, т.е. найдется вектор еэ, )еэ) = 1 такой, что азу(х)! ° — — гп > О.
Заметим, что для любого вектора Ьх, Ьх = (Ьх~е, )е) = 1, имеем И'у(х)(, „, = )Ьх)'И'у(х)(, „. По формуле Тейлора с остаточным членом в форме Пеано получим ЬДх) = ау(а) + -а~у(а) + о()Ьх)~) > -)съх(~т(1+ о(1)), 1 2 2 т.е. найдется е > 0, такое, что для любой точки х Е 0(а,е) выполняетси неравенство Ь~(х) > О. Первый пункт рассмотрен.. Пункт 2) рассматривается аналогично. Перейдем к третьему пункту.
В силу неопределенности квадратичной формы п~у(а) получим гп < 0(М, где М = эир й )(а), ти = пЫ а у(а), (ае)п1 )ае)=1 зз1 причем величина М достигается на векторе сы а величина тп — иа векторе ет. Тогда функция у~(1) = 1(а+1е~) при 1 = О имеет локальный максимум, а функция ут(1) = 1(а+1ез) — локальный минимум, а сама функция 1(х) в любой окрестности точки а принимает значения, как большие 1(а), так и меньшие 1(а), т.е.
точка а ие является точкой локального экстремума. Теорема 2 доказана. з 9. НЕЯВНЫЕ ФУНКЦИИ Пусть заданы точка (а,Ь) = (аы...,а„мЬ) б Й", некоторая ее е-окрестиость и множество точек, принадлежащих этой с-окрестиости и удовлетворяющих ураэиеииЮ 1(х, у) = О. Определение 1. Фуикция ~р(х), зависящая от (и — 1)-й переменкой х = (хы..., х„~) и заданная в некоторой 6-окрестцости точки а, называется неявной функжней, соответствующей уравнению 1(х, у) = О, если для любой точки х из этой 6-окрестиости имеет место равенство 1(х, р(х)) = О. Определение 2.