Босс В. - Лекции по математике Том 1. Анализ (1092155), страница 15
Текст из файла (страница 15)
Даже А = у'(х), но у'(х) стало вектором (градиен- том), а произведение в (4.16) — скалярным. Для оператора Г(х), действующего в Вв, т.е. у(х) = (у1(х),..., уц(х)), тоже ничего не меняется, внешне. По-прежнему А = Г'(х), но те- перь Гч(х) — это матрица размера и х и, у (х) = которую называют производной Фреше, или матрицей Якоби ы). Плюс к тому, в у'(х) Ьх подразумевается умножение матрицы на вектор. а См. например, Аалмагорав А, Н., фемии С д Элементы теории функций н функционального аназнза. ~й Вообще говоря, могут рассмагрнваться отображения 7 нэ Л" в Лм прн и Е т.
В этом случае матрица Якоби будет иметь размер т х и. 89 4.14. Дифференцирование оператора Короче говоря, интерпретация меняется, форма — прежняя, (4.17) Обратим внимание, что ничего нового(!) — по сравнению ео случаем скалярной функции и переменных — здесь нет. Скаайнное является не информированием с необходимостью последующего обоснования, а констатацией ранее установленных фактов в новых условиях. Действительно, р = 7'(х) в данном случае представляет набор и скалярных функций у1 = Л(х), для каждой из которых по теореме 4.5.2 глу1 = 17Т1(х) . гдх + о(()сьхй). Объединение и таких неравенств в одну формулу (4.17) никакого нового содержания не привносит, за исключением стенографичесиого. Просто для краткости используется матричный язык.
Другое дело, что язык — вещь продуктивная. Таким образом, формула (4.17) не нуждается в обосновании. Единственное, что надо отметить, для справедливости (4.17) необходимо выполнение каких-то дополнительных условий типа непрерывности частных производных (см. теорему 4.5.2). В качестве небольшой выгоды использования матричного языка отметим пока, что умножение матриц Якоби сводит громоздкое дифференцирование сложной функции у = Г(у(х)) в одну строчку Р* = 1~ ' У* вместо п~ равенств ди ч дУ дУь дх, ~ ду, дх,' 4.14.1. ТЕОРЕМа О СРЕДНЕМ. Пусть оператор / непрерывно дифферепциууем, й е некоторой норме (~7'(х)11 < Л па отрезке, соединяющем точки х и у.
Тогда !|7(х) — т(у)Ц < л/)х — У11. (4.18) Доказательство. Разобьем отрезок я = тх+ (! — т)у, соединяющий х и р, точками я; на малые участки (полагая яь — — х, яь —— у). В силу (4.17) 11гзуй1 < Л1)гзхг11 + о(11сзз 11), где сьу, = 7(аью) — т'(я,).
отсюда ясно, что для любого г > 0 можно выбрать настолько мелкое разбиение, что 11ГЗИ < (Л+ еН1гхяЛ. Глава 4. Функции и переменных 90 Но тогда 1 1 4 ! Окончательный вывод дает предельный переход е — з О. Теорема 4.!4.1, конечно, выпадает из предыдущего раца теорем о среднем, но в большинстве случаев эти теоремы ну:кны как раз для оценок типа (4.18). Поэтому потеря свойства У(х) — У(у) = ТЯ(х — у) при переходе к операторам большой беды не представляет.
4.15. Обратные и неявные функции Изучение многих задач часто упирается в принципиальный вопрос локальной обратимости отображения у = б(х) в некоторой окрестности й рассматриваемой точки (а, Ь), а = у(Ь). Другими словами, в вопрос существования такой функции х = у '(у), что Щ '(у))— : у, что еще можно назвать однозначной разрешимостью в й уравнения у = у(х). Без ограничения общности будем считать далее а = Ь = О, чего всегда можно добиться заменой координат и = у — а, р = х — Ь. 4.15.1. Теорема. Пусть оператор б', действующий в Вв, непрерывно дифференцируем в окрестности нуля, б"(0) = 0 и матрица Якоби б'(0) невырождена. Тогда в некоторой окрестности точки 0 оператор у обратим.
Доказательство. Исходному у=/(х) эквивалентно уравнение х = Ф(х, у) с оператором Ф(х, у) = х + [Т (О) Г [у — 1(х)! имеюшим в нуле нулевую производную Фреше, Ф',(о, у) = г — [У'(о) [ 'У'(о) = [о[. Поскольку матрица Ф',(О, у) нулевая (при любом у), а сама производная Ф',(х, у) непрерывна и не зависит от у, то при некотором е ) 0 в шаре [[х[[ < е мо:кно обеспечить такую малость элементов Ф'(х, у), что [[Ф'(х, у)[[ < Л < 1. Поэтому (теорема 4.14.1) в шаре [[х[[ < е оператор Ф(х, у) сжимает с коэффициентом Л при любом у, причем, в силу Ф(0, 0) = 0 и той ие теоремы 4.14.1, Ф(х, 0) переводит шар [[х[[ < е в шар меньшего радиуса Ле.
Это, в совокупности с непрерывностью по у, гарантирует, что при малых у (из некоторого шара [[у[[ < б) оператор Ф(х, у) переводит шар [[х[[ < е в себя. Далее остается применить теорему 4.12.2, которая обеспечивает единственную разрешимость уравнения у = /(х) в окрестности Цх[[ < е, [[у[[ < б). 4 15. Обратные и неявные функции Вопрос. Где в доказательстве использована невырожденность у'(0)? 91 Локальной обратимости Г' в каждой точке В", конечно, недостаточно для сгодгымгой обратимости. Последнюю обеспечивает простое дополнительное условие 1ип !!Г(х)!) = оо.
(4.19) Гпйп Доказательстао соответствующего факта (теорема 9.9.!) приводится далее, но его полезно осознавать качественно. Образ /(В) некоторого шара В можно себе представлять как результат пластической деформации, которая не может привести к образованию складок— иначе в местах изгибов нарушалась бы локальная взаимная однозначность. Плюс к этому, в силу (4.19) отображение г' не может переводить слишком далекие точки в ограниченные заранее области.
Поэтому, какую область Х заранее ни взять, Граница Г"(В) будет лежать вне Х. А поскольку из-за локальной обратимости 7 образы внутренних точек В не могут стать граничными точками г(В), то г(В) будет накрывать Х, что означает разрешимость Г(х) = у при любом р б Х, а значит и при у Е В", в силу произвольности Х. Многократно накрывать Х образ /(В) тоже не может, иначе складки были бы где-то за пределами Х. Пример Рассмотрим функцию у = у(х) с компонентами у~ = Х~ + 21(Х2,..., Хп) 02 = Х2 + 922 (Хз,..., Хп), Уь-~ = хп-2 + 92п-2(хь) Уп — Хп. Матрица Якоби др2 ду22 1 дх, дхп дй'2 0 1 дхп Визуальная интерпретация теоремы 4.15.1 довольно прозрачна. В одномерном случае невырожденность Г'(0) ~ 0 означает монотонность линейной аппроксимации у = /'(0) х, которую в малой окрестности не может нарушить нелинейная добавка о(х).
Монотонность же, в свою очередь, обеспечивает взаимную однозначность функции. При и > 1 о монотонности речь не идет, но она и не ну:кна. Невыролщенность работает иначе, обеспечивая ситуацию общего положения для аппроксимирующих плоскостей, что дает единственную разрешимость линейных уравнений у = /'(0)х при любом у. Нелинейная добавка о(((х(!) слишком мала (в достаточно малой окрестности), чтобы ощутимо изогнуть эти плоскости. 92 Глава 4. Функции п переменных в данном случае имеет нули под диагональю, поэтому вычисление детерминанта по формуле (4.13) совсем просто: дег з'(х) = 1 (ф О).
Следовательно, /'(х) везде невырождена, и у(х) локально обратима при любом х и любых узо. Для глобальной обратимости у = 7(х) необходимо и достаточно выполнение условия (4.!9), которое также имеет место независимо от того, каковы функции уч. (м) Если в некоторой окрестности »1 точки (хо, уо) для которой Ф(хо уо) = О, векторное уравнение '»1 Ф(х,у) =О однозначно разрешимо относительно х, то говорят, что Ф(х, у) = О онредеяяет в й неявную функцию х(у).
4.15.2. Теорема о неявной функции. пуо о Ф(х„у,) = О; йра се е Ф(х, у) ненрерывно ио совокуииости иереыеиных и неирерывио дифференцируеио ио х в некоторой окрестности (хо уо). а производная фреше Ф»(хм уо) невырождеиа. Тогда уравнение Ф (х, у) = О задает в некоторой окрестности точки (хо, уо) неявную функцию х(у), которая иеирерывиа. Доказательство почти не отличается от доказательства предыдущей теоремы. Надо лишь в качестве Ф(х, у) взять Ф(х, у) = х — ! Ф',(хо, уо)) Ф(х, у). 4.16. Оптимизация Допустим, функция и = Т(х) имеет локальный максимум в нуле (Т(х) < Т(0) для ненулевых х из некоторой окрестности точки 0).
Тогда функция одной переменной Т'(О, ..., О, х;, О, ..., О) тоже имеет локальный максимум в нуле. Поэтому, в силу теоремы 3.6.1, всечастные производные ду(0)/дх; обязаны быть нулевыми, и, абстрагируясь от конкретики, можно утверждать следующее. 4.16.1. Если у(х) в точке х = а дифференцируема и принимает локально экстремальное (максимальное или минимальное) значение, то 17,((а) = О. геимеюсяввиду Ф д»хд~-од. 4.16. Оптимизация 93 Рис. 4.6 В двумерном случае линии постоянного уровня функции И = ~(хп хт) в районе локального максимума выглядят примерно как на рис. 4.6. Замкнутые контуры стягиваются к центру, в котором градиент «вынужден» быть направлен сразу во все стороны, что возможно лишь при его обнулении.