А.Н. Колмогоров, С.В. Фомин - Элементы теории функции и функционального анализа (1134953), страница 99
Текст из файла (страница 99)
д. Мы здесь ограничимся тем, что приведем лишь один результат. Его доказательство основано на применении теоремы 1!юстерника, играющей важную роль во многих вопросах теории экстремальных задач. Пусть Х и У вЂ” - банаховы пространства, Š— функция на Х и Ф; Х вЂ” ~ 1' — отображение пространства Х в У. Допустим, что ищется минимум функции Г(х) на множестве, определяемом условием Ф(х) = О.
Теорема. Пусть функция Е и отображение Ф непрерывнодифференпируемы в некоторой окрестности гочки хо, удовлетворяющей уюловию Ф(хо) = О, и пусть образ пространства Х прн отображении Ф'(хо): Х -> У залзкиут. Если в точке хо достигается локальный минимум функции К(х) на множестве (х; Ф(х) = О), то существуют число Ло и линейный функционал у', определенный на У, нс равные пулю одновременно и такие, что ЛоГ(хо) + [Ф'(ха)]" у' = О. (13) До к аз а тел ь с т в о. Введем обозначение А = Ф'(хо)Х. По условию Т, — замкнутое подпространство. Если Ь ф У, то, согласно следствию 3 теоремы Хана-Банаха (п. 3 Ц 1 гл.
1Ч) найдется ненулевой функционал у„" й У", равный нулю на Ь. Для него при всех х Е Х имеем ([Ф (хо)]*уо,х) = (уо Ф (хо)х) = О, так как Ф'(хо)х е Ь. Поэтому, приняв уо за у' и положив Ло = О, получаем (13). Рассмотрим теперь случай, когда Ф(хо)Х = У. Применив к отоб- ражению Ф теорему Дюстерника, получаем, что для каждого Л Е Х, удовлетворяющего условию Ф'(хо)Л = О, прн всех достаточно малых ! существуег такой элемент х(1, Л) = хо + !Л + г(г), что Ф(х(1,Л)) = О, 1 '[]г(1)[[ -ь О при ! -+ О.
Рассмотрим функцию у(1) = Г(х(1, Л)). Ее производная в нуле ф = Е'(хо)Л Гл. Х. Элеиенты гтифференииалинага иениеленил должна быть равна нулю. Действительно, если Р'(хо) Ь = с ~ О, то знак разности Н(х(1, Ь)) — Е(хо) = с1+ Е'(хо)г($) + о(г) определяется членом с1 и, следовательно, меняется при замене Г на -1, а при этом в точке хо не может быть экстремума. Итак, мы получаем, что Г'(ха)Ь = О для всех Ь таких, что Ь б КегФ'(ха). Иначе говоря, г'(хо) есть элемент из Х*, ортогональный надпространству Кег Ф'(хо) С Х. Но согласно лемме об аннуляторе ядра оператора (см.
и, 5, З 5, гл. 1Ъ') ]Кег Ф'(хо)]х = 1ш(Ф'(ха)]", Это означает, что если г'г(ха) б [КегФ'(хо)]"-, то найдется такой функционал у" б У*, что г (хо) = ]Ф (хо)] у (14) Положив Ло — — 1 и взяв тот функционал у', для которого вьщолнено равенство (14), мы и получим (13). Доказанная теорема представляет собой бесконсчномерное обобщение известного из классического анализа правила множителей Лагранжа для задач на условный экстремум. Действительно, если Х и У вЂ” конечномерные пространства, т.е. если ищется минимум функции уо(хы..., х„) при условиях Ь(хы...,х„) = О (г = 1,...,тп), то функционал у* — это система тп чисел Лы..., Л .
Условие замкнутости образа пространства Х в У при линейном отображении в конечномерном случае выполнено автоматически. Равенство (13) при этом превращается в ЕЛ,ах) =О, г=а т. е. в известное правило Лагранжа для нахождения условного экстремума. з 4. Метод Ньютона Одним из хорошо известных методов решения уравнений вида 1(х) = О (1) (1 — числовая функция числового аргумента, определенная на некотором отрезке ]а, 5]) является так называемый метод Ньютпоно, З о.
Метод Оьюеаона или леепеад касательных. Он состоит в том, что по рекуррентной формуле У(х ) х„+~ —— х„— (2) ищутся последовательные приближения к решению. (За нулевое приближение ха при этом берется произвольная точка того отрезка, на котором у определена,) Геометрический смысл этого метода иллюстрируется рис.
24. Можно показать, что если х'— единственный корень уравнения (1) на отрезке [а,6) и функция д имеет на этом отрезке не обращающуюся в нуль первую производную н ограниченную вторую производную, то существует «область притяжения корня х'», т. е. такая окрестность точки х", что при любом выборе точки ха в этой окрестности норис. 24 следовательность (2) сходится к х'. Метод Ньютона может быть перенесен на операторные уравнения. Мы изложим его для уравнений в банаковык пространствах. Рассмотрим уравнение Р(х) = 0„ (3) где Š— отображение банахова пространства Х в банахово пространство У. Предположим, что отображение Р сильно дифференцируемо в некотором шаре В(ха,т) радиуса г (центр которого ха мы примем за нулевое приближение искомого решения).
Заменяя, как и в одномерном случае, выражение Г(хе) — г'(х) его главной линейной частью, т.е. элементом Г'(ха)(ха — х), мы получаем из (3) линейное уравнение Г'(хо)(хо — х) = Е(ха), решение которого х1 = ха — [Е'(хс)) 'Р'(ха) естественно рассматривать как следующее приближение к точному решению х уравнения (3) (существование оператора [Г'(хо)] здесь, конечно, предполагается).
Повторяя те же рассуждения, мы получаем последовательность х„+1 = х„— [Е'(хе)) '(Г(х„)) (4) Гл. Х. Элементы дифгдеренциольного иснислмшл приближенных решений уравнения (3). В бесконечномерном случае вахождение обратного оператора [Ро(хн)] г может быть досгхгочно сложной задачей. Поэтому здесь бывает целесообразно пользоваться так называемым лгодггфиуггроеаннмлг мстодолг Ньюпгона (см. [27, 28]). Модификация состоит в том, что вместо последовательности (4) рассматривается последовательность, определяемая формулой х„лг = хи — [Р'(хо)] '(Р(хо)), (5) т.е, обратный оператор [Г'(хо)] ' берется на каждом шаге при одном н том же звачении аргумента х = хо.
Хотя такая модификация уменьшает скорость скодимости, она часто оказывается целесообразной с вычислительной точки зрения. Перейдем теперь к формулировке и доказательству точного утверждения. Теорема 1. Пусть отображение К сильно дифференцируемо в некотором шаре В(хо, г) с центром хо и радиусом г, а производная г'(х) удовлетворяет в этом шаре условию Липшица: [[Т'(хг) — Г'( аП < В[[х — х [[.
Пусть [Е'(хо)] ' существует и М = [[[Е'(хо)] '[[, й = [[[Г'(хо)] 'Р(х )[], й = Мй1.. Тогда, если !г < 114, то в шаре [[х — хо][ < Ио, где 1о — меньший корень уравнения 6гз — 1+ 1 = О, уравггение 1г(х) = О имеет единственное решение х* и последовательность (х„), определяемвл рекуррентной формулой (5), сходится к атому решению. Доказательство. Рассмотрим в пространствеХ отображение Ах = х — [Г'(хо)] гг (хо). Его сильная производная равна О в точке хо. Это отображение переводит шар []х — хо[[ < Но в себя.
Действительно, Ах — хо = х — хо — [Е'(хо)] 'Р(х) = = [Г'(хо)] (го(хо)(х — ха) — г'(х) + Е(хо)) — [Г'(хо)] ~Р(хо)- Поэтому [[Ах — хо[[ < [][Г'(хо)] '[[. [[Г'(хо)(х — хо) — р'(х) + р'(хо)[[+ + []Ях.)]-'К(хов т. е (6) []Ах — хо[] < М[[г*'(хо)(х — хо) — г'(х) + и'(хо)[[+ к. Рассмотрим вспомогательное отображение Ф(х) = Р(х) — Р(хо) — Е'(хо)(х — хо). 1 4. Мавмд Лыагаана Оно дифференцируемо и его производная равна Ф'(:г) = гч(х)— — р" (хе) Если [[х — хо~~ < й1о то имеет место оценка ИФ'(х)[[ = [[1ч(х) — ~"(хо)[[ < Чх — хо[[ < 11ой. Отсюда по теореме о среднем (формула (9) 2 1) получаем [[Ф(хЦ = [[Ф(х) — ф(хо)[[ < Иой[[х — хи[[ < агой~.
(7) Итак, если [)х — хе[[ < 1ей, то из (6) и (7) получаем [[Ах — хо[[ < М71ей + й = й(МГ 1ей + 1) = й(й1о + 1) = й1о а это и означает, что отображение А переводит шар [[х — хе[[ < й1е в себя. Покажем теперь, что А — сжимающее отображение этого шара. При ~[х — хе~[ < й1е имеем А'(х) = 1 — [8'(хо)[ 'Р'(х) = [Р (хо)[ ~(Е'(хо) — Р'(х)), откуда [[А'(х)[[ < М[[га(хе) — г'*'(х)![ < МЦх — хо[[ < Мбй1а. 1-~/1-45 Но 1е — меньший корень уравнения 51з — 1+1=0, т.е.
1е —— Поэтому [[А (х)[[ < Мг.й1, ь1 й 1 — ~у1 — 41 1 — аут — 4" < 1 (8) 2 откуда [[Аха -Ахз[[ < -[[х~ — ха[[, т е. А — сжимающееотображение. 1 Следовательно, отображение А имеет в шаре [[х — хе[[ < й1е одну и только одну неподвижную точку х'. Для этой точки х =х [г (хр)) г(х )~ т.е. Р(х ) =О. Вместе с тем Ах„= х„— [Г'(хе)] 'Г(х„) = х„+~ и в силу теоремы о сжимающих отображениях последовательность (х„1 сходится к х'.
Из неравенства (8) сразу вытекает следующая оценка скорости сходимости модифицированного метода Ньютона: [[х. — х'[! < —,', [[У (хе)Г'Г(хе) [[, (9) т.е. погрешность модифицированного метода Ньютона убывает как геометрическая прогрессия. Отметим для сравнения, что обычный метод Ньютона (в котором приближения определяются формулой (4), а пе (5)) сходится быстрее, чем геометрическая прогрессия: для этого метода [[Մ— Х'[[ < 1 (25)з 1й, рл. Х. Ьелеменсаи дифференииалиноео исчисление П р и м е р. Рассмотрим нелинейное интегральное уравнение ь х(з) = / К(з,ь,х(1)) е11, (10) а где К(з,1,и) — непрерывная и непрерывно дифференцируемвя функция своих аргументов. Введя отображение у = Г(х), определяемое равенством ь у(з) = х(з) — (с К(е,1,х(ь)) г1е, а запишем уравнение (10) в виде К(х) = О.
Пусть хе — нулевое приближение для решения этого уравнения. Тогда первая поправка Ьх(з) = х1 — хз определяется из уравнения .еее(хе)Ьх = -ее'(хе). () Если функция К(з, ь', и) н функциональное пространство, в котором рассматривается уравнение (10), таковы, что производная Г'(х) отображения Р может быть вычислена «дифференцированием под знаком интеграла», т.е. если г = г"(хо)х означает, что х(з) = х(з) — / К„'(з,ь,хз(1))х(ь) пе, а то уравнение (11) принимает внд ь Ьх(з) = ~ К„'(з,г,хз(ь))Ьх(е) е11+ <ро(з) а (12) где ь ьоо(е) = / К(з,ь,хо(ь)) еьь — хе(з). а Аналогично находятся и следующие поправки. Таким образом, накождение каждого следующего приближения сводится к решению линей ного интегрального уравнения.
Если применяется модифицированный метод Ньютона, то прн этом на каждом шаге приходится решать линейное уравнение с одним и тем же ядром. Более подробное изложение метода Ньютона и связанных с ним вопросов имеется в книге (28), а также в статье л1. В. Кантпоровнча (27], которому и принадлежат основные результаты, относящиеся к обоснованию метода Ньютона для операторных уравнений. ДОПОЛНЕНИЕ БАНАХОБЫ АЛГЕБРЫ В. М. ТИХОМИРОВ В третьей главе этой книги изучались линейные пространства.
Там был выделен важный класс линейных пространств — - балахоны пространства. Здесь, вэтом дополнении, будут изучаться банахо вы алгебры, т. е. банаховы пространства, в которых определено умножение элементов. Наличие умножения в сочетании с линейной и метрической структурой наделяет банаховы алгебры рядом замечательных свойглв. 3 1. Определение и примеры банаховых алгебр 1. Банаховы алгебры, изоморфизмы банаховых алгебр. Напомним, что линейным пространством называется непустое множество элементов, в котором введены две операции — сложение и умножение на числа, удовлетворяющие восьми аксиомам, сформулированным в 3 1 гл.
1П. Определение 1. Линейное пространство Х называется алгеброй, если в нем введена еще одна алгебраическая операция — - умножение, которое подчинено следующим аксиомам: 1. (ху)г — х(уг). 2. х(у+ в) = ху+хх; (у+в)х = ух+ гх. 3. а(ху) = (ах)у = х(пу).
4. Если существует элемент е б Х такой, что ех = хе = х для всех х б Х, то е нвзываетси единицей алгебры Х, а сама алгебра называется алгеброй с единицей') . 5. Если операция умножения коммутатнвна, т. е, если выполняется аксиома: то алгебру Х называют колсмушативнай алгеброй. Коммутативные алгебры г единицей и будут в основном объектом нашего дальнейшего рассмотрения. Всюду в этом дополнении числовое поле, над которым рассматриваются наши алгебры, это поле С комплексных чисел.