Фаддеев, Фаддеева - Вычислительные методы линейной алгебры (947503), страница 24
Текст из файла (страница 24)
Данные в теореме 13.2 условия неудобны для проверки, ибо онн требуют знания собственных чисел матрицы А. Поэтому установим некоторые более простые достаточные условия для того, чтобы А — + О. Теорема 13.3. Для того чтобы А -+О, достаточно, чтобы хоть одна из норм А была меньше единицы. Доказательство. В силу 4-го требования дтя нормы, имеем: !!А !!(!!А" '!! !!А!!( . (!!А!! . Поэтому, если !!А!!( 1, то !!А"'!!-+ О, и, в силу сказанного выше, А — + О.
Сопоставляя теоремы !3.2 и 13.3, мы приходим к следующему выводу, Теорема 13.4. Модуль каждого собственного числа матрицы не превосходит любой из ее норм. 1 Доказательство, Пусть !!А!!= а. Рассмотрим матрицу В = — А, а+6 где е !юбое положительное число. Тогда !!В!! = ' (1. Следовательно, В™-+О при т-+со. В силу теоремы 13.2 ее собственные числа по модулю меньше единицы. Но очевилно, что соб- 1 ственные числа матРицы В Равны — ль где Л собственные числа а+в матрицы А.
Таким образом, — . 1, т. е. !Л;! (а — !-е. Так как в (Ль! можно взять как угодно малым, (Л!! (а. ф 13! понятии пввдвль в линейной Алгзьвв Теорема 18.б. Для того чтобы ряд Е+А+А + ... +А™+ сходился, необходимо и достаточно, чтобьс А -+О нри т-+со. В этом случае сумма ряда (1) равна (Š— А) '. Доказательство. Необходимость этого условия очевидна. Покажем, что оно и достаточно. Пусть А -+ О. В силу теоремы 13.2 все собственные числа матрицы А по модулю меньше единицы. Следовательно, !Š— А! ть О, и потому существует (Š— А) '.
Рассмотрим тождество (Е+ А+ ... +Ас)(Š— А) = Š— А~~'. Умножив его справа на (Š— А), получим Е+А+ ... +А =(Š— А) — А (Š— А) Отсюда следует, что при сг-ьоо Е+ А+ ... + А -+ (Š— А) ', ибо А ~ -+О. Следовательно, Е+ А + ... + А + ... = (Š— А) что и требовалось доказать. В силу теоремы 13.2 необходимым н достаточным условием сходимости ряда (1) является неравенство !)и ! ..
1 для всех собственных чисел матрицы А. Достаточным признаком сходимости в силу теоремы 1З.З является неравенство !!А!! ( 1 хотя бы для одной из норм. При выполнении этого условия легко дать следующую оценку быстроты сходимости ряда (1). Теорема 13.6. Если !!А!!(1, то !!(Š— А) — (Е+А+ ... + А )!! ~ Доказательство. Имеем: (Š— А) ' — (Е+ А+ -+ А ) = А ь~+ А" ' + Отсюда !!(Š— А) ' — (Е+А+ ... +А")!!< +!'1!! + ''' 1 — 1А1' Теорема доказана. б. Некоторые оценки собственных значений. В предыдущем пункте были получены некоторые 'оценкй собственных вначений, ~З2 основныз свидания из линяйной ллгввгы [гл.
» [г — ан [ ~~ Й» (» = 1... „п), где »»с»= ~ [а» [. »» »4» Пусть Л любое собственное значение маХ=(х,, ..., х )' Доказательство. трины А и соответствующий ему собственный вектор. Тогда ~,а»»х» — — Лх; (»=1, ..., п) »» или, что то же самое, ~, а»ух» — — (Л вЂ” аи) хо у 1 у'4. » Пусть индекс» выбран так, что х» есть наибольшая по модулю компонента вектора Х. Тогда хэ Л вЂ” аы= тв а»» —, $1 —,74» х, ° »-» »к» откуда и ч [Л вЂ” ам [ <~~У [ау[ ° ~ — ~ ! < ~ [а», [=[в».
Итак, для каждого собственного значения Л найдется круг с центром аы и радиусом )сн содержащий это собственное значение. Схедовательно. все собственные значения находятсв в объединении всех таких кругов. Именно, было установлено, что все собственные значения по модулю меньше любой нормы матрицы.
Особенно удобными являются оценки прн помощи 1-й и 2-й норм, так как они просто выражаются через злементы матрицы. Сейчас мы выведем оценки, дающие более точную информацию о расположении собственных значений мзтрицы. Этн оценки носят название оценок Гершгорина, так как оии впервые появились в его работе [1[. Теорема »3.7. Пусть А=(а»») матрица с любыми комплексными элементами. Все собственные значения этой матрицы находятся в области В, являющейся обьединением кругов й ~з! понятие пгедела в линейной алгезге 1ЗЗ Замечание 1. Область Р Гершгорина целиком лежит внутри круга ~ г ~ ( ~(А()г и касается его границы.
Действительно, если и 1г — а11! (Йм то 1г ~.(~ ам~+)сг =.~~~~ ~ аО !, причем существует з г такое г, при котором неравенство превращается в равенство. Следовая тельно, )г) (шахбаз)а!1(= (~А~(г, причем снова найдется число г, г ,=1 осуществляющее равенство. Таким образом, хотя область Гершгорина есть, вообще говоря, часть круга ! г ~ ( ,')А!)г, но оценка для наибольшего по модулю собственного значения получается такой же, как при помощи 1-й нормы. 3 а и е ч а н и е 2. Взяв вместо матрицы А транспонированную, получим другую область Р', которая будет содержаться внутри круга (г).( ()А))н. Замечание 3. Область Гершгорина может распадаться на несколько связных частей.
При этом каждая связная часть содержит внутри себя столько собственных значений, сколько кругов ее составляют. Для доказательства введем в рассмотрение матрицу. ам иаж ... иа,„ иа2! а22 ' ' паз~ иа г ил1з ... а где и вещественный параметр. Ясно, что А, = А. Область Гершгорина для матрицы А„есть, очевидно, объединение кругов )г — ам ! (ийо где Й; радиусы соответствующих кругов для матрицы А. Таким обрззом, область Р„Гершгорина для А„ при О (и (1 содержится в области Гершгорина Р для матрицы А.
Поэтому при непрерывном изменении и от О до 1 собственные значения матриц А„непрерывно изменяются, не выходя из области Р. Следовательно, внутри каждой связной компоненты области Р находится одинаковое число собственных значений для любой матрицы А„, О(и (1. Но собственными значениями матрицы Ар являются диагональные элементы ап, являющиеся центрами кругов, образующих Р. Следовательно, число собственных значений матрицы Ар(а следовательно, и матрицы А), лежащих внутри яекоторой связной компоненты области Р точно равно числу кругов, объединением которых получается эта связная компонента.
За последние годы опубликовано много работ, посвященных дальнейшему уточнению области, содержащей все собственные знанения матрицы. основные сведения из линейной АлГеБРы [гл. г 134 5 14. Градиент функционала 1. Определение. Пусть Р (Х) функционал, вообще говоря, не линейный, определенный в вещественном звклидовом пространстве К и принимающий вещественные значения. Пусть вектор Х задан координатами в некотором ортонормированном базисе. Тогда функционал т".(Х) есть функция Р(хп ..., х„) от переменных координат вектора Х. Мы будем предполагать, что функционал г". (Х) дифференцируем, дтя чего достаточно потребовать, чтобы функция тт(хо ..., х„) имела непрерывные частные производные по всем аргументаи. Пусть т' произвольный вектор единичной длины с координатами Уг ° ° ° Уи.
Производной от функционала Р в точке Х по направлению т' называется выражение аг(х) у г(х+ гу) — г(х) С Производная характеризует скорость изменения функциоаа (х) нала Е при изменении „аргумента" в направлении вектора т'. Имеем далее Р (Х+ г"т ) = Р (х, + туп ..., х„+ гув) и потому — ау — = ~~ ~(~~+(У,, ~„-+1У„) ~ аг дР ах, У + + дх Уч = (~, У), д~ аг где Х вЂ” вектор с координатами — . .. — . Вектор 2 назыдхт ' ''' дх„ ' вается г р а д и е н т о м функционала Р(Х). Из последнего равенства вытекает, что — — ~2)соз(2, у), ибо ) т'~.=1.
Отсюда следует, что — г1< аг(х) <~,~ причем дт — †! д ), если направление т' совпадает с направлением дл(Х) градиента, и дР(Х) ау = — (Х(, если направление т' противоположна $14) ГРАДИЕНТ ФУНКЦИОНАЛА направлению градиента. Поэтому направление градиента есть направление наибольшей скорости роста функционала Р в данной точке, а направление, противоположное градиенту, есть направление наибольшей скорости убывания. 2. Градиенты некоторых функционалов. Пусть А самосопряженный оператор.
Определим градиент функционала Ь(Х)=(АХ, Х). Имеем Л (Х + ГЧ) — Ь (Х) (А (Х + ГЧ). Х + ГЧ) — (АХ, Х) = 2(АХ, Ч)+г(АЧ, Ч), откуда — — =2(АХ, Ч). да (х) дЧ градиент функционала р(Х) =— (АХ. Х) Имеем д д ди(Х) ' дЧ ' ' ду (Х, Х) — -(АХ, Х) — (АХ, Х) — (Х, Х) (Х, Х)а (Х, Х) 2(АХ, Ч) — (АХ, Х) 2(Х, Ч) 2 — (АХ вЂ”, (Х)Х, Ч).
2 Следовательно, с точностью до положительного множителя —, (Х,Х)' градиент функционала п(Х) равен вектору $=АХ вЂ” р(Х)Х. Отметим два свойства этого градиента: 1) (Х, в)=0; 2) (с, $) =(в, АХ). Действительно, (Х, $) =(Х, АХ вЂ” й(Х) Х) = (Х, АХ) — й(Х) (Х, Х) = 0 в силу определения и(Х), и, следовательно, градиент (АХ, Х) равен 2АХ. В частности, градиент (Х, Х) равен 2Х. Так как в дальнейшем нам важно лишь направление градиента, мы отбрасываем положительный множитель 2 и будем подразумевать под градиентом функционала (АХ, Х) вектор АХ. Совершенно аналогично находим, что градиент функционала У(Х) =(АХ, Х) — 2(Р, Х)+с равен (с точностью до множителя 2) вектору АХ вЂ” г. Вычислим, наконец, )Зб основныа свидания из линейной алгеввы (гл. ~ Далее, Я, а) = Я, АХ вЂ” р(Х) Х) = (ф, АХ) — р(Х) (Х, ф) = (ф, АХ) ибо (Х, Е) =О.