Беклемишев - Дополнительные главы линейной алгебры (947281), страница 43
Текст из файла (страница 43)
е. число 1~1-ув -увы+...к(*'>'. 2. Минимизация невязки. Невязкой, которую дает столбец х при подстановке в систему уравнений (1), называется столбец и=Ь вЂ” Ах. Решение системы это столбец, дающий нулевую невязку. Если система (!) несовместна, естественно постараться найти столбец х, который дает невязку с минимальной нормой, и если такой столбец найдется, считать его обобщенным решением системы. Разумеется, если система совместна, ес решение будет также и обоб- 4ЦЕННЫМ РеаКаЦСМ. о 1.
ЭЛЕМЕНТАРНЫЕ СВОИСТВА 189 Заметим в связи с этим следующее. В гл. 1П мы уже рассматри- вали невязки и стремились уменьшать их нормы, но ситуация тогда была другая. Система имела решение, и столбец, дающий малую невязку, рассматривался как приближение к этому решению. Здесь мы не знаем, существует ли решение, и интересуемся столб- цом, дающим минимальную невязку.
Здесь мы исследуем обобщен- ные решения теоретически и будем предполагать, что вычисления могут быть проделаны точно. Но практически обобщенное решение, как и любой другой объект, может быть вычислено только при- ближенно. Для сравнения невязок воспользуемся евклидовой нормой и, следовательно, будем искать столбец х, для которого минимальна величина (а)'= (Ь вЂ” Ах)г (Ь вЂ” Лх). (2) Рассматривая элементы столбца Х как независимые переменные, найдем полный дифференциал 1~ а1'. Как нетрудно проверить, й) и )о = — йх'А' (Ь вЂ” Ах) — (Ь вЂ” Лх)' А йх. Так как второе слагаемое, будучи матрицей первого порядка, ие меняется при транспонировании, имеем й)а 1~ = — 2йхгЛг (Ь вЂ” Лх), Поэтому дифференциал равен нулю тогда и только тогда, когда АгАх Агй (3) Эта система линейных уравнений по отношению к системе (1) назы- вается нормальной системой.
Она является следствием системы (1), но независимо от совместности системы (1) справедливо П р ел л о ж е н н е 1. Нормальная система уравнений обяза- тельно совместна. Это предложение является перефразировкой предложения 12 э 1 гл. 1. Но непосредственное доказательство на языке матриц несложно, и мы приведем его. Матрица АгА симметрична, и по- тому транспонированная однородная система для системы (3) имеет вид ЛгАу = О. Для любого решения этой системы имеют место равенства, последовательно вытекающие одно из другого: уг А г Ау = (Ау) г (Ау) = О, Ау = й уг (Агд) = О. Последнее из них означает, что для системы (3) выполнено условие теоремы Фредгольма.
Это заканчивает доказательство. П р едл о же н и е 2. Точная нижняя грань квадрата нормы невязки достигается для всех решений нормальной системы (3) и только для них. До к аз а тел ь ство. Написав формулу (2) для столбца хо+ съх и раскрыв скобки, мы получаем (Ь-А(хо+Ах))г(Ь вЂ” А(хо+Ах)) = =(Ь вЂ” Ахо)т (Ь вЂ” Ахо) — 2йхгАг (Ь вЂ” Ахо)+ЬХгАгА ЬХ 190 гл. пл псввдогвшвния н псввдоовгьтныв мктгицы Последнее слагаемое неотрицательно, так как пхгА гА Лх = =(Айх)г(Астх))0. Если хь удовлетворяет системе (3), то второе слагаемое равно нулю, и тогда добавление Лх не уменьшает значения функции, каков бы этот столбец Лх ни был, Обратно, для функции, определенной для всех х, точная нижняя грань может достигаться только в точке локального экстремума, а в таких точках дифференциал равен нулю, и выполнено условие (3).
Предложение доказано. По известной теореме (К., теорема 2 з 5 гл. Ч) все множество решений нормальной системы может быть описано формулой х = = х, +я, в которой х, — некоторое фиксированное решение нормальной системы, а в — произвольное решение однородной системы АгАе=О.
Как мы видели прн доказательстве предложения 1, последняя система эквивалентна системе Аз = О, и мы можем считать, что решение нормальной системы (3) определено с точностью до произвольного решения однородной системы Ае = О. Таины образом, справедливо П р ед ложе н и е 3. Иорлальная система имеет единственное решение пигда и только тогда, когда систел~а Ае =- О имеет только тривиальное решение, т. е.
столбцы матрицы А линейно независимы. В частности, вто будет выполнено, если л~атрица А невырождена. Если решение нормальной системы не единственно, то возникает задача выбрать какое-то одно из решений, и выбирается решение в минимальной нормой. О п р е дел е н и е. Нормальным псевдорешением системы линейных уравнений называется столбец с минимальной нормой среди всех столбцов, дающих минимальную по норме невязку при подстановке в эту систему. Поскольку не возникает опасности недоразумения, мы будем называть нормальное псевдорешение просто псевдорешеннем. Докажем существование и единственность нормального псевдо- решения. С этой целью удобно будет использовать результаты из теории евклидовых пространств, и мы будем рассматривать в пространствах столбцов Ю„ и еЯ' скалярное произведение, задаваемое обычной формулой (х, у) = х'У.
Пусть Ж" ~ еЯ', — множество решений однородной системы Ая = О, а с ~ в"Р„ — множество столбцов вида А "Ь для всевозможных Ь я еЯ.' . Условие р я е равносильно совместности системы линейных уравнений А 'х= р. С другой стороны, согласна теореме Фредгольма, последняя система совместна тогда и только тогда, когда для каждого я ен Ю выполнено астр= О. Это означает, что Напомним, что, каково бы ни было подпространство й в евклидовом пространстве, любой вектор х может быть единственным 19! 5 ь злемвнтАРнын свонстВА образом разложен в сумму вида х'+ х", где х' ен Я, а х' я Хх.
Векторы х и х" называются ортогональными проекциями х на Я н на Ж" соответственно, Обозначим через ве" множество решений нормальной системы линейных уравнений (3). Л$ы видели, что столбцы из иФ описываются формулой х = х,+в, где х, — некоторый столбец из ьВ, а ее:-йг. Т е о р е и а 1. Каждая система линейных уравнений имеет одно и только одно нормальное псевдорешение. В силу предложения 2 нам достаточно доказать, что в множестве ьв' всегда существует один и только один столбец с минимальной нормой. Для доказательства разложим произвольный стол- бЕЦ Х ИЗ М В СУММУ ЕГО ОРтОГОНаЛЬНЫХ ПРОЕКЦИЙ Хь И Х, На Е и на Ж. Очевидно, что х, также принадлежит ьФ, так как отличается от х на столбец х, ~ йь. Если у — еще один столбец из Ф", то его ортогональная проекция на также равна х,.
Действительно, у=(у — х+хз) + х„ причем (у — х)+х, ен й.", и нам остается сослаться на единственность ортогональных проекций. Итак, для всех векторов из вв'" слагаемое х, одно и то же. Для произвольного х из ь.е' мы можем написать ! х !' = (х1 + хь) г (хг+ хь) = ( х1 )ь + ) хь )ь, так как х,'хь=О. Отсюда следует, что !!х !!» !! х, !1, причем знак равенства имеег место только прн х,=О, т. е. при х=х,.
Это ПОКаЗЬщаЕт, Чта В ье" ИМЕЕтея В тОЧНОСтИ Одни СтОЛбЕц, НОрМа которого минимальна. Теорема доказана. ! 1з доказательства теоремы мы узнали, что нормальное псевдорешение может быть характсрпзовано любым из следующих свойств: а) Оно является единственным общим вектором, который имеют е и ьФ"! хо=с () ь~ ю (4) т, е. оно является единственным решением нормальной системы, имеющим вид хь = Агв. (5) б) Оно является ортогональной проекцией любого решения нормальной системы на множество е столбцов вида Агв, П р е д л о ж е н и е 4.
Пусть хь и х, — нормальныепсевдорешения двух систем линейных уравнений Ах=о и Ах с. Тогда '!!хь + ух, является нормальным псевдорешением системах Ах = = йй+ ус. Доказательство. Из АгАхь- Агд и АтАх, Агс следует, что Г!хь+ ух, удовлетворяет нормальной системе~ АгА((1хь+ ух,) - А' ())й+ ус), Далее, существуют столбцы хв н х, 192 Гл, 1ч, псеэдоРешения и псевдооБРАтные мАтРицы такие, что х, А ге, и х,=Аге,. Поэтому ~х,+ух,=АГ фе„+уг,), что и заканчивает доказательство.
Естественно, предложение 4 может быть распространено на линейные комбинации произвольного числа столбцов. Рассмотрим несколько очень простых примеров. 1) Система из двух уравнений с одной иеизвестнои: х=1, х=2. Нормальная система уравнений для этой системы есть ~~1.1) ~,',~ =)1,1) $,,'2$, илн 2х = 3. Отсюда следует, что псевдорешение равно 3/2.
2) Система из одного уравнения с двумя неизвестными: х'+хз=2. Нормальной системой уравнений будет система ~.)1, 1) ~ ~=~ /2, содержащая то же уравнение, повторенное дважды. Ее общее ре- шение Псевдорешение будет тем решением, которое получается умиоже- 111 нием А" =~ ~ на некоторый столбец г высоты т = 1. Легко видеть, что таким решением будет 1'-1 = И 1 3) Система из одного уравнения с одним неизвестным ах = 3.
Если а ~ О, то псевдорешение совпадает с решением х = Р/а. Если же а - "О, то любое число х при подстановке дает ту же самую невязку р о нормой 1 р ~. Из всех чисел мы должны выбрать то, норма которого минимальна, т. е. О. Итак, псевдорешение уравнения Ох 1) есть О. Результат в этом примере такой, какой был бы, если бы мы доопределили функцию ) (а) = — в нуле числом О.
Здесь видно, что 1 а псевдорешенив не является непрерывной функцией от элементов матрицы н столбца свободных членов. Этот же недостаток имеет место е в общем случае системы из т уравнений и и неизвестными. 4) Система линейных уравнений с нулевой матрицей Ох = Ь. Псевдорешение находится так же, как и в примере 3: все векторы дают одну и ту же невязку, равную Ь, и минимальной нормой обладает нулевой вектор, который и будет псевдорешением. 193 $1. ЭЛЕМЕНТАРНЫЕ СВОЙСТВА 3.
Псевдообратная матрица. Для невырожденной квадратной матрицы А порядка и обратную матрицу можно определить как такую, столбцы которой — решения систем линейных уравнений вида Ах =ег, (б) где е,— с-й столбец единичной матрицы порядка и. По аналогии с этим мы можем дать следующее О и р е д е л е н и е. Псевдообратной матрпцей для матрицы А размеров т х и называется матрица Л', столбцы которой — псевдорешеиия систем линейных уравнений вида (б), где е, — столбцы единичной матрицы порядка ггг.