Беклемишев - Дополнительные главы линейной алгебры (947281), страница 46
Текст из файла (страница 46)
Как для А', так и для Ач — это векторы 1,,м ..., 1„. Следовательно, Кег А+ = Кег А '. Переход к сингулярным базисам позволяет легко проверять различные тождества, касающиеся псевдообратных матриц. Докажем, например, что имеют место равенства, обобщающие формулы (9) и (10) э 1: Ае = (Аг А)+ Аг (8) и А+= Ах (ААт) . (9) Из предложения 2 видно, что равенство (8) равносильно еле. дующему разложению псевдообратного отображения: А+=(А'А)+А*.
Это равенство инвариантно, и потому нам достаточно проверить его в какой-нибудь одной паре базисов. Проверим его в сингулярных базнсах отображения А. 204 ГЛ, ПП ПСЕВДОРЕШЕНИЯ И ПСЕБДООБРАТНЫБ МАТРИЦЫ В этом случае матрица 0 отображения А имеет вид (3), Применяя формулу (4) к диагональной матрице 0т0, мы находим, что (0г0)э= с(!ай(а,', ..., а,.', О, ..., 0). Легко видеть, что произведение (0Т0)'0г совпадает с 0'. Это нам и требовалось. Формула (9) доказывается аналогично. 3. Псевдообращение при помощи предельного перехода. Обозначим через уг множество всех линейных отображений в' в Ь'„. Операции сложения и умножения на число в Й" были введены в основном курсе. Легко видеть, что относительно этих операций .Я" — линейное пространство, н выбор базисов в Ж и 8„ устанавливает изоморфизм Ж на пространство л„ матриц размеров и Х т. Пусть каждому вещественному числу ).
из интервала (а, р) сопоставлено отооражение В ().) Ее 'т'". В этом случае мы будем говорить, что на (а, б) задана функция со значениями в Я . (Соответствующие функции для матриц рассматривались в ч 4 гл. 11.) Чтобы определить понятие предела для функций со значениями в Уг", введем в Я" норму. Это можно сделать, например, так, Выбрав в о и й„ортонормированные базисы, рассмотрим матрицу В отображения В ~ Л". Ее спектральная норма не меняется при умножении В слева и справа на ортогональные матрицы, т. е. !! В !! = !! УВ'Р' !! для произвольных ортогональных матриц (у н Р порядков и и т соответственно.
Поэтому спектральная норма матрицы отображения В не зависит от выбранной пары ортонормпрованных базисов и может считаться нормой отображения В. Мы будем обозначать ее !! В !! и дадим следующее определение. Отображение В называется пределом функции В (А) при Х- !А, если для каждого Б ) О существует число 0 такое, что из О ~ ( ! ). — !А ! <е следует !1 В (А) — В !! Се. Легко видеть, что для произвольной пары ортопормированных базисов из соотношения 11гп В(Х) =В следует, что аналогичное соотношение имеет место и для матриц рассматриваемых отображении: 1!и В(Х) =В.
А и Вернемся теперь к изучению отображений А: 6„- от и его псевдообратного и рассмотрим преобразование пространства в„, определяемое выражением АА' + а!=, в котором Š— тождественное преобразование о . Докажем, что при а ) 0 это преобразование имеет обратное. Чтобы не забывать о положительности а, обозначим а = У и покажем, что матрица преобразования АА* + Х'Е в произвольном ортонормированном базисе невы- аоа 5 а псеадООБРАтное ОтОБРАжение рождена.
Более того, она положительно определена. Действительно, для любого ненулевого столбца $ имеем фт (А А " + Л2Е) ~ = (А т ф) т (А т ф) + Лотт ф ) О. Таким образом, для любого числа Л Ф 0 определено отображение В (Л): 8 — 2. О„по формуле В(Л) = А* (АА*+ Л2Е) '. Аналогично, может быть определено отображение (А*А+ УЕ)-' А*, причем существование обратного преобразования для преобразования А*А + УЕ пространства в„доказывается так же, как обратимость АА" 1- Л'Е. П р е д л о ж е н и е 4. Имеют л2есто соотношеная 1пп А'(АА*+УЕ) '=А+ А-О 11гп (АоА+ ЛИЕ) — 1 АФ = А+, А-О (и- 1 У) — 2 (<„в+У) — 2 Л вЂ” 2 Уо на диагонали.
Матрица РТС есть диагональная матрица таких же размеров и х т, как и Вт, и имеет на диагонали т ненулевых элементов сх,(со,'+Ло)-', ..., и„(и',+Ло)-' (элементы матрицы С, равные Л ', были умножены на О). Матрица РТС при Л- 0 стремится в смысле поэлемеитаой сходимости к матрице В', определяемой формулой (4). К этой же матрице она должна стремиться и относительно спектральной нормы. Отсюда непосредственно вытекает доказываемое соотношение.
Из предложения 4 следуют выражения для псевдообратной матрицы: 1нп Ат (ААт (-Л2Е)-2 А+ (10) А О !пп(АтА 1 Л2Е)-2 Ат А+ А-О (11) Обе формулы доказываются одинаково. Докажем первую из пих. Для этого выпишем матрицу отображения, стоящего под знаком предела, в сингулярных базисах отображения А. Если матрица А в этих базисах обозначена через В, то искомая матрица сеть Вт (ВВт+УЕ) '. Учитывая вид (3) матрицы В, мы замечаем, что С = (ВВт -1- Л'Е) ' — диагональная матрица с элементами 206 гл. вс псввдоянпвння и псввдоовяьтныя матти»»ы Рассмотрим систему линейных уравнений с невырожденной матрицей (А т А !» »Е) ~ А т Ь: Обозначим ее решение через $х. Тогда' $ = (Ат А+ ),»Е)-» АтЬ (~з) и формула (11) показывает, что справедливо П р е дл о ж е н и е 5.
При ) - 0 решение с» састел»ы (12) стремится к нормально,»»у псеедоре»иенаю сиса»еяья А ч = Ь. Это предложение имеет существенное теоретическое значение. Дело в том, что нормальное псевдорешение системы линейных уравнений не является непрерывной функцией от матоицы системы. Предложение 5 показывает, что система может быть включена в семейство систем с параметром Л таким образом, что решение системы непрерывно зависит от параметра. Этот результат получен с более общей точки зрения в теории регуляризующих функционалов для некорректно поставленных задач (см.
Тихонов и Арсении 13!]). Упомянутая теория в основном относится к уравнениям в бесконечномерных пространствах (например, к дифференциальным уравнениям с частными производными). В конечномсрном случае прямой необходимости во введении регуляризующих функционалов нет. Однако мы отметим, что для систем линейных алгебраических уравнений роль регуляризующего функционала может играть функция !"»Я, Ь, А) =!!Ь вЂ” Ая!!'+)»(й!' на арифметическом пространстве еЯ.'„. Найдем значение $, при котором опа достигает минимума. Иначе !» можно записать так: )» $ Ь А) (Ь А»)т (Ь Аьь) ! !»Зт$ Дифференцируя это выражение по В, находим »(!» $, Ь, А) = — 2»('тАтЬ+ 2с('тАтАя+21»с(",т~.
(12) Дифференциал обращается в нуль для столбцов $, удовлетворяющих системе уравнений, в точности совпадающей с (!2). Как мы видели выше, детерминант матрицы системы отличен от нуля, и система имеет единственное решение (13) при любых Ь, А и Х ~ О. Обозначим это решение через $»,, и пусть 1ь (в», Ь, А) = ь.
Если !! $ !! ~ )Гь»», то Л ($, Ь, А) ) ь. Поэтому на сфере радиуса 3»$/). + 1 и вне ее !» принимает значения, большие чем Ь. Если 5х ие попало внутрь сферы, увеличим ее радиус до !! $» !! + 1. Так мы получим сферу, содержащую с» и такую, что на ней и вне нее т» ($, Ь, А) ) ь. Функция непрерывна и внутри сферы имеет единственную стационарную точку. Поэтому эта точка является точкой минимума.
Приведенные рассуждения показывают, что это будет абсолютный минимум. Ф з. мвтоды вычисления Предложение б, по существу, утверждает, что при ) -э О точка, где регуляризующий функционал достигает минимума, стремится к псевдорешению системы А 4 = Ь, 5 3. Методы вычисления 1. Нахождение псевдорешения при помощи сингулярного разложения. Большая часть гл, 111 была посвящена системам линейных уравнений с квадратнымп невырожденными матрицами, точнее, таким, матрицы которых не являются почти вырожденными. Однако в реальных задачах невырожденность матрицы, а тем более ее достаточно хорошая обусловленность, как правило, заранее гарантирована быть не может.
(Исключение могут представлять собой некоторые системы линейных уравнений с матрипами специального вида). Мы видели, что проверка хорошей обусловленности матрицы— дело не простое, и по затратам времени и усилий сравнима с решением системы. Поэтому в случае, когда имеется вероятность того, что матрица системы является почти вырожденной, может оказаться предпочтительнее сразу же искать псевдорешение этой системы. Мы минимизируем норму невязки. Если минимум окажется достаточно малым, мы будем считать, что нашли решение, если же нет, то мы имеем псевдорешение, а решения не существует. Следует, однако, помнить, что в том случае, когда решение нормальной системы АгАе = АтЬ (2) пе единственно, нормальное псевдорешение выделяется из всех решений (2) искусственным требованием минимальности нормы.
Поэтому может возникнуть необходимость найти какое-нибудь другое решение нормальной системы. Значительная часть имеющихся рекомендаций по решению систем линейных уравнений общего вида требует нахождения сингулярного разложения матрицы системы или действий, по существу к этому сводящихся. Если в систему (1) мы вместо матрицы А подставим ее сингулярное разложение, то получим систему (1г Р)гх Ь или 1)р=Ь, (3) где (4) и ейй Гл пс псевдоРешения и псездооаРАтные мАГРицы Нормальная система (2) аналогично может быть приведена к виду В у=ОЬ.