Беклемишев - Дополнительные главы линейной алгебры (947281), страница 50
Текст из файла (страница 50)
Таким образом, размеры матриц в вычисленном разложении (! 9) зависят от величины е. Это вычисленное разложение является точным разложением другой матрицы А,. Ранг А, зависит от а, причем Кй А, ==. Кд А, а спектральное число обусловленности удовлетворяет неравенству с (А,) =. — ' =с(А), где ат — наибольшее сингулярное число матрицы А, Мы видим, что матрица А„вообще говоря, лучше обусловлена, чем А, но часть информации, содержащейся в А, может оказаться потерянной. Если мы признали нулевым некоторое сингулярное число, истинное значение которого положительно, мы фактически признали некоторую строку А линейно зависимой от остальных.
Итак, сделав а больше минимального сингулярного числа А, мы выберем из А наиболее достоверную информацию, которой, естественно, меньше. Одновременно, увеличение е способствует более компактной записи и, следовательно, экономии памяти. Можно использовать этот эффект для выделения наиболее суше- ственной части данных, записанных в матрице. Для этого е задают настолько большим, чтобы получить матрицу А, приемлсмого ранга, именно, достаточно малого, чтобы данные были обозримы, и достаточно бочьшого, чтобы они представляли интерес. 10. Метод Гревиля. Совсем другой подход к нахождению псевдообратной матрицы основывается на следующем построении. Пусть матрица Аг получается из матрицы А дописыванием справа столбца вп 1ам " аы си) А,=)А, а)=~ аюг " амл ам Ф а методы вычисления Допустим сначала, что АА а~а, и рассмотрим столбец (и — АА+)и (и — АА1) и,„т' (21) где ~~ э !1 обозначает евклидову норму.
П р е д л о ж е в и е 2. Если А А'а ~ а, то матрица А~+ получается из матрицы А" (Š— арт) дописыванием снизу строки рт, т. е. имеет вид (А+(Я ирт) ( (22) рт Доказательство проще всего получить, проверяя для матрицы (22) условия предложения 12 2 1, Обозначив ее через Х, найдем (А Х )А~а( т т ЛА'(Š— а()т)+а()т = АЛ++(Е- АА+) арт. Обозначим для краткости знаменатель выражения (21) через А. Тогда АтХ = ЛА +(Š— ЛЛ ) аат (Е ЛА )т Х-т Отс1ода видно, что матрица А,Х симметрична. Рассмотрим теперь произведение А,ХЛ,. Имеем А,ХА, = А,Х(Л, а(= ) А,ХА, А,Ха(.
Вычислим матрицу А,ХА, Она равна АА "А+ я-' (Š— АА') аат (Š— ЛА*) А, поскольку Š— ЛА' симметрична, так же как и АА'. Первое слагаемое равно А. Раскроем скобки во втором ела. гаемом~ (Š— АА+) иит (Š— АА+) А = аат А — А А аа т Л вЂ” аат А А'А + А Л+аат А А'А и увидим„что оно равно нулю согласно тому же тождеству АА'А =А Вычислим теперь столбец А,Хо, Он равен АА "а+ т -т (Š— АА') аит (Š— АА') а. (23) Чтобы упростить зто выражение, найдем Х. ) ат(Е-ААч)(Š— АА')а=ит (Е-2АА'+(АЛ')т)а= = ат (Е- АА+) а Произведя сокращение в выражении (23), имеем А,Ха ° АА'а+ (Е- АА') и и.
Итак АлХАт (А, и)= А,, как и требовалось. т24 гл. пл псввдоевшения н псевдоовялтныя мктеицы. Далее, можно проверить, что матрица ХА, имеет следующее кле- точное строение (с клетками размеров и х и, и Х 1, 1 Х п и 1 Х!): ХА =~ л+ (е — сег)т) л л'(е — арт) а йт л рта (24) и+т л+а !+,' Лсасс (25) и докагкеы Предложение 3, Если АА'а=а, то матрица А; полу«аетсл из малгрицьс А' (Š— аут) дописыванием снизу строки ут, т. е. равна ! 4~(е т) т (26) Доказательство, как и для предыдущего предложения, состоит в проверке условий предложения 12 6 1.
Обозначим матрицу (26) через Х и вычислим А,Х: АсХ=гА, а)~ т "~ ~~ АА'(Š— аут)+аут =АА' т в силу условия АА'а = а. Таким образом, матрица А,Х симметрична. Аналогично, независимо от вида у, имеем А,ХА,= АА'А„)АА"А, АА'а," )А, а1= Аь Вычислим матрицу ХА,. Она имеет вид (24), только вместо )) в нее входит у. Преобразуем выражения для клеток этой матрицы: А (Š— аут) А А+А — А 'аат Аст А Ай-сс где к 1+) А а)с Но А',тА'А =. А'т в силу тождества (8) й 1. Поэтому А+(Е-аут) А А+А — (А "а) (ат А т)Х-г А"А — )с-'(А'а)(А*а)т Отсюда следует, что левая верхняя клетка симметрична. Далее, в силу того же тождества Тт А =.
сст А" т А'А)с-' ° к-'ат А'", Подсчет, аналогичный приведенному выше, показывает, что глл о~ и мы видим, что эта матрица симметрична. Кроме того, умножая эту матрицу на Х, мы сразу получаем ХА,Х = Х, Предложение доказано. Рассмотрим теперь случай, когда АА'а = а. Г!оложим $ 3. методы вычисления Кроме того А (Е аут)а=А"а — Ъ А'аатА тА+а= )-'(А'а) — А+аатА+тА'а) =)-'[А'а(1+атА+тА а)— — А'аат Л'т А'а] = ) -'А"а. Это показывает, что клетка-строка получается транспонированием из клетки-столбца. Теперь видно, что матрица ХА, симметрична.
Рассмотрим произведение ХА,Х, Если 2;, 1 = 1, 2, 3, 4, обозначают клетки матрицы ХА„то хл х-)е' г') ° ))с )и ~ ) ге )и ~ ) ~-еа '1 т ' х л~(д т)+х т Подставляя вместо 2) их выражения через А, а и у, находим 2тЛ ' (Š— аут ) + 2,,ут = А" (Š— аут ) АЛ' (Š— аут ) + А' (Е - аут ) аут. Раскроем скобки и учтем, что АА'а=*а и ут А А'=)-'ат А'т А'А А+ =),"ат А) т А' у'. Тогда преобразуемое выражение превратится в А+ — А"аут = А" (Š— аут), Далее, 2зЛЕ(Š— аут)+ 24ут утАА+(Е аут) 1 утаут ут (Е тхут)т( утаут ут Таким образом, мы проверили, что ХА„Х = Х, и закончили доказательство.
Предложения 2 и 3 можно использовать для построения псевдо- обратной для данной матрицы А. Для этого рассматривают л матриц А„..., А„, где матрица А, (1 = 1, ..., и) состоит из 1 первых столбцов матрицы А. Так как Л, состоит из одного столбца, А+ находится без затруднения. Затем последовательно вычисляются А,', Аз+, ..., пока не будет получена А) = А+. Особенно этот способ удобен, если о течением времени данные пополняются, и расчеты, ранее проведенные о матрицей А„нужно повторить с матрицей А„„полученной из А) добавлением столбца. Если добавляются строки, то тот же метод применяется к транспонированной матрице.
Следует отметить, что затруднения, связанные в необходимостью одновременно о псевдообращением определять ранг матрицы, остаются и при применении рассматриваемого метода. Они появля)отся в тот момент, когда мы должны выяснить, выполнено ли равенство АА'а а, и в зависимости от этого выбрать нужную Формулу. 226 гл. пь псввдоевшвния и псевдоовгхтныв млтеицы Существуют и другие результаты, касающиеся связи псевдо- обращения и разделения матрицы на клетки, но они еще более гро.
моздки (см. Алберт (11). $4. Метод наименьших квадратов 1. Задача приближения функции. Этот параграф посвящен при« ложениям полученных ранее результатов о псевдорешениях и псевдообратных матрицах. Системы из большого числа линейных уравнений со сравнительно небольшим числом неизвестных возникают в следующей практически важной задаче, частный случай которой рассматривался во введении к 5 1. Пусть экспериментально исследуется зависимость между двумя переменными величинами $ и и и результат эксперимента представляет собой и пар соответствующих друг другу значений (в1 ч~) ($и чт) (1) Нужно найти функцию П = Г Д), которая как можно лучше представляла бы реальную зависимость между переменными величинами.
Функцию) ищут в виде линейной комбинации заранее заданных функций ч 6), ", ч«(ч). (2) называемых базисными функциями. Эти функции выбирают, исходя из природы рассматриваемой задачи. Так, если имеются основания предполагать, что исследуемая зависимость периодическая с известным периодом, то в качестве базисных могут быть выбраны тригонометрические функции. В этом случае искомая линейная комбинация выглядит как частичная сумма ряда Фурье.
Часто используются степенные базисные функции ($)" (й = О, ..., и — 1) или другие многочлены. При таком выборе функция 1 будет многочленом. Экспериментальные данные (1) содержат ошибки измерения и в зависимости от постановки задачи, возможно, другие случайные отклонения. Поэтому не требуется, чтобы равенства т1' ~($'), 1 ° 1, ..., и, (3) выполнялись, т. е. чтобы график функции г проходил через все точки (1) на координатной плоскости. Требуется только, чтобы график проходил в некотором смысле возможно ближе ко всем этим точкам. Обычное требование состоит в том, чтобы сумма ква11- ратов (и'-1(в'))'+" +() -И ))' (4) была минимальной.
Если функция г выбрана таким образом> то говорится> что она выбрана методом наименьших «вадрагпав. $ А мвтод нАименьших квхдРАгоз Подчеркнем отличие рассматриваемой постзновки задачи от задачи об интерполяции. В последней ищется функция заданного вида, принимающая в указанных точках заданные значения. В нашем же случае предполагается, что пары чисел лишь приближенно соответствуют реально существующей зависимости, и отыскивается функция заданного вида, лучше всего соответствующая экспериментальным данным. При этом не ожидается, что полученная функция точно представляет реальную зависимость между перемениымн — она должна лишь аппроксимировать эту зависимость. В соответствии с этим в корректно поставленной задаче об интерполяции число точек равно числу базисных функций, а в методе наименьших квадратов точек, как правило, значительно больше.
Если г — линейная комбинация базисных функций )($) =0 01(1)+...+0 ф„6), то равенства (3) представляют собой систему линейных уравнений относительно коэффициентов 0', ..., 0": амз'+ .. + паз = г)', (5) а„„з'+... + и „0" = ц", коэффициенты которой — значения базисных функций в точках $', ..., $т, т. е. ац = рт ($9. Матрицу системы обозначим буквой Л. Невязка, даваемая конкретным набором коэффициентов 0', ..., 0" при подстановке в эту систему, имеет компоненты г(г ) у) 1)т г дт) и квадрат ее нормы имеет вид (4). Поэтому любой набор коэффициентов, минимизирующий сумму квадратов (4), удовлетворяет нормальной системе для системы (5).
Однако важно подчеркнуть, что по отношению к той реальной зависимости между переменными, которую мы исследуем, решение нормальной системы представляет собой лишь приближение к истинному набору параметров, или, как говорят, оценку истинного набора параметров. Если столбцы матрицы А системы (5) линейно независимы, то нормальная система имеет единственное решение, которое является псевдорешеннем системы (5).