Ортега Дж., Пул У. Введение в численные методы решения дифференциальных уравнений. Под ред. А.А.Абрамова (1986) (1095855), страница 25
Текст из файла (страница 25)
Геометрически это означает, что определяемые двумя уравнениями (3.5.1) прямые почти параллельны. Эта ситуация показана на рис. 3.6. Рассмотрим теперь систему уравнений 0,832 х1 + 0,448 х~ = 1,00, 0,784х, + (0,421+ е) хз = О. (3.5.6) Второе уравнение определяет семейство прямых, зависящее от параметра е. При увеличении е от нуля примерно до 0,012 прямая поворачивается против часовой стрелки. При этом точка ее пересечения с прямой, определяемой первым уравнением, удаляется в бесконечность до тех пор, пока прямые не станут параллельными и линейная система не будет иметь решения. Ясно, что при приближении параметра е к значению, при котором система (3.5.6) вырождается, даже очень малые изменения одного коэффициента системы могут вызывать все увелнчиваюшиеся изменения решения.
В точке вырождения определитель матрицы коэффициентов обращается в нуль, и иногда считают, то малость определителя является мерой плохой обусловленности системы. Но, как показывает следуюший пример, в общем случае это неверно. Пусть 10 '~ 0 10'~ 0 Йе1 10-го Дет 1 = 10*' О 10 ' О 1О' З (3.5.7) Значения этих двух определителей совершенно различны, но прямые, задаваемые двумя соответствующими системами уравнений: 10-"х, =О, 1О"х, =О, 10 юхз =О, 10юх~ =О, (3.5.8) 100 являются одними и теми же, просто координатными осями. Как нам вскоре станет ясно, если определяемые уравнениями системы прямые взаимно перпендикулярны, то система "идеально обусловлена".
Таким образом, величина определителя матрицы коэффициентов не является хорошей мерой близости этой матрицы к вырождению. Однако, как мы увидим, если матрица надлежащим образом масштабирована, эта величина может стать основой для такой меры. В случае двух уравнений очевидно, что хорошей мерой "почти параллельности" ЛВух соответствующих прямых может служить угол между ними.
По существу, эквивалентной мерой является плошадь показанного на Если предположить, что а,| >О, то координаты ф, 7) будут задаваться формулами 11= — а12/а,> 7=а„/аг, а1 =(агп +а~2) ~, так что 1апагг — аг~а12! 1йе1А ! Й1П2 пгпг (3.5.9) Таким образом, видим, что площадь й равна значению определителя, делен- ному на произведение айаг. Хг- О Рис. 3.7. Едипичныа параллелограмм Эта мера легко распространяется на случай и уравнений. Пусть А = = (аа) — матрица коэффициентов системы.
Положим !йе1А ! и= —, (3.5.10) й!П2 - Пи где о (а2 +а 2 + +а )1/2 Мы обозначили величину в (35.10) через Р', а не через й, потому что она представляет собой объем и-мерного параллелепипеда, построенного на прямых, определяемых строками матрицы А. Величины 1 — (ап,ад,...,а1л), г'=1,...,и, ©ю' являются координатами и точек и-мерного пространства, евклидово рас- стояние которых от начала координат равно единице, и эти и точек опре- деляют параллелепипед с единичными сторонами. 101 рис.
3.7 параллелограмма, длины сторон которого равны единице, а высота обозначена через й. Так как основание равно единице, то площадь параллелограмма численно равна просто и, а угол 0 между прямыми, определяемыми этими двумя уравнениями, связан с и соотношением й = а1п0. Таким образом, площадь й изменяется от О, когда прямые сливаются, до 1, когда они перпендикулярны, и служит хорошей мерой "почти параллельности" этих прямых. Из аналитической геометрии известно, что расстояние от точки (11, 7) до прямой аг1х, + аг,хг = 0 есть и = 1аг1Р+агг7~ lпг ° пг (аг, +агг) ~ ° Интуитивно ясно и может быть доказано, что объем параллелепипеда заключен между нулем, если, например, две или более сторон совпадают, и единицей, когда все эти стороны взаимно перпендикулярны.
Если Г = О, то йетА = О, и матрица А является вырожденной. Если 1' = 1„то стороны "максимально непараллельны'", и в этом случае матрица А называется идеально обусловленной. Видим, что 1/и 1 1/2 1/г н (35.11) 1/л... 1/(2п — 1) С увеличением и эти матрицы становятся все более плохо обусловленными. Насколько плоха обусловленность этих матриц, можно проиллюстрировать таким примером. Если при л= 8 ввести элементы матрицы на ЭВМ в виде двоичных дробей с 27-ю двоичными знаками (что эквивалентно примерно 102 т.е. объем Г равен абсолютной величине определителя матрицы, строки которой нормированы на единичную евклидову длину. Плохая обусловленность матрицы проявляется не только в сложности вычисления точного решения соответствующей линейной системы.
Вернемся снова к системе (3.5.1) и предположим теперь, что "реальная" задача, которую мы бы хотели решить, описывается системой (3.5.5), но коэффициенты этой системы измеряются прн помощи некоторой физической аппаратуры, которая обеспечивает точность только до третьего десятичного знака. Таким образом, система (3.5.1) — это не та система, которую нам надо решить на самом деле, а некоторое ее приближение, которое нам удалось получить. Предположим также, что мы можем утверждать, что коэффициенты приближенной системы определены с точностью не менее 0,05%. Если сравнить системы (3.5.1) и (3.5.5), то видно, что это действительно имеет место. В такой ситуации часто можно слышать утверждение, что мы должны суметь найти решение системы примерно с той же точностью. Но, как мы уже видели, такое утверждение неверно: в случае системы (3,5.1) иэ-за плохой обусловленности матрицы небольшие погрешности в коэффициентах приводят к погрешностям в решении в 500 раз большим.
Следовательно, как бы точно мы ни решали систему (3.5.1), нам не избавиться от ошибок, обусловленных погрешностями при измерении коэффициентов. Если, например, нам надо найти решение "реальной" системы (3.5 5) с точностью не менее чем 1%, то необходимо измерять коэффициенты точнее, чем с тремя десятичными знаками. Таким образом, некоторые плохо обусловленные системы не следует даже пытаться решить, а нужно либо переформулировать задачу, либо провести более точные измерения данных. В некоторых случаях, однако, матрица коэффициентов может быть известна точно.
Классический пример плохо обусловленных матриц дают митрины Гильберта, элементы которых являются точными рациональными числами: восьми десятичными знакам), то точно вычисленная на ЭВМ обратная матрица'будет отличаться от точной обратной к На матрицы в первом знаке! Другое проявление плохой обусловленности состоит в следующем. л Предположим, что х — вычисленное решение системы Ах= Ь.
Один из л способой оценки точности х заключается в определении вектора левязок л г= Ах — Ь. (3.5.12) л Если х точное решение, то вектор г будет равен нулю. Следовательно, л мы могли бы ожидать, что если х — хорошее приближение к точному ре- шению, то вектор г будет "мал", и, наоборот, если вектор г мал, то х яв- ляется хорошим приближением. В некоторых случаях зто действительно так, но если матрица А плохо обусловлена, то величина г может быть весьма обманчивой.
В качестве примера рассмотрим систему 0,780х, +0,563х, =0,217, 0,913х, + 0,659ха =0,254 (3.5 13) и приближенное решение — 0,087 (3.5.14) В этом случае вектор невязок есть =[" ] (3.5.15) Рассмотрим теперь совершенно отличное приближенное решение 0,999 (3.5.16) и соответствующий вектор невязок — 0,0013... 0,0015... (3.5.! 7) 9999 9998 1 ~ 9999,9999 -9997, 0001 А= в=~ 10000 9999 — 10001 9998 где матрицу В мы рассматриваем как приближение к матрице А '.
Чтобы оценить точность этого приближения, вычислим матрицу невязок 0,000! 0,0001 А~ =А — 1= 0 0 (3.5.18) Сравнивая невязки (3.5.15) и (3.5.17), можем прийти к заключению, что (3.5.14) дает лучшее приближение к решению. Однако точным решением системы (3.5.13) является вектор (1, — 1), так что невязки дают информацию, которая только вводит в заблуждение. Подобное явление может возникнуть и при обращении матриц. Пусть 19998 19995 Я, =ВА — 1= -199999 -19996 (3.5.19) Какой же матрице невязок верить? Матрица (35.18) указывает на очень хорошее приближение, в то время как (3.5.19) говорит о плохом прибли- жении. Истинная же обратная матрица равна -10000 9999 так что В дает приближение с точностью до единицы в четвертом знаке.
Таким образом, матрица невязок (3.5,19) вводит нас в заблуждение и это снова является следствием плохой обусловленности матрицы А. Теперь обратимся к другому способу определения степени плохой обусловленности матрицы, основанному на использовании норм (обзорные сведения о нормах векторов и матриц можно найти в приложении 3) . Предположим сначала, что х' — решение системы Ах= Ь и х*+ с х — решение этой же системы с правой частью Ь + ЬЬ, т.е. А(х'+ Ьх) = Ь+ !1Ь. (3.5.20) Так как Ах'=Ь, то отсюда следует, что А(Ьх) = сХЬ и Ьх=А '(.ЪЬ). Здесь, как обычно, предполагаем, что матрица А невырожденна. Следовательно, ПьхП4 ПА ' ППЬЫ!, откуда видно, что изменение решения, обусловленное изменением вектора правой части, ограничено величиной ПА ' П. Таким образом, если ПА ' П велика, то небольшое изменение Ь может привести к большому изменению х'.
Понятие "большое" всегда является относительным, поэтому полезнее иметь дело с относительным изменением П ЬхП) Пх П. Из Ах'= Ь следует ПЬП< ПАП Пх'П, что вместе с (3.5.21) дает ПЬхП ПЬП< ПАП ПА ' П ПУЛЬП Пх'П, нли, что то же самое (при Ь чь О), П ЬхП ПУЛЬП ~ ПАП ПА ' П вЂ” . Пх'П ПЬП (3.5.22) Из этого неравенства видно, что относительное изменение х', обусловленное изменением Ь, ограничено величиной относительного изменения Ь, где У вЂ” единичная матрица. Если бы В равнялась А ', то матрица невязок была бы нулевой. И действительно, значения невязок очень малы, особенно в сравнении с величинами элементов матриц А и В. Это, казалось бы, свидетельствует о том, что матрица В является очень хорошим приближением к матрице А '.