Беклемишев - Дополнительные главы линейной алгебры (947281), страница 25
Текст из файла (страница 25)
Мы обозначим их х, +, х и т. д. Определяются все эти операции сходнымобрар р е зом. Определим, например, +. е Пусть а и Ь вЂ” числа из Е» р. Рассмотрим их обычную «точную» сумму с = а+ Ь.. Если [с [ ~10 Р, то полагаем а+ Ь = О. е В этом случае говорится, что результатом сложения является машинный нуль. Если [ с [) 10Р, то результат операции не опре- Г!4 ГЛ. ГП. ВВВДЕИИВ В ЧИСЛЕННЫВ МЕТОДЫ делен. Тогда говорят, что имеет место «переполнение». Таким образом, операция + определена не всегда.
(В общей алгебре такого Е рода операции называются частичными, но мы не будем вводить этот термин.) С возможностью переполнения приходится постоянно считаться. Далее, если 10» С ! с ! ~ 10», то в Е«р существует число г, являющееся приближением для с, и мы положим а + ГГ = г. Иначе Е говоря, точная сумма округляется и представляется в форме с плавающей запятой. Полученное число считается приближенным значением суммы. Разность с — г есть ошибка округления, возникающая при сложении. Точность представления чисел в системе с плавающей запятой может быть охарактеризована числом, называемым «машинное е». Опо определяется как наименьшее число, обладающее тем свойством, что 1 + з ~ 1. Рассмотрим в качестве примера операции в множестве Е«о Прибавив к 0,1000 10' число 0,5000 ! 0 ', мы снова получим О!000 10', а прибавив 0 5001 ° 10 'получим уже 0 1001 ° 10'.
Нужно отметить, что приближенные арифметические операции +, х идр. обладают совсем иными свойствами, чем точные а я операции. Например, опи не ассоциативны, не выполняется закон дистрибутивности, существуют делители нуля, т. е. произведение ненулевых сомножителей может оказаться равным нулю (это называется «возникновение машинного нуля при умножении»). При выполнении большого числа арифметических операций ошибки округления накапливаются: результат может существенно отличаться от результата выполнения соответствующих точных операций. Оценка возникающей погрешности — прямой анализ ошибок округления — дело сложное и трудоемкое по причине сложности свойств приближенных арифметических операций. В некоторых случаях прямой анализ ошибок округления может быть заменен применением принципа, называемого обршпным анализом ошибок округяения. Согласно этому принципу приближенное решение какой-либо задачи, например системы линейных уравнений, является точным решением некоторой близкой задачи, в нашем примере — системы линейных уравнений с немного измененными коэффициентами.
Вместо того чтобы оценивать отличие приближен. ного решения от точного, можно оценить отличие коэффициентов исходной и измененной систем. Обратный анализ ошибок округления реализуется намного проще, чем прямой. Приведем типичный пример задачи, в которой можно обойтись обратным анализом ошибок. Пусть коэффициенты системы линейных уравнений получены в результате физических измерений н, еле.
довательно, 'известны нам с некоторой ошибкой. Если в результате обратного анализа будет ноказаио, что влияние ошибок округ- В 1. ВВВЦВНМВ линия равносильно искахкению коэффициентов, не превосходящему ошибок измерения, то можно считать, что вычисления производятся с достаточная точностью, н не интересоваться отличием вычисленного решения от точного решения системы, которая сама определена недостаточно точно 3. Влияние неточности исходной информации. Если какая-либо практическая задача сводится к системе линейных уравнений, то коэффициенты и свободные члены системы, как правило, известны не точно, а с некоторымн погрешностями, Кроме того, как было сказано выше, запись исходных данных и вычисления связаны с ошибками округления, влияние которых равносильно некоторому искажению коэффициентов н свободных членов.
Избежать указанных искажений мы не можем, но можем, во-первых, оценнть получаемую погрешность, а во-вторых, постараться выбрать такой метод решения системы, который не увеличивал бы неопределенность результата, уже заложенную в самой системе. Мы будем стоять на следующей точке зрения: задана система линейных уравнений Ах = Ь, которую мы будем называть исходной нли невозмуиунной системой. Рассматривается еще одна система, называемая возмуи1енной системой, про которую известно, что ее коэффициенты и свободные члены лежат в заданных интервалах (ау — Лау, аут Лап), (Ь! — ЛЬ„Ь,+ЛЬ;), где ау и Ь| — коэффициенты и свободные члены исходной системы.
Погрешностью решения мы будем называть разность между решениями исходной и возмущенной систем. (При этом предполагается, что каждая из систем имеет единственное решение.) Согласно этому определению погрешность — столбец, и оценить погрешность можно только по какой-либо норме в арифметическом пространстве. В примерах этого параграфа рассматривается нсклеэчительно евклидова норма. Рассмотрим простейший случай — систему из двух линейных уравнений с двумя неизвестными. Невозх|ущенная система имеет внд ах+ Ьу =- с, а,х + Ь,у =- с„ и пусть известно, что коэффициенты при переменных заданы точно, а возмущены только свободные члены, т. е.
Ла = ЛЬ = Ла, = ЛЬ, =О. Геометрически каждое уравнение невозмущенной системы изображается прямой линией на плоскости. Соответствующее уравнение возмущенной системы — параллельной ей прямой, которая Лежит внутри некоторой полосы (рис. 3). Для первого уравнения, Например, полоса ограничена прямыми ах+ Ьу=с — Лс и ах+ Ьу=с+Лс. 116 ГЛ. 1Н. ВВЕДЕНИЕ В ЧИСЛЕННЫЕ МЕТОДЫ Таким образом, решения возмущенной системы лежат внутри параллелограмма, являющегося пересечением полос. Погрешность решения изображается вектором (Ьх, Ьу), длина которого может достигать половины длины наибольшей диагонали параллелограмма.
Поэтому искажающее влияние возмущений свободных членов системы при полосах одинаковой ширины тем больше, чем меньше угол между прямыми (1). В общем случае, когда и коэффициенты истинной системы отличаются от коэффициентов исходной, прямые, изображающие уравнения, не только сдвигаются, но и поворачиваются. Параллелограмм заменяется более сложной фигурой, но общий результат остается тот же: чем меньше угол между прямыми (1), тем, как говорится, хуже обусловлена система, т. е. такое же возмуще- ние коэффициентов моу с Ьз жет вызывать большую погрешность решения.
Вт'" ьс Наша задача — точ- ,В ~ но определить и по воз- ~М можности количественно измерить свойство системы линейных уравнений быть хуже илн лучше обусловленной. На разобранном нами примере хорошо видно, что при замене систе- Ю мы на эквивалентную Рис.
3. ей систему ее обуслов- ленность изменяется, так как при этом пара прямых (1) заменяется другой парой, пересекающейся в той же точке. Могло бы показаться, что лучше всего обусловлена система, если прямые, ею изображаемые, перпендикулярны. Однако более подробное исследование, учитывающее ширину полос, показывает, что это не всегда так. Рассмотрим, например, систему 10зх=1, 10-зу 10-з ,1(ля нее относительно небольшое изменение свободных членов 'Ьс = О, Ьс, = 10 ', при котором Нц! И%5'таит' 1З 1с1 Кс(+с3 приводит к погрешности решения, равной (О, 1), н относительной погрешности 1дх1 Р'(Дх) +(аз)з ; 1х1 1'хз+аз Ф ь вввдвннв Легко заметить, что плохая обусловленность этой системы связана с тем, что среди ее коэффициентов и свободных членов встречаются сильно различающиеся' по величине.
Положение может быть исправйено умножением второго уравнения на !О'. Посмотрим на вопрос с другой точки зрения. Систему линейных уравнений мы можем интерпретировать и иначе — как задачу отыскания прообраза точки с' (с, + Лс» аз+ Лс,) при аффинном преобразовании плоскости х* = ах+ Ьу, (2) у' =а,х+ Ь,у. Будем считать, что аффинное преобразование известно точно: Ла = Ла, = ЛЬ = ЛЬ, = О, но про точку С' известно только то, что она лежит внутри некоторого круга радиуса р с центром С (с„с,).
Прообраз круга — эллипс, и потому решение возмущенной системы лежит внутри эллипса. Центром этого эллипса является прообраз центра круга, т. е. решение невозмущенной системы. При аффинном преобразовании прообразы всех окружностей имеют одинаковое отношение полуосей. Пусть Х р и р р (Х ~ р)— полуоси прообраза окружности радиуса р. Тогда длина б вектора погрешности (Лх, Лу) не превосходит Лр. Для получения оценки относительной погрешности оценим снизу длину вектора, изображающего решение невозмущенной системы. Так как точка С лежит на окружности радиуса г = = )' с1 + с,' с центром в начале координат, ее прообраз — точка с координатами (х„ у,) отстоит от начала координат не меньше чем на рг. Таким образом, й = 'и'х„' + у„' з: рг, и для относительной погрешности решения получается оценка 6 х р Д и Г (3) Здесь р/г — максимальная относительная погрешность столбца свободных членов.
Итак, отношение полуосей эллипса Х/р можно рассматривать как число, характеризующее обусловленность системы (1). Здесь, в частности, хорошо видно, что плохая обусловленность системы не связана с величиной детерминанта: она зависит от отнощения полуосей эллипса, в то время как детерминант равен отношению площадей окружности и эллипса и никак не связан с формой эллипса. 4, Почти вырожденные матрицы.