1611688890-f641c9ec8276824e4686da772eb56520 (826652), страница 38
Текст из файла (страница 38)
. . , σmin{m,n} — сингулярные числа матрицы A, а столбцыматриц U и V являются соответственно левыми и правыми сингулярными векторами матрицы A.Представление (3.16) называется сингулярным разложением матрицы A. Если A — вещественная матрица, то U и V являются такжевещественными ортогональными матрицами, и сингулярное разложение принимает видA = U ΣV ⊤ .Для квадратных матриц доказательство сингулярного разложенияможет быть легко выведено из известного полярного разложения матрицы, т. е.
её представления в виде A = QS, где Q — ортогональная матрица, а S — симметричная положительно полуопределённая(в комплексном случае Q унитарна, а S эрмитова); см., к примеру,[9, 23, 50, 64]. Рассмотрим подробно общий комплексный случай.Как известно, любую эрмитову матрицу можно унитарными преобразованиями подобия привести к диагональному виду, так что S =T ∗ DT , где T — унитарная, а D — диагональная.
Поэтому A = (QT ∗ )DT .Это уже почти требуемое представление для A, поскольку произведение унитарных матриц Q и T ∗ тоже унитарно. Нужно лишь убедитьсяв том, что по диагонали в D стоят сингулярные числа матрицы A.Исследуем произведение A∗A:∗A∗A = (QT ∗ )DT(QT ∗ )DT= T ∗ D∗ (QT ∗ )∗ (QT ∗ )DT= T ∗ D∗ DT = T ∗D2 T.Как видим, матрица A∗A подобна диагональной матрице D2 , их собственные числа поэтому совпадают.
Следовательно, собственные числаA∗A суть квадраты диагональных элементов D. Это и требовалось доказать.Для случая общих прямоугольных матриц доказательство Теоремы 3.2.1 не очень сложно и может быть найдено, к примеру, в книгах[11, 38, 40]. Фактически, этот результат показывает, как с помощьюсингулярных чисел матрицы элегантно представляется действие соответствующего линейного оператора из одного векторного пространствав другое. Именно, для любого линейного отображения можно выбратьортонормированный базис в пространстве области определения и ортонормированный базис в пространстве области значений так, чтобы в3.2. Теоретическое введение231этих базисах рассматриваемое отображение представлялось растяжением вдоль координатных осей. Сингулярные числа матрицы оказываются, как правило, адекватным инструментом её исследования, когдасоответствующее линейное отображение действует из одного векторного пространства в другое, возможно с отличающимися друг от другаразмерностями.
Собственные числа матрицы полезны при изучении линейного преобразования векторного пространства в пространство тойже размерности, в частности, самого в себя.Другие примеры применения сингулярных чисел и сингулярныхвекторов матриц рассматриваются ниже в §3.4.Сингулярное разложение матриц впервые возникло во второй половине XIX века в трудах Э. Бельтрами и К. Жордана, но термин valeurssingulières — «сингулярные значения» — впервые был использован французским математиком Э. Пикаром около 1910 года в работе по интегральным уравнениям (см.
[94]). Задача нахождения сингулярных чисел и сингулярных векторов матриц, последняя из списка на стр. 206,по видимости является частным случаем третьей задачи, относящейсяк нахождению собственных чисел и собственных векторов. Но вычисление сингулярных чисел и векторов матриц сделалось в настоящеевремя очень важным как в теории, так и в приложениях вычислительной линейной алгебры.
С другой стороны, соответствующие численныеметоды весьма специализированы, так что эта задача в общем спискезадач уже выделяется отдельным пунктом.Комментируя современный список задач вычислительной линейнойалгебры из §3.1, можно также отметить, что на первые места в нёмвыдвинулась линейная задача о наименьших квадратах. А некоторыестарые и популярные ранее задачи как бы отошли на второй план, чтостало отражением значительных изменений в математических моделяхи вычислительных технологиях решения современных практическихзадач. Это естественный процесс, в котором большую роль сыгралоразвитие вычислительной техники и информатики.
Следует быть готовым к подобным изменениям и в будущем.3.2еМатрицы с диагональным преобладаниемВ приложениях линейной алгебры и теории матриц часто возникают матрицы, в которых диагональные элементы в том или ином смысле«преобладают» над остальной, недиагональной частью матрицы. Этообстоятельство может быть, к примеру, следствием особенностей рас-2323. Численные методы линейной алгебрысматриваемой математической модели, в которой связи составляющихеё частей с самими собой (они и выражаются диагональными элементами) сильнее, чем с остальными. Такие матрицы обладают рядом замечательных свойств, изложению одного из которых и посвящён этотпункт. Следует отметить, что сам смысл, вкладываемый в понятие«преобладания» может быть различен, и ниже мы рассмотрим простейший и наиболее популярный.Определение 3.2.3 Квадратную n × n-матрицу A = (aij ) называют матрицей с диагональным преобладанием, если для любого i =1, 2, .
. . , n имеет местоX|aii | >|aij |.(3.17)j6=iМатрицы, удовлетворяющие этому определению, некоторые авторыназывают матрицами со «строгим диагональным преобладанием». Сосвоей стороны, мы будем говорить, что n × n-матрица A = (aij ) имеетнестрогое диагональное преобладание в случае выполнения неравенствX|aii | ≥|aij |(3.18)j6=iдля любого i = 1, 2, . . .
, n. Иногда в связи с условиями (3.17) и (3.18)необходимо уточнять, что речь идёт о диагональном преобладании «построкам», поскольку имеет также смысл диагональное преобладание«по столбцам», которое определяется совершенно аналогичным образом с суммированем внедиагональных элементов по столбцам.Теорема 3.2.2 (признак Адамара) Квадратная матрица с диагональным преобладанием неособенна.Доказательство.
Предположим, что, вопреки доказываемому, рассматриваемая матрица A = (aij ) является особенной. Тогда её столбцы линейно зависимы, и для некоторого ненулевого n-вектора y =(y1 , y2 , . . . , yn )⊤ выполняется равенство Ay = 0, т. е.nXj=1aij yj = 0,i = 1, 2, . .
. , n.(3.19)2333.2. Теоретическое введениеВыберем среди компонент вектора y ту, которая имеет наибольшее абсолютное значение. Пусть она имеет номер ν, так что |yν | =max1≤j≤n |yj |, причём |yν | > 0 в силу сделанного выше предположенияо том, что y 6= 0. Следствием ν-го из равенств (3.19) является соотношениеX−aνν yν =aνj yj ,j6=νкоторое влечёт цепочку оценокXX| aνj | |yj || aνν | |yν | = aνj yj ≤j6=ν≤max |yj |1≤j≤nj6=l Xj6=ν| aνj | = |yν |Xj6=ν| aνj |.Сокращая теперь обе части полученного неравенства на |yν | > 0, будемиметьX| aνν | ≤| aνj |,j6=νчто противоречит неравенствам (3.17), т.
е. наличию, по условию теоремы, диагонального преобладания в матрице A. Итак, A действительнодолжна быть неособенной матрицей.Доказанный выше результат часто именуют также «теоремой ЛевиДеспланка» (см., к примеру, [41, 50]), но мы придерживаемся здесьтерминологии, принятой в [9, 80]. В книге М. Пароди [80] можно прочитать, в частности, некоторые сведения об истории вопроса.Внимательное изучение доказательства признака Адамара показывает, что в нём нигде не использовался факт принадлежности элементов матрицы и векторов какому-то конкретному числовому полю — Rили C.
Таким образом, признак Адамара справедлив и для комплексных матриц. Кроме того, он может быть отчасти обобщен на матрицы,удовлетворяющие нестрогому диагональному преобладанию (3.18).Вещественная или комплексная n × n-матрица A = ( aij ) называется разложимой, если существует разбиение множества { 1, 2, . . .
, n }первых n натуральных чисел на два непересекающихся подмножестваI и J, таких что aij = 0 при i ∈ I и j ∈ J. Эквивалентное определение: матрица A ∈ Rn×n разложима, если путём перестановок строк и2343. Численные методы линейной алгебрыстолбцов она может быть приведена к блочно-треугольному виду!A11 A120A22с квадратными блоками A11 и A22 . Матрицы, не являющиеся разложимыми, называются неразложимыми.
Важнейший пример неразложимых матриц — это матрицы, все элементы которых не равны нулю, вчастности, положительны.Обобщением признака Адамара являетсяТеорема 3.2.3 (теорема Таусски) Если для квадратной неразложимой матрицы A выполнены условия нестрогого диагонального преобладания (3.18), причём хотя бы одно из этих неравенств выполненострого, то матрица A неособенна.Доказательство можно найти, к примеру, в [9].3.3Нормы векторов и матриц3.3аВекторные нормыНорму можно рассматривать как обобщение на многомерный и абстрактный случаи понятия абсолютной величины числа.
Вообще, инорма, и абсолютная величина являются понятиями, которые формализуют интуитивно ясное свойство «размера» объекта, его «величины»,т. е. того, насколько он мал или велик безотносительно к его расположению в пространстве или к другим второстепенным качествам. Такова,например, длина вектора как направленного отрезка в привычном намевклидовом пространстве.Формальное определение нормы даётся следующим образом:Определение 3.3.1 Нормой в вещественном или комплексном линейном векторном пространстве X называется вещественнозначнаяфункция k · k, удовлетворяющая следующим свойствам (называемымаксиомами нормы):(ВН1) kak ≥ 0 для любого a ∈ X, причём kak = 0 ⇔ a = 0— неотрицательность,2353.3.
Нормы векторов и матриц(ВН2) kα ak = |α| · kak для любых a ∈ X и α ∈ R или C— абсолютная однородность,(ВН3) ka + bk ≤ kak + kbk для любых a, b ∈ X— «неравенство треугольника».Само пространство X с нормой называется при этом нормированнымлинейным пространством.Далее в качестве конкретных линейных векторных пространств унас, как правило, всюду рассматриваются арифметические пространства Rn или Cn .Не все нормы, удовлетворяющие выписанным аксиомам одинаковопрактичны, и часто от нормы требуют выполнения ещё тех или иныхдополнительных условий.
К примеру, удобно иметь дело с абсолютнойнормой, значение которой зависит лишь от абсолютных значений компонент векторов. В общем случае норма вектора этому условию можети не удовлетворять.Приведём примеры наиболее часто используемых норм векторов вRn и Cn . Если a = (a1 , a2 , . . . , an )⊤ , то обозначимkak1 :=kak2 :=nXi=1| ai | ,nXi=1|ai |2!1/2,kak∞ := max | ai | .1≤i≤nВторая из этих норм часто называется евклидовой, а третья — чебышёвской или максимум-нормой. Евклидова норма вектора, как направленного отрезка, — это его обычная длина, в связи с чем евклидову нормучасто называют также длиной вектора. Нередко можно встретить идругие названия рассмотренных норм.Замечательность евклидовой нормы k · k2 состоит в том, что онапорождается стандартным скалярным произведением h · , · i в Rn илиCn .