Н.И. Яцкин - Линейная алгебра (Теоремы и алгоритмы) (1109879), страница 52
Текст из файла (страница 52)
Сумме матриц J = D + Y отвечает сумма операторов§ 27Корневая сумма. Большая теорема Жордана301ϕ = δ + υ, причем оператор δ, по построению, является диагонализируемым, а оператор υ, как и его матрица, нильпотентен.27.3. Жорданова нормальная форма и критерий подобиядля квадратных матриц. Выразим результат предложения 27.2на "языке матриц".Определение 27.2. Будем говорить, что квадратная матрица Aприводима к жордановой нормальной форме (ж.н.ф.), если найдетсяей подобная блочно-диагональная матрица J с блоками — жордановыми ящиками.Предложение 27.3. Квадратная (n × n)-матрица A с элементами из поля P приводима к ж.н.ф.
тогда и только тогда, когда ее характеристический многочлен разлагается на линейные множители,или, что равносильно, когда сумма кратностей характеристическихкорней равна n.Над алгебраически замкнутым полем P любая матрица приводима к ж.н.ф.Доказательство. В п. 13.6 объяснялось, что две квадратные матрицы A, A0 ∈ L(n, P ) подобны ( A◦∼◦A0 ) тогда и только тогда, когдаони соответствуют одному и тому же л.э. ϕ ∈ L(V ) в двух базисахB, B 0 в пространстве V .
(В качестве V можно взять арифметическоелинейное пространство P n .) Таким образом, вопрос о приводимостиквадратной матрицы к ж.н.ф. равносилен вопросу о существованиижорданова базиса для соответствующего оператора и, следовательно, как первое, так и второе утверждения предложения 27.3 вытекают из предложения 27.2. ¤Замечание 27.2. В том случае, когда ж.н.ф. существует, естественно задуматься о том, насколько однозначно она определена."Большие" блоки, каждый из которых соответствует одному изсобственных значений, определяются однозначно, если договориться(как это и делалось выше) размещать "малые" блоки (ж.я.) внутри"большого" в порядке убывания их размеров.В то же время, поскольку данное поле совсем не обязательно несеткакой-либо порядок, то, вообще говоря, не существует естественногоспособа упорядочения собственных значений и, как следствие, несуществует естественного порядка расположения "больших" блоков.Так что ж.н.ф.
матрицы определена неоднозначно.302Спектральная теория линейных эндоморфизмовГл. 3Впрочем, можно считать, что блочно-диагональные матрицы, отличающиеся лишь порядком диагональных блоков, отличаются несущественно. Принято говорить, что ж.н.ф. определена однозначно, сточностью до перестановки диагональных блоков.Гораздо большая неоднозначность имеет место при вычислениипреобразующей матрицы (или, на другом языке, — при отысканиижорданова базиса).
В самом деле, по ходу построения жордановабазиса приходится (и неоднократно) определять некоторые прямыедополнения к некоторым подпространствам в некоторых более широких подпространствах, а это (в нетривиальных случаях) — сугубонеоднозначная процедура.Замечание 27.3. Развивая метафору А. А. Кириллова, мы вышене раз рассуждали о спектре, как о "душе" линейного оператора, которая видна по его "фотографии" (матрице), если оператор являетсядиагонализируемым. Если для оператора существует жорданов базис (а над "хорошими" полями это всегда так), то спектр "визуальнонаблюдается" по ж.н.ф. матрицы этого оператора.Следует однако отдавать себе отчет в том, что знания одних только собственных значений (т.
е. спектра "в чистом виде") в общемслучае не достаточно для описания всех свойств оператора. Надоиметь полные данные о структуре ж.н.ф. Напомним, что эта структура однозначно определяется по последовательностям итерированных дефектов.Если мы знаем все характеристические корни λi и для каждого(k)из них знаем последовательность di итерированных дефектов, томы знаем все о матрице и о соответствующем линейном операторе.Рассуждения предыдущего замечания можно перевести из метафорической сферы в математическую.
С этой целью ниже формулируется критерий подобия квадратных матриц.Предложение 27.4. Пусть поле P алгебраически замкнуто. Рассмотрим две квадратные матрицы A и B одинакового размера. Следующие три утверждения равносильны:(1) матрицы A и B подобны;(2) матрицы A и B можно привести к одной и той же ж.н.ф.;(3) матрицы A и B имеют одинаковые спектры, и для каждого изхарактеристических корней λi справедливы равенства:dfc((A − λi E)k ) = dfc((B − λi E)k ); k = 1, 2, ...
.(27.18)§ 27Корневая сумма. Большая теорема Жордана303Доказательство. 1. Если B = T −1 AT, то (см. предложение 17.1)совпадают характеристические многочлены и, следовательно, спектры матриц A и B:σ(A) = σ(B) = {λ1 , λ2 , ..., λs }.Алгебраическая замкнутость поля P гарантирует их непустоту(s > 0). Кроме того, подобны характеристические матрицы для A иB, что, после перемены знака, можно представить в виде равенстваполиномиальных матриц:B − λE = T −1 (A − λE)T.(27.19)Подставляя в (27.19) вместо переменной λ каждое из собственныхзначений λi , мы придем к равенствамB − λi E = T −1 (A − λi E)T ; i = 1, ...
, s.(27.20)С помощью элементарной индукции легко убедиться в справедливости (при любом натуральном k) равенств(B − λi E)k = T −1 (A − λi E)k T.(27.21)Но подобные матрицы эквивалентны [см. (13.16)] и, следовательно, имеют одинаковые ранги и дефекты. Значит, справедливы формулы (27.18), и импликация (1) ⇒ (3) доказана.2. Собственные значения (если их определенным образом упорядочить) и итерированные дефекты однозначно определяют (см.замечание 27.2) ж.н.ф. матрицы. Так что, благодаря условию (3),матрицы A и B могут быть приведены к одной и той же жордановой нормальной форме, т.
е. (3) ⇒ (2).3. Две матрицы, приводимые к одной и той же ж.н.ф., оказываются подобными одной и той же матрице и, следовательно, — подобными между собой. Таким образом, (2) ⇒ (1), и доказательство"по циклу" завершено. ¤Замечание 27.4. Условие (27.18), выраженное в терминах итерированных дефектов, можно переформулировать, используя итерированные ранги (напомним, что сумма соответствующих итерированных дефекта и ранга равняется размерности пространства):rank((A − λi E)k ) = rank((B − λi E)k ); k = 1, 2, ... .(27.180 )304Спектральная теория линейных эндоморфизмовГл. 327.4.∗ Комплексификация и овеществление.
Обобщеннаяж.н.ф. для действительных матриц. Поле действительных чисел не является алгебраически замкнутым, и, как следствие, в действительном линейном пространстве (размерности n > 2) существуют линейные эндоморфизмы, не имеющие жорданова базиса.Это равносильно (на матричном языке) тому, что существуютквадратные матрицы с действительными элементами, не приводимые к ж.н.ф.В связи с этим возникает необходимость перехода от линейногопространства над R к пространству над C. Этот переход должен,прежде всего, сохранять размерность пространства.
Кроме того, ондолжен быть таким, чтобы всякому л.э. в данном пространстве соответствовал определенный л.э. в новом пространстве, имеющий (принадлежащем выборе базисов) такую же матрицу, что и исходный.При изучении вопроса о диагонализируемости л.э. мы уже сталкивались с описанной задачей (см. замечание 21.3 и пример 21.2).Здесь мы опишем конструкцию комплексификации в большей общности и более подробно, хотя некоторые, достаточно важные, деталипо-прежнему останутся за рамками нашего изложения.
Читателей,заинтересованных в прояснении всех тонкостей данной темы, мы отсылаем к учебникам [1] и [2].Построение комплексного линейного пространства (как расширения данного действительного пространства) производится по образуи подобию построения поля комплексных чисел (как расширения поля действительных чисел).Поле C определялось (см. § 31 пособия [A1 ]) как линейное пространство R2 со специальным образом введенным умножением. Егоэлементы (комплексные числа) представлялись двояко:— как упорядоченные пары действительных чисел λ = (α, β);— как выражения вида λ = α + βi, где α, β ∈ R.Аналогично, имея действительное линейное пространство V , можно образовать внешнюю прямую сумму (см.
п. 9.4) двух экземпляровэтого пространства:V C = V ⊕ V = {(x, y) : x, y ∈ V }.(27.22)По построению, V C является линейным пространством над R; егоэлементы мы таже будем записывать в одной из двух форм:— как упорядоченные пары вида (x, y), где x и y являются векторами из V [именно такая запись принята в (27.22)];— как выражения вида z = x + iy, где i — мнимая единица.§ 27Корневая сумма.
Большая теорема Жордана305Далее вводится умножение векторов из z ∈ V C на комплексныечисла λ = α + iβ ∈ C. Делается это по формулеλ · z = (α + iβ) · (x + iy) = (αx − βy) + i(βx + αy),(27.23)ничем (по виду) не отличающейся от формулы (31.21) из первого пособия. По сути отличие все же есть: в новой формуле сомножителине равноправны (λ является скаляром, а z — вектором).Для доказательства того, что умножение (27.23) превращает V Cв линейное пространство над C, требуется проверить четыре последних из восьми аксиом линейного пространства (см. п. 1.2 настоящегопособия). Эта проверка совершенно элементарна и вполне аналогична проверке аксиом поля в [A1 , п. 31.3].Пространство V C , рассматриваемое как комплексное, называетсякомплексификацией действительного пространства V.Пространство V считается вложенным в V C в качестве первогослагаемого, с помощью отождествления x = (x, 0). Второе слагаемое,состоящее из пар вида (0, y) = iy = i(y, 0), может быть обозначено iV.В соответствии с общим принципом взаимосвязи внешних и внутренних прямых сумм (см.
предложение 9.5) будем иметь (внутреннее) прямое разложениеV C = V ⊕ iV.(27.24)Формула (27.24) выражает очень важное свойство комплексификации V C , которая представляет из себя не просто комплексное пространство, но, как иногда говорят (см. [20]), — вещественно-комплексное. Последний термин характеризует комплексные пространства с выделенным прямым разложением в прямую сумму двух изоморфных действительных подпространств.В вещественно-комплексном линейном пространстве можно определить операцию комплексного сопряжения векторов, обозначаемуюздесь (в отличие от примера 21.2) не тильдой, а привычной чертой:x + iy = z 7−→ z = x − iy,(27.25)свойства которой вполне аналогичны свойствам сопряжения в поле C.
Например, для λ ∈ C и z ∈ V C справедлива формула:λz = λz.(27.26)306Спектральная теория линейных эндоморфизмовГл. 3Предположим теперь, что пространство V является конечномерным и dimR (V ) = n (в обозначении уточнено, что размерность вычисляется над полем R). Пусть, далее, в пространстве V выбранбазисB = [b1 , b2 , ...