Н.И. Яцкин - Линейная алгебра (Теоремы и алгоритмы) (1109879), страница 64
Текст из файла (страница 64)
ann (λ)фиксированного размера n × n, с элементами из кольца многочленов P [λ]. Обозначимm = max{deg(aij (λ)) | 1 6 i, j 6 n }(30.21)§ 30Каноническая форма Смита полиномиальной матрицы 371и рассмотрим A(λ) как многочлен степени m от переменной λ сматричными коэффициентами (или, выражаясь короче, матричный многочлен):A(λ) = A0 λm + A1 λm−1 + ... + Am−1 λ + Am ,(30.22)где матрица Ak ∈ L(n, P ) (k = 0, ... , m) составляется из коэффициентов при λm−k во всех многочленах — элементах матрицы A(λ); старший коэффициент A0 , как и полагается, отличен от нуля (A0 6= O).Пример 30.2.
Полиномиальную матрицуµA(λ) =2λ2 − λλ−23λ2 + 2λ + 1−3λ¶можно представить как матричный многочлен (степени 2):A(λ) = A0 λ2 + A1 λ + A2 =µ¶µ2 3−12=λ +0 012−3¶µλ+0 1−2 0¶.Раньше мы рассматривали многочлены над полями или над коммутативными кольцами; множество L(n, P ) всех (n×n)-матриц (с алгебраическими действиями сложения и умножения) также являетсякольцом, но уже (при n > 2) — некоммутативным.
Теория многочленов с такими коэффициентами на начальных этапах развиваетсявполне аналогично теории обычных многочленов, с единственнымзапретом: при вычислении произведения многочленовÃmXi=0! lm+lXXm−il−j=Ck λm+l−k ,Ai λ·Bj λj=0гдеCk =(30.23)k=0XAi Bj ,(30.24)i,j>0i+j=kнельзя переставлять матрицы-сомножители в произведениях Ai Bj .Кроме того, проявляется еще одна особенность (встречающаясяи в коммутативном случае): при умножении многочленов возможно372Спектральная теория линейных эндоморфизмовГл. 3"падение степени". Действительно, произведение Cm+l = Am Bl двухненулевых матриц вполне может оказаться нулевым.Ситуация исправляется, если хотя бы один из двух сомножителейимеет обратимый старший коэффициент (такие матричные многочлены называются регулярными).
В этом случае действует привычное правило: "степень произведения равна сумме степеней".(Взгляните еще раз на матричный многочлен из примера 30.2.Регулярным он, очевидно, не является.)Частным случаем регулярных матричных многочленов являютсянормализованные матричные многочлены, старшим коэффициентому которых служит единичная матрица.Два облика, (30.20) и (30.22), одного и того же объекта A(λ) оказываются идеально согласованными. Произведение A(λ)B(λ) можновычислять— либо как матричное произведение, в предположении, что матричные элементы перемножаются как многочлены;— либо как произведение многочленов, в предположении, что коэффициенты многочленов перемножаются как матрицы.Результат будет один и тот же.Оговорим еще одну условность, связанную с матричными многочленами.
Переменная λ в формуле (30.22) располагается справа отматричных коэффицинтов. Договоримся, что ее можно располагатьи слева от них, считая записьA(λ) = λm A0 + λm−1 A1 + ... + λAm−1 + Am ,(30.220 )равносильной записи (30.22).У такой договоренности есть косвенная мотивировка: скалярнаяпеременная λ трактуется как матричная переменная λE. Напомним,что матрицы такого типа как раз принято именовать скалярнымиматрицами и что они коммутируют с любыми матрицами.Обычному (скалярному) многочленуa(λ) = a0 λm + a1 λm−1 + ... + am−1 λ + am(30.25)можно сопоставить матричный многочленA(λ) = a(λ)E == (a0 E)λm + (a1 E)λm−1 + ... + (am−1 E)λ + (am E),(30.25m)все коэффициенты которого являются скалярными матрицами.§ 30Каноническая форма Смита полиномиальной матрицы 373Переход от полиномиальных квадратных матриц к матричныммногочленам дает возможность определения значений полиномиальной матрицы на матрицах (т.
е. подстановки квадратной матрицывместо переменной λ в матричный многочлен), подобно тому, какэто делалось в п. 29.1 для скалярных многочленов.Здесь однако приходится рассматривать два (вообще говоря, различных) значения матричного многочлена A (λ) на (постоянной)n×nматрице C :n×n— правое значение, соответствующее записи матричного многочлена в виде (30.22):→A(C) = A0 C m + A1 C m−1 + ...
+ Am−1 C + Am ;(30.26)— левое значение, соответствующее записи (30.220 ):←A(C) = C m A0 + C m−1 A1 + ... + CAm−1 + Am .(30.260 )В простейшем случае, когда все коэффициенты многочлена A(λ)являются скалярными матрицами [или, что равносильно, когда этотмногочлен происходит от некоторого скалярного многочлена a(λ);см. формулу (30.25m)], правое и левое значения (на любой матрице C) не отличаются.Без труда, как и в скалярном случае, доказывается, что правое(левое) значение суммы A(λ) + B(λ) двух матричных многочленовна произвольной матрице C равно сумме значений этих многочленовна C. А вот аналогичное свойство→→→(A · B)(C) = A(C) · B(C)(30.27)для правого (и аналогично — левого) значения произведения матричных многочленов оказывается, вообще говоря, ложным.Пример 30.3. Достаточно рассмотреть два линейных многочлена A(λ) = A0 λ и B(λ) = B0 λ.
Их произведение будет многочленом(A · B)(λ) = A0 B0 λ2 .Правые значения этих трех многочленов на матрице C равны соответственно:→→→A(C) = A0 C; B(C) = B0 C; (A · B)(C) = A0 B0 C 2 .374Спектральная теория линейных эндоморфизмовГл. 3Легко подобрать матрицы-коэффициенты так, чтобы равенствоA0 B0 C 2 = A0 CB0 C оказалось ложным.Ясно, однако, что для многочленов вида (30.25m) соотношение(30.27) справедливо (и, как уже объяснялось, стрелочки в нем ненужны).Из материала первого семестра (см.
[A1 , §§ 37, 38, 45]) нам известно, какую большую роль в теории многочленов играет деление состатком. В случае многочленов над полем любой многочлен можно(однозначно) поделить с остатком на любой ненулевой многочлен;в случае многочленов над кольцом добавляется (см. замечание 37.2в [A1 ]) условие: старший коэффициент делителя должен быть обратимым.Примерно так же обстоит дело для матричных многочленов: надо требовать, чтобы делитель был регулярным многочленом.
Однако некоммутативность матричного умножения приводит к тому, чтоопределены два различных деления с остатком: правое и левое.Переходим к точным формулировкам. Для любых двух матричных многочленов, A(λ) (степени m) и B(λ) (степени l), в предположении, что A(λ) регулярен (т. е. его старший коэффициент A0 является обратимой матрицей), существуют и однозначно определеныматричные многочлены:→— Q(λ) (называемый правым неполным частным);→— R(λ) (называемый правым остатком и — либо нулевой, либоимеющий степень, меньшую m);←— Q(λ) (называемый левым неполным частным);←— R(λ) (называемый левым остатком и — либо нулевой, либо имеющий степень, меньшую m),такие, что справедливы (соответственно) равенства:→→B(λ) = Q(λ)A(λ) + R(λ);←←B(λ) = A(λ)Q(λ) + R(λ).(30.28)(30.280 )Обратите внимание на то, что правое частное пишется слева.В этом нет ничего удивительного, поскольку справа пишется правыйделитель.
(Со второй формулой — все "с точностью до наоборот".)§ 30Каноническая форма Смита полиномиальной матрицы 375Доказательство сформулированных выше фактов ничем существенным (кроме непременного слежения за порядком сомножителей)не отличается от доказательства в скалярном случае.Если правый (левый) остаток обращается в нуль, то говорят, чтоA(λ) является правым (левым) делителем для B(λ).
Это фиксируется с помощью следующих обозначений:→→←←→[ A(λ) | B(λ) ] ⇔ [ ∃ Q(λ) ] [ B(λ) = Q(λ)A(λ) ];←[ A(λ) | B(λ) ] ⇔ [ ∃ Q(λ) ] [ B(λ) = A(λ)Q(λ) ].(30.29)(30.290 )[В принципе, определения (30.29) и (30.290 ) имеют смысл и безпредположения о регулярности A(λ).]Могут быть определены и изучены два понятия НОД: наибольший общий левый делитель (НОлД) и наибольший общий правыйделитель (НОпД) для двух матричных многочленов, но мы не будем останавливаться на этих вопросах.Переходим к изложению материала, связанного с так называемойматричной теоремой Безу.Здесь нам вновь понадобится понятие характеристической матрицы (см.
п. 17.1 в настоящем пособии)C(λ) = Eλ − A,(30.30)соответствующей квадратной матрице A (с элементами из поля P ).Полиномиальная матрица (30.30) является нормализованным и, следовательно, регулярным матричным двучленом первой степени.Значит, на нее можно поделить с остатком (как слева, так и справа) любой матричный многочленF (λ) = F0 λm + F1 λm−1 + ... + Fm−1 λ + Fm .(30.31)Справедлива следующаяТеорема 30.3 (матричная теорема Безу). 1. Правым (левым)остатком от деления матричного многочлена F (λ) на двучлен Eλ−Aслужит правое (левое) значение F (λ) на матрице A, т.
е. справедливыформулы:→→F (λ) = Q(λ)(Eλ − A) + F (A);←←F (λ) = (Eλ − A)Q(λ) + F (A).(30.32)(30.320 )376Спектральная теория линейных эндоморфизмовГл. 32. Двучлен Eλ − A является правым (левым) делителем матричного многочлена F (λ) тогда и только тогда, когда правое значе→←ние F (A) (левое значение F (A)) данного многочлена на матрице Aявляется нулевой матрицей.
В формульной записи:→→←←[ Eλ − A | F (λ) ] ⇔ [ F (A) = O ];[ Eλ − A | F (λ) ] ⇔ [ F (A) = O ].(30.33)(30.330 )Доказательство данной теоремы довольно поучительно ввиду наличия некоторых "ложных следов". Начало рассуждения совершенно очевидно: согласно общим результатам о делении матричных многочленов, при правом делении F (λ) на Eλ − A получится (правый)остаток, являющийся постоянной матрицей:→F (λ) = Q(λ)(Eλ − A) + R0 .(30.34)Теперь, как и в скалярном случае (см.
п. 39.2 в первом пособии), вформулу (30.34) следует вместо переменной λ подставить матрицу Aи учесть при этом, что значение на A двучлена Eλ−A равно нулевойматрице.Однако, в отличие от скалярной ситуации, для правого (или левого) значения матричных многочленов перестает быть справедливым правило "значение произведения равно произведению значений". Значит, скалярное рассуждение не пройдет. Что делать?→Надо "честно" перемножить правое частное Q(λ), являющеесяматричным многочленом степени m−1, и линейный двучлен Eλ−A:→Q(λ) (Eλ−A) = (Q0 λm−1 +Q1 λm−2 +...+Qm−2 λ+Qm−1 )(Eλ−A) == Q0 λm + (Q1 − Q0 A)λm−1 + ...
+ (Qm−1 − Qm−2 A)λ − Qm−1 A,а затем вычислить правое значение произведения на матрице A иубедиться, что оно равно нулевой матрице. Отсюда можно будетзаключить, что правое значение левой части равенства (30.34) наматрице A совпадает с постоянной матрицей R0 .Остальное все — как в скалярном случае. ¤Между прочим, из матричной теоремы Безу легко вывести теорему Гамильтона — Кэли (см. теорему 29.2 выше).§ 30Каноническая форма Смита полиномиальной матрицы 377Рассмотрим (скалярный) характеристический многочленhA (λ) = det(Eλ − A) = λn + c1 λn−1 + ... + cn−1 λ + cn(30.35)для (n × n)-матрицы A и превратим его в матричный многочленH(λ) = hA (λ)E.(30.35m)Далее рассмотрим матрицу (Eλ − A)∨ , присоединенную к характеристической; она также будет полиномиальной, степени n − 1 по λ(поскольку составлена из алгебраических дополнений к элементамполиномиальной матрицы).