Н.И. Яцкин - Линейная алгебра (Теоремы и алгоритмы) (1109879), страница 58
Текст из файла (страница 58)
В этой алгебре заданы алгебраические действия сложения, композиции и умножения на скаляр, для§ 29Многочлены от матриц. Аннулирующие многочлены339которых справедливы обычные законы (см. п. 12.1).Композиция в алгебре L(V ) играет роль умножения и позволяет определить неотрицательные степени (итерации) ϕk для любогол.э. ϕ (причем нулевая степень считается равной тождественномуэндоморфизму: ϕ0 = ε).Действие умножения л.э.
ϕ на скаляр λ ∈ P может быть сведено к умножению (композиции) эндоморфизма ϕ и так называемогоскалярного эндоморфизма λε:λϕ = λε ◦ ϕ = ϕ ◦ λε,(29.1)причем не важно, с какой стороны располагать скалярный множитель. (Последнее обстоятельство связано с тем, что, хотя алгебраL(V ) не коммутативна, т.
е. сомножители в произведении ϕ ◦ ψ переставлять, вообще говоря, нельзя, скалярные эндоморфизмы перестановочны со всеми л.э.)Нам понадобится также следующий факт (справедивый для элементов произвольных колец): степени одного и того же элементакоммутируют между собой. Применительно к алгебре л.э. можемзаписать:ϕk ◦ ϕl = ϕl ◦ ϕk (= ϕk+l ).(29.2)Впредь мы условимся опускать "слишком громоздкий" знак умножения ◦ (подобно тому, как это делалось в теории перестановок;см. [A1 , гл. 3]).Рассмотрим теперь произвольный многочленf (λ) = a0 λr + a1 λr−1 + ...
+ ar−1 λ + ar(29.3)степени r, от переменной λ, с коэффициентами ai ∈ P (i = 1, ... , r);a0 6= 0.Определение 29.1. Значением многочлена (29.3) от линейногоэндоморфизма (или: на линейном эндоморфизме) ϕ ∈ L(V ) называется л.э.f (ϕ) = с0 ϕr + с1 ϕr−1 + ... + сr−1 ϕ + сr ε.(29.4)Для нулевого многочлена его значением от любого л.э. считаетсянулевой эндоморфизм o.Так возникает отображение вычисления:νϕ : P [λ] −→ L(V ); f (λ) 7→ f (ϕ); f (λ) ∈ P [λ],(29.5)340Спектральная теория линейных эндоморфизмовГл.
3сопоставляющее каждому многочлену его значение на (фиксированном) л.э. ϕ. Формула (29.5) является обобщением формулы (39.2)из пособия [A1 ], определявшей значение f (c) многочлена (29.3) напроизвольном скаляре c из поля коэффициентов.Отображение (29.5) является гомоморфизмом колец, т. е. согласовано с алгебраическими действиями сложения и умножения:(f + g)(ϕ) = f (ϕ) + g(ϕ);(29.6a)(f g)(ϕ) = f (ϕ)g(ϕ),(29.6b)где g(λ) также является многочленом над P.Формула (29.6а) совершенно очевидна; (29.6b), в принципе, — тоже, но здесь имеются (уже неоднократно встречавшиеся нам) "подводные камни", связанные с тонким различием между многочленамии соответствующими полиномиальными функциями.Просмотрите еще раз выкладку (39.7) в пособии [A1 ], с помощьюкоторой мы доказывали аналогичное свойство для полиномиальныхфункций f (c) и g(c) скалярного аргумента c ∈ P.
В ней ничегоне придется менять и в рассматриваемом здесь случае многочленовf (ϕ) и g(ϕ) от "операторного аргумента" ϕ ∈ L(V ). В обоих случаяхрешающим звеном в рассуждении является правило перемноженияфункций, отвечающих одночленам. В случае многочленов от ϕ этоправило имеет вид(fk ϕk )(gl ϕl ) = (fk gl )ϕk+lи вытекает из соотношений (29.2) [и других законов алгебры л.э.].Важным следствием соотношения (29.6b) является следующее заключение: если многочлен f (λ) разлагается на линейные множители:f (λ) = a0 (λ − λ1 )m1 (λ − λ2 )m2 ...
(λ − λs )ms ,(29.7)Psгде λi ∈ P ; mi ∈ N (i = 1, ..., s); i=1 mi = r, то и после подстановкивместо переменной λ эндоморфизма ϕ равенство сохраняет силу:f (ϕ) = a0 (ϕ − λ1 ε)m1 (ϕ − λ2 ε)m2 ... (ϕ − λs ε)ms .(29.8)Имеет место еще одно, очень существенное, свойство многочленов от л.э. Для любых двух многочленов f (λ), g(λ) ∈ P [λ] и любогоэндоморфизма ϕ ∈ L(V ) значения f (ϕ) и g(ϕ) являются коммутирующими л.э.:f (ϕ)g(ϕ) = g(ϕ)f (ϕ).(29.9)§ 29Многочлены от матриц. Аннулирующие многочлены341Доказательство коммутирования (29.9) немедленно следует изкоммутирования (29.2) степеней л.э. ϕ (и все тех же законов операторной алгебры).Предположим теперь, что данное линейное пространство V является конечномерным и dim(V ) = n.
Фиксация произвольного базисаB в пространстве V позволяет установить изоморфизм между алгеброй L(V ) л.э., действующих в V, и алгеброй квадратных (n × n)матриц L(n, P ).Многочлены от квадратных матриц определяются точно так же,как многочлены от л.э.Определение 29.10 . Значением многочлена (29.3) от матрицыA ∈ L(n, P ) называется матрицаf (A) = a0 Ar + a1 Ar−1 + ... + ar−1 A + ar E.(29.40 )Разумеется (в силу общей теоремы 12.1), если матрица A отвечаетоператору ϕ в базисе B, то (в том же базисе) матрица f (A) отвечаетоператору f (ϕ), и, как следствие, для многочленов от квадратныхматриц справедливы все свойства, установленные выше для многочленов от л.э.Во многих (но не во всех) отношениях работа с матрицами даетбольше, чем работа с операторами, поскольку она "охотнее поддается компьютеризации". В связи с этим мы отметим два свойствамногочленов от квадратных матриц (которые допускают и операторную формулировку, но все-таки легче представляются на матричномязыке).1.
Если квадратная матрица A является блочно-диагональной:A = diag(A1 , A2 , ... , As ),(29.10)то и значение многочлена f (λ) ∈ P [λ] на этой матрице вычисляетсяпоблочно:f (A) = diag(f (A1 ), f (A2 ), ... , f (As )).(29.11)Это утверждение непосредственно вытекает из замечания 20.4.2. Если две квадратные матрицы A и B подобны, т.
е.B = T −1 AT(29.12)342Спектральная теория линейных эндоморфизмовГл. 3для некоторой обратимой матрицы T, то для любого многочленаf (λ) ∈ P [λ]:f (B) = T −1 f (A)T,(29.13)т. е. матрицы f (A) и f (B) также подобны (с той же сопрягающейматрицей T ).В самом деле, по индукции легко доказываются соотношенияB k = T −1 Ak T ; k = 0, 1, 2, ... ,(29.14)а формула (29.13) из них с очевидностью следует.Пример 29.1. Вычислим значение многочлена (29.3) от жорданова ящикаλ0 0 0 0A = Jn (λ0 ) = ... 0001λ000...00001λ00...000001λ0...000... 0...
0... 0... 0... ...... λ0... 0... 00000...1λ0000 0 0 ,... 0 1λ0(29.15)который можно представить в видеA = λ0 E + I 1 ,(29.16)где E = En — единичная матрица, а0 1 00 0 10 0 00 0 0I1 = Jn (0) = ... ... ...0 0 00 0 00 0 00010...000........................0 00 00 00 0...
...0 10 00 00000... 010(29.17)— нильпотентный жорданов ящик.Про скалярную матрицу λ0 E мы знаем, что она коммутирует слюбой матрицей, и легко можем возвести ее в любую неотрицательную целую степень: (λ0 E)k = λk0 E.§ 29Многочлены от матриц. Аннулирующие многочлены343Матрицу I1 также легко возвести в неотрицательную степень k:(I1 )k = Ik ,(29.18)где 1) I0 = E; 2) для любого k ∈ {1, ..., n − 1} все элементы матрицы Ik равны нулю, кроме равных единице элементов k-й верхнейнаддиагонали; 3) для k > n: Ik = O.Последний факт нам давно известен: он выражает нильпотентность (с показателем, равным n) матрицы I1 .
Автор надеется, чтов свое время (при изучении примера 13.4) читатели не уклонилисьот упражнения по возведению в степень н.ж.я. Если же вы все-такипропустили это упражнение, то не поленитесь доказать указанныйфакт сейчас, причем — в полной общности (используя, например,индукцию по k, или же, что проще, — обращаясь к л.э., отвечающему I1 ).Для примера выпишем матрицу I14 при n = 7:0004I1 = I4 = 0000000000000000000000000100000001000000010.000Далее заметим, что формула бинома Ньютона, позволяющая возводить в произвольную целую неотрицательную степень сумму двухчисел, остается справедливой в любом кольце при условии, что слагаемые коммутируют.
(В самом деле, ничем, кроме аксиом кольцаи свойства степеней (ab)k = ak bk , справедливого в предположенииab = ba, мы при доказательстве этой формулы не пользуемся.)Так что, если матрицы A, B ∈ L(n, P ) коммутируют (т. е. перестановочны: AB = BA), то для любого целого k > 0 справедливоравенство:kXk(29.19)(A + B) =Cks Ak−s B s ,s=0где, напомним, биномиальные коэффициенты (числа сочетаний) находятся по формулам:Cks =s(s − 1)...(s − k + 1).s!(29.20)344Спектральная теория линейных эндоморфизмовГл. 3Применим (29.19) к матрице (29.16):kkA = (λ0 E + I1 ) =kXCks (λ0 E)k−s I1s=s=0kXCks λk−sIs .0(29.21)s=0Важно заметить, что если номер s > n, то соответствующее слагаемое в (29.21) обращается в нуль, т.
е. фактически суммированиев этой формуле происходит лишь до min(k, n − 1).Скажем, при n = 7, k = 4 мы будем иметь:4X44Is = λ40 E + 4λ30 I1 + 6λ20 I2 + 4λ0 I3 + I4 =A = (λ0 E + I1 ) =Cks λk−s0s=0λ404λ306λ204λ00λ404λ306λ204λ0100λ404λ306λ204λ0000λ404λ306λ200000λ404λ3000000λ400 1 4λ0 ,26λ0 34λ0 00000а при n = 7, k = 8 — соответственно:0λ40=100A8 = λ80 E + 8λ70 I1 + C82 λ60 I2 + C83 λ50 I3 + C84 λ40 I4 + C85 λ30 I5 + C86 λ20 I6 ==λ808λ70C82 λ60C83 λ50C84 λ40C85 λ30C86 λ200λ808λ70C82 λ60C83 λ50C84 λ40C85 λ3000λ808λ70C82 λ60C83 λ50000λ808λ70C82 λ600000λ808λ7000000λ800000004 4C8 λ0 3 5C8 λ0 .2 6C8 λ0 7 8λ0 λ80§ 29Многочлены от матриц. Аннулирующие многочлены345Вычислим теперь на матрице (29.15) значение многочлена (29.3),который удобнее будет переписать по возрастанию степеней:f (λ) =rXfk λk = f0 + f1 λ + f2 λ2 + ...
+ fr λr .(29.30 )k=0В преобразованиях нам встретится знакомое правило переменыпорядка суммирования в двойной сумме, однако — в несколько болеесложной ситуации. Двойную сумму по паре индексов (k, s), котораяудовлетворяет системе неравенств{0 6 k 6 r; 0 6 s 6 k},мы заменим на двойную сумму по паре индексов (s, k), удовлетворяющей равносильной системе неравенств{0 6 s 6 r; s 6 k 6 r}.Начинаем выкладку:f (A) =rXk=0=X(s,k):06s6r;s6k6rkfk A =rXfkCks λk−sIs0s=0k=0Cks fk λk−sIs0kX=Cks fk λk−sIs =0(k,s):06k6r;06s6kà rrXXs=0=Xk=s!Cks fk λk−s0Is =rXµs Is ,s=0где символом µs обозначен скалярный множитель, сформировавшийся в круглых скобках на последнем шаге преобразований.
Проясним смысл этого скаляра:(29.20)ssµs = fs + Cs+1fs+1 λ0 + Cs+2fs+2 λ20 + ... + Crs fr λr−s=====0fs+1 λ0 + (s+2)(s+1)...3λ20 + ... + r(r−1)...(r−s+1)fr λr−s== fs + (s+1)s...20s!s!s!¢1¡=s!fs + (s + 1)s...2 fs+1 λ0 + ... + r(r − 1)...(r − s + 1) fr λr−s.0s!В последнем выражении нетрудно усмотреть деленное на s! значение s-й производной f (s) (λ), взятое в точке λ = λ0 . Окончательнополучается:rXf (A) =f (s) (λ0 ) Is ,(29.22)s=0346Спектральная теория линейных эндоморфизмовГл. 3где снова надо иметь в виду, что при s > n матрицы Is являютсянулевыми, т. е. фактически суммирование в (29.22) заканчиваетсяпри s = min(r, n − 1).К примеру, при n = 6, r = 8 мы будем иметь:f (A)=f (λ0 )f 0 (λ0 )1 002! f (λ0 )1 (3)3! f (λ0 )1 (4)4! f (λ0 )1 (5)5! f (λ0 )0f (λ0 )f 0 (λ0 )1 002! f (λ0 )1 (3)3! f (λ0 )1 (4)4! f (λ0 )00f (λ0 )f 0 (λ0 )1 002! f (λ0 )1 (3)3! f (λ0 )000f (λ0 )f 0 (λ0 )1 002! f (λ0 )0000f (λ0 )f 0 (λ0 )00000f (λ0 ).Замечание 29.1.
Расмотренный выше пример, а также установленные ранее свойства функций от матриц, позволяют, в принципе,вычислять значения многочленов от произвольных матриц, приводя их предварительно к ж.н.ф. В самом деле, если J = T −1 AT —жорданова форма матрицы A, то применяя к обратному выражениюA = T JT −1 многочлен (29.3), мы получим f (A) = T f (J)T −1 .