1610915347-b0cdcab04f9552ce71235da8ebe43143 (824740), страница 34
Текст из файла (страница 34)
е. если любойвектор из Si ортогонален к любому вектору из Sj при различных i и j, тосумма (207) представляет собою матрицу проектирования в подпространство(S1 + . . . + Sm ), образованное всеми теми векторами, которые служили для образования подпространств Sk . В частном случае эта сумма может быть равнойединичной матрице I = PS1 + . . . + PSm , и в этом случае обычно говорят оразложении единицы на матрицы проектирования или просто о разложенииединицы.Рассмотрим еще произведение двух матриц проектированияP = PS PR .(208)Для того чтобы это произведение также было матрицей проектирования,необходимо прежде всего, чтобы это произведение было эрмитовской матрицей,а для этого, как известно [41], необходимо, чтобы наши матрицы коммутировалиPR PS = PS PR .(209)Покажем, что это условие достаточно, т.
е. что в данном случае квадратматрицы P 2 совпадает с самой матрицей P :P 2 = PS PR PS PRили, переставляя матрицы в силу условия (209):2= PS PR ,P 2 = PS2 PRчто и требовалось доказать. Нетрудно проверить, что при условии коммутирования (209) матрице (208) соответствует проектирование в подпространство,образованное векторами, общими тем двум совокупностям векторов, которыеобразуют R и S.Отметим еще один результат, не останавливаясь на его доказательстве, которое не представляет никакого труда, а именно: если подпространство S составляет часть подпространства R, то разностьP = PR − PS(210)194Гл. II. Линейные преобразования и квадратичные формы[43есть также матрица проектирования.
Если x(k) суть основные векторы, образующие S, то для получения основных векторов, образующих R, мы должныдобавить к вышеуказанным векторам еще один или несколько линейно независимых векторов. Эти последние векторы сами по себе образуют некотороеподпространство T , и матрица (210) в рассматриваемом случае и будет матрицей проектирования в это подпространство.Пользуясь матрицами проектирования, можно формулировать задачу приведения эрмитовской матрицы к диагональной форме вполне однозначным образом и при наличии кратных собственных значений.Положим, например, что мы имеем эрмитовскую матрицуA = U [λ1 , . .
. , λn ]U −1 ,где U — некоторая унитарная матрица. Положим для определенности, что числа λk распадаются на две части, одинаковые между собой, причем первые mчисел равны μ, а остальные (n − m) равны ν:A = U [μ, . . . , μ, ν, . . . , ν]U −1 .Мы можем, очевидно, переписать нашу матрицу в видеA = μU [1, . . . , 1, 0, . . . , 0]U −1 + νU [0, . . .
, 0, 1, . . . , 1]U −1 .Введем в рассмотрение матрицы проектированияPR = U [1, . . . , 1, 0, . . . , 0]U −1 ;PS = U [0, . . . , 0, 1, . . . , 1]U −1 .Соответствующие подпространства R и S, очевидно, взаимно ортогональны, и наши матрицы проектирования в сумме дают единичную матрицу. Мыимеем таким образом в данном случае A = μPR + νPS , причем λ1 = . . . = λm =μ и λm+1 = . . . = λn = ν.В общем случае задача приведения эрмитовской матрицы к диагональнойформе сводится к такому разложению единичной матрицыI = PS1 + .
. . + PSm ,(211)чтобы наша матрица A могла быть представлена в видеA = μ1 PS1 + . . . + μm PSm ,(212)где μk — различные собственные значения нашей матрицы. Таким образом,всякой эрмитовской матрице соответствует определенное разложение единицы(211) такое, что эта матрица представляется в виде (212).Нетрудно перевести все предыдущие результаты на язык не матриц, а формЭрмита. Всякой матрице проектирования PR с элементами pik соответствуетнекоторая форма Эрмита:PR (x) = (PR x, x) =npik xi xk ,(213)i,k=1которая называется иногда особой формой (Einzelform). Символ PR (x) — краткая запись (PR x, x).44]§ 4. Квадратичные формы195Если соответствующее подпространство R имеет l измерений и мы выберемза первые l ортов l единичных взаимно ортогональных векторов подпространства R, то в такой координатной системе наша форма (213) будет иметь вид(PR x , x) = x1 x1 + x2 x2 + .
. . + xl xl .Заметим далее, что если матрицы PSk являются разложением единицы согласно (211), то, выбирая за орты единичные взаимно ортогональные векторыв каждом из подпространств Sk , мы будем, очевидно, иметь:mk=1PSk (x ) =nxi xi ,i=1и, следовательно, при всяком выборе координатных осей суммаmk=1PSk (x)выражает квадрат длины вектора. Мы можем, таким образом, сказать, чтозадача приведения формы Эрмита A к сумме квадратов равносильна следующим двум равенствам:(Ax, x) =mk=1|x|2 =mk=1μk PSk (x),PSk (x).(214)(215)Введение матриц проектирования позволяет, таким образом, формулировать задачу приведения эрмитовской матрицы к диагональной форме без всякого специального выбора координатных осей.
Это дает, в свою очередь, возможность перенести предыдущие результаты, с соответственными изменениями, и на случай пространства с бесчисленным множеством измерений, что иявляется основной задачей математического аппарата современной квантовоймеханики. Мы будем говорить об этом лишь значительно позже. Это распространение на случай бесчисленного множества измерений выводит нас из рамокалгебры и существенным образом связано с введением аппарата анализа.44. Функции от матриц. Матрица может играть роль аргумента некоторой функции.
Мы ограничимся здесь рассмотрениемнаиболее элементарных функций, а именно полинома от матрицы и рациональной дроби. Более подробное рассмотрение теориифункций матриц мы сделаем впоследствии, после изложения теории функций комплексного переменного. Полином f (A) степени mот переменной матрицы A имеет видf (A) = c0 + c1 A + . . . + cm Am ,(216)196Гл. II. Линейные преобразования и квадратичные формы[44где ck — некоторые численные коэффициенты. Значение функциив данном случае есть тоже некоторая матрица, элементы которойвыражаются, очевидно, по формулам{f (A)}ik = c0 δik + c1 {A}ik + .
. . + cm {Am }ik ,гдеδik = 0при i = kи δii = 1.Можно рассматривать полином и от нескольких матриц, но приэтом надо иметь в виду некоммутативность этих матриц при умножении. Общий вид полинома второй степени от двух переменныхматриц A и B будет:f (A, B) = c0 + c1 A + c2 B + c3 A2 + c4 B 2 + c5 AB + c6 BA.Заменим в формуле (216) матрицу A некоторой подобной ей матрицей U −1 AU . Принимая во внимание, что (U −1 AU )k = U −1 Ak U ,будем иметь:f (U −1 AU ) = c0 + c1 U −1 AU + . . .
+ cm U −1 Am U == U −1 (c0 + c1 A + . . . + cm Am )U,т. е.f (U −1 AU ) = U −1 f (A)U.(217)Аналогичная формула будет иметь место и для полинома отнескольких матрицf (U −1 AU, U −1 BU ) = U −1 f (A, B)U.(218)Остановимся теперь несколько подробнее на случае эрмитовских матриц. Если A есть эрмитовская матрица, то непосредственно из определения следует, что любая целая положительная степеньAk , а также произведение cA, где c — вещественная постоянная,суть также эрмитовские матрицы.
Кроме того, сумма эрмитовскихматриц есть также эрмитовская матрица. Отсюда непосредственно следует, что если в формуле (216) A есть эрмитовская матрицаи коэффициенты ck — вещественные числа, то и значение функции44]§ 4. Квадратичные формы197f (A) будет эрмитовской матрицей. Эта эрмитовская матрица f (A),очевидно, коммутирует с A, и их можно одновременно привести кдиагональной форме при помощи некоторого унитарного преобразования. Заметим прежде всего, что если мы подставим в функцию(216) вместо A некоторую диагональную матрицу [λ1 , . .
. , λn ], то врезультате получим, очевидно, также диагональную матрицуmck [λk1 , . . . , λkn ] = [f (λ1 ), . . . , f (λn )],(219)k=0где f (λk ) есть численное значение нашего полинома при подстановке вместо A числа λk .Положим теперь, что V есть унитарное преобразование, преобразующее матрицу A к диагональной формеA = V [λ1 , . . .
, λn ]V −1 .В силу (217) и (219) будем иметь:f (A) = V [f (λ1 ), . . . , f (λn )]V −1 ,т. е. V преобразует и f (A) к диагональной форме, причем f (λk )суть характеристические числа этой последней матрицы.Перейдем теперь к рассмотрению рациональных дробей. Пустьf1 (A) и f2 (A) — два полинома от матрицы A. Рассмотрим их частноеf1 (A).(220)f2 (A)Как мы раньше видели, частное двух матриц не имеет, вообще говоря, определенного значения [26], но в данном случае, какнетрудно показать, мы получим для частного (220) одно определенное значение, если только определитель матрицы f2 (A) отличенот нуля. Частное (220) можно записать двояко:f1 (A)f2 (A)−1или f2 (A)−1 f1 (A).Покажем, что эти два произведения равны между собой:f1 (A)f2 (A)−1 = f2 (A)−1 f1 (A),198Гл. II. Линейные преобразования и квадратичные формы[44или, что равносильно:f2 (A)f1 (A) = f1 (A)f2 (A).(221)Так как наши полиномы содержат только одну матрицу A, тоони коммутируют, т.
е. (221) действительно имеет место, и нашечастное (220) имеет определенное значение. Нетрудно проверитьдальше, что рациональные дроби в случае одной матрицы перемножаются, как и обычные дроби. Действительно:f1 (A) f3 (A)= f1 (A)f2 (A)−1 f3 (A)f4 (A)−1f2 (A) f4 (A)или, принимая во внимание коммутативность:f1 (A) f3 (A)f1 (A) f3 (A)= f1 (A)f3 (A) · [f2 (A)f4 (A)]−1 =.f2 (A) f4 (A)f2 (A) f4 (A)В качестве примера рассмотрим рациональную дробь видаU=1 + iA,1 − iA(222)(∗)где A — некоторая эрмитовская матрица, т.
е. Aказать, что матрица U будет унитарной, т. е. чтоU(∗)= A. Легко по-= U −1 .(223)Действительно, мы имеем:U=1 − iA= (1 − iA)(1 + iA)−1 ,1 + iAоткуда, переходя к транспонированной матрице, получим [26]:U(∗)(∗) −1= (1 + iA)(∗)−1 (1 − iA)(∗) = (1 + iA(∗)или, в силу того, что AU(∗))= A:= (1 + iA)−1 (1 − iA) =(∗)(1 − iA1 − iA= U −1 ,1 + iA),45]§ 4. Квадратичные формы199т. е.
(223) выполнено, и U есть действительная унитарная матрица.Формулу (222) мы можем записать в видеU (1 − iA) = (1 + iA),причем в силу (222) U коммутирует с A, и значит:U −1.(224)U +1Совершенно так же, как и выше, можно показать, что если U естьунитарная матрица и определитель матрицы U + 1 отличен от нуля, то A, определяемая формулой (224), будет эрмитовской матрицей. Таким образом, всякую унитарную матрицу, для которойD(U + 1) = 0, можно представить через эрмитовскую матрицу Aпо формуле (222).A=i45. Пространство с бесчисленным множеством измерений. Мы переходим теперь к введению понятия о пространствес бесчисленным множеством измерений.