1610915347-b0cdcab04f9552ce71235da8ebe43143 (824740), страница 23
Текст из файла (страница 23)
, vnk столбцаматрицы V с номером k и число λk :nais vsk = λk vik(i = 1, 2, . . . , n).(103)s=1Если мы будем считать элементы (vik , . . . , vnk ) как составляющие некоторого вектора v(k) , то можем записать предыдущее равенство в виде одного векторного равенства:Av(k) = λk v(k) .(104)Мы видим, таким образом, что разыскание матрицы V , которая приводит матрицу A к диагональной форме, сводится к разысканию таких векторов v(k) , которые воспроизводятся с точностьюдо численного множителя в результате линейного преобразования,определяемого матрицей A. Этот факт является алгебраическим27]§ 3. Линейные преобразования131аналогом того факта современной квантовой механики, согласнокоторому матричная механика Гейзенберга по существу равносильна волновой механике Шрёдингера.
Согласно первой точке зрения, существенным вопросом является задача приведения некоторой матрицы (бесконечной) к диагональной форме. Что же касается волновой механики, то здесь основным вопросом является задачаотыскания таких векторов (в пространстве с бесчисленным множеством измерений), которые бы воспроизводились с точностью дочисленного множителя в результате некоторого линейного преобразования. Предыдущие соображения мы назвали алгебраическиманалогом потому, что, ограничиваясь пространством с конечнымчислом измерений, мы приводим наши задачи к чисто алгебраическим задачам.
В более же сложных случаях пространства с бесчисленным множеством измерений мы существенным образом выходим из рамок обычной алгебры и нуждаемся в аппарате анализа. Более подробно все эти вопросы будут выяснены впоследствии,причем заметим, что для приложений к физике в рассматриваемомслучае конечного числа измерений достаточно ограничиться матрицами A частного типа (эрмитовские матрицы, у которых aki = aik )и, кроме того, матрица U также должна быть определенного типа(унитарная матрица, определение которой будет дано ниже). Здесьмы рассматриваем общий вопрос для любой конечной матрицы,причем ограничимся лишь приведением окончательных результатов, не приводя полностью доказательство. Для тех задач, которыебудут интересны в приложениях, вопрос будет решен полностью.Переходим к решению системы (103) или (104). В раскрытомвиде мы можем записать ее так:⎫(a11 − λk )v1k + a12 v2k + .
. . + a1n vnk = 0, ⎪⎪⎪a21 v1k + (a22 − λk )v2k + . . . + a2n vnk = 0, ⎬(105). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .⎪⎪⎪⎭an1 v1k + an2 v2k + . . . + (ann − λk )vnk = 0.Для того чтобы получить для (v1k , . . . , vnk ) решение, отличноеот нулевого, необходимо и достаточно, чтобы определитель написанной системы был равен нулю, т. е. необходимо и достаточно,чтобы число λk было корнем характеристического уравнения. Раз-132Гл.
II. Линейные преобразования и квадратичные формы[27берем подробно лишь тот случай, когда это уравнение имеет различные корни. Обозначим эти корни через λ1 , . . . , λn . Подставляяв коэффициенты системы (105) вместо λk первый корень λ1 , мысможем определить из нее элементы первого столбца таблицы V ,причем не рассматриваем вопроса о том, насколько широк будетвыбор этих величин vi1 . Выберем решение системы каким-нибудьодним определенным образом лишь так, чтобы оно было отличноот нулевого.Точно так же, заменяя в коэффициентах системы (105) λk = λ2 ,мы сможем определить элементы второго столбца матрицы V ит.
д. до n-го столбца. Равенства (105) равносильны (102), и, чтобыперейти к основному равенству (101), нам надо только, чтобы Vимела обратную матрицу V −1 , т. е. чтобы определитель V был отличен от нуля. Будем доказывать это от противного. Положим, чтоон равен нулю. Как мы знаем [12], это равносильно тому, что междувекторами v(k) , определяемыми столбцами матрицы V , существуетлинейное соотношение:C1 v(1) + . . . + Cn v(n) = 0,где не все коэффициенты Ck равны нулю. Применим к обеим частям этого равенства (n−1) раз преобразование, определяемое матрицей A. Пользуясь (104), будем иметь n равенств:C1 v(1) + .
. . + Cn v(n) = 0,λ1 C1 v(1) + . . . + λn Cn v(n) = 0,....................................C1 v(1) + . . . + λn−1Cn v(n) = 0.λn−1n1Принимая во внимание, что не все векторы Ck v(k) равны нулю,можем утверждать, что определитель написанной системы долженравняться нулю: 11...1 λ1λ2...λn . . . . . . . . . . . . .
. . . . . . . . . . . = 0, n−1λλn−1 . . . λn−1 12n27]§ 3. Линейные преобразования133где числа λk по условию различны. Но последнее равенство противоречит тому, что определитель Вандермонда от неравных чиселотличен от нуля. Таким образом мы доказали возможность приведения матрицы преобразованием подобия к диагональной формедля того случая, когда все характеристические числа матрицы различны. В том случае, когда среди характеристических чисел имеются равные, может случиться, что матрица не может быть приведена преобразованием подобия к диагональной форме. Все же и вэтом случае существует наиболее простое или, как говорят, каноническое представление матрицы. Это каноническое представление втом случае, когда матрица приводится к диагональной форме, имеет вид[λ1 , λ2 , . .
. , λn ],где λk — лишь характеристические числа матрицы. Для общего случая сформулируем лишь результат6. Пусть λ = a является корнемуравнения (100) кратности k. Положим далее, что для всех определителей порядка (n − 1) таблицы, стоящей в левой части уравнения(100), число λ = a является корнем кратности k1 , но не выше, т. е.все эти определители делятся на (λ − a)k1 , но хоть один из них неделится на (λ − a)k1 +1 . Положим далее, что все определители упомянутой таблицы порядка (n − 2) имеют λ = a корнем кратностиk2 , но не выше, и так дальше, и, наконец, все определители порядка (n − m) имеют упомянутый корень кратности km , а хоть одиниз определителей порядка (n − m − 1) уже вовсе не обращается внуль при λ = a.
То же самое будет, очевидно, иметь место и дляопределителей более низкого порядка. Можно доказать, что числаks убывают: k > k1 > k2 > . . . > km . Введем следующие положительные целые числа:l1 = k − k1 ;l2 = k1 − k2 ;. . . ; lm+1 = km ,причем, очевидно, l1 + l2 + .
. . + lm+1 = k.Биномы:(λ − a)l1 ; (λ − a)l2 ; . . . ; (λ − a)lm+16 Его доказательство приводится в специальном дополнении в конце второйчасти этого тома.134Гл. II. Линейные преобразования и квадратичные формы[27называются элементарными делителями матрицы A, соответствующими корню λ = a. Мы можем таким образом определитьэлементарные делители для всех характеристических чисел матрицы A, в результате чего получим совокупность элементарныхделителей:(λ − λ1 )ρ1 ;(λ − λ2 )ρ2 ;...;(λ − λp )ρp ,(106)гдеρ1 + ρ2 + . .
. + ρp = n(107)и среди чисел λk могут быть и одинаковые.Выше мы видели, что характеристические числа не меняютсяпри преобразовании подобия. Оказывается, что таким же свойствомобладает и совокупность элементарных делителей матрицы. Введем теперь некоторые новые, простейшие матрицы Iρ (a). Мы подразумеваем под этим матрицу порядка ρ, у которой на главной диагонали везде стоит число a, на следующей нижестоящей диагоналистоит везде единица, а остальные элементы равны нулю:a 0 0 . .
. 0 0 1 a 0 . . . 0 00 1 a . . . 0 0.(108)Iρ (a) = . . . . . . . . . . . . . . . . . . . .0 0 0 . . . a 0 0 0 0 . . . 1 aОсновным фактом в вопросе о представлении матриц в канонической форме является следующий результат: если матрица Aимеет элементарные делители (106), то существует такая матрицаU с определителем, отличным от нуля, чтоU AU −1 + [Iρ1 (λ1 ), Iρ2 (λ2 ), .
. . , Iρp (λp )].(109)Заметим, что если известны все характеристические числа матрицы A, то нахождение матрицы U сводится к элементарным алгебраическим операциям. Если ρ = 1, то под Iρ (a) мы подразумеваемпросто число a. Может случиться, что и при наличии одинаковых28]§ 3. Линейные преобразования135характеристических чисел все элементарные делители (106) будутпростыми, т.
е. будут иметь вид(λ − λ1 );(λ − λ2 );...;(λ − λn ).В этом случае квазидиагональная матрица[Iρ1 (λ1 ), Iρ2 (λ2 ), . . . , Iρp (λp )]превращается просто в диагональную матрицу [λ1 , . . . , λn ], и матрица приводится к диагональной форме.Нетрудно доказать, что для возможности приведения матрицык диагональной форме необходимо и достаточно, чтобы ранг таблицы коэффициентов в системе (105) был равен (n − μk ), где μk —кратность корня λk векового уравнения. При выполнении этогоусловия система (105) определит μk линейно независимых векторов (v1k , v2k , . .
. , vnk ) [14].Отметим, что матрица U , входящая в формулу (109), определяется не единственным образом. В частности, если d — величинаопределителя матрицы U , то в формуле (109) можно заменитьUна1√Undи U −1на√ndU,т. е. можно считать, что в формуле (109) определитель матрицыU равен единице. Этими указаниями мы и ограничимся в общейзадаче приведения матриц к каноническому виду. Мы вернемся кэтой задаче в специальном добавлении ко второй части третьеготома. Как уже упоминалось выше, мы будем дальше рассматриватьподробно эту задачу для матриц особого типа.28.
Унитарные и ортогональные преобразования. В этоми следующих номерах мы будем пользоваться понятиями скалярного произведения и нормы (длины) вектора, которое было введенов [13]. Напомним, что квадрат нормы (длины) определяется формулойn||x||2 = (x, x) =|xs |2 ,(110)s=1136Гл. II. Линейные преобразования и квадратичные формы[28или, в случае вещественных составляющих,||x||2 =nx2s .s=1Это определение нормы связано с определенным выбором основных ортов, т. е. координатных осей.
Мы будем называть координатную систему с указанным выше определением нормы нормальной,или декартовой, системой. Помимо длины вектора было определеноеще скалярное произведение двух векторов следующей формулой:(x, y ) = x1 y1 + x2 y2 + . . . + xn y n .(111)В случае вещественных векторов эта формула принимает болеесимметричный вид(x, y ) = x1 y1 + x2 y2 + . .