Шеффе Г. - Дисперсионный анализ (1185347), страница 89
Текст из файла (страница 89)
Мы получилн, что рг') А = и. Этот пример показывает, что сушествует тесная связь между рангом н определителями. Действительно, можно установить следуюший результат (здесь подматрица А понимается как матрица, полученная из А вычеркиванием некоторого числа строк и столбцов). Теорема 5. Рассмотрим есе квадратные нееырожденные подматрицы матрицы Ао"""1.
Ранг А равен максимальному порядку этих нееырожденных подматриц. С л е д с т в и е 1. Максимальное число линейно независимых столбцов А<м"ю (т. е. ранг А) равно максимальному числу линейно незаеисимьгх строк. Доказательство. Использовать теорему 1. Следствие 2. г(А<"'ни>)~( 1пй((, и). Л е м и а 3, г(АВ) ( гп(п (г(А), г(В) ) Д о к а з а т е л ь с т в о. Так как по правилу, приведенному перед (П.7), столбцы АВ являются линейными комбинациями столбцов А, то число линейно независимых столбцов в АВ не может превосходить число линейно независимых столбцов в А; следовательно, г(АВ) ~ г(А). Проведя аналогичное рассуждение для строк, получим, что ргАВ ( рг В.
Л е м м а 4. Если А — матрица размера (т Х и) и если Рс 1 и (Еы' 1 нееырожденвц то г(РА(1)= г(А), т. е. ранг ч) В формулах ранг А обозначается г(А). ПРИЛОЖЕНИЕ 11 442 матрицы не меняется при умножении ее справа или слева на невырожденную л!агрицу. Д о к а з а т ел ь с т в о. По лемме 3 г(РА) ( г(А). Пусть РА = В. Так как Р-' существует, то А = Р-'В. Следовательно, снова по лемме 3 г(А) ( г(В) = г(РА). Итак, мы получилн г(РА) ( г(А) < г(РА); таким образом, рг РА = рг А. Аналогично находим, что если С имеет размеры (гп Х и), то г(СЩ = = г(С). Теперь, применяя это к (РА)Я с РА = С, находим, что г((РА)Я) = г(РА) = г(А). Квадратичные формы Определение 10.
Квадрагично!1 формой и переменных х1, хт, ..., х„называется функция вида л л ! 1= ~. 2 аих;хр !1-! где (а!!) — постоянные. Напомним читателю о нашем общем предположении, что все переменные и постоянные — действительные числа. Используя вектор х = (хь хв..., хл) ' и матрицу А = (ао), мы сможем записать квадратичную форму в матричных обо. значениях Я = х'Ах. А называется матрицей квадратичной формы Я, Мы будем всегда предполагать, что матрица А квадратичной формы симметрична (т. е. А' = А). Это оправдывается следующей леммой. Л ем м а 5.
Не ограничивая общности, мы можем допустить, что матрица квадратичной формы симметрична. Доказательство. Так как Я является (1Х1)-матрицей, то !"!' = (г; следовательно, х'А'х = х'Ах или (г= — х'Ах + — х'А'х=х'Вх, где В = — (А+ А'). Таким обра- 2 зом, если мы заменим матрицу квадратичной формы Я на В, то получим такое же Я н В' = В. Пример. Если !2 = ах!+12хгхт+7хт, то 2 2 (З=Бх,+ех,х +6хтх!+7х =(х1, хт)~ )~ ). ~6 7)~ха)' Матрица этой формы симметрична. Во многих случаях, когда встречается квадратичная форма Я, бывает удобно сделать невырожденное линейное преобразование переменных так, чтобы форма Я, выраженная в новых переменных, имела более простой вид.
Мы увидим, что в Я всегда можно исключить члены с ! ~ /, так что в новых пере- МАТРИЧНАЯ АЛГЕБРА 443 менных уо у„..., у„квадратичная форма Я будет иметь прол стой вид Я= ~~'„Л,у~ь Мы увидим также, что к такому виду Ц 3 ! может быть приведено при помощи специального линейного преобразования с простыми свойствами, называемого ортогональным. В этом случае коэффициенты (Л;) представляют наибольший интерес. Пусть мы преобразуем х=(х,,х„)' в у=(уь ..у„)' певырожденным линейным преобразованием у= Р-'Х так что х = Ру. Тогда х' = у'Р' и Я = х'Ах = у'Р'АРу. Матрицей квадратичной формы Я, выраженной через у, является Р'АР. Таким образом, в матричной формулировке задача преобразования ставится так: задана симметричная матрица А; найти невырожденпую матрицу Р так, чтобы Р'АР имела наиболее простой внд. Ортогональные матрицы и преобразования Определение )!.
Матрица Р~л"ю называется ортогональной мазрицеи, если Р'Р = 1; тогда преобразование х = Ру называют ортогональным преобразованием. Отметим, что условие Р'Р =1 эквивалентно условию РР' = = 1, так как оба они эквивалентны Р-' = Р'. Кроме того, обратная и транспоиированная матрица ортогональной матрицы также является ортогональной, так как по леммам 1 и 2 из (РР')-' = 1 следует, что (Р-') '(Р-') = 1. Из определения немедленно можно получить следующие свойства ортогональных матриц и преобразований. Л е м м а 6. Матрица Р~лны ортогональна тогда и только тогда, когда ее столбцы (или строки ее транспонированной матрицы) являются ортонормированным базисом Л е м м а 7.
Скалярное произведение х'г не изменится, если к х и г применить одно и то же ортогональное преобразование. Д о к а з а т е л ь с т во. Если Р'Р = 1, х = Рх*, г = Рг', то х'г = х*'Р'Рг = хл'х, Отсюда следует, что длина любого вектора х инвариантна относительно ортогонального преобразования. Мы можем рассматривать ортогональное преобразование как преобразование точек п-мерного евклидова пространства (точек, расположенных на концах векторов х, проведенных из начала координат). Тогда расстояние между любыми двумя точками инвариантно. Действительно, если точки отмечаются векторами х и у, то расстояние между ними равно ()х — у!! (см. рис. 1.4). Если теперь мы положим х =х — у, х = х" — у', где х = Рх', у = Ру*, ПРИЛОЖЕНИЕ 1! 444 а Р— матрица ортогонального преобразования, то г = Рг* и, следовательно, х"'г'= х'х или 11 х* — у'1Р = 1(х — у))з.
Так как при ортогональном преобразовании расстояния между любыми парами точек при любом их расположении сохраняются, а начало координат фиксировано, то геометрически ясно, что это преобразование должно быть вращением вокруг начала координат с добавлением возможных отражений в некоторых плоскостях. Примером отражения может быть ортогональное преобразование с матрицей Г1! ~) являющееся отражением в (хм хз) -плоскости.
Следующая лемма иллюстрирует один случай, когда появляется ортогональное преобразование. Л е м м а 8. Если (а1, аь..., а,), ((11, рь..., р„) — ортогональные базисы 1/„и если а1, ..., а„; Ь1, ..., Ь„являются координатами вектора х в этих базисах, то эти координаты связаны ортогональным преобразованием, т. е. если а = (а1,..., а„)', Ь =(Ь1,...,Ь„)', то существует ортогональное преобразование Р такое, что Ь = Ра.
Доказательство. Пусть А и  — матрицы, столбцы которых являются векторами базиса, т. е. А =(а1,...,а,), В = = (1)1,...,(3„), так что и А, и В ортогональны, тогда, согласно интерпретации матричного умножения, приведенной перед л л (11. 7), соотношение х = ~~' а1а1 —— ,)' Ь1()1 можно записать в виде 1 ! х=Аа=ВЬ. Отсюда следует, что Ь=Ра с Р=В-'А и Р'Р = 1. Теорема о приведении к главным осям О п редел е н не 12. Квадратная матрица (аи) называется диагональной матрицеи, если а„= О при 1 Ф 1' (т. е. все «не- диагональные» элементы равны 0); квадратичная форма называется диагональной квадрата~ной формой, если ее матрица диагональна (т. е.
нет членов с различными индексами). Теорема 8 (теорема о приведении к главным ос я м). Для любой квадратичной формь1 Я = х'Ах от и переменных существует ортогональное преобразование х = Ру, которое приводит 1".1 к диагональной квадратичной форме (у = й,у1 + й,у~ + ...
+ й„у~. Мы не будем доказывать эту теорему, Поясним ее название. Уравнение х'Ах = сопз1 можно рассматривать как уравнение центральной поверхности второго порядка в п-мериом евклидовом пространстве (например, в трехмерном пространстве, эл- МАТРИЧНАЯ АЛГВВРА 445 липсоид или одно- или двуполостиый гиперболоид, или какая- нибудь вырожденная поверхность этих типов). Преобразование можно интерпретировагь как переход к системе координат, совпадающей с главными осями поверхности. Такой выбор приводит к тому, что члены с разными индексами исчезают. Очевидна формулировка теоремы в матричной форме. Теорема 6'.
Если А<"ию симметричное), то существует ортогональная матрица Р<" к" > такая, что Р'АР диагональна, т. е. Р'АР = (Л<би)- Теперь мы покажем, что независимо от ортогонального преобразования Р, используемого для приведения к диагональному виду матрицы А в теореме 6', элементы (Л<) являются всегда, с точностью до расположения, одними и теми же. Мы увидим также, как можно вычислить (Л;). О и р еде лен и е 13. Характеристическим полиномом матрицы А<л" я> называется определитель !А — Л1), являющийся полиномом по Л степени и.
Примеры. (!) Если А /а«аы ь ~, то ее характеристический поли<. ла< аы ! ао — Л аы ! иом равен ~ ~, или Л вЂ” Л (и, < + ааа) + (а~1ааа — апат<). аы аы — Л~ (2) Если А<" " гл диагональна с диагональными алемеитами и„,..., а„„, так что А (а<гй, ), то ее хаРактеРистический полипом Равен (а„— Л))ю Х (оы — Л) ... (а„„вЂ” Л).
Л е м м а 9. Если Р— ортогональная матрица, то характеристический полипом А инвариантен относительна преобразования Р'АР (г. е. Р'АР имеет такой же характеристический полипом, как А). Доказательство. Если А' = Р'АР, то ее характеристическим полииомом является !А' — Л1)<=~<Р'АР— ЛР'1Р( =~<Р'(А — Л1)Р(= =)Р ) )А — Щ )Р) =)А — Л1), так как из Р'Р = 1 следует, что (Р'))Р!= 1.
Определение 14. Характеристическими числил<и матрицы А<яка> называются корни ее характеристического полинома. Так как характеристический полинам инвариантен относительно преобразования Р'АР, если Р ортогональна, то характеристические числа тоже инвариантны. Теперь мы видим, что числа (Л<) в теореме о приведении к главным осям являются характеристическими числами матрицы квадратичной формы и, следовательно, могут быть вычислены, как решения уравнения и-й степени.
Из теоремы 6' ясно, что характеристические числа (Л,) действительны. Отметим, что ранг А равен числу *) Напоминаем, что всс матрниы предполагаются действительными. приложиыив 1! 446 ненулевых характеристических чисел. Это следует из примера 2, теоремы 6' и леммы 4. Определение 1б. Симметричная матрица А!"""! и квадратичная форма х'Ах называются положительно определенными, если*) вое характеристические числа А положительны, и неогрицательяо опредгленныл!и (отметим, что это понятие включает положительную определенность), если все характеристические числа неотрицательпы.
Такая терминология объясняется следующей леммой. Л е и м а 10. Квадратичная форма ( [ = х'Ах является положительно определенной тогда и только тогда, когда (г» О прп любом х чь О, и неотрицатгльно определенной тогда и только тогда, когда О =з 0 при всех х. Доказательство. Пусть х= Ру является ортогональным преобразованием теоремы 6, так что (,=,г Х!уз!. Если ! (;[ положительно определенная и х Ф О, то у Ф 0 (иначе х = = Ру = 0); следовательно, некоторые у; ча О, а все Х! ) О, поэтому Я ) О. Обратно.
Пусть О ) О при любом х чь О. Предположим, что Я не является положительно определенной. Тогда существуют Хь ( О. Рассмотрим вектор у, у которого й.я координата равна 1, а остальные О. Существует х = хы которое дает этот у, т. е. хо = Ру, хо Ф 0 (в противном случае у = Р-'х, = = О). При х = хо квадратичная форма Я = Хь ( О. Полученное противоречие доказывает первую часть леммы, вторая часть доказывается аналогично. Теперь из теорем 6 и 6' мы получим некоторые результаты о приведении квадратичных форм и матриц к специальному диагональному виду при помощи невырожденного (обычно пеортогонального) преобразования. Л ем м а 11.