Н.И. Яцкин - Линейная алгебра (Теоремы и алгоритмы) (1109879), страница 84
Текст из файла (страница 84)
Попробуем теперь получить неравенство ∆k > 0 для произвольного k = 1, ... , n−1. С этой целью рассмотрим линейное k-мерноеподпространство Wk 6 V, являющееся линейной оболочкой первых kбазисных векторов:Wk = hBk i ; Bk = [b1 , ... , bk ],(38.24)и сузим (ограничим) на это подпространство с.б.ф. f и кв.ф. h, т. е.рассмотрим функции¯f k = f ¯Wk ×Wkи: Wk ×Wk −→ R; fk (x, y) = f (x, y); x, y ∈ Wk (38.25a)¯hk = h¯W : Wk −→ R; hk (x) = h(x); x ∈ Wk ,k(38.25b)которые, очевидно, также являются соответствующими друг другусимметрической билинейной и квадратичной формами, причем —наследующими свойство положительной определенности.В базисе Bk этим формам соответствует подматрица северо-западного угла A(k) [см.
(37.1)]. Применяя к суженным формам результатподпункта 1.2.1, получим:∆k = det(A(k) ) > 0.(38.26)2. Как уже отмечалось, отрицательная определенность для кв.ф.равносильна положительной определенности для противоположнойформы. Если форме h отвечает (в базисе B) матрица A, то форме −hбудет отвечать (в том же базисе) матрица −A. В силу свойства антисимметричности определителей, для любого k = 1, ... , n, угловой§ 38Квадратичные формы над полем R . Сигнатура491(k × k)-минор матрицы −A будет отличаться от соответствующего минора ∆k (построенного по A) наличием знакового множителя (−1)k .По уже доказанному первому утверждению настоящей теоремы,все угловые миноры матрицы −A положительны. Значит, угловыеминоры данной матрицы чередуются по знаку, причем первый изних ∆1 < 0.
¤Пример 38.4. Предлагается следующая типовая з а д а ч а изтипового задачника. Квадратичная форма задана своей координатной записью (в некотором базисе), содержащей параметр λ ∈ R:h(x) = λx21 − 2x22 − 3x23 + 2x1 x2 − 2x1 x3 + 2x2 x3 .Найти все значения параметра, при которых форма h являетсязнакоопределенной.Р е ш е н и е. Составим матрицу кв.ф. h:λA= 1−11 −1−2 1 .1 −3Вычислим угловые миноры ∆1 = λ; ∆2 = −2λ − 1; ∆3 = 5λ + 3 иприменим критерий Сильвестра.Следующие две системы неравенств выражают условия положительной (отрицательной) определенности соответственно:λ−2λ(1)5λ> 0;− 1 > 0;+ 3 > 0;λ−2λ(2)5λ< 0;− 1 > 0;+ 3 < 0.Система (1) имеет пустое множество решений; множеством решений (2) является полуось (−∞, −3/5).О т в е т: форма h является о.о.
при λ < −3/5; ни при какихзначениях λ она не может быть п.о.Но "типовое" решение и "типовой" ответ, скорее всего, должнывызвать у читателей настоящего пособия чувство неудоволетворения. (По крайней мере, автор пытался его "воспитать"; см., например, советы и "назидателные рекомендации" в п. 41.3 пособия [A1 ].)В самом деле, что будет при остальных значениях λ? Надо начинать дополнительное и с с л е д о в а н и е.492Линейные, билинейные и квадратичные формыГл.
4Нули угловых миноров как функций от λ разбивают числовуюось, которую пробегает этот параметр, на четыре промежутка и триособые точки:R = (−∞, − 35 ) ∪ {− 35 } ∪ (− 53 , − 12 ) ∪ {− 12 } ∪ (− 12 , 0) ∪ {0} ∪ (0, ∞).Если исключить две особые точки (−1/2 и 0), то допустимо применение метода диагонализации по Якоби и получается следующийдиагональный вид:h(x) = ∆1 y12 +∆2 2 ∆3 22λ + 1 2 5λ + 3 2y2 −y .y2 +y3 = λy12 −∆1∆2λ2λ + 1 3В третьей особой точке (λ = −3/5) эта формула сохраняет силуи, превратившись в31h(x) = − y12 − y22 ,52позволяет заключить, что при этом значении параметра форма hвырождена, имеет ранг 2 и сигнатуру [0, 2], т.
е. является о.п.о.Далее, применяя хорошо знакомый "школьный" метод интервалов, мы выяснем распределение знаков функцийµ1 = λ; µ2 = −2λ + 15λ + 3; µ3 = −λ2λ + 1на четырех рассматриваемых интервалах; результаты сводим в таблицу:ИнтервалЗнак µ1Знак µ2Знак µ3Сигнатура h(−∞, − 35 )−−−[0, 3](− 35 , − 12 )−−+[1, 2](− 12 , 0)−+−[1, 2](0, ∞)+−−[1, 2]Получается, что на всех промежутках кв.ф. h невырожденна, напервом — отрицательно определена, на остальных — знакопеременна, с сигнатурой [1, 2].§ 38Квадратичные формы над полем R . Сигнатура493Остались не рассмотренными два особых значения параметра:λ = 0 и λ = −1/2, при которых метод Якоби неприменим.
Всегда может выручить метод Лагранжа, однако здесь проще добитьсяприменимости метода Якоби, произведя подходящую перестановкупеременных.При λ = 0 матрица A имеет вид:0A= 1−1замена переменных x1 =временной перестановке втакже — первой и второйрица:1 −1−2 1 ;1 −3z2 ; x2 = z1 ; x3 = z3 равносильна одноматрице A первого и второго столбцов, астрок, после чего получается новая мат−21A=11101 ,−1 −3с новыми угловыми минорами (∆1 = −2, ∆2 = −1 и ∆3 = 3) идиагональными коэффициентами (µ1 = −2, µ2 = 12 и µ3 = −3) взаписи формы:1h(x) = −2z12 + z22 − 3z32 ,2что опять-таки дает сигнатуру [1, 2].Совершенно аналогично рассматривается случай λ = − 12 , толькоздесь, чтобы "исправить" второй угловой минор, приходится переставлять первый и третий столбцы, а также — первую и третьюстроки.
Проделайте это самостоятельно, и вы убедитесь, что вновьсигнатура окажется равной [1, 2].О к о н ч а т е л ь н ы й р е з у л ь т а т исследования: приλ < −3/5 форма отрицательно определена, при λ = −3/5 отрицательно полуопределена (имеет сигнатуру [0, 2]), при всех остальныхзначениях параметра — является невырожденной и знакопеременной (сигнатуры [1, 2]).Замечание 38.5.∗ Из критерия Сильвестра вытекает, что положительно определенная с.б.ф.
f ∈ L2s (V ) удовлетворяет условиямЯкоби, в связи с чем для отыскания диагонализирующего (или: f ортогонального; см. п. 37.3) базиса в пространстве V можно применять алгоритм 37.2 (процесс ортогонализации Грама — Шмидта);494Линейные, билинейные и квадратичные формыГл. 4при этом все знаменатели в рекуррентных формулах (37.25) будутположительны.Всякую п.о. с.б.ф. f можно рассматривать как скалярное произведение на V . В этом случае понятие f -ортогональности обладает всеми привычными свойствами геометрической ортогональности.В частности (ср. с замечанием 34.8), ортогональное дополнение W ⊥к линейному подпространству W 6 V является прямым дополнением к W :V = W ⊕ W ⊥.(38.27)38.5.∗ Исследование функций на экстремум и квадратичные формы. В настоящем пункте нам предстоит небольшая экскурсия в область математического анализа.
Хотелось бы, прежде всего,чтобы читатели прочувствовали первичную идею дифференциального исчисления. Имя ей — линеаризация. Производная изобретенадля того, чтобы можно было приближенно заменять функцию налинейную функцию.Несколько конкретнее: пусть y = f (x) является функцией действительной переменной x, определенной и достаточно гладкой вокрестности точки x0 .
("С запасом" будем считать, что f (x) трижды непрерывно дифференцируема.) Для точек x, близких к x0(т. е. таких, что разность ∆x = x − x0 мала) имеет место представление:f (x) = f (x0 ) + f 0 (x0 )∆x + α1 (x0 , ∆x),(38.28)где функция α1 является бесконечно малой более высокого порядка малости, чем ∆x; отбрасывая ее, мы производим линеаризацию:функция f (x0 + ∆x) (от переменной ∆x; значение x0 фиксировано, вформулы входит как параметр) приближенно заменяется на линейную (по ∆x) функцию.Формула линеаризации (38.28) может быть уточнена (путем линеаризации своей погрешности); так мы приходим к формуле Тейлоравторого порядка:1f (x) = f (x0 ) + f 0 (x0 )∆x + f 00 (x0 )∆x2 + α2 (x0 , ∆x),2(38.28)где уже α2 является бесконечно малой более высокого порядка малости, чем ∆x2 .Если x0 является точкой локального экстремума для функцииf (x), то (согласно необходимому условию экстремума) производная§ 38Квадратичные формы над полем R .
Сигнатура495f 0 (x0 ) = 0, т. е. точка x0 является, как говорят, критической точкойдля функции f (x).Исследование того, имеется ли на самом деле в критической точке x0 экстремум, может быть проведено с помощью второй производной, если только она отлична от нуля.В случае f 00 (x0 ) > 0 критическая точка оказывается точкой минимума, а в случае f 00 (x0 ) < 0 — точкой максимума. Это объясняется тем, что в невырожденной критической точке (f 0 (x0 ) = 0;f 00 (x0 ) 6= 0) поведение правой части формулы1f (x) = f (x0 ) + f 00 (x0 )∆x2 + α2 (x0 , ∆x),2(38.29)при малых ∆x, полностью определяется квадратичным по ∆x членом (вне зависимости от α2 ).
Скажем, если f 00 (x0 ) > 0, то вблизи x0будет выполняться неравенство f (x) > f (x0 ).Иначе обстоит дело в вырожденном случае (f 00 (x0 ) = 0): здесьтребуется учет членов третьего и более высоких порядков малости.В том, наверняка известном вам, аналитическом материале, который бегло (и не очень строго) был изложен выше, линейная алгебраприсутствует лишь в зародыше. Скажем, член с первой производной (дифференциал) f 0 (x0 )∆x является линейной формой, а второйдифференциал f 00 (x0 )∆x2 — квадратичной формой; и все это — в одномерном случае (с единственной переменной ∆x).Всё по-настоящему интересное происходит в многомерных пространствах. Рассмотрим достаточно гладкую (скажем, трижды непрерывно дифференцируемую) функцию y = f (x) от n действительных переменных x = (x1 , x2 , ... , xn ), определенную в окрестноститочки x0 = (x01 , x02 , ...
, x0n ).Рассматриваются (малые) приращения ∆xi = xi −x0i (i = 1, ... , n),составляющие вектор ∆x = (∆x1 , ∆x2 , ... , ∆xn ), вычисляются всепервые и вторые частные производные от данной функции в точке x0 :1) ai = fx0 i (x0 ) (i = 1, ... , n);2) aij = fx00i xj (x0 ) (i, j = 1, ... , n).Про вторые смешанные производные известно, что они (при сделанных предположениях) совпадают:aij = fx00i xj (x0 ) = fx00j xi (x0 ) = aji .(38.30)496Линейные, билинейные и квадратичные формыГл.
4Далее записывается формула Тейлора второго порядка:0f (x) = f (x ) +nXfx0 i (x0 )∆xi +i=1+nX1fx00i xj (x0 )∆xi ∆xj + α2 (x0 , ∆x) =2 i,j=1n1 Xai ∆xi +aij ∆xi ∆xj + α2 (x0 , ∆x),= f (x ) +2 i,j=1i=10nX(38.31)где фигурируют:— линейная форма0L(x , ∆x) =nXai ∆xi(38.32)i=1от переменных ∆xi , кооэффициентами которой служат первые частные производные данной функции в данной точке (она называетсядифференциалом, а также градиентом функции f (x) в точке x0 );— квадратичная форма0H(x , ∆x) =nXaij ∆xi ∆xj(38.33)i,j=1от переменных ∆xi , кооэффициентами которой служат вторые частные производные данной функции в данной точке; она определяетсясимметрической [в силу (38.30)] матрицей A = (aij )ni,j=1 , называемой матрицей Гессе функции f (x) в точке x0 );— остаточный член α2 , более высокого порядка малости, нежеликвадраты приращений; его влияние является пренебрежимым, есликвадратичная форма (матрица Гессе) невырожденна.Необходимым условием экстремума для функции нескольких переменных является обращение в нуль всех частных производных первого порядка, или, что равносильно, тривиальность линейной формы L(x0 , ∆x) — градиента.
(Точки, в которых обращается в нульградиент функции, называются критическими.)В критической точке x0 формула (38.31) приобретает вид:1f (x) = f (x0 ) + H(x0 , ∆x) + α2 (x0 , ∆x).2(38.34)§ 39Задачи на диагонализацию квадратичных форм497Характер невырожденной критической точки x0 (т. е. такой критической точки, в которой ранг матрицы Гессе равен n) полностьюопределяется сигнатурой квадратичной формы H(x0 , ∆x):— если форма H положительно определена, т. е. для любого вектора ∆x значение H(x0 , ∆x) > 0, то при достаточно малых ∆x имеетместо неравенство f (x) > f (x0 ) и, следовательно, x0 является точкойлокального минимума;— если форма H отрицательно определена, т.