В.А.Зорич-Математический анализ(часть1) (522403), страница 103
Текст из файла (страница 103)
По необходимому условию экстремума ее производная при $ = 0 должна обращаться в нуль, т. е. должно выполняться условие $7 ПОВЕРХНОСТЬ В К И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 519 —. (х, Л) = —. (х) — ~ Л; —, (х) = О дХ д~ дР' дх ' = дх ., * д — (х, Л) = — Р'(х) = О д1. дЛ; (33) (1= 1,..., т). Таким образом, при отыскании экстремума функции (24), переменные которой подчинены связям (25), можно написать с неопределенными множителями функцию Лагранжа (32) и искать уже ее критические точки. Если есть возможность из системы (33) найти хо — — (хр1,..., хо ), не находя Л = (Л1,..., Л ), то с точки зрения исходной задачи именно это и следует делать.
Как видно из соотношения (31), множители Л; (1 = 1,..., т) определяются однозначно, если только векторы рай Р'(хо) (1 = 1,..., т) линейно независимы. Независимость этих векторов равносильна тому, что ранг системы (29) равен т, т. е. что все уравнения этой системы существенны (ни одно из них не является следствием остальных).
Это обычно выполнено, ибо считается, что все соотношения (25) независимы и ранг системы функций Р', ..., Р™ в любой точке х (= Я равен т. Функцию Лагранжа часто записывают в виде Ь(х, Л) = У(х) + ,'> ' Л;Р'(х), 1=1 который отличается от прежнего только несущественной заменой Л; на — Л;.') П ример 9.
Найдем экстремумы симметрической квадратичной формы о ,1'(х) = ~~) а; х'х1 (а; =а;) (34) на сфере (35) Запишем функцию Лагранжа данной задачи: ь(х, л) = ~ а~~ х'к~ — 1 ~ (л*) — 1) 1,,1'=1 1=1 1) По поводу необходимого признака условного экстремума см. также задачу 6 к $ 7 гл. Х (часть 11). Эту функцию называют функцией Лагранжа, а метод ее использования— методом множите*ей Лагранжа. Функция (32) удобна тем, что необходимые условия ее экстремума как функции переменных (х, Л) = (х',..., х", Л1,..., Л,„) в точности совпадают с условиями (31) и (25).
Действительно, 520 ГЛ.УП1. Дите)аФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ и, с учетом того, что а; = а,;, необходимые ус)1овия экстремума функции Цх, Л): —.(х,1) = 2 ~ пахе — Лх') =0 (е =1,...,и), дам у=1 (36) — (х,~) = 2 (х') — 1) =р. дЬ; г дЛ Домножая первое уравнение на х' и суммируя затем все первые соотношения, с учетом второго уравнения получим, что в точке экстремума должно быть выполнено равенство а1 х'хг — Л = О. ЪЗ=1 Систему (36) без последнего уравнения можно переписать в виде (37) а;~хг = Лх' (е = 1, ..., ), (38) а $'И =1 1, у=1 (39) а вместо (35)— 'Е (')'= Л 1=1 Но ",); (И)г есть квадрат расстояния от точки й = ф,..., Ф") квадрики (39) 1=1 до начала координат.
Таким образом, если, например, соотношение (39) зада- откуда следует, что Л вЂ” собственное значение линейного преобразования А, задаваемого матрицей (а;~), а х = (х',..., х") — собственный вектор этого преобразования, отвечающий этому собственному значению. и Поекоеьку вепрермвваа ва компакте о = (х П ае" ~ ~; (х') = 1) фувквве 1=1 (34) обязана принимать в некоторой его точке максимальное значение, система (36), а значит и система (38), должна иметь решение.
Таким образом, мы попутно установили, что любая вещественная симметрическая матрица (а;.) имеет по крайней мере одно вещественное собственное значение. Это хорошо известный вам из линейной алгебры результат, являющийся основным в доказательстве существования базиса из собственных векторов симметрического оператора. Чтобы указать геометрический смысл собственного значения Л, заметим, что если Л ) О, то, переходя к координатам 1' = х'/~ГЛ, вместо (37) получим 1 7 ПОВЕРХНОСТЬ В %" И ТЕОРИЯ УСЛОВНОГО ЭКСТРЕМУМА 521 ет эллипсоид, то величина 1/А, обратная к собственному значению А, является квадратом величины одной из его полуосей.
Это полезное наблюдение. Оно, в частности, показывает, что соотношения (36), необходимые для условного экстремума, еще не являются достаточными: ведь, например, в Жз эллипсоид кроме наибольшей и наименьшей полуосей может иметь промежуточную по величине полуось, в любой окрестности конца которой есть как точки более близкие к началу координат, так и более далекие от него в сравнении с расстоянием от конца полуоси до начала координат.
Последнее становится совсем очевидным, если рассмотреть эллипсы, получающиеся в сечении исходного эллипсоида двумя плоскостями, проходящими через промежуточную полуось и меньшую или большую полуоси эллипсоида соответственно. В одном из этих случаев промежуточная полуось будет большей из двух полуосей эллипса сечения, а в другом случае — меньшей полуосью. К сказанному следует добавить, что если 1/Л есть величина этой промежуточной полуоси,то,как видно из канонического уравнения.эллипсоида, величина Л, очевидно, будет собственным значением преобразования А, поэтому система (36), выражающая необходимые условия экстремума функции Д~, действительно будет иметь решение, не дающее экстремума этой функции.
Полученный в теореме 1 результат (необходимый признак условного экстремума) проиллюстрирован на рис. 63 а, 6. Первый из этих рисунков поясняет, почему точка хо поверхности Я не может быть точкой экстремума функции Дя, если Я не касается поверхности Х = 1х Е Ж"! ~(я) = Дхо) = се) в точке хо.
При этом предполагается, что огай Дюо) ф О. Последнее условие гарантирует то, что в окрестности точки хо имеются точки как более высокого сг-уровня функции ~, так и точки более низкого с1-уровня этой функции. Рис. 63 Поскольку гладкая поверхность Я пересекает поверхность Х, т. е. се-уровень гладкой функции ~, то Я будет пересекать как более высокие, так и более низкие уровни функции ~ в окрестности точки хо. Но это и означает, что хо не может быть точкой экстремума функции Дя. Второй рисунок показывает, почему при касании Ф и 5 в точке хо эта точка может оказаться точкой экстремума.
На рисунке юо — точка локального максимума функции Яя. 522 ГЛ. »'1П. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Эти же соображения позволяют нарисовать картинку, аналитическая запись которой может показать, что необходимый признак условного экстремума не является достаточным. Действительно, в соответствии с рис. 64 положим, например, у(х, у) — у, р(х, у) — хз у — О Тогда очевидно, что на кривой Я С К~, заданной уравнением у = х~, величина у с не имеет экстремума в точке (0,0), хотя эта кривая касается линии уровня Дх, у) = = 0 функции т в этой точке. Заметим, что рас1~(0,0) = (0,1) ф.
О. Очевидно, это по существу тот же пример, который нам в свое время служил для иллюстрации различия между необходимым и достаточным условиями классического внутреннего экстремума функции. с. Достаточный признак условного экстремума. Докажем теперь следующий достаточный признак наличия или отсутствия условного экстремума,. Теорема 2. Пустпь ~: Р— ~ К вЂ” функция, определенная на отпкрытом множестве Р С К" и принадлежащая классу С®(Р;К); Я вЂ” поверхностпь в .О, заданная систпемой уравнений (25), где Г' Е С(')(Р; К) (з = 1,..., т) и ранг системы фрнкций (Р1,..., Р"') в лтобой тпочке области Р равен т. Пусть в функции Лагранжа >и .1.(х) = Ь(х; Л) = Дх1,..., х") — ~~~ Л;Р*(х1,...,х") параметры Л1,..., Л,„выбраны в соответпствии с необходимым признаком (31) условного экстремума функции Яэ в точке хо Е Я.') Для того чтобы при этом точка хв была тпочкой экстремума функции Дз, достаточно, чтобы квадратичная форма (41) была знакоопределенной для векторов 4 Е ТБ„.
Если форма (41) положительно определена на ТЯ „то хв — точка строгого локального минимума функции Дэ, если форма (41) отприцатпельно определена на ТЯ „то хо — точка стпрогого локального максимума функции Яз. Для того чтобы точка хо не была точкой экстремума функции Дз, достатпочно, чтобы форма (41) принимала на ТБх, значения разных знаков.
Ц Фиксирован Л, мы получаем из Х (х; Л) функцию> завислщую только от х; мы позволили себе обозначать ее через Ь(х). $ т. НОВВРхность В и и теОРиЯ УслОВИОРО экстРемУмА 523 Цх) — Ь(хо) = —,, (ха) (х' — х~а) (х — хна) + о(Цх — ха Ц~) (42) при х -+ ха. Напомним теперь, что, мотивируя определение 2, мы отметили возможность локального (например, в окрестности точки хр Е Я) параметрического задания гладкой Й-мерной поверхности Я (в нашем случае Й = п — т).
Иными словами, существует гладкое отображение (мы будем его, как и прежде, записывать в виде х = х($) ), при котором окрестность точки 0 = (О, О) б К" биективно преобразуется в некоторую окрестность точки ха на поверхности Я, причем ха — — х(0). Заметим,что соотношение х(й) — х(0) = х'(0) й+ (ЦФЦ) при й -+ О, выражающее дифференцируемость отображения Ф ~+ х(Ф) в точке 1 = О, рав- носильно и координатным равенствам (43) в которых индекс а пробегает целые значения от 1 до Й и по нему происходит суммирование. Из этих числовых равенств следует, что ~х'(й) — х'(0)~ = О(Цф) при й -+ 0 и, значит, Цх(й) — х(0)Ци — — О(ЦФЦи~) при й -э О. (44) Используя соотношения (43), (44), из равенства (42) получаем, что при Ф-+О Ь(х(Ф)) — Цх(0)) = у уф(ха) д х'(О) дух~(0) Ф~ ~а + о(Ц Ц~) .
(42') ° Отметим прежде всего, что Ь(х)— : ~(х) для х Е Я, поэтому, показав, что точка хо Е Я является точкой экстремума функции Ця, мы одновременно покажем, что она является точкой экстремума функции Дя. По условию необходимый признак (31) экстремума функции Яя в точке хо е Я выполнен, поэтому в этой точке р'ада(ха) = О. Значит, тейлоровское разложение функции Ь(х) в окрестности точки хо = (хо1,..., хо) имеет вид ГЛ. У111. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Отсюда при условии знакоопределенности формы дуй(х0) д,„х'(0) дзх1(О) 1,~~Д (45) следует, что функция 1.(х($)) имеет при Ф = 0 экстремум, Если же форма (45) принимает значения разных знаков, то Ь(х(1)) при Ф = 0 экстремума не имеет.