FMP7 (957144), страница 2
Текст из файла (страница 2)
Рис. 2.16
Теория условного экстремума неизмеримо сложнее теории «обычного» безусловного экстремума. Мы здесь ограничимся рассмотрением на «физическом» уровне строгости решения задачи для функции трех переменных при двух уравнениях связи, т.е. при .
Итак, рассмотрим, прежде всего, вопрос о необходимых условиях экстремума функции при
Продифференцируем уравнения связи:
(3)
Если бы уравнения связи отсутствовали, то для достижения локального экстремума функцией было бы необходимо, чтобы ее первый дифференциал в исследуемой точке обращался в нуль:
(4)
Уравнения связи и вытекающие из них уравнения (3) накладывают ограничения на дифференциалы (приращения) независимых переменных - они перестают быть независимыми: в предположении, что ранг матрицы
равен двум, любые два из этих трех дифференциалов могут быть выражены через третий.
Иначе говоря, если все условия теоремы 2.6 (о неявной функции) выполняются, то любые две переменные можно выразить через третью, и тем самым вопрос об условном экстремуме функции трех переменных может быть сведен к вопросу о безусловном экстремуме функции одного переменного.
Именно, из системы (3) выразим дифференциалы и через дифференциал :
(5)
Обозначая главный определитель системы (3) через , а определители и через и соответственно, преобразуем (5) к виду:
(6)
Подставляя (6) в (4), получим
(7)
откуда
(8)
Нетрудно видеть, что левая часть (8) есть определитель третьего порядка
Это не что иное, как якобиан . Равенство нулю определителя означает, что его строки линейно зависимы, а так как мы предположили, что ранг матрицы Якоби равен двум, то вторая и третья строки указанного определителя линейно независимы, и тогда первая строка есть их линейная комбинация, т.е. существуют такие одновременно не равные нулю числа , что
(9)
Систему равенств (9) можно переписать в векторной форме:
(10)
Итак, мы можем утверждать, что при сформулированных перед проведенными выкладками предположениях в точке условного локального экстремума функции градиент функции есть линейная комбинация градиентов функций, задающих уравнения связи.
В общем случае может быть доказан следующий результат.
Теорема 2.10 (о необходимых условиях условного локального экстремума). Если точка есть точка условного локального экстремума функции (1) при уравнениях связи (2), причем существует открытое множество , содержащее точку , такое, что функции суть функции класса , и ранг матрицы Якоби равен , то существуют такие не равные нулю одновременно числа , что
(11)
Подробное доказательство теоремы не приводится, хотя написанные выше выкладки могут рассматриваться как набросок такого доказательства в частном случае (при ).
Точка , удовлетворяющая условию (11), называется условной стационарной точкой функции (1) при уравнениях связи (2) (или, короче, условной стационарной точкой задачи (1) - (2)).
Исследование условного экстремума удобно проводить в терминах так называемых функций Лагранжа.
Определение 2.27. Функцией Лагранжа задачи (1)-(2) называется любая функция вида
, (12)
где числа не равны нулю одновременно.
Тем самым функция Лагранжа есть числовая функция векторного аргумента с параметрами , число которых равно числу уравнений связи (2). В общем случае для задачи (1)-(2) определено некоторое -параметрическое семейство функций Лагранжа (12).
Утверждение 2.12. Точка есть условная стационарная точка задачи (1) - (2) тогда и только тогда, когда она является (безусловной ) стационарной точкой некоторой функции Лагранжа этой задачи.
Доказательство. Из (11) следует, что в точке обращается в нуль градиент функции , совпадающей с функцией Лагранжа при (для всех ).
Наоборот, если в семействе функций Лагранжа нашлась такая функция (12), что , то из очевидных свойств градиента следует равенство
,
что эквивалентно (11) при (для всех ).
С учетом изложенного можно предложить такой алгоритм поиска условных стационарных точек задачи (1) - (2).
-
Записать функцию Лагранжа (12) при неизвестных пока значениях параметров .
-
Приравнять нулю все частные производные функции (12), получив из этого систему уравнений:
(13)
-
Дополнив систему (13) (систему уравнений с неизвестными) уравнениями связи (2), определить значения вектора и параметров , при которых удовлетворяется одновременно (13) и (2).
-
Все полученные в п. (3) точки (при соответствующих значениях функции Лагранжа и являются условными стационарными точками задачи (1) - (2)).
Разберем пример: исследуем аналитически ту задачу, геометрическое обсуждение которой было дано выше: найти точки условного экстремума функции
при
.
В данном случае .
Запишем функцию Лагранжа для этой задачи
(14)
(по традиции параметры функции Лагранжа обозначаются буквой с возможными индексами). Для данной задачи мы, естественно, получаем однопараметрическое семейство функций Лагранжа.
Находим частные производные функции (14) и приравниваем их к нулю:
(15)
откуда .
С учетом уравнения связи имеем:
,
и, следовательно,
.
Таким образом, в данной задаче возникает семейство функций Лагранжа, удовлетворяющее одновременно уравнению связи и условию (15) равенства нулю градиента, которое состоит из двух функций.
При получим условную стационарную точку ; при условная стационарная точка есть .
Чисто геометрические соображения подсказывают нам, что первая точка есть точка условного минимума, а вторая - точка условного максимума.
Теория достаточных условий условного экстремума в сколько-нибудь обстоятельном изложении выходит за пределы нашего курса. Можно доказать, что это исследование тоже сводится к исследованию достаточных условий обычного (безусловного) экстремума для функций Лагранжа. В простейших случаях достаточно вычислить второй дифференциал функции Лагранжа (одной из тех, что была найдена при вычислении условных стационарных точек) с учетом соотношений между дифференциалами, вытекающих из уравнений связи. Положительность (отрицательность) этого дифференциала есть достаточное условие строгого условного минимума (максимума) в рассматриваемой точке.
Например, для рассмотренной выше задачи исследования функции трех переменных при двух уравнениях связи будем, с учетом равенств (6) иметь:
Таким образом, в этом случае знак второго дифференциала функции Лагранжа определяется записанным выше выражением в квадратных скобках (при подстановке тех значений параметров , которые были получены при вычислении условных стационарных точек данной задачи).
Рассмотрим в качестве примера такую задачу: найти точки экстремума функции
при
Составляем функцию Лагранжа:
Приравниваем нулю ее частные производные:
Умножая первое уравнение на , а второе - на , и вычитая из первого второе, получим:
,
откуда
(16)
или
(17)
Аналогично из второго и третьего уравнений получаем:
(18)
или
(19)
Ясно, что (16) и (19) не могут выполняться одновременно, так как если , то из первого уравнения связи следует , но из второго уравнения связи тогда следует .
Пусть имеет место (16) и (19). Тогда и . Из уравнений связи получаем:
Проанализируем точку . Из (19) имеем:
, с другой стороны, из равенства следует, что , но так как , то .
Итак, мы получили условную стационарную точку и соответствующие ей параметры функции Лагранжа.
Разберемся теперь с достаточными условиями. Второй дифференциал функции Лагранжа в произвольной точке и при произвольных значениях параметров имеет вид:
(20)
(можно заметить, что второй дифференциал не зависит от параметра ).
В (20) два из трех дифференциалов независимых переменных следует выразить через третий. Дифференцируя уравнения связи, получим:
Так как в рассматриваемой точке , то выразим и через (одновременно подставляя координаты точки):
Наконец, подставляя это в (20) (с учетом значений параметров), получим:
Следовательно, данная условная стационарная точка является точкой локального условного минимума. Минимальное значение функции в этой точке равно . Вычисление остальных условных стационарных точек и исследование их по достаточным условиям предоставляется читателю.
Мы видим, таким образом, что исследование функции на условный экстремум сводится к исследованию на обычный безусловный экстремум некоторого многопараметрического (в общем случае) семейства функций (каковым является семейство функций Лагранжа). Мы не только определяем координаты стационарной точки, но и выбираем из данного семейства функций некоторые функции, проходящие через эти точки. Нельзя поэтому говорить, что решение задачи об условном экстремуме сводится к решению задачи о безусловном экстремуме для какой-то одной функции Лагранжа. Принципиальное усложнение задачи при переходе от безусловного к условному экстремуму в том и состоит, что ищется не только точка, но и сама функция. Разные условные стационарные точки отвечают, вообще говоря, и разным функциям Лагранжа, которые проходят через них.
В случае функции двух переменных при одном уравнении связи задача об условном экстремуме имеет прозрачную геометрическую интерпретацию. Условие (11) тогда принимает совсем простой вид:
,
т.е. градиенты самой исследуемой функции и функции, задающей уравнение связи, в условной стационарной точке должны быть коллинеарны.
Другими словами, кривая и некоторая линия уровня функции - кривая для некоторого - имеют в условной стационарной точке общую касательную.
а) б) в)
Рис. 2.17
На рис. 2.17 представлены различные ситуации, которые могут иметь место при существовании общей касательной к линии уровня исследуемой функции (красный цвет) и кривой, соответствующей уравнению связи (синий цвет). Стрелка изображает вектор градиента функции . На рис. 2.17 (а) изображена точка условного максимума: двигаясь все время по синей линии (уравнение связи!) и приближаясь к точке касания с красной линией, мы двигаемся по направлению возрастания функции. Миновав точку касания, мы начинаем двигаться уже против направления возрастания и по направлению убывания. На рис. 2.17 (б) изображена точка условного минимума, а на рис. 2.17 (в) - условная стационарная точка, не являющаяся точкой условного экстремума (синяя и красная линии «переплетаются» - некий аналог точки перегиба).
Рис. 2.18
На рис. 2.18 представлена геометрия разбиравшейся выше задачи «плоскость -цилиндр». Очевидно из ранее изложенного, что «верхняя» точка есть точка максимума, а «нижняя» - минимума.
Аналитическое же исследование условных стационарных точек в этой задаче даст такие результаты:
.
Таким образом, даже независимо от того, какое соотношение между дифференциалами и имеет место (а из уравнений связи следует, что ), знак второго дифференциала функции Лагранжа определяется только знаком параметра . Следовательно, в той условной стационарной точке, которая отвечает отрицательному , имеет место максимум, а в точке с положительным - минимум.