Ф.П. Васильев - Методы оптимизации (2002) (1158201), страница 18
Текст из файла (страница 18)
Пусть для некоторых е > 0 и Н > 0 выполнено неравенство )7'(х)) > с 'тх, )х) > Н. Докажите, что хо = 0 — точка глобального минимума функции у на Е О. Постройте пример (нарисуйте графики линий уровня) дифференцируемой функции у(н), н = (х, у) е е, у которой имеется ровно т стационарных точек и все они являются точками локального минимума втой функции. 7, Пусть заданы произвольные целые числа гп > О, Ь > О, ! > О. Покажите, что существует гладкая фуннция 7(х), н = (х, у) е Е, у которой имеется ровно хь+ й+ ! стационарных точек, причем т из них являются точками лонального минимума, Ь вЂ” точками локального максимума, ! — седловыми точками (определение 4. 9.
!). В. Пусть Я" ' =(х Е Е"; )х)г = !) — единичная сфера з Е", пусть гладкая функция 7(х), х е Я", имеет две точки локального максимума на Я", Покажите, что функция > имеет стационарную точку, отличную от упомянутых двух и от точни глобального минимума втой функции на Я Э 3. Задачи на условный экстремум.
Необходимые условия первого порядка В приложениях задачи на безусловный экстремум встречаются редко. Дело в том, что в практических задачах переменные, как правило, не могут быть совершенно произвольными и должны удовлетворять некоторым дополнительным условиям, выражающим, например, условия неотрицательности тех или иных переменных, условия ограниченности используемых ресурсов, ограничения на параметры конструкции системы, условия нормировки и т.
п. Иначе говоря, переменные х = (х',...,х ) должны принадлежать некоторому заданному множеству Х из Е". Тогда, чтобы подчеркнуть, что экстремум функции ищется при условии х Е Х ?4 а'", часто говорят о задаче на условный экстремум. В таких задачах мы также будем различать точки локального минимума и максимума. Напомним, что точка у Е Х называется точкой локального минимума «максимума'1 функции г(х) на Х, если существует такая г-окрестность 0(У, г) = (х Е ст": «х У~ < г) точки У, что г (х) ) )г (У) «г" (х) ~< г (У)) для Т?х Е Х П 0(у, г), Если функция )(х) дважды гладкая на Х и точка у ее локального минимума [максимума) является внутренней точкой множества Х, то необходимо 7"'(у) =О, ул(у) > О [ул(п) < О].
Эти условия доказываются точно также, как в теореме 2.1. Однако, если у — граничная точка множества Х, то такие условия, вообще говоря, не имеют места. Так, например, функция 7"(х) = — х' на отрезке Х =(х Е Е'. 1 < х < 2) имеет глобальный минимум в точке н = 2, но г'(2) = — 4, ул(2) = — 2. Следовательно, условия экстремума в задачах на условный экстремум должны иметь другую форму, чем в теореме 2.1, В этом параграфе будут сформулированы необходимые условия экстремума, основанные на правиле множителей Лагранжа. 1. Начнем с классической задачи на условный экстремум, традиционно рассматриваемой в математическом анализе «327; 350; 352; 534; 768): найти экстремумы функции 7(х) при условии, что х Е Х = (х Е Е: д!(х) = О,..., д (х) = О).
Здесь предполагается, что функции у(х), д,(х) определены на всем пространстве Е". Ограничения д,(х) = О, г = 1,..., з, принято называть Ограничениями типа равенств. В тех случаях, когда систему уравнений (1) удается преобразовать к эквивалентному виду х' = гр!(ха+ ',..., х"),..., хз = р„(х" ~ ',..., х"), выразив из (1) какие-то р переменных через остальные, рассматриваемую задачу на условный экстремум можно свести к задаче на безусловный экстремум функции д(х"+',..., х") = 7(р!(х" т',..., ха),..., у,(ха" ',... ..., х"), х" '" ',, х") переменных (ха+ ',, х') Е Е" ", которую можно исследовать по описанной в Э 2 схеме.
Однако этот подход имеет ограниченное применение из-за того, что явное выра>кение вида (2) одной группы переменных через остальные удается получить лишь в редких случаях. Более общий подход к исследованию задачи поиска экстремума функции 7"(х) на множестве (1) дает правило множителей Лагранжа.
Это правило заключается в следующем. Вводится функция С(х, Л) = Л 7(х) + ~; Луд,(х) (3) у=! переменных х = (х',..., х") Е с>", Л = (Л„Л„..., Л„) Е Е'+ ', называемая функцией Лагранжа. Имеет место Теорема 1 (правило множителей Лагранжа). Пусть х, — точка локального минимума функции У(х) на множестве (1), пусть функции )(х), дг(х), г = 1,..., з, непрерывно диффврвнциругмы в окрестности точки х,. Тогда суи!гствуют числа Л',..., Л,*, называемые множителями Лагранжа, такие, что = (Л,",..., Л,*) Ф О, Л' > О, Таким образом, в теореме 1 утверждается, что всякая точка локального минимума х„является стационарной точкой функции Лагранжа С(х, Л ) при некотором, подходящим образом выбранном, нетривиальном наборе множителей Л. Д о к а з а т е л ь с т в о.
Условие (4) означает, что градиенты 1'(х,),д!'(х,), ..., д,'(х,) линейно зависимы. Допустим противное: пусть это не так, пусть 60 61 Гв. 3. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА $ 3. ЗАДАЧИ НА УСЛОВНЫЙ ЭКСТРЕМУМ эти векторы линейно независимы. Тогда в+ 1 < и. В случае в+1 < и возьмем какие-либо векторы е,ь „..., г„, так, чтобы система 7"'(х,), д,'(х„),... ..., д,'(х.), е, „,..., е„, образовала базис в Е". Введем вектор-функцию г"(х, о) = (Ях, о),,1,(х, о),..., ~„,(х, г)), где ?о(х, о) = 1(х) — ?(х„) + 1, ?(х, й)=д (х), 1= 1,..., в, 5(х, З)= (г,, х — х ), а'=в+1,..., и — 1, (х, о)Е е Е"+'. Рассмотрим систему и уравнений г(х, о) =(?о(х, г), ?1(х, о),..., ~',(х, ~)) =0 (5) относительно и неизвестных х = (х',...,х"). Для ее исследования применим теорему о неявных функциях [327; 350; 352; 534; 768].
Заметим, что Е(х„,О) = О. Далее, функции ?о(х,1) непрерывно дифференцируемы в окРестности точки (х„О) Е Е" ", пРичем ?о,. (х„О) = Г'(х,), ?ы(х„О) = д.'(х„), 1 = 1,..., в, ?ы(х„О) = г,, з' = в+ 1,..., и — 1. Это значит, что в точке (х„О) якобиан системы функцйй Е(х, 1) =(~,(х, г), 1=0,..., и — 1), представляющий собой определитель квадратной матрицы со строками 7"'(х,), д,'(х„),..., д,'(х,), е,+ „..., е,, образующими базис в Е", отличен от нуля, Тогда по теореме о неявных функциях система (5) имеет решение при каждом г, ~г~ < оо, где 1 — достаточно малое положительное число, или, точнее, существует непрерывно днфференцируемая вектор функция х= х(о) =(х'(1),...
..., х (о)), такая, что при всех 1, )о! < $о х(0) = х„1(х(г)) = ?(х,) — 1, д.(х(о)) =О, Т = 1,..., в, (е,,х(о) — х)=0, 1=в+1,...,и — 1. Это значит, что х(1)ЕХ, 0< о < го. Однако Г(х(1))=7"(х )-Ф < Г(х ) 91 Е е (О, ~ ), что противоречит тому, что х„— точка локального минимума. Тем самым доказано, что векторы Г'(х,), д,'(х„),..., д,'(х,) линейно зависимы, т. е. существует набор Л ~0, что х,,(х„л ) =О. Тогда для набора ( — Л ) ~ фО также х,.(х„— Л ) =О. Поэтому можем считать, что Л' > О. Теорема 1 доказана.
П Условие (4), в котором используются лишь первые производные функций ?(х), д,(х), 1 = 1,..., в, принято называть необходимым условием первого порядка. Разумеется, в (4) неравенство Л' > 0 вполне можно было бы заменить на Л; < 0 — это принципиального значения не имеет. Однако, следуя традициям, восходящим к Вейерштрассу, в литературе по экстремальным задачам для определенности обычно берут Л,* > О, относя это неравенство к характеристике точки локального минимума, Из теоремы 1 следует, что'подозрительнымн на локальный минимум. могут быть лишь те точки х а Е", для которых существуют множители Лагранжа Л = (Л,..., Л,) такие,, что пара (х, Л) является решением системы Ло?'(х)+ х,' Л.д.'(х) =О, д.(х) =О, 1 =1,..., в, Л фО, Ло >О.
(6) з=| Пусть о — какая-либо фиксированная точка локального минимума функции ?'(х) на множестве (1). Множество всех Л, для которых пара (х = о, Л) является решением системы (6), будем называть множителями Лагранжа, соответствующими точке о, и обозначать через Л = А(о). Нетрудно видеть, что если (о, Л) — решение системы (6), то (о, оЛ) при любом гг > 0 также является решением этой системы. Ото|ода следует, что множество Л(о) является конусом, будем его называть конусом Лагранжа точки о.
3 а м е ч а н и е 1. Поскольку всякая точка х* е Х локального максимума функции Г(х) является точкой локального минимума функции ( — 7" (х)), то, применяя теорему 1 к функции ( — ?(х)), получим, что для точки х' необходимо существуют множители Лагранжа Л = (Л',, Л,*) такие, что Е,(х', Л ) =О, Л ф О, Л,* < О. Отсюда следует, что подозрительными на локальный максимум функции ?(х) на множестве (1) могут быть лишь те точки х е Е", для которых существуют множители Л = (Л*,..., Л,*) такие, что пара (х, Л) является решением системы Ло?'(х)+ ',), 'Л,д.'(х)=0, д,.(х) =О, 1=1,..., в, Л ~0, Ло <О. (7) в=! Множество всех Л, для которых пара (х = о, Л) является решением системы (7), также является конусом, который мы будем обозначать через Л (о) и называть конусом Лагранжа точки о локального максимума.
Отличие этого конуса от конуса, соответствующего точке локального минимума в том, что здесь у всех точек Ле Ь. (о) координата Л, <О. Такое соглашение о знаке Л, несмотря на всю свою условность, ниже позволит нам единообразно формулировать необходимые и достаточные условия экстремума второго порядка, как-то упорядочит процедуру исследования точек экстремума. Из теоремы 1 и замечания 1 следует, что в точке о экстремума функции 7" (х) на множестве (1) конус Лагранжа не может быть пустым — если этот конус пуст, то такая точка о заведомо не может быть точкой экстремума. Из того, что множество множителей Лагранжа является конусом, условие Л фО в (6), (7) можно заменить каким-либо условием нормировки, взяв, например, ~Л 1' = 2" Л,'= 1.