Ф.П. Васильев - Методы оптимизации (1125241), страница 17
Текст из файла (страница 17)
14. Пусть Х вЂ” произвольное множество из Е", У вЂ” компактное множество из Ь"', функ- ция зо(х, у) непрерывна !полунепрерывна снизу! на Х х У, Доказать, что " нк — ' ! зо(, у) н пр рывка !полунепрерывна снизу! на Х. Покажите, что условия на У и тг(х, у) в атом утверждении существенны !54), Рассмотрите примеры: 1) у(ц у) = жд, Х= У = Е'! 2) зо(хо у) = х у + д, Х = У = Ь"'; 3) зо(х„ у) = 2 2, Х = У = Е '; 4) 1о(х, у) = у-у-у, ж .~- д ф 0; то(0, 0) = О, Х = У =- 1-1, 1)! 5) ж(п у) = шах(0; 1 — ху), Х = У = !О, +со).
15.ПстьХ Ей У у с е, У с е — произвольные множества, функция то(ц у) непрерывна на Х х У, пусть У вЂ” плотное в У подмножество, Х вЂ” ограниченное подмножество из Х, такие, что при каждом ус У функция х(ж, у) своего максимума на Х достигает в точке х= х(у) е Х. Доказать, что функция У(у) = аир 1о(п у) непрерывна на У. йеХ 9 2. Классический метод решения задач на безусловный экстремум Рассмотрим задачу поиска локального или глобального экстремума глад- кой функции многих переменных на всем пространстве Е". Закуте задач у принято называть задачей на безусловный экстремум.
В этом названии отражен тот факт, что на переменные х=(х', .. ч х ) никакие дополнитель- ные ограничения в такой задаче не накладываются. Кратко изложим клас- сический метод поиска решения задач на безусловный экстремум, подра- зумевая под этим тот подход к ним, который основан на дифференциальном исчислении функций многих переменных и обычно излагается в учебниках по математическому анализу [327; 350; 352; 534; 768).
Сначала напомним некоторые понятия и факты. Оп р е деле н и е 1. Пусть функция У(х) определена в некоторой е-ок- рестности 0(х, е) =(де Е": !и — х! с е) точки х, Говорят, что функция 7(х) дифферениирцема в точке х, если существует вектор у'(х) е Е", такой, что приращение функции можно представить в виде: 227(х) = 7(х+ Ь) — 7(х) = (7'(х), А) + о(5, х), ~5! < е, (1) где о(5, х) — величина, бесконечно малая более высокого порядка, чем ~А), о(ьз х! т. е. !пп „ = О, Вектор('(х) называется первой производной или гра- диентом функции у' в точке х.
Условие (1) однозначно определяет градиент 7'(х), причем у'(х) = (уы(х),..., уех(х)), (2) где Г«2, КЛАССИЧЕСКИЙ МЕТОД РЕШЕНИЯ ЗАДАЧ 54 Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЗКСТРЕМ4'МА )"(х„) = О. (6) (3) есть частная производная функции г" в точке х по переменной х', е« = = (О,..., 1,..., 0) — единичныи вектор, у которого Т-я координата равна 1, остальные координаты равны нулю, 4' = 1,..., и. Если функция дифференцируема в каждой точке множества Х, то ее часто называют гладкой на Х. Если производная Г'(х) существует и непрерывна в каждой точке х Е Х, то функцию Г(х) называют непрерывно диффгргнциругмой на множестве Х.
Напомним, что функция, дифференцируемая в точке х, непрерывна в этой точке. О п р е д е л е н и е 2. Пусть функция 7(х) определена и дифференцируема во всех точках некоторой г-окрестности точки х. Говорят, что функция Г(х) дважды диффгргнцируема в точке х, если существует матрица 7'"(х) размера и х п, такая, что Г(х+ 6) — 7'(х) = Го(х)6+ о,(6, х), !6[ < г, где !!ш ' ' ! =О.
Матрица ! "(х) называется второй производной функ !М о !А! ции Т в точке х. Условие (3) однозначно определяет вторую производную Го(х), причем (««(х) ««««(х) (~«~«(х) . (х«*',(х«((,,(х), 4, 2 = 1 и) (4) ~'„..«(х) 7...«(х) ... Д„...(х) где(; (х) = †": †' 4 = †. ~ †"'-. ) = — ~ ,, ! — вторая частная производная функции !(х) по переменным х',х'.
Как видим, !4(х) — симметричная матрица. Если функция )(х) дважды дифференцируема в некоторой г-окрестности точки х, причем ее вторая производная непрерывна в точке х, т. е. 1!ш [[74(х + 6) — ("(х)[[ = О, то !м о сьГ(х)=Г(х+6) — г(х) = (г'(х)«6)+2(г"(х)6«6)+со(6«х), [Ь[ < г (5) где !!гп ' 'о =0 [327; 350; 352; 534; 768]. Квадратичную форму 4РГ" (х) = !ь!-.о ! ь!о = (г""( х) Ь, 6) = 2 — Р-] Ь ! Ьз переменной Ь Е Е " называют вторым диф«, ! =. 1 дх' дх! фгренциалом функции г" в точке х. Если функция дважды дифференцируема в каждой точке множества Х, то ее часто называют дважды гладкой на Х. Если вторая производная г""(х) существует и непрерывна в каждой точке х е Х, то функцию г(х) называют дважды непрерывно диффергнЧирувмой на множестве Х. Определение 3. Пусть А = (ае, 4,2' = 1,..., п) симметричная « матрица, (А Ь, 6) = 2 ае 64 Ь' — соответствующая ей квадратичная форма. «,«'= ! Говорят, что матрица А положительно [неотрицательно] определена на Е" и обозначают А > 0 [А > 0], если (АЬ, 6) >0 «46 Е Е", Ь ~ 0 [(АЬ, 6) > > 0 о'Ь Е Е"].
Аналогично, матрица А отрицательно [неположительно] '!' . -й« определена на Е", т. е. А < 0 [А < 0], если (АЬ, 6) < 0 ЧЬ Е Е", Ь фО [(АЬ, 6) <0 ЧЬ е Е"] (см. [192 213; 349 353]). Перейдем к изложению необходимых и достаточных условий оптимальности в задачах на безусловный экстремум. Т е о р е м а 1 (Необходимое условие экстремума). Лусть х„— точка локального экстремума (минимума или максимума) функции Г(х) на Е", пусть г(х) диффвргнциругма в точке х,. Тогда Если г(х) дважды диффгргнцируема в некоторой г-окрестности 0(х„, г) точки х, и Го(х) непрерывна в точке х„то г""(х„) > 0 в точке локального минимума и 74(х„) < 0 в точке локального максимума. До к азат ель ство. Пусть для определенности х„— точка локального минимума Г(х) на Е", Это значит, что существует г-окрестность 0(х„г) точки х, такая, что Г"(х) > !"(х,) «гх Е 0(х„г).
Отсюда и из (1) при х= х„, 6 = — «Г'(х„), 0 < й < оо, гДе число «о столь мало, что оо!)'(х,)! < г, имеем 0 < (Г(х.),* — сГ'(х,)) + о(о) = — 4[!'(х„)['+ о(о). Разделим это неравенство на т > 0 и затем устремим с — +О. Получим — 1/,Г(х„)[' > О, что возможно только при выполнении равенства (6). Далее, пусть 7(х) дважды дифференцируема в окрестности 0(х., г) и Г""(х) непрерывна в точке х,. Зафиксируем произвольное Ь Е Е" и возьмем со > 0 столь малым, что ~[6[ < г.
Тогда х„+ ФЬ Е 0(х„г) и из (5) с учетом уже доказанного равенства (6) имеем * 0 < )«(х„+ 46) — Г(х,) = — ( !""(х,) Ь, 6) ! о + о(1 ) «ой 0 < 1 < ео. Разделим это неравенство на о' > 0 и устремим с — «+О. Получим 0 < < (14(х,) Ь, 6) о'!! Е Е". Согласно определению 3 это значит, что Г4(х,) > О. Так как точка локального максимума функции Г" (х) является точкой локального минимума функции ( — 7(х)), то, применяя уже доказанные утверждения теоремы к функции ( — 7(х)), получим, что если х, — точка локального максимума Г" (х) на Е", то )'(х„) = О, Го(х,) < О.
П О п р е д е л е н и е 4. Точка е, удовлетворяющая уравнению Г«(е) = О, называется стационарной точкой функции Г" (х). Из теоремы 1 следует, что только стационарные точки могут быть точками экстремума дифференцируемой на .Е" функции. Однако стационарная точка необязательно является точкой экстремума. Более того, если в стационарной точке е еще выполняется условие Го(о) > 0 [)'о(е) < 0], то это также не значит, что точка е непременно является точкой локального минимума [максимума], Можно уверенно сказать лишь одно: стационарные точки являются подозрительными на экстремум.
П р и м е р 1. Пусть г(и)=х4 — у4, и=(х, у) Е Ео. Очевидно, е=(0, 0)— стационарная точка функции Г(х) и в ней ! "(е) =О. Однако в любой окрестности точки е = 0 существуют точки х, в которых 1(х) > 1(е) = 0 и !(х) < О, т. е. е = 0 не является точкой экстремума. Этот пример показывает, что условия экстремума, сформулированные в теореме 1, являются лишь необходимыми, но в общем случае этих условий ! * )!! Гл. 2.
КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА недостаточно для экстремума. Тем не менее, оказывается, несколько усилив условия теоремы 1, можно получить условия, достаточные для экстремума. Теорема 2. Пусть функция 1(х) дважды дифференцируема в окрестности О(о, г) стационарной точки о этой функции и 1'г(х) непрерывна в точке и. Тогда если 1а(о) > О, то о — точка строгого локального минимума функции 1(х), а если 1" (и) < О, то и — точка строгого локального максимума. Доказательство. Пусть в точке о выполнены условия ~'(и) =О, .1а(п) > О, но и не является точкой строгого локального минимума, Тогда сУществУет послеДовательность (х„), такаЯ, что х, ~ ц, (х ) — о, 1(хь) < хь — е < 1"(о), Точки х„можем пРедставить в виде хв = о + гьйь, где с(„= [ " га = [х — и[ — ! 0 при Ь вЂ” со.
Так как ~с(а[= 1, то, выбирая при необходимости йодпоследовательность согласно теореме Больцано — Вейерштрасса [327; 350; 352; 534[, можем считать, что (г(ь) — до, )да[= 1. Тогда полагая в (5) х = о, Ь = !ьг8ь, имеем О > 1(х ) — 7(о) = 2 йь'(~л(о) г(го с(ь) + о( !ь), 6 = 1, 2,.... Разделим это неравенство на сьэ > О и устремим 6 — т со. Получим (1а(о)г(в, г(о) < О, где г(о ~О. Однако это пРотивоРечит Условию Гл(п) > О.
Следовательно, и — точка строгого локального минимума функции 7(х). Аналогично доказывается, что если Г(о) = О, 1а(п) < О, то о — точка строгого локального максимума. Теорема 2 доказана. С) 3 а м е ч а н и е 1. Для выяснения знакоопределенности квадратичных форм < АЬ, Ь >.= 2 а„ЬгЬг существуют различные алгебраические кричу=! терни [192; 213; 349; 353[.
Определение 5. Главными минорами матрицы А называются определители сь ! =с(е( . ° ° ° ., 1<(!<Ч«...вь<п, 6=1,..чп Ьгь й а! . .. а! ! Главными угловыми минорами называются определители гл! в ь, 6 = = 1,..., п. Критерий Сильвестра: для того, чтобы А > О, необходимо и достаточно, чтобы все главные миноры матрицы А были неотрицательны; для того, чтобы А > О, необходимо и достаточно, чтобы все главные угловые миноры матрицы А были положительны.