Ф.П. Васильев - Методы оптимизации (2002) (1158201), страница 17
Текст из файла (страница 17)
Квадратичную форму д2,1'(х) = иц о воу = (Тл(х)6, 6) = 2; — Д-16'Ь' переменной Ь Е.Е" называют вторым диф, Вхсзхт фгренциалом функции Г в точке х. Если функция дважды дифференцируема в каждой точке множества Х, то ее часто называют дважды гладкой на Х. Если вторая производная Г"(х) существует и непрерывна в каждой точке х е Х, то функцию 7(х) называют дважды непрерьсвно дифференцируемой на множестве Х. ОпРеделение 3. ПУсть А =(ае, 2, 2'=1,...,6]- симметРичнаЯ матрица, (АЬ, 6) = 2 аеЬс62 — соответствующая ей квадратичная форма. ,т — -1 Говорят, что матрица А полоокительно [нготрицательно] определена на Е" и обозначают А > 0 [А > 0], если (АЬ, 6) > 0 оЬ Е Е', Ь ~ 0 [(АЬ, 6) > > 0 УЬ Е с'"]. Аналогично, матрица А отрицательно [неположительно] определена на с'", т.
е. А < 0 [А < 0], если (А6, 6) < 0 оЬ Е а", Ь ф 0 [(АЬ, 6) < 0 26 Е.Е "] (см. [192; 213; 349; 353]). Перейдем к излохсению необходимых и достаточных условий оптимальности в задачах на безусловный экстремум. Теорема 1 (Необходимое условие экстремума). Луста х„— точка локального экстремума (минимума или максимума) функции Г(х) на Л", пусть |(х) диффергнцируема в точке х,. Тогда )'(х,) = О.
(6) Если )'(х) дваждсч дифференцируема в некоторой е -окрестности О(х„г) точки х, и )'"(х) непрерьсвна в точке х„, то )о(х„) > 0 в точке локального минимума и )л(х,) < 0 в точке локального максимума. Доя аз а т ел ь с т в о. Пусть для определенности х, — точка локального минимума )(х) на Е".
Это значит, что существует г-окрестность 0(х„, г) точки х, такая, что Г(х) > )(х,) Ух Е О(х„, е). Отсюда и из (1) при х = х„, Ь = — г~'(х„), 0 < о < ео, где число ео столь мало, что 2 ~)'(х,)~ < г, имеем 0 < ()'(х.),* — 2Г'(х,)) + о(о) = — г[7'(х,)[2+ о(г). Разделйм это неравенство на г > 0 и затем устремим 2 — +О. Получим — 2[)'(х„)]2 > О, что возможно только при выполнении равенства (6). Далее, пусть )'(х) дважды дифференцируема в окрестности 0(х„, г) и Тл(х) непрерывна в точке х,. Зафиксируем произвольное Ь я Ь'" и возьмем оо > 0 столь малым, что г ~6~ < г.
Тогда х, + 26 Е О(х„г) и из (5) с учетом уже доказанного равенства (6) имеем 0 ( 1 (х, + 26) — Г(х„) = й ()' (х,) Ь, 6) 2'+ о(2') ЧЙ 0 < 2 < йо. Разделим это неравенство на 22 > 0 и устремим 2 — +О. Получим 0( < (То(х.)6, 6) ЧЬ Е Я". Согласно определению 3 это значит, что 7о(х,) > О. Так как точка локального максимума функции 7(х) является точкой локального минимума функции ( — 7(х)), то, применяя уже доказанные утверждения теоремы к функции ( — )'(х)), получим, что если х„— точка локального максимума 7(х) на Е", то 7'(х,) = О, )о(х,) < О.
С1 Оп редел ение 4. Точка о, удовлетворяющая уравнению Т"'(о) =О, называется стационарной точкой функции 7(х). Из теоремы 1 следует, что только стационарные точки могут быть точками экстремума дифференцируемой на Е" функции. Однако стационарная точка необязательно является точкой экстремума. Более того, если в стационарной точке о еще выполняется условие тл(о) > 0 [Гл(22) < О], то это также не значит, что точка о непременно является точкой локального минимума [максимума]. Можно уверенно сказать лишь одно: стационарные точки являются подозрительными на экстремум.
П р и м е р 1. Пусть )'(и)=х' — у', и=(х, у) Е Е2. Очевидно, о=(0, 0)— стационарная точка функции )'(х) и в ней 7"(о) =О. Однако в любой окрестности точки о = 0 существуют точки х, в которых Т(х) > )(о) =0 и Г(х) < О, т. е. о = 0 не является точкой экстремума. Этот пример показывает, что условия экстремума, сформулированные в теореме 1, являются лишь необходимыми, но в общем случае этих условий Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА $2.
КЛАССИЧЕСКИЙ МЕТОД РЕШЕНИЯ ЗАДАЧ т«! ,'е «! ф .., !« Упражнения недостаточно для экстремума. Тем не менее, оказывается, несколько усилив условия теоремы 1, можно получить условия, достаточные для экстремума. Т е о р е м а 2, Лусть функция 1(х) дважды дифференцируема в окрестности 0(и, г) стационарной точки и этой функции и 1л(х) непрерывна в точке и. Тогда если 1е(и) > О, то и — точка строгого локального минимума функции Г(х), а если Г"(е) < О, то и — точка строгого локального максимума. Доказательство.
Пусть в точке и выполнены условия Г(и) =О, 1л(у) > О, но и не является точкой строгого локального минимума. Тогда существует последовательность (хьД, такая, что хь ~ и, (хь) — и, Г(хь) < < 1(и). Точки х„можем представить в виде х, = и + гег(„где г(ь =,ь гь = [х„— и[- 0 при й — оо. Так как [Ыь[= 1, то, выбирая при необходимости йодпоследовательность согласно теореме Больцано — Вейерштрасса [327; 350; 352; 534[, можем считать, что (сЦ- 4,, )до[= 1.
Тогда полагая в (5) х= и, 6 = !едем имеем 0 > Г(хь) — Г(и) = 2 !ь(Гл(и)г(гы дь) +о(!ь), й = 1, 2,.... Разделим это неравенство на (ь' > 0 и устремим й — оо. Получим (1и(и)до, до) < О, где до ~0. Однако это пРотивоРечит Условию Га(и) >О. Следовательно, и — точка строгого локального минимума функции 1(х).
Аналогично доказывается, что если )'(и) =О, 1л(и) < О, то и — точка строгого локального максимума. Теорема 2 доказана. П 3 а м е ч а н и е 1. Для выяснения знакоопределенности квадратичных форм < А6, 6 >ее ')„ав6«6' существуют различные алгебраические кри;!'= ! терни [192; 213; 349; 353[.
Определение 5. Главными минорами матрицы А называются определители Главными угловыми минорами называются определители сь! э й = = 1,..., п. Критерий Сильвестра: для того, чтобы А > О, необходимо и достаточно, чтобы все главные миноры матрицы А были неотрицательны; для того, чтобы А > О, необходимо и достаточно, чтобы все главные угловые миноры матрицы А были положительны. Сформулируем критерии знакоопределенности матрицы А в терминах собственных чисел этои матрицы. Йапомним, что собственным числом матрицы А называется решение Л уравнения де([А — Л1„[=0, где 1„— единичная матрица размера п х и. Так как у нас А — симметричная матрица, то у нее существует и действительных собственных чисел Л „Л,..., Л„ (с учетом их кратности).
Для того, чтобы А > 0 [А > О[, необходимо и достаточно, чтобы все собственные числа матрицы А были неотрицательны [положительны[. Квадратичная форма (А6, 6) знакопеременна тогда и только тогда, когда у матрицы А имеется хотя ы одно положительное и хотя бы одно отрицательное собственное число. В том случае, когда в стационарной точке и квадратичная форма (Гв(и)6, 6) не меняет знака при всех 6 Е Е", но может равняться нулю при некоторых 6 ~0, то для выяснения поведения функции в окрестности точки и можно привлечь старшие производные и связанные с ними формы более высокого порядка: е-Г!.!=Š—,Гг!"! — „:!«! ...!«.Г, (дх')Ч ...(дхи)ч где суммирование проводится по всем целым т„..., т„таким, что 0 < т! < т, ( = 1,..., и, т + т +...+т„= гп.
Однако на практике исследование характера стационарных точек с помощью форм д" Г(и), гп > 3, почти не применяется из-за его громоздкости. В тех случаях, когда описанным выше способом удается выявить все точки локального минимума [максимума) функции Г(х), то для определения глобального минимума [максимума[ этой функции на всем пространстве Е нужно перебрать все найденные точки и из них выбрать точку с наименьшим [наибольшим] значением функции, если такая точка существует.
П р и м е р 2. Пусть в пространстве Е" даны Р точек х! = (х!,..., ху), е = 1,..., р, и требуется найти точку х Е Е", сумма квадратов расстояний от которой до этих данных точек минимальна. г Эта задача равносильна задаче минимизации функции 1(х) = 2,'[х — х,[Я «=! на Е". Функцию 1(х) удобнее представить в виде: Г(х) = р[х[' — 2р(х, хо)+ г Р + 2 , '[хг[', где х = — 2; х! Отсюда видно, что Г(х) = 2р(х — х ) и и = х,— '=! «=! стационарная точка. Матрица Гл(и) =2р1„, где 1„— единичная матрица размера и х и. Следовательно, (1л(и) 6, 6) = 2Р~ 6 ~в > 0 при всех 6 е Е", 6 ~ О, Согласно теореме 2 это значит, что и = т — точка строгого локального минимума.
Однако здесь можно сказать болыпе: и = х — точка глобального минимума Г(х) на Е", В самом деле, рассматриваемая функция такова, что (пп Г(х) =со. Тогда по теореме 1.3 множество Х„точек глобального миьй о« нимума 7(х) на Е" непусто, а по теореме 1 !Ух„е Х. является стационарной точкой. Поскольку здесь имеется единственная стационапнаягточка и = х, то и е Х„. Следовательно, Х, = (хо), Г, = 1(хо) = — 'р[х,[ + 2" [хг[в. Заме«=! тим, что при исследовании этой несложной задачи можно было обойтись и без привлечения теоремы 1.3, поскольку здесь 1(х) — 1(хе) = р~х — х [' > 0 !Ух е Е".
Ясно также, что в этой задаче 1' = зпр Г(х) = +со, т. е. задача еег" максимизации 1(х) на Е" не имеет решения. !. Найти экстремумы функций: а) 1(и)=(х+у-!)е !* *" "!, и=(х,у)еи; б) 1(и)=хива (! — х — 2у — За), и=(х,у,в)Е Е; в) 1(и)=в!п(х+у) — в«пх — а!ну, и=(х,у)еЕ 2. Может ли функция двух переменных на плоскости иметь бесконечно много точек локального минимума и ии одной точки локального максимуме? Рассмотрите функцию 1(и) = = хе — ( ! -!- е ) сов у, и = (х, у) Е гг . 58 Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА $ 3. ЗАДАЧИ НА УСЛОВНЫЙ ЭКСТРЕМУМ г з Зх — 2х — 1 +(Зхг 2хз)е-т ,г (2) , и(,' ' В следующие упражнения 3 — 8 вошли, задачи, которые автору сообщил Н.
А. Бобылев. 3. В точке но — — (О, О) фУнкциЯ >" (н) пеРеменных и = (х, У) е ег имеет локальный минимУм вдоль каждой прямой, проходящей через точку оо. Можно ли утверждать, что в точке но реализуется локальный минимум функции У(х)? Рассмотреть функции: У („) ( „г)(2 уг) У („) г 2 уг „4 4. Построить пример гладкой функции >(о), и =(х, у) Е Е , для которой точка (О, 0) является единственной стационарной точкой, причем (О, 0) — точка локального минимума функции Л не являющаяся точной ее глобального минимума. Рассмотреть функцию б. Пусть хо = 0 является единственной стационарной точкой гладкой функции 7(х) на Е", в которой реализуется лональный минимум атой функции.