Ф.П. Васильев - Методы оптимизации (1125241), страница 11
Текст из файла (страница 11)
Неравенства (4) остаютили и = 6, так как при выполнении условий теоремы функц функция /(х) непрерывна во всех точках отрезка [а, ] и в ( ) можно совершить предельный переход при е — а+ Пример 2 показывает, что конечность величин /'(а+ 0), /'(Ь вЂ” 0) существенна для выполнения условия Липшица ( . ). (6.1). Теорема 4. Пусть функция/(х) вььпуклана отрезке[а, Ь], а!~и)— любая функция, удовлетворяющая неравенствам /'(е — 0) < 1(е) < г '(е+ + 0) прйа< е < Ь. Тогда 1(е) не убььвает при е е (а, Ь) и справедливо /(и) >/(е)+ !(е)(и — е), и Е [а, Ь].
(5) Если, кроме того, /(х) дифференцируема во всех точках отрезка [а, 6], /(и) ) /(е)+/'(е)(и — е), и Е [а, 6], (6) при любом е е [а, 6], Если неравенство (5) (или (6)) обраьцается в равенство при некотором и = с Е [а, Ь] (сне), то /(и)=/(е)+!(е)(и — е) — е)) — /(е) < сь(/(и) — /(е)) (О < сь < 1), Разделив обе части этого неравенства на сь и перейдя к пределу при о — +О, получим /(и) — /(е) > /'(е+ +0)(и — е) > !(е)(и-е) при и > е и /(и) — /(е) > / (е — 0)(и — е) >1(е)(и — е) при и < е. Неравенство (5) доказано. Заметим, что при а< и'с Ь переменные и, е в (5) входят равноправно, поэтому, меняя их ролями, получаем /(е) > /(и)+ Ци)(е — и) при всех е Е [а, 6].
Сложим последнее неравенство с (5) почленно. Будем иметь (1(и) — 1(е))(и — е) ) 0 при всех и, е Е (а, 6), что равносильно монотонному возрастанию Це), Пусть теперь /(х) дифференцируема во всех точках х Е [а, 6]. Тогда /'(и О) =/'( — О) =/'(и) при всех и е [а, 6]. Полагая в (5) !(е] =/'(е), убеждаемся в справедливости неравенства '6) пр (, ). й у ствования конечных функций /'(а + 0), /'(Ь вЂ” 0) и из (4) следует, что г(аконец, пусть /(с) = /(е) = 1(е)(с — е) при некотором с Е [а, 6] (с ф е). лости /гх) тогда следует, что /(и) < сь/(с)+(! — а)/(е) = а (/(е)+ 1(е)(с— — е))+( — сь)/(е)=/(е)+1(е)(и — е) (иЕ[с, е]), Сравнивая это неравенство с (5), заключаем, что /(и)=/(е)+1(е)(и — е) при всех и Е [с, е]. П График линейной функции /(е)+/'(е)(и — е) переменной и Е [а, Ь] представляет собой касательную к графику / =/(х) в точке е. Поэтому неравенство (6) означает, что график любои выпуклой дифференцируемой функции лежит не ниже любой касательной к нему.
Обобщая понятие касательной на случай выпуклых недифференцируемых функций, прямую д(и е) = /(е) + !(е)(и — е) где /'(е — 0) < 1(е) < /'(е + 0) также будем называть касательной к графику / =/(х) в точке е. Следствие 1. Пусть функция /(х) выпукла на [а, 6]. Тогда производные /'(и+0), /'(и — 0) монотонно возрастают при и Е (а, 6) (если существуют конечные /'(а+0), /'(Ь вЂ” 0), то утверждение справедливо на всем отрезке [а, 6]). Доказательство этого утверждения непосредственно следует из теоремы 4, если в ней принять !(е) =/'(е+0) или !(е) =/'(е — 0).
Те о рема 5. Пусть функция /(х) выпукла на отрезке.[а, 6] и 1пп /(х) =/(а), !!ш /(х) =/(6). Тогда множество Х„точек ее гло- еО ь-е бального минимума на [а, Ь] непусто и все точки локального минимума /(х) принадлежат Х„. Для того чтобы х, Е Х„необходимо и достаточно, чтобы /'(х. + 0) > О, /'(х, — 0) < О (7) (если х, = а или х, = Ь, то (7) заменяется одним неравенством / (а+О) >0 или /'(Ь вЂ” 0) < 0 соответственно). До к аз а тел ь ство. Из условий на функцию/(х) и теоремы 2 следует непрерывность /(х) на [а, Ь]. Согласно теореме 1.1 тогда множество Х, непусто.
Пусть х, — какая-либо точка локального минимума /(х). Тогда /(х+Ь)-/(х ) > 0 при всех достаточно малых ]Ь], для которых х +Ь Е [а, 6]. Разделив это неравенство на Ь > 0 и Ь < 0 и устремив Ь к нулю, получим условие (7). Заметим, что существование и конечность /'(х, хО) при ас с х„< Ь следует из теоремы 2, Если х, = а, то существование и конечность /'(а+ 0) следует из того, что (/(а+ Ь) — /(а))/Ь монотонно убывает при Ь- +О и ограничена снизу нулем. Аналогично доказывается существование и конечность /'(Ь вЂ” 0) при х„= Ь, Таким образом, показано, что всякая точка локального минимума необходимо удовлетворяет условиям (7). Пусть теперь некоторая точка х, е (а, 6) удовлетворяет условию (7).
Положим в неравенстве (5) е = х., !(е) =0 и получим, что /(и) >/(х„) при всех и е [а, 6]. Это значит, что х„е Х,. Аналогично с использованием неравенств (4) рассматриваются случаи х, = а или х. = 6 и показывается, что х. е Х„. Отсюда следует, что всякая точка локального минимума выпуклой и непрерывной на [а, 6] функции является точкой ее глобального минимума на [а, Ь]. П Т е о р е м а 6. Пусть функция /(х) выпукла на отрезке [а, Ь] и 1!ш /(и) =/(а), !пп /(и) =/(6) пусть Х, — множество точек мии аь.О и ь — о нимума /(х) на [а, Ь] и е — некоторая точка (а < е < Ь), Тогда для того чтобы Х, г! [а, е] =!2! (Х, П [е, Ь] = Я), необходимо и достаточно выполнения неравенства /'(е + 0) < 0 (/'(е — 0) > 0)..для того чтобы Х„П [а, е] ф 0 (Х, П [е, Ь] ф О), необходимо и достаточно, чтобы /'(е + 0) > 0 (/'(е — 0) < 0).
Доказательство. Достаточность. Пусть/(е+0)<0. Тогда согласно следствию 1 /'(и+ 0) < 0 при всех и е [а, е], Из теоремы 5 тогда имеем Х,П[а, е] =О. Если /'(е — 0) > О, то аналогично получаем /'(и — 0) >0 при всех и Е [е, 6], так что Х, П [и, 6] =!о, 36 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ Не о 5 ходи !я г! от ь.
Пусть Х,П[а, е) =[2!. Допустим, что / (и+ ), Тогда возможно, что /'(е — 0) < 0 или /'(е — 0) > О. Если /'(п — 0) < О, то из (7! следует, что п е Х,. Если же /'(е — 0) > О, то по доказанному выше Х,П[и, 6]=Я и, следовательно, Х„П [а, п]Ф!2!. В обоих случаях приходим к противоречию с тем, что Х, П [а, е] = О. Это значит, что при Х. и [а, и] = = Я необходимо, чтобы /'(п + О) < О. Аналогично доказывается, что если Х, п[и, 6] =!2), то необходимо, чтобь! /'(е — 0) > О.
В справедливости последнего утверждения теоремы 6 легко убедиться рассуждением от противного со ссылкой на уже доказанное первое утвер- ждейие, П Теорема 7. Если функция /(х) выпукла на отрезке [а, Ь] и 1[ш /(и) = /(а), [пп /(ы) =/(Ь), то она унижодальна на [а, Ь]. До к а з а т е л ь с т в о. Обозначим и, = !и[ Х„, и„= зцр Х,. Из непрерыв- ности /(х) на [а, 6) и определения верхней и нижней грани множества Х, , е Х . Если и = ью то Х, состоит из одной точки и„. Если и, < е„, то с учетом выпуклости /(х) имеем /„= [и[ /(и) </(сти,+( — а)е,) < сг/(и,) +(1 — гэ)/(и,) =/,. Это значит, что /(сги„+(1 — сг)е,) =/, Далее, так как Х.
О [а, е] = Я для любого е (а < и < и„), то по теореме имеем / (и+О) <0 при а< е < и,. А тогда / (и+О) <(/(п+/ь)-/(и))//ь <0 при вс ех достаточно малых Ь, т. е. /(х) строго монотонно убывает при а< х < и., Аналогично показывается, что при е, < х < Ь функция /(х) р х ст ого монотонно возрастает. П Как показывает пример 1, при нарушении условий теоремы 7.
множество Х, может быть пустым. Приведем еще несколько примеров. Пр и мер 3. Функция/(х)=хэ выпукла на отрезке [ — 1, [] и множество Х, состоит из единственной точки х, = О. П р и м е р 4. Функция /(х) =]х]+]х — 1[ выпукла на отрезке [ — 1, 2) и множество Х„представляет собой отрезок Х, ='[О, ]. Х вЂ” гО 1! Пример 5. Пусть /(х) =0 при 0< х < 1, /(О) = 1. Функция /(х) выпукла на [О, 1), но множество Х, = (х: 0 < х < 1) не является отрезком. Здесь 1!ш /(и) ~ /(0) — нарушено одно из условий теоремы +о Критерий выпуклости функций, приведенный в теореме 1, не очень удо- бен для практической проверки.
Приведем другие, часто более удобные критерии выпуклости функций. Теорема 8. Для того чтобы дифференцируежая функция /(х) на отрезке [а, Ь] была выпуклой, необходимо и достаточно, чтобы ее производная /Ь(х) не убывала на [а, Ь]. Д о к а з а т е л ь с т в о, Необходимость доказана в теореме 4, так как в рассматриваемом случае [(е) =/'(е) (е Е [а, 6]). Достаточность Пусть/'(х) не убывает на [а, Ь]. Пусть а<и <и < < тл < Ь. Применяя формулу Лагранжа, имеем (/(и) — /(е))/(и — п) = /'(с!), е < с! < и, (7(пг) /(и))/(тп ы) =/ (ьг) и < чг < тп П ию,гЯ ) < /Я ), поэтому из поедыдущих равенств следует одно из неравенств (2), что согласно теореме [ равносильно выпукл 8 8. ВЫПУКЛЫЕ ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ 37 Т е о р е м а 9.