Ф.П. Васильев - Методы оптимизации (2002) (1158201), страница 11
Текст из файла (страница 11)
огда /'(и +О) =/'(и — [1) =/'(и) при всех и б [а, Ь]. Полагая в (5) 1(е~ =/'(е), убеждаемся в справедливости неравенства (6) при всех и е (а, 6). з суще- ствования конечных функций /'(а + 0), /'(Ь вЂ” 0) и из (4) следует, что г[аконец, пусть |(с)=/(е)= Це)(с — е) при некотором се[а, ~ (с фи). Возьмем произвольную точку и = ос+(1 — гь)е из отрезка [с, е). з выпук- лости /~х) тогда следует, что /(и) ( а/(с)+(1 — сь)/(е) = ьх(/(е)+1(е)(с— — е)1+() - сь)/(е) = 7 (е)+1(е)(и — е) (и й [с, е)).
Сравнивая это неравенство с (5), заключаем, что 7(и)=7(е)+1(е)(и — е) при всех и е [с, е]. График линейной функции /(е) +/'(е)(и — е) переменной и е [а, 6) представляет собой касательную к графику / =/(х) в точке е. Поэтому неравенство (6) означает, что график любои выпуклой дифференцируемои функции лежит не ниже любой касательной к нему. Обобщая понятие касательной на случай выпуклых недифференцируемых функций, прямую д(и, е) =/(е)+1(е)(и — е), где ~'(е — О) ((1(е) < /'(о+ 0), также будем называть касательной к графику / =/(х) в точке е.
Следствие 1. Пусть функция /(х) вььпукла на [а, Ь]. Тогда производныв /'(и+0), /'(и — 0) монотонно возрастают при и е (а, 6) (всли существуют конечные /'(а+0), /'(Ь вЂ” 0), то утверждение справедливо на всем отрезке [а, 6)). Доказательство этого утверждения непосредственно следует из теоремы 4, если в ней принять 1(е) = /'(е + 0) или 1(е) = /'(е — 0).
Теорема 5. Пусть функция /(х) выпукла на отрезке [а, 6) и йгп /(х) = Яа), !пп /(х) =/(Ь). Тогда множество Х„точек ее глаз а.ьь ь-о бального минимума на [а, 6) непусто и все точки локального минимума /(х) принадлежат Х., Для того чтобьь х. Е Х„необходимо и достаточно, чтобы /'(х„+0) > О, /'(х„— 0) <0 (7) (если х„= а или х,= Ь, то(7) заменяется одним неравенством /'(а+О) >0 или /'(Ь вЂ” 0) < 0 соответственно).
Доказательство. Из условий на функцию/(х) и теоремы 2 следует непрерывность /(х) на [а, 6), Согласно теореме 1.1 тогда множество Х„ непусто. Пусть х, — какая-либо точка локального минимума /(х). Тогда /(х+Ь) — /(х ) >О при всех достаточно малых)Ь), для которых х+Ье[а, 6]. Разделив это неравенство на Ь > 0 и Ь < 0 и устремив Ь к нулю, получим условие (7). Заметим, что существование и конечность /'(х„~ 0) при ос < х„< Ь следует из теоремы 2.
Если х, = а, то существование и конечность /'(а+ 0) следует из того, что (/(а+ Ь) — /(а))/Ь монотонно убывает при Ь вЂ” +О и ограничена снизу нулем. Аналогично доказывается существование и конечность /'(Ь вЂ” 0) при х, = 6. Таким образом, показано, что всякая точка локального минимума необходимо удовлетворяет условиям (7). Пусть теперь некоторая точка х, е (а, 6) удовлетворяет условию (?). Положим в неравенстве (5) е = х„ 1(е) = 0 и получим, что /(и) > /(х.) при всех и е [а, 6]. Это значит, что х, е Х„. Аналогично с использованием неравенств (4) рассматриваются случаи х, = а или х, = Ь и показывается, что х, Е Х,. Отсюда следует, что всякая точка локального минимума выпуклой и непрерывной на [а, 6] функции является точкой ее глобального минимума на [а, Ь).
П Теорема 6. Пусть функция /(х) выпукла на отрезке [а, Ь] и 11ш /(и) = /(а), 1пп /(и) = /(Ь); пусть Մ— множество точек мин а.ьь ь-ь нимума /(х) на [а, Ь) и е — некоторая точка (а < е ( Ь). Тогда для того чтобьь Х, Гь [а, е) = 0 (Х, Гь [е, 6) = И), необходимо и достаточно выполнения неравенства /'(о+ 0) < 0 (/'(е — 0) > 0). Для того чтобьь Х, Гь [а, е) ~ И (Х, гь [е, Ь) ф Я), необходимо и достаточно, чтобы /'(е + 0) > 0 (/'(е — 0) < 0). Д о к а з а т е л ь с т в о. Д о с т а т о ч н о с т ь.
Пусть /'(о+0) < О. Тогда согласно следствию 1 /'(и + 0) < 0 при всех и Е [а, е). Из теоремы 5 тогда имеем Х гь[а, е] =О. Если / (е — О) > О, то аналогично получаем / (и — О) > 0 при всех и Е [е, Ь), так что Х, гь [о, Ь) = О. й 3. ВЫПУКЛЫЕ ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ 37 36 Гл. !. МЕТОДЫ МИНИМИЗАПИИ ФУНК!(ИЙ ОДНОЙ ПЕРЕМЕННОЙ Н е о б х о д и м о с т ь.
Пусть Х„П [и, и] = И. ДопУстим, что /'(и + 0) > 0 Тогда возможно, что /'(и — 0) < 0 или /'(и — 0) > О. Если /'(о — 0) < О, то из (7) следует, что и е Х„. Если же /'(и — 0) > О, то по доказанному выше Х, О [и, Ь] = И и, следовательно, Х„ П [а, и] ~ И.
В обоих случаях приходим к противоречию с тем, что Х. П [и, и] = И. Это значит, что при Х, п [и, и] = = И необходимо, чтобы /'(и + 0) < О. Аналогично доказывается, что если Х, и [и, 6] = И, то необходимо, чтобы /'(и — 0) > О. В справедливости последнего утверждения теоремы 6 легко убедиться рассуждением от противного со ссылкой на уже доказанное первое утверТеорема 7. Если функция /(х) выпукла на отрезке [а,Ь] и 1нп /(и) = /(а), [пп /(и) = /(6), то она унимодальни ни [а, 61. Доказательство.
Обозначим и,=[п1Х„, п„=зцрХ.. Из непрерыв- ности /(х) на [а, 6] и определения верхней и нижйей гранй множества Х, и. и е Х . Если и = и„ то Х, состоит из одной точки и,. Если и, < ею то с Учетом выпУклости /(х) имеем /, = !и[ 3(и) /(мхи„ + ( — ст)и,) < сг/(и„)+(1 — сг)/(и„) =/,. Это значит, что /(сги, +(1 — сг)н,) =/„ ме 6 Далее, так как Х„п [о, и] = И для любого о (а < и < и,), то по теореме имеем / (и+О) < 0 при и<и <и,. А тогда Г(и+О) < (/(и+ 6) — /(и))/6 < при всех достаточно малых 6, т. е.
/(х) строго монотонно убывает при и < х < и„. Аналогично показывается, что при и, < х < Ь функция /(х) строго Как показывает пример 1, при нарушении условий теоремы 7 множество Х„может быть пустым, Приведем еще несколько примеров. Пример 3. Функция/(х)=х' выпукла на отрезке [-1, Ц и множество Х„ состоит из единственной точки х, = О. Прим е р 4.
Функция /(х) = [х[+ [х — 1[ выпукла на отрезке [ — 1, 2] и множество Х, представляет собой отрезок Х„= [О, Ц. П р и м е р 5. Пусть /(х) = 0 при 0 < х < 1, /(0) = 1. Функция /(х) выпукла на [О, Ц, но множество Х„= (х; 0 < х < 1( не является отрезком. Здесь 1!гп /(и) ~ /(О) — нарушено одно из условии теоремы 7. +о К " !пуклости функций, приведенный в теореме 1ь не очень удоритерий вь бные бен для практической проверки. Приведем другие, часто более удобн критерии выпуклости функций. Теорема 8.
Для того чтобы диффврвнцирувмия функция /(х) на отрезке [сч Ь] бьгли выпуклой, необходимо и достаточно, чтобьз вв производная /'(х) нв убывала на [а, 6]. Д о к а з а т е л ь с т в о. Необходимость доказана в теореме 4, так как в рассматриваемом случае 1(н) =/'(и) (и е [и, 6]). Д о с т а т о ч н о с т ь Пусть /'(х) не убывает на [а, 6]. Пусть а < и < и < < иг < Ь. Применяя формулу Лагранжа, имеем (/(ы) — /(и))/(и — и) = /'(с,), и < с, < и, (/(тс) — /(и))/(ш — и) = / (ьсз), и < ьсз < нг.
По условию /'(с,) < /'(сз), поэтому из предыдущих равенств следует одно из неравенств (2), что согласно теореме 1 равносильно выпуклости /(х) на Т е о р е м а 9. Для того чтобы дважды диффервнцируемия функция /(х) на отрезке [а, Ь] была выпуклой, необходимо и достаточно, чтобьс /з х) > 0 ни [а, Ь]. Ъ- о к азательство. Условие /л(х) >0 является необходимым и достаточным для неубывания /'(х) на [а, 6], Отсюда и из теоремы 8 следует требуемое. Б Используя теоремы 8, 9, легко проверить, что функции /(х) = а*, /(х) = = — [п х, /(х) = х [в х выпуклы на любом отрезке из области своего определения; функции /(х) = х" при г < 1, т < 0 и /(х) = — х" при 0 < т < 1 выпуклы на любых отрезках [о, 6] (О < а < Ь < оо).
Функция /(х) = з!их выпукла на отрезке [ — я., 0], но невыпукла на [ — тг, тг]. Упражнения 1. Доказать, что если функция /(х) выпукла нз отрезке [а, Ь], то /'(а+ 0) = !и! (/(х+ 6)— — /(х))/6, / (х — О) = зцр (/(х) — /(х — 6))/Ь при всем х с[а, Ь!. ь>о 3. Пусть функции /(х) выпукла нз отрезке [а, 6], Доказать, что тогда /'(х+ 0) непрерывна слева, з /'(х — 0) непрерывна справа при всех х (а<х < Ь). Укзззние: воспользоваться непрерывностью /(х), следствием ! и упрзжнением 1.