Ф.П. Васильев - Методы оптимизации (1125241), страница 12
Текст из файла (страница 12)
Для того чтобь! дважды дифференцируемая функция /(х) на отрезке [а, Ь) была вь!пуклой, необходимо и достаточно, чтобы /э(х) > 0 на [а, Ь). Доказательство. Условие /е(х) > 0 является необходимым и достаточным для неубывания /'(х) на [а, Ь]. Отсюда и из теоремы 8 следует требуемое. П Используя теоремы 8, 9, легко проверить, что функции /(х) = а*, /(х) = = — [п х, /(х) = х ]п х выпуклы на любом отрезке из области своего опре. деления; функции /(х) = х" при т < 1, т < 0 и /(х) = — х" при 0 < т < 1 выпуклы на любых отрезках [а, 6) (0< а < 6 < со). Функция /(х) = з!их выпукла на отрезке [ — я; 0], но невыпукла на [ — л; тг). Упражнения !.
Доказать, что если функция /(х) выпукла на отрезке [а, Ь], то /'(хи-0) = !и! (/(хи- й)- — /(х))/Ь, /'(х — 0) = эпр(/(х) — /(х — Ь))/Ь при всех х Е [о, Ь]. ь>о 2. пусть функция Пх) выпукла на отрезке [а, 6]. Доказать, что тогда /'(э+ 0) непрерыана слева, а /'(х — 0) непрерывна справа при всех х (о< х < Ь).
У к аз ание: эоспольэоэаться непрерывностью /(х), следстаием 1 и упражнением 1. 3. Пусть /(х) выпукла на [о, Ь]. Доказать, что / (е — О) < / (о+О) (/ (и — О) (/ (игО) при всех и, е (а< е < и < 6). Пользуясь этими неравенствами, показать, что /(з) дифференцируема з точке е (о < е < Ь) тогда и только тогда, когда одна из функций /'(х 1- 0) или /'(х — 0) непрерывна а точке е. 4. Пусть /(х) выпукла на [о 6].
Польз[ясь упраэннениями 2, 3, доказать, что множестаа точек непрерывности функции / (я+0) н / (х-0) совпадают. Вывести отсюда, что множество точек, з которых /(х) недифференцируема, не более чем счетно. б. Пусть функция Пз) непрерывна на отрезке [а, Ь], дифференцируема на отрезках [о, о!],[а!, аз],...,[а„ !,а ],[а„, 6] (о < а! « ... а„ < 6), причем на каждом таком отрез. яе производная /'(х) суммируема, не убыаает и /'(а! -0) </'(ог -1-0) (4 = 1,..., и). Доказать, что тогда Пх) выпукла на [а, 6]. а.
Для выпуклости функции Пх) на интерэале (а, Ь) необходимо и достаточно, чтобы сущестэоэала функция !(е) (е е (о, 6)) таяая, что /(х) > /(е)+ !(е)(х — е) при всех х е (о, 6). Необходимость доказана а теореме 4, докажите достаточность Покажите, что !(е) = /!(е) почти всюду на (о, 6). 7. Пользуясь теоремой 3, донаэать, что выпуклая на отрезке [о, Ь] функция Пх) абсолютно непрерывна на любом отрезке [з, Р] с (а, 6). 8. Если фуннция д(!) аозрастает на отрезке [о, 6] и суммируема на этом отрезке, то фуняция /(х) = [ д(!)Ж выпукла на [а, Ь], Доказать, Верно ли обратное утверждение? а О.
Пусть /(х) выпукла на [о, 6] и имеет обратную функцию. Можно ли утверждать', что обратная функция таюяе будет выпуклой? Рассмотреть функции /(х) = е*, /(х) = е *. !О. Пусть Пх) аыпуяла на [о,Ь] и Вгп /(и) = /(о), Ою /(и) = /(6), а Х, — множе. ч эо ь-о ство точек минимума /(х) на [а, 6]. доназать, что х, гт [а, р]т'мг, (х, с !п! [з, р]) тогда и тольао тогда, когда / (и — О) < О, / 03+0) > О, (/ (з — О) < О, / 03+0) > О); здесь о < и < р < 6. 11.
Доказать, что выпуклая ни отрезке [о, 6] функция /(х), отличная от постоянной, не может достигать своей верхней грани анутри отрезка [а, Ь]. 12. Пусть функция /(и) выпукла и монотонно аозрастает на отрезке [о, 6], а фуннция э(х) выпукла на [с, о], причем э(х) я [о, 6] при всех хе [ц о]. Доказать, что тогда сложная функция д(х) = /(э(х)) вЫпуКла на [с, о]. !3.
Нааозем функцию /(х) эыпуялой на отрезке [о, Ь], если /((и+е)/2) ((/(и)Ч/[е))/2 при асеэ и, е е [о, Ь]. Доказать, что для непрерывных функций это определение аыпуклои функции равносильно определению 1. Если не требовать непрерывности /(х), то новое определение аыяеляет более широкий ююсс функций — см. пример из [735, стр.119]. Ь О. Метод клслтельных 39 гв .', (2) ~(хз)=р„(хз), з=0,1,...,п (3) 9 Й. Метод касательных д(х, и) < у(х) Чх е [а, Ь] 38 Гл. 1. МЕТОДЫ МИНИМИЗЛЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ 14. Пусть у(х) — выпуклая функция при х ) О, у(0) <'О.
Доказать, что тогда функция зи(х) = у(хфх монотонно возрастает при х >О. На примере функции у(х) = 1+ х убедиться, т что при у( ) >О зто утверждение неверно. У к а ванне: воспользоваться равенством у(а)= =г( —,, ( чь)ч ',, о) (ь>о). 16. Пусть функция у(х) выпукла и двазкды дифференцируема при х > О, причем Ох (ху'(х) — Пх)) < О. Доказать, что тогда 1и(х) = Г(х)/х монотонно убывает при х > О. и ии указание: вычислить производные функций р(х) и ху'(х) — у(х), 16.
Доказать, что (а+ б)" < 2" '(а" + би) при всех п >1, а) О, б >О. Указание; воспользоваться выпуклостью функции у(х) = х" при х > О, п ~ )1. 1. Пусть функция у(х) выпукла и дифференцируема на отрезке [а, Ь]. Согласно теоремам 8.3, 8.7 такая функция удовлетворяет условию Липшица и уиимодальна на [а, Ь]. Поэтому для минимизации у(х) на [а, Ь] применимы почти все описанные выше методы, в частности, метод ломаных из 9 6. Однако, если значения функции у(х) и ее производной )и(х) вычисляются достаточно просто, то здесь можно предложить другой, вообще говоря, более эффективный вариант метода ломаных, когда в качестве звеньев ломаных берутся отрезки касательных к графику у'(х) в соответствующих точках. Зафиксируем какую-либо точку о е [а, Ь] и определим функцию д(х, и) = = у(о)+ )'(о)(х — о), а < х < Ь.
Согласно теореме 8,4 В качестве начального приближения возьмем любую точку х е [а, Ь] (например, хо= а), составим функцию рв(х) = д(х, хо) и определим точку и, е [а, Ь] из условия рб(х,) = ш!п ро(ы) (ясно, что при у'(хо) фО будет х, = а или — Ь).
е(, ь1 х,= Далее, берем новую функцию р,(х) = шах(рс(х); д(х„х,)) и следующую точку х, Е [а, Ь] наидем из условия р,(х,) = пт!и р,(ы), и т. д. Если точи я(ь ь! ки то, х„..., х„(и > 1) уже известны, то составляем функцию р (х) = = шах(р,,(х); д(х, х )) = шах д(х, хз) и следующую точку х„ч, опредео<гчи ляем из условий р„(х,) = ппп р„(ы) (х, „, е[а, Ь]).
Если при каком-либо и Е1ь ь! ть > 0 окажется, что у'(х„+ 0) > О, )ч(х — 0) < 0 (если а < х„< Ь, то это равносильно условию 1'(х„) = 0), то согласно теореме 8.5 х„е Մ— в этом случае задача минимизаций уже решена и итерации на этом заканчиваются. Нетрудно видеть, что р,(х) — непрерывная кусочно линейная функция и ее график представляет собой ломаную, состоящую из отрезков касательных к графику функции у(х) в точках х, х„..., х„(рис. 1.5).
Поэтому описанный метод естественно назвать методом касательных. Теорема 1. Пусть функция )'(х) на отрезке [а, Ь] выпукла и дифференцируема, а последовательность (х ) получена описанным выше методом касательных, причем х ф Х, (и =О, 1,,). Тогда: 1) !пп У(х.) = 1!ш р„(х„„,) = у"„ и справедлива оценка п 0<~(х„,) — Д„<)(х„,) — р (х...), и=1,2, 2) Вш р(х„, Х,) =О, или точнее, (х„) имеет не более двух предельных точек, совпадающих с и, = !и! Х„или и. = зцр Х„. Д о к а з а т е л ь с т в о.
Поскольку величины у'(а+ 0), У'(Ь вЂ” 0) конечны по условию, то в силу теоремы 8.3 функция у(х) удовлетворяет условию Липшица с постоянной 5 = шах(!)'(а)~, !у'(Ь)[). Кроме того, согласно (1) и определению функции р„(х) имеем Р 1(х)<р (х)(Дх) хЕ[а Ь] и=1,2 Тогда у'(хг) = д(х,, х,.) < р„(хз) < у (хг), т. е.
Наконец, угловые коэффициенты касательных д(х, х,) равны )'(хз), причем [у'(хз)] < т,. Из теоремы 6.1 тогда следует, что р„(х) удовлетворяет условию Липшица с постоянной 5 . Отсюда с учетом (2), (3) с помощью тех же рассуждений, которые применялись при доказательстве теоремы 6.3, нетрудно убедиться в справедливости всех утверждений доказываемой теоремы. Остается лишь заметить, что из того, что функция у'(х) унимодальна и х„(с Х„= [ы„, о,] (и > 0), равенство !пп р(х„, Х„) = 0 возможно тдлько в том случае, если предельными для (х,) будут лишь точки и„ или и„. П 2.
Метод касательных обладает всеми достоинствами метода ломаных из $6. Недостаток этого метода: Рис. 1.5. лв — график р(х, о). Ов — график а(х,х,), ОН П ИМЕНИМ ЛИШЬ В СЛ - ЛВ — график й(х) РΠ— графику(х, я), ЛМЛГВ— он пРименим лишь в слу фик, (. ), Д — г; фик р( и ), ЛМпВ — график чае, когда минимизируемая „( ) функция выпукла и значения функции и ее производных вычисляются достаточно просто.
Можно предложить более удобную для использования на ЭВМ вычислительнуго схему метода касательных, которая не требует хранения в машинной памяти информации обо всей ломаной р„(х) при х е [а, Ь]. А именно, з.":;:: возьмем а, = а, Ь, = Ь, вычислим у'(а ) = у'(а+ 0), у'(Ь ) = у'(Ь вЂ” 0). Если у'(а ) > 0 или У'(Ь ) < О, то по теореме 8 5 ае Х, или Ь е А, — задача решена. Поэтому, пусть У'(а,) < О, У'(Ь,) > О, что согласно теореме 8.6 означа- ет Х, с (а, Ь). Пусть отрезок [а„„Ь„,] (и > 2) уже построен, причем гз У'(а,,) <О, )"(Ь„,) >О, Х, с(а„„Ь„;).
Обозначим через х, точку пе'.,'л;:.и.и ресечения касательных д(х,а, ,) и д(х, Ь„ ,). Ясно, что а, , < х„ < Ь Вычислим г"'(х„). Если У'(х„) =О, то х е Х, — задача решейа, итерации на :з' ". 40 Гл. 1. МЕТОДЫ МИНИМИЗАПИИ ФУНКНИЙ ОДНОЙ ПЕРЕМЕННОЙ этом заканчиваются. Если /'(х„) ф О, то положим а „п У'(х„) > О, х„, /'(х )сО, х„, /(ха) > О, ] Ь, о Х'(х„)<0. По построению /'(а„) < О, /'(Ь ) > О, и согласно теореме 8.6 Х, с (а, Ь).