Ф.П. Васильев - Методы оптимизации (2002) (1158201), страница 64
Текст из файла (страница 64)
До к,а лат ел ьст ао. Пока>кем, что (/>(и) — /'(о), и — х) > Е ппп(1; 2з»ян — о[", и, о е л>" 2 (12) Здесь /'(х) = р~х[» х. Тогда (/'(н) — /'(о),п — о) = (р[п[» и — р[о[» »,н — о) = = р[[и[» -1-(о[» — (и, о)([о[» -1-[о[>' )[ = 2 [([ > Е2)~ — ~[~([~(" + [о[" ), (13) Пока>кем, что [н[" + [о[' > [и — о[» пнп(1; 2»), и, о е Ю" (14) Рассмотрим функци>о Р(х) =(х" +1)/(х+1) при х) 1, и >О. Имеем З>(х) = с>(х" — 1)(х+ + 1) " '. Если сг > 1, то >р'(х) >О, и т>(х) > З>(1)=2! "для всех х > 1.
Если 0< и <1, то у>(х) <О и >р(х) > у>(со) =1 при всех х > 1. Следоаательно, т>(х) > А =щьп(1; 2' ч) >ух > 1, или А (х+!) (х" +1, х>1, п>0. Далее имеем [и-о[" я <([и[+[о))» я. Без ограничения общности можем считать [и[) [о[ Тогда с помощью неравенства (!5) получим [и — е[» Я ( [о[" "([и[/[»[+ 1)" з (А > з(([и[/[о[)» а+ 1)[о[" 2б(!)<срКх+т)"-' — х» '1, >О, т>0 С помощью формулы конечных превращений отсюда имеем 2б(!) < !2р(р — 1)(х+ Ез)» < !яр(р — 1)х"-т х > О, т > О Зафиксируем здесь произвольное ! > О, а х устремим к со.
Получим б(1) ю 0 при всех ! > О. Таким образом, функция Пх) = [х[» при 1 < р < 2 не является равномерно выпуклой на й». Можно, однако, показать, что зта функция строго рааномерно выпукла на любом аыпуклом ограниченном множестве из И" [1911. что равносильно (! 4). Из (! 3) и (14) следует неравенство (12).
С помощью теоремы 3 отсюда заключаем, что функция /(х) = [х[» при р ) 2 равномерно аыпунла на ж" с модулем б(т) = щ!п(1;2з- )/2.!З Более тонкие оценки показывают, что функция /(х) = [х[" при р > 2 имеет точный модуль выпуклости Р(с) = з»/2» х, т > О, Будет ли функции /(х) = [х~» равномерно выпуклой на И" при ! < р < 22 Оказывается, не будет. Чтобы убедиться а атом, достаточно показать, что функция !»(х) = х" одной переменной при 1 < р < 2 не будет равномерно выпуклой на полуоси х > О, поскольку функция /(х) = [а[» вдоль лучей х = те,[е[ = 1, аедет себя как функция !» одной переменной.
Если бы функция у>(х) = х", 1 < р < 2, была равномерно аыпуклой прн х ) 1 с некоторым модулем выпуклости б(т), то согласно теореме 2 необходимо аыполнялось бы неравенство (10). В данном случае неравенство (10) имеет аид 211 $7. РАВНОМЕРНО ВЫПУКЛЫЕ ФУНКЦИИ -.тб-:, гйа, В 8. Обоснование правила множителей Лагранжа Пользуясь теоремами отделимости выпуклых множеств и теорией неявных функций из классического анализа, мы уже в состоянии дать строгое обоснование правила множителей Лагранжа, изложенного в $2.3.
6олее того, мы получим необходимые условия экстремума первого порядка для несколько более общей задачи: ,/(х) — > !п1, х е Х, (1) Х=(хЕХо: д(х)<0, з=1,...,т; д(х)=0, з=тп+1,...,г). (2) где Х, — заданное множество из Е", функции /(х), дз(х), з' = 1,..., а, определены на Хо.
Здесь не исключаются возможности, когда отсутствуют либо ограничения дз(х) < 0 типа неравенств (тп =0), либо ограничения д,(х) = 0 типа равенств (а = т), либо оба вида ограничений (тп = з = О, Х = Х ), Если Хо = Е", то получим задачи, рассмотренные в главе 2. Разумеется, и само множество Хо в (2) может задаваться ограничениями типа равенств и неравенств. При выделении множества Хо обычно руководствуются тем, чтобы Хо имело простую структуру, чтобы легко (без трудоемкой вычислительной работы) можно было проверить включение х Е Хо, указать какую-либо конкретную точку из Хо, чтобы легко было проектировать точку на Х .
В задачах линейного программирования (глава 3) роль Хо играл неотрицательный ортант Е". Часто множество Хо представляет собой параллелепипед Хо — (х = (х» з ) Е Е ст> < х! < </)„з = 1,..., и ), где ою />з — заданные числа, сг></>г (возможно, некоторые а>=ос, /)!=+со) Функция Лагранжа для задачи (1), (2) определяется также, как в главе 2 ,С(х, Л) = Лх/(х) + Л > д (х) +... + Л,д (х), (3) где х=(х',...,х )ЕХо, Л=(Ло,...,Л,„)ЕЕ'г!, Л,>0,, Л >О, Теорема 1. Пусть множество Х задается условиями (2), где Хо — выпуклое множество из Е", функции /(х)„дз(х), з = 1, .. ч з, опре- делены на Х . Пусть х.
е Х вЂ” точка локального минимума е зада- че (1), (2), пусть функции /(х), д,(х),..., д (х) дифференцируемы е точ- ке х„а функции д „,(х),..., д,(х) непрерывно дифференцируемы е неко- торой окрестности О(х„г) П Хо точки х„. Тогда существуют числа Л = (Л„..., Л,) такие, что Л =(Лщ,, „Л,) ФО, Л, >О, Л, >О,..., Л.,>О, (Е,(х„> Л), х — х,) ) 0 Ух Е Хо, Лзд>(х,) =О, з = 1,..., т. Сразу же заметим, что при Хо = Е" условие (5) эквивалентно равенству й,(х„Л ) =-0 — это легко доказывается с помощью тех же рассуждений, использованных в теореме 2.3 в аналогичной ситуации.
Отсюда следует, что при Хо = Е теорема 1 превращается в теорему 2.3.2. Поэтому, доказав теорему 1, мы получим также и доказательство теорем 2.3,1, 2.3.2. Как и в главе 2, числа Л = (Л,..., Л„) из (3) — (6) будем называть множителями Ь 8. ОБОСНОВАНИЕ ПРАВИЛА МНОЖИТЕЛЕЙ ЛАГРАН>КА 213 212 Гсс 4. ЭЛЕМЕНТЫ ВЪ|ПУКЛОГО АНАЛИЗА "'1;' ' с) Лсд,'(х„)+ 2, а>е! =О, (Л,„„„..., Л„а„..., а ) ф О. Лагранжа, соответствующими точке х„равенства (6) — условиями дополняющей нежгстности. Будем также придерживаться прежних определений активных и пассивных ограничений: ограничение д>(х) < 0 активно в точке х„если дс(ж„) =О, и пассивно в точке ж„, если дс(х„) < О.
Из теоремы 1 следует, что точками локального минимума в задаче (1), (2) могут быть лишь те точки х = е, для которых существуют множители г>агранжа Л =(Л,..., Л,), такие, что пара (е, Л) е Е" л'е' является решением системы (ЛоХ (е) + Л,д,'(е) +... + Л,д,'(е), х — е) > 0 Чх Е Хо, Л>д(е)=0, >=1,...,т; еЕХо, д(е)<0,, д (е)<0, д „,(е)=0, ..., д(е)=0, (8) л ~ о, л, > о, ..., л„> о. (9) Множество всех тех Л, для которых пара (е, Л) — решение системы (7)- (9), будем обозначать через Л=Л(е).
Так как если (е, Л) — решение системы (7) — (9), то пара (е, ссЛ) при Лс!с > 0 также решение этой системы. Следовательно, Л(е) — конус, который как и в главе 1, будем называть конусом Лагранжа. Предлагаем читателю доказать, что Л(е) — выпуклый конус, а конус Л(е)Г>(0) замкнут. 3 а м е ч а н и е 1. Если е — точка локального максимума функции 1(х) на множестве (2), то учитывая, что е — точка локального минимума функции ( — Х(х)), и применяя к ( — Х(х)) теорему 1, получим, что для точки локального максимума существуют множители Лагранжа Л = (Ло,..., Л ), такие, что пара (е, Л) удовлетворяет соотношениям (7), (8), а условие (9) заменяется на ЛФО, Л,<0, Л,>0,, Л >О, (1О) множество таких Л образует выпуклый конус, который также будем обозначать через Л(е) и называть конусом Лагранжа точки локального максимума.
В системах (7) — (9) и (7), (8), (10) условие Л ~0 можно заменить каким- либо условием нормировки, например, !Л!' = Х Л,'. = 1. Для выявления то=о чек, подозрительных на локальный экстремум (минимум или максимум) достаточно рассмотреть систему (7), (8) с требованием Л, > О,..., Л„> О, в последовательно полагая в ней Ло —- 1, Ло = — 1 и Ло =О, 2„Л,'. = 1. При ~=о обсуждении теоремы 2.3 было замечено, что вариационные неравенства (с,.(е, Л), ж — е) > 0 Чж Е Хо, вообще говоря, могут быть записаны в виде системы и уравнений. Поэтому можно сказать, что система (7), (8) с учетом условий нормировки, содержит подсистему из и+в+ 1 уравнений с и+в+1 неизвестными (е, Л).
Определив решения этой подсистемы и отобрав из них те, которые удовлетворяют остальным условиям (7)-(9) или (10), получим множество точек е, подозрительных на локальный экстремум, и соответствующий множитель Л из конуса Л(е), Описанный подход к поиску точек экстремума функции 1(х) на множестве (2), как и в главе 2, будем называть правилом множителей Лагранжа.
Доказательство теоремы 1 проведем, используя методику книги [670) (гл. 4, $2). Пусть 1, = 1(х„) = (с ! 1 < Ь < т, дс(х„) = 0) — множество номеров активных ограничений в точке х„(возможность 1, = О здесь не исключается), пусть !1,! — количество номеров 1„. Определим множество А, состоящее из точек а=(ао, ас, с Е Х„а „„..., а,) С Е' +! !~', представимых в виде ао = (Х'(х„), ж — х,), а! = (д,'(х„), ж — ж,) для с е 1„и с = т+1,..., г при некотором ж Е г! Хо. Так как г! Хо ф Я (теорема 1.11), то А ~ О.
Кроме того, введем множество В = (Ь = (Ь, Ьс, ! я Х„, Ь„~ „..., Ь ) е Е' "о!" + '. Ь, < О, Ь! < 0,1 е 1„, Ь„+, — — О,..., Ь, = О). Очевидно,  — непустое выпуклое множество, Нетрудно доказать, что множество А также выпукло. В самом деле, пусть с1„до е А. По определению множества А тогда существуют точки х„х Е г1Х, такие, что д,. = (а, = (Х'(х„), жт — х,), ае = = (д,.'(х„), х, — х.), о е 1„, 1 = >и + 1,..., г), г' = 1, 2.