Б.Н. Пшеничный - Выпуклый анализ и экстремальные задачи (1125256), страница 11
Текст из файла (страница 11)
Напомним, что производной по направлению р я Х от функции 1 в точке х называется величина Пш1(. + Лт) — 1(.) Хго если предел в правой части равенства существует. 1. Определения и основные свойства. Л е м и а 3.1. Пусть 1(х) — выпуклая собственная функция, хооя дош1.
Тогда величина 1'(хо, р) — конечная или бесконечная — суи)ествует при любом р. Д о к а з а т е л ь с т в о. Если хо+ Лр Ф с(ош 1 прк всех Л)О, то 1(хо+Лр) +со и 1'(хо, р) =+го. Если хо+Лрон Йош1 для малых Л, то согласно лемме 1.8 отношение 1('о + "Р) — 1('о) Л есть невозрастающая функция Л, когда Л стремится к нулю убывая. Позтому предел 1(во+ ЛР) 1(хо) 1'(х, р) = Пш ьго существует всегда, что доказывает лемму.
Лемма 3.2. Если хо+Лргвбош1 для Лов( — е, +з), е) О, то 1 (хо, р) есть конечная величина. Доказательство. Согласно второму нз неравенств леммы 1.8 при ого= — е, а~ =О, сот =Л имеем 1(х,) — 1(х — гР) 1(в, + ЛР) — 1(х,) 5 г пРОизВОдные по нАпРАВленням откуда, переходя к пределу по Л г О, получаем 1( ' ЛР) 1( ) , 1( ) 1( ) ' > 1'(х„ р) в ' ' .
(3.1) Лемма 3.3. 1'(хг, р) есть положительно однородная выпуклая функция р. Доказательство. По определению для а~ О 1(г~+ ЛаР) 1(е~) 1' (х„ар) = Ппг Его 1(* +(Ла) Р) — 1( ) П е ° о 1 ( ьго Далее, для Ль Лг>0, Л|+Лг=1, имеем 1 (гг Ф Л (Лгрд + Л. Рг)) — 1(я ) Л 1(Л~(г~ тЛР ) +Л~(е~+ ЛР )) Л~1(е~) Л~1(е~) Л 1(*о Рг) 1(тг) 1(ге ЛРг) — 1(хе) <Л ' 1 "+Л Переходя к пределу по Л г О, получаем 1 (хо, Л1р1+ Лгрг) ~ Л11 (хг, Р1) + Лг1 (хо, Рг), что доказывает лемму.
Определение 3.1. Вектор хе называется субградиентом выпуклой собственной функцни 1(х) в точке ха ~и допг 1, если 1(х) — 1(х,) ~ <х — х„х*> для всех х. Данное определение субградиента нелокально, так как использует все х, а не только окрестность точки хг. Следующая лемма показывает, что на самом деле субградиент есть локальное понятие.
Л е и м а 3.4. Вектор хе является субградиентом функции Дх) в точке хг тогда и только тогда, когда 1'(хг, р) ~ <р, х > (3.2) для всех р. гл. и, выптклыв Фгнкцип 72 Доказательство. Если х* — субградиент, то 1(хо+>р) — 1(хо) ~Х<р, х*>, откуда 1(хо+ 2Р) 1(ео) )(р, х*> и 1'(хо, р) > <р, х*>, Обратно, если неравенство (3.2) выполнено, то для 0(>,(1 (см. доказательство леммы 3.1) 1(х) 1(х ) о и о ) 1(хо+ т (е — е„)) — 1(ео) 1( +>(* — .)) — 1(*) )1'(х, х — х,)) ~~(х хо х > т. е. х* — субградпент.
О п р е д е л е н и е 3.2. Множество субградиентов в точке хо называется субдифференциалом и обозначается д1(хо) Это записывается д1(хо) =(х»: 1(х) — 1(хо)~)(х — хо, х»>, 'Ух). Из леммы 3.4 следует, что д1(хо) = дю1'(хо. О), (3.3) где д„означает субдифференцнал от 1'(хо, р) по аргументу р. Действительно, 1'(хо, О) =0 по определению, поэтому неравенство (3.2) может быть переписано в виде 1 (хо, р) — 1 (хо, О) > <р, х»>, а это означает,что х* ж д,1'(хо, р). Теорема 3.1.
Если 1'(хо, р) есть зютнутая функция р, то д1(хо) не пусто и 1' (хо, р) = вор ((р, х*>: х* еи д1(хо)). Доказательство. Так как 1'(хо, р) положительно однородна и выпукла, то при условии замкнутости к ней может быть применена теорема 2.5. Согласно этой теореме 1'(хо, р) = зпр((р, х»>: х» ен <(ош(1'(хо, ))*), (3.4) Ф 3, пгонэводныв по нлпглвлениям где (('(хо, ) ) е означает функцию, сопряженную к ) (хо р) относительно р, т. е.
()'(х„, ))в(х*) = зпр((р,хе> — 1'(хо рО (3 5) р Но, как показано в $2, „, ~ О, хе~ йош(1'(х„° ))о, (+, 'Фд У (х„.))', поэтому с учетом соотношения (3.5) получаем, что хо~ дош(~'(хо, ))о тогда и только тогда, когда О~ <р, х*> — ('(хо, р), что эквивалентно неравенству (3.2). Отсюда следует, что дУ(хо) = д У'(хо, О) =' дош (~'(хо, . ) )'. Последняя формула совместно с формулой (3.4) доказы- вает теорему. Теорема 3.2. д)(хо) есть вьтуклое замкнутое мно- хсество.
Доказательство получается непосредственной провер- кой указанных в утверждении свойств, исходя из опре- деления 3.2. Теорема 3.3. хвоям(хо) тогда и только тогда, когда <хо, хв> — у(хо) = ~о(х*). Доказательство. Действительно, по определению х*~д~(хо), если <хо, хо> — )(хо) > <х, хо> — )(х). Беря в правой части верхнюю грань, получаем <хо, х*> — ~(хо) > ~о(хо).
Но <хо, хо> — )(хо) «)о(хо) по лемме 2.2, поэтому <хо, х*> — К(хо) = уо(х*). Теорема 3.4. Если выпуклая функция дифференцируема в точке хо, то д1(хо) = Ц'(хо)), т. е. д)(хо) состоит из единственного вектора )'(хо)— градиента функции ). гл. и. выпь кльш фвнкции Доказательство. Если ~(х) дифференцпруема в точке хо, то 1'(хо, р) = <р, 1'(хо) >, и поэтому ~'(хо, р) есть замкнутая функция р.
По теореме ЗА справедлива формула (р, ~'(хо)) = звр((р, х*>: хо ен д~(хо)). в Легко видеть, что это возможно лишь в том случае, если множество д1(хо) состоит из одной точки )'(хо) Теорема 3.5. Пусть выпуклая функция Дх) непрерывна в точке хо. Тогда д((хо) — непуетое ограниченное множество и ~' (хо, р) = шах ((р, хо): х* ~ д~ (хоИ.
Доказательство. Так как ~(хо) непрерывна в точке хо, то по лемме 3.2 1'(хо, р) — конечная величина. Рассмотрим в К"+' луч !е'=Ихо, х): хо=у(хо)+ц'(хо, р), х=хо+г,р, Х>0) и множество А = ((хо, х): хо ) ~(х)). Множества А и .'Р' выпуклы и не пересекаются. Докажем это. Выпуклость А сразу следует из выпуклости ~(х). Из неравенства 1( о+ р) ~(хо) вытекает, что Кхо+ > р) ~ У(хо) + Ч (хо, р). Если же точка (У(хо) + ЛУ'(хо, р), хо+ Лр) луча Ы' принадлежит А, то 1(хо)+ Ц'(хо, р) )1(хо+) р) в противоречии с предыдущим неравенством.
По теореме отделимости Е2.3 существует такой не равный нулю вектор (хоо, х*) ~и Кэ ы что уо ° хоо + <у, х*> ( хо ° хо' + <х, х*>, (3.6) (уо у) ы Я (хо х)ы А О 3. ПРОИЗВОДНЫЕ ПО НАПРАВЛЕНИЯМ 75 Так как хо ) 7(х) для (х', х) ои А, то хо можно устремлять к + . Неравенство (3.6) тогда нарушалось бы в случае хо* < 0; поэтому хо* ) О. Покажем, что хо* ) О.
Если хо" = О, то (3.6) переходит в неравенство <у х*> < <х, х*>, (уо, у) онУ, хоп о)ошК. (3.7) Точка (У(хо), хо) ж.У. С другой стороны, хо+езж дош К, з~нВ, при достаточно малом е) О, так как хо — точка непрерывности ~, и, значит, хо ои(по оош ~. Поэтому (3.7) дает <хо, х*) ((хо, хо)+е<з, х*), т. е. <з, х*) ~0, з он В, где  — единичный шар с центром в нуле. Последнее возможно лишь в том случае, если хо = О, т. е. (хоо, хо) = = (О, 0). Получено противоречие с тем, что этот вектор ненулевой. Итак, хоо) 0 и можно положить хо*=1 (иначе следовало бы разделить обе части неравенства (3.6) на хо*).
Подставим в неравенство (3.6) вместо (уо, у) ои.х их выражение для уо, у, а в правой части положим х'=~(х). Последнее возможно по непрерывности, так как неравенство (3.6) справедливо для всех хо) ~(х). Теперь оно приобретает вид У(хо)+Ц'(хо, Р)+ <хо+ЛР, хо> ~У(х)+<х, хо>, (3.8) Л>0. Положив Л = О, получаем (х — хо, — х*) ( )(х) — 7(хо), т. е. х*" = .— хо ен д~ (х,). Таким образом, д)(хо) чь 8. С учетом этого мох но переписать неравенство (3.8) в следующем виде: 7(х) 7(хо)~~<х — хо хо)+Л[1 (хо Р) — <Р~ х~)~.
Полагая х = хо, получаем 7 (хо~ Р)(~(Р хо) хое= д7(хо). (3.9) По лемме ЗА ~'(хо Р) ) <Р, х*>, хо ж д1(хо). (ЗАО) 76 ГЛ. П. ВЫПУКЛЫЕ ФУНКЦПП Совмещение неравенств (3.9) п (3.10) дает » (х„р) = < р, х'> =гиах ((р, х*>: хе ~ д)'(х )). Ф (3.11) Осталось доказать, что д>(хс) есть ограниченное множество. Согласно теореме 1.3»х) удовлетворяет условию Лппшпца в точке хс, поэтому Отсюда с учетом соотношения (ЗЛ1) получаем <р, х*> ( Ир!! для всех хе ы д)(хс) и любых р. Полагая р хе, получим, что (И! <Е. Теорема полностью доказана. Теорема З.б. Если хам г(бош>, то д)(хц) чь 1д и » (хс р) = зпр (<р ха>: х' ~ Н (хэ)). Доказательство. Пусть Я = Ьшйош>; тогда (и) =» э+у), у -=2', (3.12) т.
е. )х(у) определена на подпространстве Я (будем ее рассматривать только на этом подпространстве). Тогда точка у = 0 есть внутренняя точка дош )х в этом подпРостРанстве, так как хсы 11 йош). Согласно теореме 1.4 )х (у) непрерывна в точке у = О, и поэтому по предыдущей теореме )х (О, р) = шах (<р, у >: у* еи д)х (О)) (ЗЛЗ) Р для ры2'. При этом д(х(0) также вычисляется только относительно подпространства 5~, т. е. д)х(0) ы2'. Обозначим через Ы'- ортогональное дополнение 2' до всего пространства Х = К", т. е.
г 1Е,У~ тогда и только тогда, когда <р, г> = О, р ы2,'. Любой вектор р'ш К" мол'но однозначно представить в виде р =р+з, р1н2', гы.х'~. о г. пРОизВОдные по нАпРАВлениям 77 Пусть теперь РФх =Е(пйош). Тогда хо+ХРФйош7 для Х 'О, п позтому ~'(хь р) =+ РФ2'. (3.14) Если рж2', то ('(хо, р) = )х(0, р). (ЗЛ5) Положим (ЗЛб) Тогда для любого вектора р имеем Р=ро+г, РоонУ г~У~ <Ръ г> =О. шах (р, уо) = РоЕА = шах[(Ро+г Уо+ го): Уорд)х(0), го Я.У [= Родо о' = шах [(р„у,*): у ~ д1х(0)[ -)-шах [(г, го): а*~ ЗА[= гчьО, в=О, + со, Кх(01 Ро) поскольку, как легко видеть, при г ш.'х'".