Б.Н. Пшеничный - Выпуклый анализ и экстремальные задачи (1125256), страница 30
Текст из файла (страница 30)
кОнусы кАсАтельных нАНРАВленнн н шАтРы 203 В силу (1.30) и того, что )Ы-вгв(х) -0 прн х- О, г(х) обладает тем же свойством. Предположим, что хечьО. Так как ззвнп'ф, то существует такое ез) О, что ха+ (лп в)» 0 (еоВ) — Дь Введем в рассмотрение конус к.-(ь д,и»щ*,$(в — -,)), дввв Нетрудно видеть, что если х ви Кв, то ~)„)-.) —,,')<в вв.вв) Поэтому, если х вв 1лн 9 0 Кв„то в силу неравенства (1.34) получаем, что =в~ х = х, + ~ ' х — хв) ~ хв + 1ЛЕ 9; й (е,В), * е,. Пусть теперь 0=Ч ПОв()К;. Введем следующие обозначения: А и г,(х) =х+ ~в у'(х)ев, гг(х) = х — '~р у'(х)ео в=1 '=1.~.1 В силу равенства (1.31) фх) = вРв(гв(х)) = врг(гг(х)). (1.35) Выберем ев ) 0 настолько малым, чтобы из условий Я ~ ев, х ж ф следовало, что ~~г,.
(х) ~ <е. г. 1х) = К., (1.30) Из соотношений (1.30) и (1.33) следует возможность такого выбора. Заметим теперь, что так как векторы е», 1 1, ..., й, принадлежат 1ш()ь то г1(х) вв 1,1нв'„)в для х ы 9. 204 ГЛ. У. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА Аналогично, если х ~в К то гг(х) ю Ь(п(Ь Поэтому для хю() й (Э~В) из формул (1.36) и (1.26) следует, что г; (х) е= Ь1пуг ПКг, вг(х) ее ф Д(еВ), ф,(тв(х)) ю ЛХЯ 1= 1, 2. Но тогда равенство ОЬ35) показывает, что фх) юМ~ й Мг для х~Дй(е1В), т.
е. для хе~юг(К, хоМО, построены множество Ч и функция ф, удовлетворяющие условиям теоремы. Если хе=О, то Ь(п9 й (еьВ) ш9< при достаточно малом ее ) О, а отсюда сразу следует, что (); = Ь1п 9, т. е. ф — подпространство. Причем, так как Ь1п Д, = Ь(п Кь то ()~ =Ь(ЕКь Положим 9 =()~ й 9~=1лпД~ й Ь1~9~ п выберем з~ > О настолько малым, чтобы из 1х1 ( з~ следовало неравенство Ц(х)1<с. Тогда для хы()й(е,В) выполняется включение г,(х) юЧ; й (еВ), 1=1, 2, и фор)аулы (1.26) показывают, что ф(г,(х)) юЛХь 1=1, 2.
Теперь из равенства (1.35) получаем соотношение ф(х) = ф1(г~(х)) = ф(г,(х)) ю М1 й Мь Теорема доказана. Т е о р е м а 1.3. Пусть вьмголнены условия теоремы 1.2 и хотя бы один ив конусов Км,(хь) не есть подпространство. Тогда существует точка х1 ю М, отличная от хе. Доказательство. Пусть хе=О и Кс— = Км;(О). Так как конусы К~ неотделимы, то г(К= П г(К;чьЕ(, К= П Ко гаг Рв С $3 ФУНКЦИП, ДОПУСКАЮЩИЕ АППРОКСИМАЦИЮ 205 Допустим, что конус Кь угв1, не есть надпространство. Тогда ОФп' Кь ибо, как мы видели в конце доказательства предыдущей теоремы, из условия, что Оюг( Кь вытекает равенство К1 — — 1АПКР Так как г(КФИ, то можно указать направление хзгиг( К такое, что х,чьО. Согласно предыдущей теореме существует такой конус (,), что тзгип(), Ч вЂ” К, 1лп() =11ПК, п такая функция ф(х) =х+г(х), что 1х!~ 'г(х) - О при х- Ои ~у(х) ю М, х ~и ч П (еВ), е > О.
Так как 1х1-'г(х) - О прн х- О, то ~у(х) ФО при достаточно малых х. Поэтому при достаточно малых х, принадлежащих (), фх) ~в М, ф(х) ФО, что и требовалось доказать. Теорема 1.4. Пусть выполнены все условия теоремы 1.2, и пусть, кроме того, Кмг(хг) — гладкие локальные шатрЫ т. е. соответствующие им функции ~)ч(х), фигурирующие в определении 1.3 локального шатра, непрерывно дифференцируемы в окрестности начала координат. Тогда конус П Км;(хо) гне есть гладкий локальный шатер к М в точке хз. Доказательство практически полностью совпадает с доказательством теоремы 1.2.
Однако теперь в силу замечанпя к теореме 1.1 можно утверждать, что построенная в доказательстве теоремы 1.2 функция ф(х) — гладкая,п поэтому К вЂ” локальный гаатер. 3 2. Функции, допускающие верхнюю выпуклую аппроксимацию Для того чтобы моягпо было выписать необходимые условия экстремума, необходимо, чтобы функции, фигурирующие в задаче, обладали некоторыми специальными свойствами.
В частности, в окрестности точки минимума они должны допускать аппроксимацию некоторыми более 206 гл. у. неОБхОдимые услОВия экстгемума простыми и сравнительно легко вычислимыми функциямн. Так, например, гладкие функции допускают линейную аппроксимацию. Как было показано в $2 главы 1, выпуклые функции достаточно хорошо аппроксимнруются выпуклыми положительно однородными функцнямп— производными по направлению.
Однако негладкие и не- выпуклые функции уже невозможно приблизить в окрестности некоторой точки выпуклыми положительно однородными функциями. Для таких функций вводится понятие верхней выпуклой аппроксимации. Следует сразу заметить, что верхняя выпуклая аппроксимация определяется неоднозначно, и для получения содержательных условий экстремума, как правило, необходпмо знать достаточно широкое семейство верхних выпуклых аппроксимаций. 1.
Определение верхней выпуклой аппроксимации п субдиффереициала. Пусть 1(л), хж Х, — произвольная функция, принимающая конечные значения и значения . Положим а У-(зл (У(ли ~+-). Определение 2Л. Положим для х ж йош 1, л ж Х, ЕФО, Р (л, х) = зпр 1(ш з яр ~ ( + * ко ьго Л где внешняя верхняя грань берется по всем функциям г(Л) жХ таким, что Л 'г(Л) - О при Л Ф О. Очевидно, что величина Р(л, х) — конечная нли бесконечная — существует всегда. Легко также проверить, что функция Р(х, х) положительно одяородна по х, т.
е. для Л ) 0 Р(Лх, л) =ЛР(х, х). Замечание. Если функция 1(х) в окрестности точки х удовлетворяет условию Липшица, то (~(л+ Лк+ г(Л)) — ~(х+ Лт)! ( Пг(Л)(Л Поэтому 1(. + Лз+ г (Л)) — 1(а+ Л*) Л ь з. атнкции, доптскаюпшв лппвокснмлцию тот Р(х, х) = зор)«шзпр~ + йо ь»о + ) (*+ х +. (х)) — ) (*+ л ),. 1( + ) ) — у (*) т. е. для функций, удовлетворяющих условию Липшица, справедлива формула ь«о Определение 2.2. Функция Ь(х, х) называется верхней выпуклой аппроксимацией функции )(х) в точке х, если: 1) Ых, х) > Р(х, х) для всех х т- 0; 2) Ь(х, х) — выпуклая замкнутая положительно однородная функция х. Для краткости в дальнейшем вместо слов «верхняя выпуклая аппроксимация» будем писать просто в.в.а. Ясно, что в.в.
а. для функции 1(х) в точке х определена неоднозначно и может существовать много различных в. в. а. Очевидна следующая лемма. Лемма 2.1. Если Ь1(х, х) и Ь»(х, х) есть в.в.а. для ~ в точке х, то Ь1Ь1+Ь»Ь«, )а+А» 1, Ьь Ьз>0, и шах(Ьн Ь») также являются в.в.а. Определение 23. Кслп Ых, х) есть в.в.а. для 1 в точке х, то множество дЫО, х) =(хошХ*: Ь(х, х) ~ <х, хо>, хжХ) (2Л) называется субдифференциалом функции ~ в точке х и обозначается д~(х). Согласно определению 2.2 и теореме 11.3.12 субднфференциал дЫО, х) выпуклой замкнутой положительно однородной функции Ых, х) относительно х существует всегда. При этом дЫО, х) =бош Ь*( °, х), (2.2) где Ьо(хо, х) знр [(х, хо) — Ь(х, х)). 208 ГЛ. У.
НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА С другой стороны, из соотношения (2.2) и теоремы 11.2.5 следует, что Ь (х, х) = зпр [(х, х*): х* ~ дй (О, х)) хх нли, с учетом определения 2.3, Ь (х, х) = звр [(х, х*): х* ~ д~ (х)]. (2.3) х* При атом ясно, что субдифференциал д)'(х) в формуле (2.3) вычислен по функции Ых, х). Из формулы (2.3) также видно, что Ых, х) есть опорная функция множества д~(х). Формулы (2.1) и (2.3) показывают, что й(х, х) и д)'(х) однозначно определяют друг друга. Если д>(х) — субдифференциал, то д)(х) — выпуклое замкнутое множество, а функция Ь(х, х), определенная при помощи формулы (2.3), должна быть верхней выпуклой аппроксимацией для 1 в точке х.
Выпуклость и замкнутость субдифференцнала непосредственно следуют из определения 2.3 и теоремы И.3.2. Из сказанного следует, что возможно другое определение субдпфференпиала, эквивалентное определению 2,3: выпуклое замкнутое множество д~(х) называется еубдифференциало>к функции 1' в точке х, если функция Ых, х), определенная формулой (2.3), есть в.в. а.
для 1 в точке х. Как и в.в.а., субднфференциал определен неоднозначно. Использование одного и того же символа д((х), введенного для общего случая определением 2.3, а для выпуклой функции — определением 11.3.2, не приводит, как правило, к недоразумениям, так как из контекста всегда достаточно ясно, о чем идет речь.
Более того, если функция 1 выпукла и непрерывна в точке х, то следствие 2 формулируемой ниже теоремы 2.2 показывает, что субдифференциал такой функции в смысле определения 11.3. 2 есть одновременно и субдифференциал в используемом здесь смысле. Лемма 2.2. Если Ь1 и Ьт — в.в.а. длл ) в точке х ий>>йм то д>)(х) ю де~(х), $2. Функции, допускаюгцнв АппгоксимАпию 209 еде д1~(х) и де((х) — субдифференуиалы, определяемые Ь1 и Ье соответственно. Действительно, согласно определению 2.3 и формуле (2Л) хе~яде)"(х) тогда и только тогда, когда <х, х*> (Ье(х, х). В силу условия леммы отсюда вытекает, что <х, хе> ( Ьз(х, х) < Ь|(х, х), т.
е. хе ~н д~~(х). Проиллюстрируем данные простым примером. Пусть хай', Нетрудно подсчитать, что для с ) 0 Поэтому любая функция Ь(х, 0) ах, а..'в: О, является в.в.а. для ~, в точке х О. Соответственно д),(0) =(а), а>0. Итак, если с) О, то ~, в точке нуль имеет целое множество субдифференциалов, каждый из которых состоит из единственного числа а> О. Если с ~0, то (+, х(0, г" (х, О) = ~ О, х)0. Положим (- ) + со, х(0, О, х)0. Функция Ьэ(х, 0) выпукла, замкнута и положительно однородна, так что Ье есть в.