Б.Н. Пшеничный - Выпуклый анализ и экстремальные задачи (1125256), страница 28
Текст из файла (страница 28)
Локально эти множества и функции должны обладать некоторыми свойствами. Эти свойства выражаются в понятиях конусов касательных направлений и шатров для множеств. Локальные свойства функций описываются верхней выпуклой аппроксимацией, определение которой дается во втором параграфе. й 1. Конусы касательных направлений и шатры $. Касательные направления. Пусть М вЂ” произвольное множество в пространстве Х. Определение 1Л. Вектор хшХ называется касательным к множеству М в точке хюМ, если существует такая функция ~р(Л) ~в Х, что х+Лх+ у(Л) -=М при достаточно малых Л>О и Л '~р(Л)- О, когда Л1 О.
Касательные направления можно собирать в некоторые множества — обычно конусы, так как легко видеть, что если х — касательный вектор, то и вектор их, и > О, также является касательным. Определение 1.2. Выпуклый конус К„(х) называется панусом касательных направлений в точке х к множеству М, если из включения х ю К (х) следует, что х — касательный вектор к множеству М в точке х~и М. Важно отметить, что конус Кн(х) определен неоднозначно. В этом есть свои положительные стороны, которые будут более ясны из дальнейшего изложения. Во всяком случае необходимые условия минимума не бу- 1ЗЗ гл. ч. нковходимык колония экстгнмтма дуг зависеть по своей форме от выбора конуса Кн(х).
Однако чем этот конус шире, тем более существенны будут эти условия, Если М вЂ” выпуклое множество, то легко видеть,что К (х) =сон(М-х) =(х: х=Х(х~-х), И.1) х~ыМ, Л>О) есть конус касательных направлений к М. Для этогодостаточо положить ~уй) =О в определение 1Л. Условимся, что если множество М вЂ” выпукло, то всегда в качестве К„(х) будет браться конус, задаваемый формулой ИЛ). Приведем примеры конусов касательных направлений, Пример 1Л. Пусть множество М задано системой уравнений Х(х) =О, (ыХ, И.2) где Х вЂ” конечное множество индексов, а функции Х,(х) непрерывно дифференцируемы.
Лемма 1Л. Если хгыМ, т. е. хг удовлетворяет системе И.2), и градиенты 1~(х ), (ен Х, линейно независимы, то К„(хв)=(ж(х,Х';(хв))=О, (~Х) (1.3) есть конус касательных направлений. Доказательство. Пусть 1'(хг) есть матрица, стро- Ф ками которой служат векторы 1; (хв), ( ен Х. Пусть мощность множества Х равна т, так что Х'(хг) имеет размерность и Х и (Х = К"). Тогда условие х ы К„,(хг) можно записать в виде 1'(хг)х = О.
Пусть (Х'(хс))* — матрица, транспонированная к Х'(хо), и Ф = Х'(хОНХ'(хг)) в. Квадратная матрица .аа размерности иХгп невырождена. В самом деле, если предположнть, что она вырождена, то найдется ненулевой вектор уж К™ такой, что % ь кОнусы кАсАтельных нАпРАВлений и шАтРы 189 Фу =О. Тогда (у, оЕу) =)(1'(хо))*у//' =)! ~1;(х,) у'~~ = От т. е. ~ ~; (хо) у) = 0 при условии, что не все у' равны нулю.
Последнее ра- Р венство означает, что векторы ~о(хо), (ен1, линейно зависимы в противоречии с предположением. Итак, М'— невырожденная матрица. рассмотрим систему уравнений ф(Л, у) = Яхо+ Лх+(1'(хо))"'у) = О, (ов 1, И.4) где у — неизвестное, а Л вЂ” переменный параметр. Нетрудно посчитать, что ддо(О, О) л =<х Уо(хо))=0 оеБ1, <р(Л) = (У'(хо))оу(Л). Тогда Л '~р(Л) — 0 при Л- 0 и согласно системе (4.4) хо + Лх + 4р(Л) ов М при достаточно малых Л) О, т. е.
х — действительно касательный вектор. Вычислим конус, сопряженный к конусу, задаваемому соотношением (1.3). Поскольку система уравнений <х, ~~(хо)) = О, оы1, эквивалентна системе неравенств (х, г';(хо))))0, (х Ую (хо)) ~ ~0 (еи1 (я1, аа,(о, о) а матрица с элементами —,, о', у = $, .... Ло,совпа-. дао дает с Ф и поэтому невырождена. По доказываемой ниже теореме система (4.4) имеет при достаточно малых Л) 0 решение у(Л), причем Л 'у(Л) - О, если Л- О.
Положим 190 гл. ч. нковходимыв головня зкстгкмума то согласно теореме 1.4.9 конус Км(х,) состоит из элементов вида * = ~~~', Л+Х; ( ) — 2" Л Х1 (х,), 1Е1 1Е1 Л+)О, Л; )О. Обозначая Л1 = Л1+ — Л, получаем Км(хз) = (хе: х* = Д Л111 (х,), Л1 ен К', 1 ел 1). (1.5) 1Е1 Пример 1.2. Пусть множество М задано системой равенств н неравенств: М (х: 1,(х) < О, 11Е 1-, 1;(х) = О, 11ЕХ), где 1- и Х вЂ” конечные множества индексов, а функции 11(х) непрерывно днфференцируемы. Пусть хс 1в М и 1 (ха) = 01в 1: У1(хс)= 0).
Если векторы Х,(хс), 1е1, линейно независимы, то на- правление х, удовлетворяющее соотношениям (х, Х;(хз)) <О, 1'ЯХ (х,), (х, Х; (хр)) = О, 1 ел Х, (1.6) где Ь вЂ” точка отрезка, соединяющего хс ихс+Лх+ф(Л). Из формулы (1.7) следует, что если 1ы1-~1 (ха), то Д(хс) (О, и У,(х,+Лх+ р(Л)) (О является касательным.
Действительно, согласно предыдущему примеру существует такая функция ф(Л) (Л ф(Л)- О, если Л Ф 0), что Х,(х + Лх + р(Л) ) = О, 1 - =Х. С другой стороны, для 11н 1- согласно известной формуле анализа имеем 11(ха+а+ф(Л)) =11(хз)+Л(х+ Л ~ф(Л), Х1(ф1)), ((.7) % 1. КОНУСЫ КАСАТЕЛЬНЫХ НАПРАВЛЕНИИ И ШАТРЫ 191 при достаточно малых Л) О. Если же 1ЫХ (хо), то фор- мула (1.7) показывает, что 11 (х + Лх + ф (Л)) = = Л (х, ро (х,)) + Л (х, 11 ($1) — 11 (х,)) + (ф (Л), у; ($1)). Так как ь1- хо при Л- О, то последние два слагаемых стремятся к нулю, причем быстрее, чем Л. Поэтому в си- лу неравенства (1,6) Н(хо+Лх+ф(Л))(0, оовХ (х), при малых Л ~ О. Итак, при достаточно малых Л~О выполняются со- отношения Х1(хо+ Лх+ ф(Л)) ( О, (ж Х-, Х1(хо+ Лх+ф(Л)) =О, 1ЫХ, т. е.
хо+Лх+ф(Л) овМ. Полученное включение означает, что вектор х — касательное направление к множествуМ. Таким образом, йм(хо) = = (х: (х, Р; (хо)) < О, 1 он Х- (х ), (х, Х; (хо)) = О, 1 ее Х). (1.8) Применяя теорему 1.4.9, нетрудно показать, что й'м(хо) = (хо: х* = Х Ч'(хо) Х ЛИ (хо) Л1~~0 1 ех Х (хо)3- ОИ1 (хв) ои1 (1.9) 2. Теорема о неявных функциях. Как было видно из приведенного выше примера, вычисление касательных направлений невозможно без применения теорем о раз- решимости тех или иных систем нелинейных уравнений. Такого рода теоремы необходимы и в дальнейшем— при построении шатров и получении необходимых усло- вий экстремума.
Теорема 1Л, ХХуетв хыИ", уовИо и у(у, х) — не- прерывная вектор4ункция е компонентами у1(у, х), 1 192 ГЛ. У. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА =1, ..., и, удовлетворяющая следующему условию: су- Ф ществует такая невырожденная пХп-матриуа дх, что )к)и, ) — а'*))~ Ь')*)~5ю6, Замечание. Из условий теоремы легко следует, что: а) у(0, 0) = 0; б) существуют первые частные производные функ ции у(у, х) в точке у = О, х = О, причем у)г(0, 0) = О, в) матрица у — матрица частных производных ев,.(о, о) , (, у =1, ..., и,— невырождена. Если предположить, что функции у)(у, х) непрерывно дифференцируемы В окрестности точки у=О, х=О, то легко убедиться, что из условий а), б) и в) следует выполнение условий теоремы 1.1. Более того, в этом случае она совпадает с обычной теоремой о неявных функциях, из которой следует, что х(у) есть непрерывно дифференцируемая функция у в окрестности начала координат.
Д о к а з а т е л ь с т в о. Из условий теоремы следует, что у(у, х) = ухх+ г(у, х), ) й, ))< ЫГ г)-ТЛ') (1 10) Рассмотрим отображение ) (у, х) = х — Ы у(у, х). где г(Л) =о(Л). Тогда при достаточно малых у система уравнений у(у, х) = 0 разрешима относительно х, причем существует такое решение х(у), что 1)ш г( = О.
() х (У) 1 6~) 1!. КОНУСЫ КАСАТЕЛЬПЫХ НАПРАВЛЕЫИН И ШАТРЫ 193 Используя соотношение (1 10), получаем 1(у, х) = — (у„) ~г(у, х), Пну,.~и !Н ')-'1~ ( 'П.И'+Иу(*). (1.11) Заметим теперь, что без ограничения общности мояшо считать г(Х) неубывающей функцией Х. В самом деле, в случае, если это не так, заменим функцию гЮ на функцию се(Х) = зир г(1) ОВСВЬ и покажем, что сэ(Л) — неубывающая функция и — -ы О. ш (с.) Действительно, так как Х-'г(Х) — О, то для всякого з )О найдется такое б ) О, что 7 (с) — (е, с как только с ( б.
Если теперь Х < б, то ш (Х) 1 - г(С) — = — зир г(1)» зир — (е, Х О»С.Ь О,С,Ь С т. е. Х 'сой) — О. Пусть теперь т(у) = (п1(т: сг(У'~у~с+ т') (т), где с=1(у ) '1 При достаточно малых у выполняется неравенство сгу' (у$О+//у1О = сг(у 2/!у//)~(!!у~, поэтоь(у т(у) (1у1. Кроме того, по определению точной нижней грани для каждого у существует такое т*(у), что т(у) ~ тз(у) ~ т(у) + 1у1О (1.12) сг( с'1у(з + (тв(у))з) < та(у). 13 в.
н. пшеввчвыа иэа гл. ч. нвовходимыв головня экстгвмгма Покажем, что — -е- О, т (у) Иу! когда у- О. По определению т(у) имеем т(у) — Иу!Р < сг(УИуИз+ (т(у) — Иу(Р)з) < ~ сг(ИуИ + 1т(у) — ИуИз1), (И.ИЗ) где использовано то, что йХ) — неубывающая функция и У~з+бз~~+б, х>О, И>О. Далее, так как т(у) ( ИуИ для малых у, то правую часть неравенства (ИЛЗ) можно, оценить следующим образом: сю (ИуИ + 1т(у) — ИуИз1) ( сг(2ИуИ), откуда г(у) — ИуИз ~ сг(2ИуИ), нли ИиИ 2)иИ т. е. т (у) — -э О ИиИ при у - О. Но тогда нз неравенства (1Л2) следует, что т* (г) — -+ О.
НУИ Если теперь И*И ( те (у), то согласно неравенствам (И.ИИ) н (И.12) справедливы неравенства 1~9 *а~ ьтггттг)( ио~~-("ь)гм"ь> Отсюда следует, что непрерывное отображение )(у, х) отображает шар ИхИ ~ те(у) в себя. На основании теоремы Брауэра можно утверждать, что отобраягение г(у, х) имеет неподвижную точку в этом шаре, т. е. существует такая $ ь БОнусы каслткльных нлпглвлкнин и шатРы 195 точка х(у), что х(у) )(у, х(у)), гх(у)П ~ т*(у). Но из определения ~(у, х) следует, что у(у, х(у)) = О. Кроме того, т.
е. гу11-'х(у) — 0 при у- О. Теорема доказана. Покажем, что проверка условий теоремы может быть упрощена. Лемма т.2. Пусть функция )'(х), х ~а К, имеет в точке хг градиент )'(хг) и )1*в+Лв+ф( )) )(*г) с в ' = <., ~'(х.)> ьгв Л для любого вектора х~й" и любой функции ф(Л) ~в К", определенной для малых Л) О и удовлетворяющей условию Л 'ф(Л) — 0 при Л(0. Тогда существует такая функция т(сг), а 'т(х) — 0 при аФО, что !г(х) — У(хо) — <х — хг, г'(хо)>( ( т(Ьх — хг!!).
Д о к а з а т е л ь с т в о. Без ограничения общности можно считать, что хв = О, )(хг) = О, так что 11ш) т( ) = <х, Х'(0)>. ИЛЗ') ьго Допустим, что лемма неверна. Тогда найдется такая последовательность точек х,-~ О, что 1 1( ,) < „, ) (о)> ! !М (1Л4) Векторы ь хь !М имеют единичную норму, и поэтому из них молгно выбрать сходящуюся подпоследовательность. Без ограничения 13* 196 гл. у. неОБхОдимые УслОВия экстгемуМА общности можно предполагать, что х, — х. Положим ) 4 1ХА1~ р(ЛА) Л4(х4 х) (1 15) Можно считать, что Л4+4 (л,. На промеяоутках (Л,ьь Л4) зададим функцию ~рй) при помощи линейной интерполяции. Тогда из соотношений (115) и того, что х,- х, следует, что Л '~р(Л) - О.