Ильин_ Позняк - Основы математичемкого анализа. Часть 1 (1111798), страница 115
Текст из файла (страница 115)
2 1, уз -(- уз 1 ( уз -(- уе , (уд -(- уз 2 ) (, 2 ' 2 у~ — т уе — т у~ — х ув — т) 2 2 ' 2 2 =( 1 = -[(13( — х. у( — х) + 2(у( — х, у — х) + (ув — х, ув — х)]. (14.92) 4 Ъбедив(ся тг(перз в справед.пивости строгого неравенства ((„— к»,— и(( ( Др, —;», —:::(»(у, —:,»1 — (((. (~49»( Для этого воспользуемся тем, что для любых векторов а и Ь пространства ял», не коллинеарных друг другу (т. е. таких, что а ф.
ЛЬ ни для одного вещественного Л), справедливо строгое неравенство Коши — Буняковского 2) 1(,»(( ~ »(»й( (», ь) Это означает., что для доказательства неравенства (14.93) нам достаточно убедиться в том. что векторы у( — (г, и уя — х не колли- неарны, т. ( . убедиться в том, 1то ни для одного всщественного Л не может быть справедливо равенство уз — х = Л(ув — х). (14.94) Если бы равенство (14.94) было справедливо для такого Л, которого )Л) ф 1, то было бы п(.возможно равен(тво АУ( ) =Е(У2 )- Справедливость равенства (14.94) для Л = +1 противоречила бы тому, что точки у( и ув являются различными. Наконец, справедливость равенства (14.94) для Л = -1 ознауз -(- уе чала оы, что У 1 = х а этот случай мы исклгочилп.
2 Итак, равенство (14.94) не справедливо ни для одного вещественного Л, а потому доказат(льство неравенства (14.93) завер- ПП'ИО. ) С»ь, например. з 1 гл. 4 книги В.Л. Ильина и Э.11 11озняка зьг)инейгная алгебра». Из 1-во «11аука», 1978. ) В самом деле, при а ф ЛЬ вектор (а — ЛЬ) не яв.зяется нулевым. Поэтому квадратный трехчлен (а — ЛЬ, а — ЛЪ) = (а, а) — 2Л(а,Ъ) т Л'(Ь, Ъ) строго положителен и его днскриминанг 4((а, Ь)~ — (а, а) (Ь, Ь)) строго отрнназелен.
848 Г:1. )! эь нкнии ннскольких нинимннных Сопоставляя равенство (14.92) с неравенством (14,93), получим, что 2/ У)+У ) р~х,' ' < 2 1 < - [(у! — х, у! — (г) + 2 (у! — (г. у! — х) (92 — (г, уг — ( ) + ~Ь вЂ”:: » -х)1 =; [~Ъ вЂ”:, — )'-Ч а-.:,тГ ..)] = — — [Р((х, У)) + Р(х У2)] Р (х, У() Р (.( У2) Т(гм самым доказательство неравенства (14.91) завершено. 11о это н(Й)авенство Означает, (то и множ('.ства (е наш '(Всь Гочка У! +У> — — '-, боле(' близкая к (г чем точки у~ и уг, а это противоре шт тому (то каждая и ! точек у! и уя является проекцией точки х на множество ()>, т. е, 5(вл5((е!'ся тОчнОЙ нижней гранью расст05(ния р(х.у) для всевозможных у, принадлежащих СЭ. Подученное противоречие показывает, что предположе>п(е о том, что су(пествушт две различные проекции у! и уг точки х на множ(.ство О, является Ошнбо Еным.
ДОКЕ)()е)тельство леммы 1 ПОле(остью завершено. Перейд()м теперь к Опр('.делен!по вьшуклОЙ функции, Определение х. Ф>унк(1ия «(х), задоннал. на выпуклом. Л(ноэн)еспше О пространшнва Г"), на:)ь(воетпся в ы п у кл, о и в и, и,! али просп)о в ы и у к л о и на этом мнооюесп)ве, если для лн>- бых двух то (ек х! и:г> мноэ(сество, Ц и для любого веи1ес>поенного числа 1, из сегмента.
0 < 1 < 1 справедливо неравенство «[((52+ 1(х2 — (г!)] < «(х!) + 1[«(х2) — «(х()]. (14 95) Определение Я. Фу)гкцая «(з!), заданная, на вь(>)уклом мнооюестве С~ просту>анства Е"", называется с т, р о г о в ыи у к л о и на этом мноэнгестюе, если, для ллобых д(ух точек х! и (гг мнаоюесп)во.
Сз и для л>обого веи1ественного числа 1 и! инп(ервала 0 < у < 1 справед>)иво строгое неравенство «[х2+ Х(х2 — х,)] < «(х,) +1[«(х2) — «(х!)]. (14.99) Ясно, что всякая строго выпуклая на л(но>кестве (() функция «(х) является выпуклой па этом множестве.
10гко (' стае(овить достато п(00 условие выпуклосте! (соотгетственно строгой выпуклости) дважды дифференцнруемой на выпуклом множестве Сг функции «(х). 1>с>оду в дальней(иел(, мы будем предполагать, чело,ммо;ясеств(о Ц имеет хотя бь! одну внутреншо>о точи!. 17 гглдикнтный мктод ноискл нкствкмумл Лемма х.
Пусть функция т"(х) задана и два раэв, дифференцируема на выпуклом многаггстве сэ. Тогда длл того, чтобы. эта функция являлась выпуклой (стрг)го въгауклой) нэ, лзногасестве Я. догти)почно, чтобы вторг)й дифу)гзренциглл. 112 ' этой фуНКции ВО ВСЕХ )ПОЧКаХ С) ЛВЛЛЛСЛ КеагиПГ)ЛОЭЮитгЕЛЬНО ОПувделеннг)й (строго полоэ)сительно определенной) квадратичной формой, Д о к а з а т с л ь с т в о. Пусть х) и:с) -. л)обыс две фнкснрованныс точки множества б,). Рассмотрим на сегменте 0 <1< 1 следуюшую функпию одной независимой переменной 1; Р(4) = ф[х, + 4(хг — х))] — ('(гс)) — 2[~(:с2) — ('(хз)].
(14.97) Н~~~~~~~. что второй лиг[)г[)еренниал 14 7' 1])ункни)1 1(гс) =-,Г (Гл)Л)2,..., Хгп) 7П Нс)ВВИСИМЫХ П11Н)ЫЕННЫХ Х),.'12,...,Хпг В даННОй ТОЧКЕ )à — (ГХ), 11'2, ., ., Гегп) р )Вг.и ) т гп 112У(э)) = ~ ~'~ ) (гс) .,Ьх, Ьхэ (14.98) 1=~ г-! Дифференцируя функпшо (14.97) два раза по 1 по правилу дифференцирования сложной функции, получим т т ГП(1) = ~ ~) [Г) + Е(ГС2 — )С))] [Х,, — Х,) ~Хг — ХЬ)~г ,=1 В-1 (14.99) 2 2 2 где (г),хг,...,)гт) и (х),хг,...,хгп) .
координаты точек х) и Хг СОГ)ТВСТСТВЕННО. Сонг)ставляя соотношения (14.98) и (14.99), мы убедимся в справгздливости раВенстВВ Г ()) = д ф[х)+ 1(х2 — э:1)]. (14.100) гле в выражении для 11 1 приран)гния Ьхц взяты равными 2 г'1 г')' Дальнейшие рассуждения, ради определенное)и, проведем для сл) чая, .когда второй дифг[)1'1кенпиач д 7 ВО Всех зг)'1ках являг'тся квазиположительно опрсдслсняой квадратичной формой. В этом случае для всех 1 из сегмента 0 < 4 < 1 правая (а, стало быть. и левая) часть (14.100) неотрицательпа, т. е. лля всех 1 из сегмента 0 < 1 < 1 Гп(4) > О. (14.101) ') См.
и. 2 г 5 гл. 14. эх нкции нкскольких нкгкмкнных Г:1. г! В силу опредешння 2 н соотношения (14.97) нйм достато тно доказать, по для всех 1 из сегмента 0 < 1 < 1 сгтравсэдливо неравенство Г(й) < О. (14. 102) ,«пя доказательства неравенства (14.102) используем сооттюшенне (14.10!) и легко проверяемые равенства Г(0) = О, Г(1) = О. (14.103) Прсдпоги)жиы, что внутри сРГЯ!Р11!а 0 («г «(1 су!ЦРствуР г хОтя бы одна точка 1, в которой Г(1) > О. Тогда функция Г(4) достиГаслт свос',ГО ме1кснмйлье10ГО нй с)с)гмгсгнтс) 0 «( т «(1 значРния в некоторой внутренней точке 10 .этого сегмента, причем Г(йо) > О. В этой точке ко функция Г(4) имеет локальный максимум, а потому Г'(1о) = О.
Но пз неравенства (14.101) вытекает, что проглзводная Г'(1) не убывает нй всеъл сегменте 0 < 1 < 1, й потому и на сегменте КО < ~ < 1. Отсюда н из усчовия Г'(1о) =0 след с)т, что ~)оиглводггегя Г (1) неотригтательнй Гсгодг пй сс".г-мсгнтс'. 1О (1 < 1, й поэтому функция Г(1) не убывает на этом сегменте. Это приводит нас к неравенству Г(1) > Г()0) > О протнворечаппгму второму соотношеншо (14.103). Полученное противоретие доказывает, что предположение о том, что на сегменте 0 ( Х ( 1 существует хотя бы одна точка 1, в которой Г(1) > О, является ошибо шым, т. е.
доказывает справедливость во!оду на сегмс нтс" 0 < 1 < 1 неравенства (14.102). '1ем самым первая часть леммы (о выпуклости 1'(х) при условии, тто 11 1 является квазиполо)кительно определенной квадрати'тнОЙ с))ОВМОЙ) дОказае1а. Вторая часть леммы (о строгой выпуклости 1(х) ггргг условии, что 11 7 является строго положительно определеншпг квад1Я1тп'1етОЙ 11)ора!ОЙ) 1!Оказывается апти10Гично. ИсхОдя из нсрйвонства (14,101), справедливого на этот раз со знаком >, и из равенств (14.103) и предположив, что внутри сегмента 0 < 1 < 1 существует хотя бы однй тм)чка Й в которой Г(Х) > О, мы придем к выводу, что Г(1) имеет внутри сегмента 0 < 1 < 1 точку локального максимума ~Ш причем Г(йв) ) О.
110 тогда, ггоскольк) Г'(1о) = О, из (14.101) получим, что Г'(1) > 0 ил!году на гишуинтервале 1й < Е < 1, а это означает, что Г(1) > Г(11)) > О. .Е1ьг снОва НОлучаем ггротиворсгчисэ со в10рым сООтнопптниеът (14.103). которое доказывает. что Г(~) < 0 всюду на интервале 0 < 1 < 1, т, е. доказывает строгую выпуклость 7"(х) нй множестве ЕЗ. 1 1'ЛДИЕН'!'НЫЙ Ь!ЕТОД НОИОКЛ НКОТ1'ЕМУМЛ 551 21еыэн) 2 полностыо доказана. доказанная лемма естественно наводит на мысль о рассмотрении следующего еще более узкого класса выпуклых па выи ~клоь! МножестВс. Сд и дВВ рагз, дис))фц)епцируеыых на этОм множестве функций. Определение 4.
Двп раап дслфферслтлцируемпя на выпуклом мноэняестве Сг ф12)лкция. 2 (х) на.,)ьлваетася, с и л, ь н о в и и у кл о тл на, этполл мнонсеспглге, если гуцестсгун)тп тслкие. две положиагсльныг. нг)стоянньле Л! и !12, что втпорот дифференциал 112у этой функции, опредсляемьш, гоотношением (14.98). во всех точках х мноэа)еспгва сг) удовлст)к)рлвт непавенс.'тсласм )ц . (л, )2 < 1121 < )с2 , (л)) )2 (14.104) !В этих неравенствах через л))х обозна !ен вектор с координатами (Ьэ)).ллх2....,Ьхтп). а символ (Ьх) ооозпачает скалЯРпыи квадрат этого вектора,.) Из левого неравенства 114.104) сразу же вытекает, что второй дифференциал сильно выпуклой функции представляет собой строго положительно определенную во всех то !ках множества Ц фупкци!о.
а потому Св силу леммы 2) сильно выпуклал на множегтпве. Сд фу)ап!ия заведомо являетгл, строго выпуклой на этом множеспше.. Вместе с тем класс сильно выпуклых функций достаточно широк и Важен В 1ц)икладных задачах. и мы ОГрпничнмс)! этим классом при изложении теории градиентного метода поиска минимума.
На шс)м с ВыяснР!ш)1 ВОпрОса О с'ущРстВОва!п1и и О 1!динстеен" ности минимума. 2. Существование минимума у сильно выпуклой функции и единственность минимума у строго выпуклой функции. Пусть функция у(х) определена на вьшуклом лгножестве с,г. БУдем говоРить, что эта фУпкЦиЯ имеет в точке ха множества, С,г л о к а л ь н ы й м и н и м у м, если существует такая Л-окрестность этой точки ха, что:)пачсппс 1(ха) является наимш1ьшим среди 3!Эпшс)ниы 1(э)) этой с))5 пкции ВО Всех точках пересечения о-окрестности хв и множества О. При таком Определении пОнятиР локальноГО ъпнпгы1ума Вкспошет в себя н )оч)сн крас!Восо минимума ф н)спин ф!х) на ! 1Кн нице множес:тва бгг.