Ф.П. Васильев - Методы оптимизации (2002) (1158201), страница 25
Текст из файла (страница 25)
Допустим, что х, — точка локального минимума функции Г"(х) на множестве (21). Можем считать, что в (21) все ограничения в точке х, активны, так как удаление неактивных ограничений из (21) не повлияет на свойство точки х. быть локальным минимумом функции У(х). Тогда точка д„=(х„, и, =0) е 1 будет точкой локального минимума функции У(х) на множестве (22), и для нее будет справедливы приведенные в $3, 4 теоремы для множеств, задаваемых ограничениями типа равенств, Применим их и посмотрим, что из этого получится для исходнои задачи.
Предположим, что градиенты д,'(х„),..., д '(х„) линейно независимы. Тогда градиенты д,.'(д.) = д! ~ "), 4=1,..., гп, также будут линейно независимы, т. е. у,=(х„, 0) — нормальная точка множества (22), и теперь можно будет воспользоваться теоремой 1. Составим функцию Лагранжа: х,(у, Л) = Л Г(х)+ + 2 Л!(д!(х)+(ю!)'), ее производными будут: 1=1 4", (У, Л) = Лоу(х)+ 2 Л!д,'(х), Е„(У, Л) =(2Л,ю',...,2Л и™), !=! Е„(У, Л) = (х,,(д, Л), х,„(У, Л)), х.,„(у! Л) = Лог(х) + 2; Л,д,."(х), !=! О т Согласно теореме 3.1 существует такой набор Л = (Ло... Л ) ~0, Ло > О, Ю„(д„, Л) =О. Отсюда имеем Ю,(у„, Л) = Л Г'(х,)+ 2" Л,д,'(х,) =О, равенст. а=! во 4". (У„Л) = 0 выполняется автоматически и полезной информации не несет.
Так как д, — нормальная точка множества (22), то можем считать Л = 1. Кроме того, у нас д!(х,) =О, г = 1,..., гп, по предположению, и условия дополняющей нежесткости Л!д!(х,) = О, г = 1,..., т, выполняются автоматически. А где же условия Л, > О,..., Л > О? Они, оказывается, при рассматриваемом подходе относятся к необходимым условиям второго порядка. В самом деле, применяя теорему 1, получим: (А". (у„Л)6, Ь) > 0 ЧЬ Е К!(У,) =(Ь =(Ь„Ьо): Ь, Е Е, Ь, ~ Е, (д (д,), 6) =О, 4 =1,..., ) = (Ь =(Ь„Ьз): (д,.'(х,), Ь!) +(О, Ьз) = (д,'(х,), Ь!~ =О, в' = 1,..., гп]. Ото!ода следует, что (ь".
(у„, Л)6!, Ь ) >0 !УЬ! Е К(х)=[6 ЕЕ": (д (х), 6) =О, 1 = 1,..., т), и (х, (У„Л)Ь„Ьз) =2Л!(Ь!)з+...+2Л (Ьз )з > О ЧЬз ЕЕ", что возможно только при Л, > О,..., Л > О. Так как х', (У„Л) =.С,„(х„Л), и, кроме того, рассуждая также, как в замечании 2, кону™с К (х.) без ущерба можем заменить на Ко(х,) = ((Г'(х„), 6) < О, (д,.'(х„), 6) = О, г = 1,..., гп), то имеем (Е.,(х„Л)6, 6) > О ЧЬ Е К,(х,). Конус Кз(х,), вообще говоря, беднее конуса из (15), поэтому полученные на этом пути необходимые условия второго порядка слабее, чем в теореме 3.
Применение указанного приема ко множеству (10) в общем случае также приводит к более слабым необходимым условиям экстремума, чем это получено выше. Тем не менее простота этого приема привлекательна, и от него не стоит совсем отказываться при исследовании задач на экстремум при наличии ограничений типа неравенств. $5. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА 82 Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА Упражнения 1. Применить теоремы 2, 3 к исследованию задач из примеров, приведенных в $3.
2. Исследовать задачи на экстремум, пользуясь правилом множителей Лагранжа и теоремами 2, 3, если: а) т'(х)= (х ) +хг, Х=(х=(х!,хг)ЕЕ~: д(х)=(х ) +(хг) — 2<0); =1" б) л(х)=х, Х =(х=(х, х )СЕг; д!(х)=(х!) +(х ) — 1<0, дг(х)=(х ) +(хг) — 1=О); в) уо(х) = т(х) — (х!')г — (х г)г — (х!з)г, Х =(х ее!з: д!(х) =Ода(х) =О), где функции У(х), д!(х), дг(х) взяты из примера б; в определении функции У(х) считать с = О.
3. Применить правило множителей Лагранжа и теоремы 2, 3 для поиска точек экстремума функций Пю) = х, т'(ю) =хе, 7(х) = ха+ уз на множестве Х = (и= (х, у) е.Е: д(м)=01< 0, г. > О]), где д(ю) = х" + у«или д(ю) = хв — у«, р, д — натуральные числа, Найти все нормальные и анормальные точки множества Х. 4. Пусть Г7о, 17!, .. ч О, — симметричные матрицы размера и х и, пусть К = (х е Ею; (О!х х) <О, » = 1,..., ют; (Ойх х) =О, ! = юг+1,..., в). Доказать, что (й7ох х) >Она конусе К тогда и только тогда, когда точка ю = 0 является решением задачи: 7(~) = (Чо~ ) (23) б.
Пусть (Оох, х) > 0 тх е К (обозначения см. в упраткнении 4). Доказать, что для ть е Е" в БЛ =Л(Ь)=(ло(Ь) >О,..., Л (Ь)>О,Л,(Ь),,..,Л,(Ь)), что ([ ~„'Лй(Ь)Я,)Ь, Ь) >О и =о индекс квадратичной формы (( т Лй(Ь)ьт! б, б) не превышает ]7(0)], где ЦО) — множество лй=о активных ограничений из К в точке ю = О, ]7(0)] — количество элементов множества ЦО). Указание: применить к задаче (23) теорему 3 в точке о =О. 6. Найти точки экстремума функций т"(х) = х, т'(х) = х, т'(х) = (х — 3/2), т'(х) =(х — 3), 7(х) = (х — 1)(ю — 2) на множестве Х = (хе Е: д!(х) =-х <О, дг(х) = х — Зх + 2х ч з г < О), Обратить внимание, чта х = 0 является изолированной точкой множества Х и ее можно считать точкой локального минимума ]максимума] любой функции. 7.
Пусть ю — изолированное решение системы уравнений дт(х) = О, « = 1,..., з; и > в. Доказать, что тогда для тЬ е К(ю) = (Ь е Е»; (дд(ю), Ь) = О, ! = 1,..., з] существует Л = = Л(Ь) =(Л!,..., Л ), что Л (Ь) ф О, Е„(ю, Л(Ь)) = 2; Л,(Ь)д (ю) = 0 (24) ! (т. е. ю — анормальная точка множества (1)), Л (ю) ф И, шах (л,вз(ю, Л)Ь, Ь) лО в л е Л„(ю), 1л]= ! '«Ь е К(ю), где л.(х, Л) = 2, Лйдй(ю), Л(ю) — множество всех Л, удовлетворяющих услог=! иию (24), Л„(ю) — подмножество тек Л е Л(ю), для которых существует сопровождающее подпространство П=П(Л) со свойствами (5)-(7) при замене в (7) С на л., Указание: убедиться, что точка ю будет изолированной точной мно!кества (1) тогда и только тогда, когда ю — точка локального минимума функции 7(х) = -]х — ю), и затем к функции 7(х) на г множестве (1) применить теорему 2.
а. применяя к функции т(х) =-]х-ю]з на множестве (! 0) теорему 3, получить необходимое условие изолированности точки ю множества (! 0). Э 5. Достаточные условия экстремума Продолжим исследование задачи поиска экстремума функции У(х) на множестве Х = (х ш Е™: д (х) < О, г =1,..., пл; д (х) =О, з = тп+ 1,, з)-.
(1) Приведенное в ЭЭ 3, 4 условия первого и второго порядков являются лишь необходимыми условиями экстремума, и поэтому те точки, которые отбира- ются с их помощью, являются лишь подозрительными на экстремум и, как мы видели на примерах, в этих точках не всегда реализуется ожидаемый экстремум. Дзя выяснения характера экстремума в отобранных точках предназначены достаточные условия, в формулировке которых используются производные второго и более высокого порядков для функций 7(х), дв(х), г = 1,..., з. Здесь мы ограничимся достаточными условиями, которые формулируются с помощью второй производной функции Лагранжа.
Теорема 1. Пусть функции У(х), дй(х), г =1,...,з, дважды непоерывно дифференцируемь! в окрестности точки о и Х, пусть конус'т]агранжа Л(о) этой точки непуст и !пах (т- (о, Л)Ь, Ь)) > О ЛтЬ ф О, Ь Е К(о), (у'( ), Ь) < 0 л е л!«1,!л! = ! ™ где (2) шах (Е (о, Л)Ь, Ь) >0 луЬ фО, Ь ЕК(о), (7"'(о), Ь) >О, (3) лел! 1,!л1=! то в точке о реализуется строгий локальный максимум функции Т(х) на множестве (1).
Замечание 1. Так как конус Л(о)Ы(0) замкнут, то множество (Л е Л(о),[Л[ = 1) компактно и максимум в (2) при любом фиксированном Ь достигается хотя бы в одной точке Л = Л(Ь) е Л(о), [Л(Ь)[= 1. Как мы видели в примерах 4.3, 4.8, одной «универсальной» точки Л, в которой реализуется максимум в (2) одновременно для всех Ь Е К(о), (~'(о), Ь) <,О, может не быть. Аналогичное замечание справедливо и для условия (3).
Если в (1) ограничений типа неравенств нет (тп = 0), то в условиях (2), (3) ограничения (7"'(х), Ь) < 0 (> 0) могут быть опущены без ущерба— этот вопрос мы уже обсуждали в замечании 4.2. При тп = г = 0 теорема 1 превращается в теорему 2.2. Доказательство теоремы 1. Если о — изолированная точка множества (1), то, по определению, о — точка строгого локального минимума [максимума[. Поэтому далее предполагается, что о не является изолированной точкой множества (1).
Допустим, что условие (2) выполнено, но точка о не является точкой строгого локального минимума. Тогда найдется последовательность (х.), такая, что ха Фо, дй(х,) <О, г =],...,тп, дй(х„) =О, з =ш+1, „з вг(хй) <.7(о) Ь = 1, 2,..., (х„) — ! о. (4) Точки х можем представить в виде х„=о+ дйг]й где с]й»я ", ! =[х— й = )х" ю]~ й = й— — о)- 0 при Ь -«оо. Так как )г]й ) =1, Ь = 1, 2,..., то, выбирая при необходимости подпоследовательность согласно теореме Больцано — Вейерштрасса, К(о) (ЬЕЕ ° (дй(о),Ь)<0, гНТ(о)Г)(з; 1<,г<«), (д!'(о), Ь) = О, г = тп+ 1,..., в), Цо) — множество индексов активных ограничений точки о.