Ф.П. Васильев - Методы оптимизации (2002) (1158201), страница 23
Текст из файла (страница 23)
(О, Л(Ь))Ь, Ь) >О. Из Хе лдм, )Г/ = « этого примера видно, что в условии (9) взятие максимума по множеству (Л а А.(0) /Л / = 1) существенно. П р и м е р 4. Пусть 7'(х) — произвольная дважды непрерывно дифференцируемая на Е4 функция, 7'(0) ~ О, пусть Х = (х Е Е'. д(х) = =(х')'+(х')' — (х')' — (х4)'=О). Функция Лагранжа имеет внд;,С(х«Л)= $4. НЕОБХОДИМЪ|Е УСЛОВИЯ ЭКСТРЕМУМА 74 Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА = Лог(х)+ Л,д(х), а ее производные: х' 1 0 0 0 0 1 0 0 С*(х Л) Л«7 (х)+2Л> з > С (х Л) Ло> (х)+2Л> О 0 — ! Π— х' 0 0 0 — 1 Равенство С (О, Л) = Л»7'(0) + Лд'(0) = Ло,~'(О) = 0 выполняется лишь при Ло =0 и любых Л,.
Следовательно, точка о =0 удовлетворяет необходимому условию экстремума первого порядка, ее конус Лагранжа Л(0) = (Л = =(Ло, Л,): Ло =О, г'Л> ФО). Конусы 1сег С'(0), К(0) здесь совпадают со всем пространством Е'. Ясно также, что г> = 0 — анормальная точка множества Х.
Число отрицательных собственных чисел у матрицы 1 0 0 О 0 1 0 0 с-(О л)=2Л о о -! о 0 0 0 — 1 при любых Л, ~0 равно 2. Однако по теореме 2 индекс квадратичной формы (С„(0, Л)6, 6) не должен быть выше о = 1 для о'Л е Л (0). Это означает, что конус Л.(0) пуст. Условие (8) нарушено. По теореме 2 и замечанию 1 точка г> = 0 не может быть точкои экстремума функции 7(х) на мнохсестве Х. П р и м е р 5. Пусть 7(х) — произвольная дважды непрерывная диф~>еренцируемая на Е' функция, 7'(0) фо, пусть Х =(х е Ез: д(х) ='(х') + +(х')' — (х')г =О).
Тогда функция Лагранжа: .С(х, Л) = Л 7(х)+ Л,д(х), ее производные: /х>Л /1 О 0! С,(х, Л)=лоУ'(х)+2Л> ~ хг ~, С (х, Л)='Л«У»(х)+2Л> >~ 0 1 0 3 ™ 0 Π— 1 Нетрудно видеть, что точка г> = 0 подозрительна на экстремум в силу теоремы 3.1 и ее конус Лагранжа Л(О) = (Л =(Ло, Л„): Л =О,УЛ> фо), конусы (сег С>(0) = К(0) = Е'. Кроме того, в = 0 — анормальная точка множества Х. П именим к ней теорему 2. Заметим, что С (О, Л) = >'! 0,0 =2Л, ~0 1 0 при всех Л еЛ(0). Отсюда видно, что индекс квадра- 0 0 — 1 тичной формы (С (О, Л)6, 6) равен 1 при Л, > 0 и равен 2 при Л, < О. По теореме 2 индекс этой формы не может превышать о = 1. Это означает, что при Л, <0 точка Л е Л(0) не может принадлежать конусу Л.(0).
Рассмотрим случай Л > О. Тогда, оказывается, точка Л = (О, Л) е Л.(0). В самом деле, для каждой точки Л =(Л =О, Л, > О) ЕЛ(0) можем указать сопровождающее подпространство П = (Ь =(Ь', Ьг, Ьз), Ьз =О, оЬ>, Ь'); свойства (5) — (7) здесь легко проверяются: с(|ш П = 2(= 㻠— з), П с 1сег С'(0) = Е', (С„,(0, Л)6, Ь) = 2Л,((Ь')'+ (Ь')') > ОУЬ е П, Это и значит, что Л.(0) = = (Л = (О, Л): Л > О). Далее воспользуемся утверждением (9) теоремы 2. Множество (Л: Л е Л,(0), /Л! = 1) здесь состоит из единственной точки Л =(Л =О, Л, =1) и для нее неравенство (С (О, Л)Ь, 6) =(Ь')'+(Ьг)'— — (Ьз)~ ) 0 не может выполняться при всех Ь Е К(0) = Е', т. е. нарушено условие (9).
В силу теоремы 2 и замечания 1 точка г> =0 не может быть точкой экстремума рассматриваемой функции 7"(х) на Х. П р и м е р 6. Пусть >" (х) = (с, х) + (Я,х, х), где х Е Е>о, с Е Е'о, с ф О, Яо — произвольная матрица размегва 10 х 10. Пусть Х = )х е Е'о: д,(х) = (х>~2 (хг)г | (хз)г | (х>) +(х ) =О, д (х)= (хо)г (х )г | (хз)г | (хо)г +(х о) =О).
Так как д,'(0) = О, д,'(0) =О, то г> =0 — анормальная точка множества Х, и, следовательно, она подозрительна на экстремум. Конус,Лагранжа этой точки равен Л(0)=(Л =(Ло, Л„лф Л,=О, Чл„>УЛ„(л„лг)Ф фо), т. к. 7"'(О) = с фо; 1сег С'(0) = К(0) = Е о. Найдем конус Арутюнова Л,(0), Для >>Л Е Л(0~ квадратичная форма (С, (О, Л)6, Ь) = 2Л ( — (Ь')»в (Ьг)г+(Ьз)г+(64) | (Ьз)г)+2Л ( (Ьо)г (6«>)г+(Ьв)г+(у о)~+(р >о)г) Если Л, <0 или Л, < О, то индекс этой формы > 3, а для Л е Л„(0) этот индекс не может превышать 2.
Это значит, что точки Л = (Ло = О, Л, < О, Л, < 0) не могут принадлежать Л.(0). Для точек Л =(Ло =О, Л, > О, Л, > 0) индекс формы (С (О, Л)6, 6) ) 4, поэтому такие точки также не могут принадлежать конусу Л (0). Следовательно, лишь лучи Л, =(Л =(Ло=о, Л, >О, Л, =0)) и Л, = (Л =(Л =О, Л, = О, Л, >0)) могут принадлежать Л.(0). В самом деле, для Л, можем взять сопровождающее подпространство П, =(Ь е Е",. Ь' = Ь'=О), для Л вЂ” П =(6 е Е'о: Ьо= Ь'=0), размерность которых равна 8. Так как здесь !сег сг'(0) = Е'о, то ясно, что все условия (5) — (7) выполняются. Таким образом, конус Л,(0) представляет собой объединение двух лучей Л, и Л,.
Проверим условие (9). Множество (Л е Л„(0); ~Л ) =1) состоит из двух точек Л, =(Л =О, Л,=1, Л,=о)ЕЛ>, Л,=(Ло=о> Л,=О, Л',=1)ЕЛг. Возьмем Ь = Ь е Е' = К(0) с координатами Ь' = 1, Ь' = 1, все остальные координаты Ь' = О. Тогда (.С„„(0, Л,.')Ь, Ь ) = — 2, г = 1, 2, и в точке Ь условие (9) нарушается.
В силу теоремы 2 и замечания 1 заключаем, что в не может быть точкой экстремума функции 7(х) на множестве Х. Следующий пример показывает, что теорема 2 не «всесильна» и не всегда «распознает» точки, которые подозрительны на экстремум в силу теоремы 3.1, но на самом деле в них нет экстремума. П р и и е р 7.
Рассмотрим функцию 7" (х) = — (х')' — (х')'+(х')' на множестве Х =(х =(х', х', х') еЕ'. д(х) = х'х'=О). Нетрудно проверить, что о =0 — анормальная точка этого множества. Следовательно, она подозрительна на экстремум. Ее конус Лагранжа Л(0) = (Л = (Л, Л,): Л > О, 'ол> фо), конусы 1сег С(0) = К(0) = Е'. Опишем конус Арутюнова Л.(0). Согласно теореме 2 индекс квадратичной формы (С.,(0, Л)6, 6) = 2Л ( — (Ь')'— — (Ьг)'+ (Ьз)') + 2Л,Ь'Ьг не может превышать з = 1 д>ся всех Л е Л,(0).
Матрица / 2Ло Л> 0 с.,(о,л)=~ л, -2л, о ) 0 0 2Ло имеет тРи собственных числа Г> = — 2Ло+ Л,, Тг = — 2Ло — Л, Тз — — 2Л, > О. Если Л е Л(0) и /Л>! < 2Ло, то Т> <О, .~г < О, т. е. индекс квадратичной формы (С„„(0, Л)Ь, 6) равен 2, и поэтому такие Л не могут принадлежать конусу Л„(0). Если Л е Л(0) и /Л>! > 2Л ) О, то только одно из собственных чисел Т> или .уг будет отрицательным, поэтому индекс формы (С, (О, Л)6, Ь) будет равен 1.
В качестве сопровождающего подпространства П для всех Л ф О, |Л>) ) 2Л > 0 можно взять П = (Ь е Е'. Ь' = Ь' = О, с>6~). Тогда Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА 4 4. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА (18) ь ,.ъ ъъ (С (О, Л)Ь, Ь) = 2Ль(Ьь)ъ > 0 и, очевидно, все УсловиЯ (5) — (7) выполнены, Следовательно, конус Л (0) = (Л = (Л, Л,): Л ~ О, /Л, / > 2Ль > О). Проверим условие (9). Возьмем ЧЬ = (Ь', Ьъ, Ь') е К(0) = Еъ и определим Л = Л(Ь) так: Ль=О, Л,=1 пРи Ь Ь'>Он Л,= — 1 пРн Ь Ьъ<О.Ясно, что Л(Ь)Е ЕЛ„(0) н /Л(Ь)! =1, Тогда шах (С (О, Л)Ь, Ь) > (С..(0, Л(Ь))Ь, Ь) = гъл.<оь ~л~-1 = 2!Л, ЦЬ' Ьъ/ > 0 ЧЬ е Е'.
Как видим, точка е = 0 удовлетворяет всем необходимым условиям второго порядка теоремы 2. Но о =О, очевидно, не является точкой экстремума функции Х(х) на Х. Однако теорема 2 не сумела ее забраковать. 2. Сформулируем необходимое условие экстремума второго порядка для множеств более общего вида: Х=(х ЕЕ": д(х) <О,..., д (х) <О,д„,,(х)=О,,д (х)=0). (10) Пусть е — точка локального минимума функции Х(х) на множестве (10), пусть Л(е) — конус Лагранжа этой точки, Напомним, что конус Лагранжа точки в состоит из всех тех точек Л=(Л„Л„..., Л,)~0, Л >О, Л, >О,..., Л„> О, для которых пара (е, Л) является решением системы (3,13), Пусть 1(о) = (ъ': 1 < ъ' < пъ„д;(в) = 0) 0 (ъ: ъп + 1 < ъ < г) — множество номеров активных ограничений точки е, /1(о)) — количество элементов множества Х(е).
Конусом Арутюнова точки е множества (10) будем называть подмножество Л.(еХ таких точек Л е Л(е), для которых существует подпространство П = П(Л) пространства Е", обладающее следующими свойствами: 81ш П(Л) > шах(п — /1(е)!; 0); (11) П(Л )С 'кег С'(о)=(Ь Е Е"; < д,.'(е), Ь > =О, ъ ЕХ(в)), С=(д,, ъ ЕХ(о)); (12) (л, (о, Л)Ь, Ь) > 0 ЧЬ Е П(Л). (13) Как и в определении 3, подпространство П(Л) со свойствами (11)-(13) будем называть сопровождающим подпространством точки Л е Л.(е). Рассуждая также, как в случае множества (1), нетрудно убедиться, что и здесь Л,(е) действительно является конусом. Заметим, что при (1(е)( > и каждая точка Л Е Л(е) обладает нулевым сопровождающим подпространством П(Л ) = (О).
Поэтому конус Л.(е) = Л(е) при /1(е)/ > и. Т е о р е м а 3 (Арутюнов [44)), Пусть о — то1ъка локального минимума функции Х(х) на множестве (10), пусть функции Х(х), д,(х),..., д,(х) дважды непрерывно диффгргнциругмы в некоторой окрестности точки е. Тогда Л,(в) ф О, (14) шах (С„.(в, Л)Ь, Ь) > 0 ЧЬ Е К(е), (Х'(е), Ь) <О, (15) лълхел И/ 1 гдг К(в) = (Ь Е Е": (д,.'(е), Ь) < О, ъ Е 1(е) П (ъ: 1 ( ъ ( ъп), (д,!(о), Ь) = О, ъ = гп+ 1,..., г) (16) — конус критических направлений множества (10) в точке е. Доказательство этой теоремы проводится с помощью метода штрафных функций в $5.18. Сделаем несколько замечаний. Замечание 2.
Прежде всего убедимся, что при гп =0 теорема 3 превращается в теорему 2.,1(ля этого покажем, что неравенство (Х'(е), Ь) < 0 из (15) в случае пъ =0 может быть опущено без потерь. В самом деле, очевидно, для любого вектора Ь Е Е" выполняется одно из двух неравенств: (Х'(е), Ь) < 0 или (Х'(е), Ь) > О, и справедливо равенство (л. (в, Л)Ь, Ь) = (С,(о, Л)( — Ь), ( — Ь)).
Кроме того из (Х'(е), Ь) < 0 следует, что (Х'(е), ( — Ь)~ > О. Отсюда ясно, что если неравенство (9) выполняется для ЧЬ ~ К(в), (Х'(о), Ь) < О, то оно выполняется и для ЧЬ Е К(е), ~'(>', ) Х'(в), Ь) > О. Это значит, что при ъп = 0 в условии (15) требование Х'(о), Ь) < 0 может быть опущено, а тогда теорема 3 превращается в теорему 2. 3 а м е ч а н и е 3. Если о — точка локального максимума функции Х(х) на множестве (10), то утверждения (14), (15) сохраняют силу, нужно лишь конус Л.(е) заменить на Л„(о), а в условии (15) неравенство (Х'(о), Ь) < 0 заменить на (Х'(е), Ь) > О. Конус Арутюнова Л,(о) для точки е локального максимума функции Х(х) на множестве (10) определяется также, как конус Л„(е), нужно лишь вместо Л(о) взять конус Л (е) (см. замечание 3.2).