Ф.П. Васильев - Методы оптимизации (2002) (1158201), страница 21
Текст из файла (страница 21)
О п р е д е л е н и е 1. Точка р называется нормальной, точкой множества (1), если и е Х н векторы д!'(р),..., д,'(р) линейно независимы. Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА Требование нормальности точки в литературе часто называют условием Люстерника. Посмотрим, как устроен конус Лагранжа Л(е) в нормальной точке локального минимума, Перепишем уравнение С„(е, Л) = 0 из системы (3.6) в виде: (2) Л, д,'(е) +... + Л,д,'(и) = — ЛоУ'(е).
По определению точка Л = (Л,..., Л,) принадлежит конусу Л(е) тогда и только тогда, когда Л является решением уравнения (2) и Л ~0, Ло >О. При каждом фиксированном Л (2) представляет собой систему линейных алгебраических уравнений относительно неизвестных Л =(Л„..., Л,) с матрицей (д,'(е),..., д,'(е)), ранг которой в нормальной точке е равен г, причем г < и. Отсюда следует [192; 353), что при каждом Ло система (2) имеет единственное решение Л, и оно представимо в виде Л = Л р, где р — решение этой системы при Ло = 1.
Это значит, что конус Лагранжа в нормальной точке е есть открытый луч Л(е) = (Л е Е'" '. Л = Ло(1, р), Ло > 0) с направляющим вектором (1, р). Теорема 1. Пусть функции У(х),д,(х),...,д,(х) дважды непрерывно дифференцируемы в некоторой окрестности точки е локального минимума функции г(х) на множестве (1), пусть е — нормальная точка этого множества, Л(е) — конус Лагранжа точки е. Тогда для любой точки Л е Л(е) (С„(е, Л)Ь, Ь) > 0 чЬЕК(е)=(Ь Е Е": (д,'(е), Ь)=0, 4=1,..., г).
(3) Конус К(е), введенный в (3), называют конусом критических направлений множества (1) в точке е. Этот конус непуст, так как он всегда содержит точку Ь = О. В нормальной точке е при г = и конус К(е) состоит из единственной точки Ь =О, а при 0 < г < и он является подпространством размерности и — г. Так как функция С(х, Л ) однородна по переменной Л, т. е. С(х, аЛ)=слС(х, Л) еа, аЛ(е) — луче направляющим вектором (1, р), то условие (3) достаточно проверить при Л = (1, р,).
Для нормальной точки локального максимума теорема 1 сохраняется, нужно лишь в ее формулировке конус Л(е) заменить на конус Л (е) =(Л е Е'+': Л = Ло(1, р), Ли <0). Для иллюстрации теоремы 1 приведем пример. Пример 1. Пусть Т(х) =(х')о — (хо1', Х =(х =(х', х') е Е'. д(х)= х' =,0). Тогда фУнкциЯ ЛагРанжа С(х Л) = Ло((х )о — (х ) )+ Лх', — 12Ло 0 ее производные С„(х, Л)=(2Л х +˄— 2Л х ), С (х, Л)= [ о,> квадратичная форма (С„.(х, Л)Ь, Ь) = 2Ло((Ь')' — (Ь') ). Нетрудно видеть, что точка е = (О, 0) нормальна и подозрительна на локальный минимум, ее конус Лагранжа Л(0) = (Л = Л,(1, 0), Ло > 0), Применим к ней теорему 1. Здесь конус критических направлений К(0) = (Ь = (Ь', Ь'): Ь' = 0). Тогда (С (О, Л)Ь, Ь) = — 2Ло(Ь')' <0 о'Ь Е К(0), Ь ~0, Условие (3) не выполняется. Следовательно, точка е = 0 не может быть точкой локального минимума функции г" (х) на множестве Х.
Нетрудно убедиться, что точка е = 0 с конусом Л (0) = (Л = Ло(1, 0), Ло < О) также удовлетворяет условию (3) и претендует на локальнйй максимум. В этом простом примере ясно, что е = 0 — точка глобального максимума г" (х) на Х. 69 $4. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА :'3'::,,';:: Теперь откажемся от априорного требования нормальности точки, подозрительной на экстремум. О п р е д е л е н н е 2.
Точка е называется анормальной точкой мно- в: .::. жества (1), если е е Х и векторы д,'(е),..., д,'(е) линейно зависимы, т; е, существуют числа Л„ ..., Л„ такие, что Л,д,'(е)+...+Л„д,'(е)=0, Л =(Л„...,Л,)фО. (4) Сразу отметим следу>ощее интересное свойство анормальных точек. Условие (4) можно переписать в равносильном виде: 0 ~'(е)+ Л,д,'(е) + .. ,, +Л,д,'(е)=0, Л =(Ло=О, Л)фО, длялюбойдифференцируемой функции Т(х). Это значит, что набор Л = (О, Л) Е Л(е), т. е. конус Л(е) фИ. Следовательно, всякая анормальная точка е множества (1), по сути выражающая лишь некоторое специфическое свойство (4) этого множества, автоматически удовлетворяет необходимым условиям экстремума первого порядка н оказывается подозрительной на экстремум для любой дифференцируемой функции у(х), Посмотрим, как устроен конус Лагранжа в анормальной точке локального минимума.
Оказывается, в такой точке е конус Л(и) ы (О) содержит прямую. В самом деле, если набор Л =(Л„..., Л,) удовлетворяет условию (4), то набор ( — Л) также удовлетворяет ему. Тогда точки Л = (Л =О, Л) фО и ( — Ло) = (Ло —— О, -Л) ф 0 являются решением системы (2) при Ло = 0 и, следовательно, Л, ( — Л,) Е Л(е). Так как Л(е) конус, то прямая Л(4) = т Л, :;:- л'„'~::; — со < ь' < +со, с направляющим вектором Ло ~ О, принадлежит Л(е) О (О).
Верно и обратное: если конус Л(е) О (О) содержит некоторую прямую ':;$ Л(г) = гр, — оо < г <+со, й=(р,..., р,) фО, то е — анормальная точка множества (1). Действительно, тогда Л(1) = й и Л( — 1) = — >Т принадлежат "г! ";,,:::-.: Л(е), Поскольку у всех точек Л конуса Л(е) координата Л, > О, то необходимо р > О, — р > О, так что р =О, Л = (р„..., р,) ФО. Это значит, что условия С,(е, р) = О, е фО из системы (3.6) превращаются в условие (4), Следовательно, е — анормальная точка множества (1). Из приведенных рассуждений следует, что точка е локального минимума ,,а,'', анормальна тогда и только тогда, когда конус Л(е) с> (0) неострый. Аналогично доказывается, что точка е локального максимума будет анормальной Э-';;, тогда и только тогда, когда конус Л (е) О (0) Неострый Заметим, что наличие анормальных точек у множества (1) довольно частое явление.
Если г > п, то всякая точка множества (1) анормальна и, следовательно, подозрительна на экстремум для любой дифференцируемой функции У(х). Типичным примером задачи, приводящей к необходимости исследования на экстремум анормальных точек, является следующая: при каких условиях на симметРичные матРицы оео,..., йг, квадРатичнаЯ фоРма (ь',> х, х) > 0 >Ух е Е К = (х Е Е": < ь) х, х >=0[< 0], 4=1,..., г) (см.
ниже упражнения4, „>$' 5). Эта задача имеет различные приложения и показывает, что проблема изучения анормальных точек экстремума не является надуманной. Дпя дальнейшего анализа на экстремум анормальных точек нужны необходимые условия второго порядка. Однако теоремой 1 мы здесь пользоваться не можем, так как она доказана в предположении, что е — нормальная точка. Более того, нетрудно привести примеры, показывающие, что для анормальных точек теорема 1 просто неверна $4. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА 71 ?О Гл, 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА йш П(Л) > шах(п — в; 0), где 41ш П(Л) — размерность П(Л); (5) >' д, 'Л П(Л) с кег С'(о)=(ЬЕЕ": (д,'(о), Ь)=0, 4=1,..., в), С = ...; (6) дв (7) (С (е, Л)Ь, Ь) )~ 0 >УЬ Е П(Л) П р и м е р 2, Рассмотрим задачу: > (х~ = — (х')' — (х'~ + (х'~ — ' 1п( хЕХ=(х=(х',х~,х)ЕЕ~; д~(х)=х'х =О,д>(х)=(х) — (х) =О(. Нетрудно видеть, что множество Х состоит из точек х =(0,0, х') с Ух .
Отсюда ясно, что е = (0,0, 0) =0 — точка глобального минимума функции ?(х) на Х. Так как д,'(О) =О, д,'(0) =О, то условия (4) выполняются при всех Л = (Л„Л,) ~ О. Следовательно, о = 0 — анормальная точка множества Х. Кроме того, ?'(0) = О, и, очевидно, конус Лагранжа Л(0) = (Л = (Л, Л „Л,): Ль > О, УЛ„>?лх, Л ф 0). УбедимсЯ, что Условие (3) не выполнЯетсЯ нн дла одного набора Л е Л(0). В самом деле, здесь /-1 0 01 /О 1 Ол >г2 0 О) С (х, Л)=2ль 0 — 1 0 +Л, 1 0 О +Л, Π— 2 0 УхЕЕ~, 0 0 1 0 0 0 0 О 0 конус К'(0) =(Ь =(Ь', Ь', Ь') е Е'.
(д,'(0), Ь) =О, (д,'(0), Ь) =0) = Е~. По этому условие (3) означает, что С.„(0, Л) > 0 (см. определение 2.2). Вос- пользуемся критерием неотрицательности матрицы, приведенном в замеча- нии 2.2. Если Л = (Ль ) О, Л, = О, Л, = 0), то неравенство / — 1 0 ОЛ (О, Л)=2ль ~ 0 — 1 0) >О 0 0 1 невозможно ни прн каком Л, > О. Если же Л=(Л,=О, >>Л„УЛ,), то неравен?2л, л ОЛ С (0)л)=, Л, — 2Л, 0 )О 0 0 0 также невозможно, так как де1~ Л ' Л ~ = — 4Л, — Л, <О >>(ЛИЛ,)фо. 12Л, Л 1 2 Аналогично исследуется случай Ль > О, (Л „Л,) Ф О, Таким образом, теорема 1 в анормальных точках перестает быть справед- ливой. Следовательно, необходимые условия экстремума второго порядка для анормальных точек должны формулироваться как-то иначе, чем в те- ореме 1. А как? Ниже приводится необходимое условие второго порядка, справедливое в общем случае, независимо от того, является ли точка е нормальной или анормальной.
Этот интересный и изящный результат при- надле>кит А. В. Арутюнову 144] и в учебной литературе излагается впервые. О п р е д е л е н и е 3. Пусть о — точка локального минимума функции Т(х) на множестве (1) и Л(о) — соответствующий ей конус Лагранжа.
Ко- нусом Арутюнова Л. =Л.(е) будем называть конус, состоящий из таких наборов Л =(Л,..., Л„) ЕЛ(о) для каждого нз которых существует под- пространство П = П(л) пространства Е", обладающее следующими тремя свойствами: Подпространство П(л) со свойствами (5)-(7) будем называть сопровождающим подпространством точки Л еЛ,(о). Убедимся, что множество Л.(о) в самом деле является конусом. Возьмем произвольные точку Л Е Л.(е) н число а > О. Для точки ал в качестве сопровождающего подпространства можно взять то же подпространство П(Л), которое является сопровождающим для точки Л.
Свойства (5), (61 не требуют доказательств, а свойство (?) вытекает из того, что (.С„.(е,аЛ )Ь, Ь) = = а (С,.(о, Л) Ь, Ь) > 0 ЧЬ Е П(Л), Ча > О. Это значит, что Л„(е) — конус, Заметим, что при в > п каждая точка Л Е Л(е) обладает сопровождающим подпространством П(л) = (0). Следовательно, Л.(х) =Л(е) при в > и. Т е о р е м а 2 (Арутюнов [441). Пусть е — точка локального минимума функции ?(х) на множестве (1), пусть функции 7(х), д,(х),..., д,(х) дважды непрерывно диффгрвнцирувмы в некоторой окрестности точки о.