Ф.П. Васильев - Методы оптимизации (2002) (1158201), страница 22
Текст из файла (страница 22)
Тогда (8) (9) Л„(е)ФИ; шах (С„,(о, Л)Ь, Ь) > 0 Л лЛ,(л), И)= 3 ЦЬЕК(е)=(Ь Е Е"; (д,.'(о), Ь)=0, 4=1,..., в). Доказательство этой теоремы будет дано ниже в $5.16. Сейчас мы прокомментируем ее и проиллюстрируем примерами. Сразу же заметим, что в условиях (7) и (9) участвует одна и та же квадратичная форма (.С (о, Л)Ь, Ь), и у читателя может сложиться впечатление, что оба этих условия как-то связаны с неотрицательной определенностью указанной формы. Условие (7) в самом деле означает неотрицательность этой формы на сопровождающем подпространстве 'П(Л).
А условие (9) гарантирует лишь то, что для каждого фиксированного Ь Е К(о) найдется своя точка Л = Л(Ь) Е Л (е), (Л(Ь)( = 1, для которой значение квадратичной формы (С (о, Л)Ь, Ь) > О, что вовсе не исключает того, что в какой-либо другой точке Ь е К(о) значение той же формы будет < О. Как увидим' ниже на при'- мерах, бывают, конечно, случаи, когда максимум в (9) достигается в одной н той же точке Л при всех Ь е К(е), н для такого Л квадратичная форма (С.„(о, Л )Ь, Ь) в самом деле будет неотрицательной на К(е). На примерах мы также увидим, что такого универсального Л*, не зависящего от Ь, может н не существовать. Заметим также, что условие (8) непустоты конуса Л,(х) вовсе не вытекает из условия Л(е) ф О и весьма содержательно.
Посмотрим, во что превращается теорема 2, когда о — нормальная точка множества (1). Тогда, как было выяснено выше, конус Лагранжа Л(о) = = (Л = Ль(1, р), Ль > О) — открытый луч с направляющим вектором (1, р) где р — решение системы (2) при Л = 1. Согласно теореме 2 конус Л (о) у> ф О. Отсюда и из включения Л (х) с Л(о) следует, что Л.(о) =Л(е). Далее, в нормальной точке о конус нега'(е) является подпространством в Е' размерности и-в >О. С другой стороны, сопровождающее подпространство П(Л) точки Л Е Л.(о) в силу (5), (6) имеет размерность йш П(Л) ) и — в, н П(Л) с кег С'(е). Следовательно, П(Л) = нег С'(о) УЛ ЕЛ,(о), т. е. все точки Л е Л„(е) обладают одним и тем же сопровождающим подпространством, совпадающим с кег С'(о).
Кроме того, в рассматриваемой задаче кег С'(е) = = К(е), и условие (7) означает, что (С,.(Р, Л)Ь, Ь) > 0 >>Ь Е П(Л) = К(е) Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА Е 4. НЮВХОДИМЫВ УСЛОВИЯ ЭКСТРВМУМХ 73 ,'~1' 4«т ' и ЧЛ е Л,(о) = А(о). Отсюда следует, что условие (9) в нормальной точке о совпадает с условием (7), так как множество (Л с Л.(т«), )Л ! = 1) состоит из единственной точки и знак максимума в (9) можно опустить.
Таким образом, если точка локального минимума о функции 7(х) на множестве (1) является нормальной точкой этого множества, то теорема 2 превращается в теорему 1. Теперь рассмотрим другу|о крайность, когда о — точка локального минимума, является анормальной точкой множества (1), и, более того, пусть д,'(о) =... = д,'(о) =О. Тогда конус кег С'(о) = Е", и условие (6) трйвиально выполняется для всех Л е Л,(о). Для истолкования условий (5), (7) здесь удобно воспользоваться понятием индекса квадратичной формы. Как известно нз линейной алгебры 1192; 213; 349; 351; 353], всякая квадратичная форма (Ах, х) с помощью невырожденного линейного преобразования может быть приведена к каноническому (диагональному) виду, причем число положительных, число отрицательных и число нулевых членов в канонической форме не зависит от способа приведения (закон инерции квадратичных форм). Поэтому имеет смысл Определение 4.
Число положительных членов в каноническом виде квадратичной формы (Ах, х) называется положительным индексом этой формы, число отрицательных членов — отрицагпельнььи индексом. Если при приведении квадратичной формы (Ах, х) к каноническому виду используются лишь ортогональные преобразования, то коэффициенты канонического вида квадратичной формы совпадают с собственными числами матрицы А, причем положительный индекс этой формы равен числу положительных собственных чисел матрицы А, отрицательный индекс — числу отрицательных собственных чисел этой матрицы (с учетом их кратности). Ниже нас будет интересовать лишь отрицательный индекс, и мы его для краткости будем называть просто индексом квадратичной формы.
Можно доказать, что индекс квадратичной формы совпадает с размерностью максимального подпространства Е пространства Е , на котором форма (Ах, х) отрицательна, т. е. (Ах, х) <0 т'х Е Е, х фО, или еще иначе, индекс формы равен коразмерности максимального подпространства л 4, на котором форма неотрицательно определена. Напомним, что коразмерность подпространства Е„, по определению, есть число (и — б1ш Ь, ) [192; 213,' 349; 353). Отсюда и йз (5), (7) получаем содержательное утверждение: если 0 < з < < и и кег С'(о) = Е" в анормальной точке о локального минимума функции 7(х) на множестве(1) индекс квадратичной формы (С (т«, Л)Ь, Ь) не превышает з при всех Л е Л.(о), или, иначе говоря, количество отрицательных собственных чисел матрицы л", (о, Л') не превышает е при ЧЛ еА (о).
В общем случае, когда в анормальной точке подпространство кег С'(е~,-4 Е', можно показать, что количество отрицательных собственных чисел матрицы Р(о)С (ц Л)Р(о) не Превышает е — гапК(д,«(4«),..., д,«(о)), где Р(о)— матрица оператора проектирования пространства Е" на подпространство кег С'(о), ганя(д,'(о),..., д,'(о)) обозначает рангматрицы, столбцами которой являются векторы д,'(о),..., д,'(о). Заметим, что Р(п)С (и, Л)Р(и)— симметричная матрица, так как симметричны матрицы Р(о) С (ц Л). 3 а м е ч а н и е 1. Учитывая, что всякая точка локального максимума функции 7" (х) на множестве Х является точкой локального минимума функции (-7(х)) на том же множестве, из теорем 1,2 нетрудно получить необходимые условия второго порядка для точки локального максимума.
Пред- лагаем читателю убедиться, что все утверждения теорем 1, 2 полностью сохраняются, нужно лишь конусы Л(««), А.(о) заменить соответственно конусами А (о), А.(о). Определение конуса Арутюнова А„(о) для точки с локального максймума функции 7(х) на множестве (1) получается из определения 3 заменой конуса А(о) на конус А (о), в котором, в отличие от Л(о), все наборы Л = (Л,..., Л,) имеют координату Ль < 0 (см. замечание 3.1). Для иллюстрации теоремы 2 рассмотрим несколько примеров. Пои мезо 3.
Задача: у~х)= — (х')з — (хз~з+(хз)' — «1п1, хЕХ=.(х= =(х, х', х ) еЕ'. д (х)=х х =О, дз(х)=(х )' — (х')'=0). Эту задачу мы уже рассматривали в примере 2 н убедились, что точка с = (О, О, 0) глобального минимума является анормальной точкой множества Х и теорема 1 к нет неприменима. Теорема 2 к этой точке, конечно, применима, и тем не менее интересно посмотреть, как конкретно устроен здесь конус А.(0), подпространства П(0) и т.
п. Конус Лагранжа А(0) для точки о =О, как мы уже знаем, состоит из всех точек Л =(Л„Л „Л,) у'= 0 с произвольнымн Л, > О, Л, Л,, а конус кег С'(0) = Ез. Покажем, что конус Арутюнова Л,(0) = А(0). В самом деле, возьмем ЧЛ е А(0) и подпространство П = (Ь = (Ь', Ь', Ь') е Е': Ь' = О, Ь1=0). Здесь и = 3, з = 2, и йшП =1 = 3 — 2, П с кег С (0) = Е'. Кроме того, (л, (О, Л)Ь, Ь) = 2Л,(Ь') > 0 1гЬ а П. Таким образом, для всех Л е А(0) нам удалось указать одно и то же сопровождающее подпространство П.
Это значит, что Л.(0) = Л(0). Заметим, что для некоторых Л я А(0) можно указать и другие сопровождающие подпространства. Например, для Л,=(0, 1, 0) квадратичная форма (л", (О, Л,)Ь, Ь)=Л,Ь'Ь'>О для всех Ь е я П=П(Л„)=(Ь=(Ь', Ьз, Ьз): Ь'=уЬз) с «1«>0, Ясно, что 41гпП(Л,)=2 > 1 и все свойства (5)-(7) выполнены. Нетрудно проверить, что индекс квадратичной формы (С„(0, Л)Ь, Ь) при всех Л еЛ.(0), как и положено по теореме 2, не превышает 2, причем для некоторых Л, например, для Л,=(0, 1, 0) этот индекс равен 1, для Л,=(1, О, 0) индекс равен 2.
Теперь обратимся к условию (9). Здесь (с (О Л)Ь Ь) 2Л ( (Ь«)з (Ьз)з+(Ьз)з)+2Л Ь«Ьз+2Л ((Ь«)г (Ьз)г) В примере 2 было показано, что условие (л, (О, Л)Ь, Ь) >0 ЧЬ е К(0) =Е' не может выполняться ни при каких Л е А(0) =А (0). Это означает, что нет единого, «универсального» для всех Ь набора Л еА„(0), для которого (С„.(0, Л) Ь, Ь) > 0 т'Ь е Х(0) = Е'.
Однако для каждого отдельно взятого Ь е Е' можно указать Л =Л(Ь) ЕА(0), )Л(Ь)1=1, что (с„(Од Л(Ь))Ь, Ь) >О. Например, можно взять Л = Л (Ь) = (О, 1, 0) прн Ь Ьз > О, Л (Ь) = (О, — 1, 0) при Ь'Ь'<О, Л(Ь)=(0,0,1) при Ь'Ьз=О, (Ь')'-(Ь')'>О, Л(Ь)=(0,0, — 1) при Ь«Ьз=О, (Ь«)'-(Ьз)'<О, Л(Ь)=(1,0,0) при Ь'Ь'=О, (Ь')' — (Ь')'=О, т. е. Ь'=Ь'=О. Тогда шах (С,(0, Л)Ь, Ь) >(л.