Ф.П. Васильев - Методы оптимизации (1125241), страница 21
Текст из файла (страница 21)
3. Среди всех параллелепипедов, имеющих ребра данной длины, найти параллелепипед наибольшего объема. 9 4. Необходимые условия экстремума второго порядка ,:[::.:,, Для более тонкого анализа точек экстремума используются необходимые условия второго порядка. Так называются условия, в формулировке которых используются вторые производные функций, входящих в постановку задачи. С помощью этих условий проводят дополнительный отбор и суживают множество точек, подозрительных на экстремум, выделенных с помощью необходимых условий первого порядка.
Для задач на безусловный экстремум необходимые условия второго порядка мы уже формулировали выше (теорема 2.1). Перейдем к формулировке таких условий для задач на условный экстремум, а. Как в предыдущем параграфе, изложение начнем с классической задачи +.":::;.:,:: поиска экстремума на множестве Х = (х Е Е": д!(х) = О,..., д (х) ='О), (1) задаваемом ограничения типа равенств. Известные в литературе необходимые условия второго порядка в задачах на условный экстремум обычно ,) ',,:-' формулируются при дополнительном требовании нормальности точки, подозрительной на экстремум (см., например, 114; 670; 72Ц), '-~)! ":;::;:": О п р е д е л е н и е 1.
Точка и называется нормальной точкой множества (1), если и е Х и векторы д!'(и),..., д,'(и) линейно независимы. 3 )г 4. Среди треугольных пирамид с данным основанием и высотой найти ту, которая имеет наименьшую боковую поверхность. 5. Пусть А = А(х!,..., х„) — определитель матрицы (х!,..., х„), столбцами которой яв. лаются вектор-столбцы х; с координатами х!,..., х;", 4 = 1,..., и. Найти наибольшее и наи. меньшее значение величйны определителя гз при условии, что [хг~ = о,, где а! — заданные положительные числа, 4 = 1,..., и. Доказать неравенство Адамара 17з! (1х![ [хт!.... )х„). Дать геометрическую интерпретацию задачи при и = 2,3 (ср, с упражнением 3) [352, ч.
1, с. 554-557]. О. Найти наименьшее и наибольшее значение квадратичной формы 7(х) = (Ах, х) при усло- ВИИ Х Е Х = (Х Е Еч: (Х, Х) = Ц, ГдЕ А — СИММЕтрИЧЕСКая МатрИца. ПОКаэатЬ, Чтс ВЕЛИЧИНЫ 7" = ш!и 7(х) и 7' = шак 7(х) представляют собой соответственно наименьшее и наибольшее х х собственное число матрицы А ([353, с. 209)), 7. Найти точки экстремума функций 7"(м)=х+у, 7(м)=[я[+[у — 1[, 7'(м)=х +2уз на мно- жествах Х, где Х=(м=(х„у) е Ез: 0 < х < 1, 0~( у ( ц или Х=(м=(х, у) е Ез; х-уз > О, ха+ уз < 1), или Х =(и=(х у) е Е з: х ~ )О, у ) О, ох+ Ьу = ц, числа а > О, Ь > О. у к а з а н и е: нарисовать пересечения графиков лиийй уровня 7(х) ш сопя! со множеством Х.
8. Пусть Х=(хе Е": (с, х) = Ц или Х =(хе Е": (с х) (1), где с Е Ь'", с~О. Найти точку х е Х, сумма квадратов расстояний от которой до р дайных точек х!, хз,..., х е Е" р была бы минимальной [максимальной) (ср. с примерами 1,3). 9. Задачи из примеров 1, 3 и упражнения 8 исследовать геометрически (при и = 2, 3), 2 используя тот факт, что поверхности уровня 7"(х) = сопз1, где 7"(х) = 2; [х — хг[, являются Р г=! сфеРами 1х-тс1=Л с центРом х =Р ~; х!. '=! 10. Пусть 7(м)=х, Х=(м=(х, у)еЬз: д!(м)=х — у=О, дз(м)= х -1-у=О, дз(х)=х=О). Дайте описание конуса Лагранжа точки о =(О, 0), выясните характер экстремума в этой точке.
и. Приведите пример функции 7"(х) и множества Х, таких, что 7(х) не имеет ни одной точки экстремума на Х, а система (13) имеет бесконечно многояпешений. Начните с функции 7(м) = х + у на множестве Х = (и = (х у) Е Ез: д(м) = хз — у = 0). Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА Требование нормальности точки в литературе часто называют условием Люстерника. Посмотрим, как устроен конус Лагранжа Л(е) в нормальной точке локального минимума. Перепишем уравнение С.(о, Л) = 0 из системы (3,6) в виде: (2) Л,д,'(е) +... + Л,д,'(е) = — Л 1'(о) По определению точка Л =(Л„..., Л,) принадлежит конусу Л(е) тогда и только тогда, когда Л является решением уравнения (2) и Л фО, Л > О. При каждом фиксированном Лв (2) представляет собой систему линейных алгебраических уравнений относительно неизвестных Л =(Л„..., Л,) с матрицей (д,'(н),..., д,'(о)), ранг которой в нормальной точке и равен з, причем з < и.
Отсюда следует 1192; 353], что при каждом Лв система (2) имеет единственное решение Л, и оно представимо в виде Л = Л,и, где р — решение этой системы при Лз = 1. Это значит, что конус Лагранжа в нормальной точке е есть открытый луч Л(о) = (Л е Е'+'. Л = Ла(1, р), Лв > 0) с направляющим вектором (1, И). Теорема 1.
Пусть функции Т(х),д,(х),...,д,(х) дважды непрерывно дифференцируемы в некоторой окрестности точки о локального минимума функции Т(х) на множестве (1), пусть и — нормальная точка этого множества, Л(е) — конус Лагранжа точки е. Тогда для любой точки Л е Л(н) (л, (е, Л)Ь, Ь) > 0 ЧЬеК(о)=(Ь Е Е": (д,'(о), Ь)=0, 4=1,..., з) (3) Конус К(с), введенный в (3), называют конусом критических направлений множества (1) в точке е. Этот конус непуст, так как он всегда содержит точку Ь =О. В нормальной точке н при з = и конус К(о) состоит из единственной точки Ь =О, а при 0 < з < и он является подпространством размерности и — з.
Так как функция С(х, Л) однородна по переменной Л, т. е. с,(х, а Л) = свл(х, Л) Чсв, а Л(о) — луч с направля>ощим вектором (1, р), то условие (3) достаточно проверить при Л = (1, р,). Для нормальной точки локального максимума теорема 1 сохраняется, нужно лишь в ее формулировке конус Л(о) заменить на конус Л (н) = (Л Е Е ь э ': Л = Л (1, и), Л, < 0).
Для иллюстрации теоремы 1 приведем пример. П р и м е р 1. Пусть У(х) = (х')в — (хв)в, Х = (х = (х', хв) е Ев: д(х) = х' =О). Тогда функция Лагранжа С(х, Л) = Л ((х') — (х~)') + Л,х', ее производные С,(х, Л)=(2Лвх'+Ли — 2Л х ), ь", (х, Л)=1 в ); о,г квадратичная форма (в. (х, Л)Ь, Ь) =2Л ((Ь')' — (Ь')').
Нетрудно видеть, что точка н = (О, 0) нормальна и подозрительна на локальный минимум, ее конус Лагранжа Л(0) = (Л = Лв(1, 0), Лв > О). Применим к ней теорему 1. Здесь конус критических направлений К(0) = (Ь = (Ь', Ь'): Ь' =0). Тогда (С (О Л)Ь Ь) = — 2Л (Ь ) <О тЬ Е К(0), ЬФО. Условие (3) не выполняется. Следовательно, точка е = 0 не может быть точкой локального минимума функции Т(х) на множестве Х. Нетрудно убедиться, что точка о =0 с конусом Л (0) = (Л = Лз(1, 0), Лз < О) также удовлетворяет условию (3) и претендует на локальнйй максимум, В этом простом примере ясно, что е = 0 — точка глобального максимума Г(х) на Х. 5 4 НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА 69 Теперь откажемся от априорного требования нормальности точки, подозрительной на экстремум.
Оп р еде ле н не 2. Точка н называется анормальной точкой множества (1), если е е Х и векторы д,'(о),..., д,'(о) линейно зависимы, т. е. существуют числа Л„ ..., Л, такие, что а Л,д>'( )+...+Л,д,'( )=О, Л =(Л„...,Л,)~О. (4) Сразу отметим следующее интересное свойство анормальных точек. Условие (4) можно переписать в равносильном виде: 0 у'(е)+ Л,д,'(е) +...
.. +Л„д,'(о)=0, Л =(Лв=О, Л)~0, для любой днфференцируемой функции Г(х). Это значит, что набор Л = (О, Л) е Л(о), т. е. конус Л(о) фИ. Следовательно, всякая анормальная точка е множества (1), по сути вырахгающая лишь некоторое специфическое свойство (4) этого множества, автоматически удовлетворяет необходимым условиям экстремума первого порядка и оказывается подозрительной на экстремум для любой дифференцируемой в:;:::,. функции Г(х), "> Посмотрим, как устроен конус Лагранжа в анормальной точке локального минимума.
Оказывается, в такой точке н конус Л(о) О(0) содержит прямую. В самом деле, если набор Л = (Л„..., Л,) удовлетворяет условию (4), ,'3::;::;:,;. л то набор ( — Л) также удовлетворяет ему. Тогда точки Л,=(Л,=О, Л) фО и ( — Л,) = (Лв = О, — Л) ф 0 являются решением системы (2) при Лз = 0 н, :,1,;::-':;::: > следовательно, Л, (-Лд)ЕЛ(е). Так как Л(е) конус, то прямая Л(с)=1Лз, — сс < с < +со, с направляющим вектором Л, ~ О, принадлежит Л(е) О (О). Верно и обратное: если конус Л(н) О (О) содержит некоторую прямую Л(с) = ср, — сс < 4 <+со, >в =(р,..., р,) фО, то о — анормальная точка множества (1). Действительно, тогда Л(1) = >Т и Л( — 1) = — р принадлежат Л(н).
Поскольку у всех точек Л конуса Л(е) координата Лв > О, то необходимо р > О, — р > О, так что р =О, Л =(р„...,,и,) фО. Это значит, что условия С.(е, р) = О, уды О из системы (3.6) превращаются в условие (4). ]в':;,:; " Следовательно, и — анормальная точка множества (1). Из приведенных рассуждений следует, что точка о локального минимума анормальна тогда и только тогда, когда конус Л(е) с> (О) неострый. Аналогично доказывается, что точка о локального максимума будет анормальной тогда и только тогда, когда конус Л (о) О (0) неострый. ,$,!:!;::;!, Заметим, что наличие анормальных точек у множества (1) довольно частое явление. Если з > и, то всякая точка множества (1) анормальна н, :,4';,",:.~::,'-:::::; следовательно, подозрительна на экстремум для любой дифференцируемой функции Г(х).
Типичным примером задачи, приводящей к необходимости исследования на экстремум анормальных точек, является следующая: при каких условиях на симметРичные матРицы Я~,..., Я, квадРатичнаЯ фоРма (стах, х) > 0 >>х Е е К = (х е Е": < Я х, х >= 0 [< 0], 4=1,..., з) (см. ниже упражнения 4, 6). Эта задача имеет различные приложения и показывает, что проблема й,'::, изучения анормальных точек экстремума не является надуманной.
Для дальнейшего анализа на экстремум анормальных точек нужны необ- .„'-:„:::;:;;'в ' ходимые условия второго порядка. Однако теоремой 1 мы здесь пользоваться не можем, так как она доказана в предположении, что е — нормальная точка. Более того, нетрудно привести примеры, показывающие, что для анормальных точек теорема 1 просто неверна $4. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА 71 70 Гл. 2, КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА П р и м е р 2. Рассмотрим задачу: 7(х~ = — (*')' — (хт+ (х ~ — ' !п( х Е Х = (х = (х', х~, х~) Е Е~: д,(х) = х'х = О, дв(х) = (х ) — (х ) = О(. Нетрудно видеть, что множество Х состоит из точек х = (0,0, х ) с Чх .
з Отсюда ясно, что и =(0,0, 0) =0 — точка глобального минимума функции 7'(х) на Х. Так как д,'(О) =О, д,'(0) =О, то условия (4) выполняются при всех Л = (Л„Л,) ф О, Следовательно, и = 0 — анормальная точка множества Х. Кроме того, 7"'(0) = О, и, очевидно, конус Лагранжа Л(0) = (Л = (Л, Л „Л,): Лв > О, ЧЛ„ЧЛх, Л фО). Убедимся, что условие (3) не выполняется ни для одного набора Л ЕЛ(0). В самом деле, здесь / — 1 . 0 ОЛ /О 1 ОЛ /2 0 ОЛ С,(х, Л)=2Лв 0 — 1 0 +Л, 1 0 0 +Л, ~ 0 — 2 0 ЧхЕЕ~, 0 0 1 0 0 0 0 0 0 конус К(0) = (Ь =(Ь', Ьв, 61) е Ез: (д,'(0), 6) =О, (д '(0), 6) =О) = Ев, По этому условие (3) означает, что А", (О, Л) > 0 (см.