14 Условный экстремум (Лекции Линейная алгебра и ФНП), страница 2
Описание файла
Файл "14 Условный экстремум" внутри архива находится в папке "ФНП лекции". PDF-файл из архива "Лекции Линейная алгебра и ФНП", который расположен в категории "". Всё это находится в предмете "линейная алгебра и аналитическая геометрия" из 2 семестр, которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "лекции и семинары", в предмете "линейная алгебра и фнп" в общих файлах.
Просмотр PDF-файла онлайн
Текст 2 страницы из PDF
дифференциал второго порядка функции Лагранжа, при значениях дифференциалов dxj , j = 1, n, которые удовлетворяютсистеме линейных уравненийÌÃÒÓточки a вместе с координатами некоторого вектора λa удовлетворяют системе уравнений (14.10).Тогда:1) если квадратичная форма d2 L(a)H положительно определенная, то функция f (x) имеет вточке a строгий условный локальный минимум при условии ϕ(x) = 0;2) если квадратичная форма d2 L(a)H отрицательно определенная, то функция f (x) имеет вточке a строгий условный локальный максимум при условии ϕ(x) = 0;3) если квадратичная форма d2 L(a)H знакопеременная, то функция f (x) в точке a не имеетусловного экстремума.
#ÔÍ-12Достаточные условия условного экстремума в задаче (14.3), (14.4) можно сформулироватьс помощью функции Лагранжа. Пусть в задаче на условный экстремум функции f : Rn → Rпри условиях ϕi (x) = 0, i = 1, m, заданных функциями ϕi : Rn → R, в точке a ∈ Rn выполнено необходимое условие условного экстремума. В этом случае в точке a определен векторλa множителей Лагранжа. Зафиксируем в функции Лагранжа L(x, λ) значения множителейЛагранжа, представив ее как функцию только переменных x: L(x) = L(x, λa ). Чтобы выяснить, является ли точка a точкой условного экстремума рассматриваемой функции, нужнопроанализировать дифференциал второго порядка d2 L(a) функции L(x) в точке a, являющийсяквадратичной формой от приращений переменных.
Рассмотрим этот дифференциал как квадратичную форму d2 L(a)H на линейном подпространстве H в Rn , заданном системой линейныхуравнений dϕi (a) = 0, i = 1, n.ÔÍ-12ÔÍ-1214.3. Достаточные условия условного экстремумаÌÃÒÓÌÃÒÓ∂xjпроизводных фунций ϕi в точке a равен m.
Если в точке a функция f (x) имеет условный локальный экстремум при условиях ϕi (x) = 0, i = 1, m, то существуют такие числа λ1 , λ2 , . . . ,λm , которые вместе с координатами точки a удовлетворяют системе уравнений∂L(x, λ)= 0,∂x1. . . . .
. ,∂L(x, λ)= 0,∂xn(14.10)∂L(x, λ)= 0,∂λ1. . . . . . ,∂L(x, λ)= 0.∂λmÌÃÒÓÔÍ-12Теорема 14.2. Пусть функции f : Rn → R и ϕi : Rn → Rm , i = 1, m, определены и непре∂ϕ(a)iрывно дифференцируемы в окрестности точки a ∈ Rn , причем ранг матрицычастныхÔÍ-12ÌÃÒÓÌÃÒÓ66ÔÍ-12ÌÃÒÓÔÍ-12ÌÃÒÓÔÍ-12ÔÍ-12ÌÃÒÓÔÍ-12ЛЕКЦИЯ 14. УСЛОВНЫЙЭКСТРЕМУМÔÍ-12ÌÃÒÓПример 14.3. В примере 14.2 уравнение dϕ = 0 дает dx + dy = 0, откуда можно, например,выразить dx через dy: dx = −dy. Дифференциал второго порядка функции Лагранжа L(x, y, λ)при фиксированном значении λ = −p/2 в точке (p/2; p/2) имеет вид d2 L = 2dxdy. Исключаяиз второго дифференциала dx, получаем квадратичную форму 2(−dy)dy = −2(dy)2 , котораяотрицательно определена.
Следовательно, в точке (p/2; p/2) мы имеем условный локальныймаксимум.Пример 14.4. Исследуем на условный экстремум функцию f (x, y) = x2 + y 2 при условииx2 /a2 + y 2 /b2 = 1, где a > b.Функция f (x, y), как и функция ϕ(x, y) = x2 /a2 +y 2 /b2 −1, является по крайней мере дваждынепрерывно дифференцируемой на всей плоскости. Составим функцию ЛагранжаλλL(x, y) = f (x, y) + λϕ(x, y) = 1 + 2 x2 + 1 + 2 y 2 − λ.abÔÍ-12Запишем систему (14.10) необходимых условий условного экстремума:λ0Lx (x, y) = 2 1 + 2 x = 0,aλ0Ly (x, y) = 2 1 + 2 y = 0,b22yx += 1.a2b2x1,2 = 0, y1,2 = ±b,x3,4 = ±a, y3,4 = 0,λ = −b2 ;λ = −a2 .ÔÍ-12Исследуем эти четыре точки, применяя достаточное условие условного экстремума.
Рассмотрим два случая.В первом случае, когда λ = −b2 , дифференциал второго порядка функции Лагранжа имеетвидb2 d2 L(x, y) = 2 1 − 2 dx2 .aÌÃÒÓИз первого уравнения находим, что либо x = 0, либо λ = −a2 . В первом случае (x = 0) изтретьего уравнения вытекает, что y = ±b 6= 0, а из второго — что λ = −b2 . Во втором случае(λ = −a2 ) из второго уравнения сразу получаем, что y = 0. Окончательно, используя третьеуравнение, заключаем, что есть четыре точки, подозрительные на условный экстремум:ÌÃÒÓÔÍ-12ÌÃÒÓчастных производных функций ϕi (x) в точке a, ранг которой по условию теоремы 14.2 равен m.Следовательно, система (14.11) позволяет выразить m дифференциалов через оставшиеся n − mдифференциалов.
Зафиксируем известные значения множителей Лагранжа (координат вектора λa ). Рассматривая функцию Лагранжа L(x) как функцию только переменных x1 , . . . , xn ,вычислим ее дифференциал второго порядка d2 L в точке a. Исключим из квадратичной формыd2 L указанные m дифференциалов. Получим квадратичную форму относительно n − m дифференциалов. Если эта квадратичная форма является положительно определенной (отрицательноопределенной, знакопеременной), то в точке a функция f (x) имеет условный локальный минимум (условный локальный максимум, не имеет условного локального экстремума). Еслиуказанная квадратичная форма от n − m переменных вырождена, но сохраняет знак (неположительно или неотрицательно определена), то в точке a функция f (x) может иметь условныйлокальный экстремум, а может и не иметь.
В этом случае по виду второго дифференциала вточке выявить поведение функции f (x) нельзя и нужны другие методы исследования.ÔÍ-12ÔÍ-12∂ϕi (a)∂xjÌÃÒÓÌÃÒÓÌÃÒÓÔÍ-12Матрица этой системы линейных алгебраических уравнений совпадает с матрицейÌÃÒÓ67ÔÍ-12ÌÃÒÓÔÍ-12ÌÃÒÓÔÍ-12ÌÃÒÓÔÍ-12ÔÍ-12ÌÃÒÓÔÍ-12ЛЕКЦИЯ 14.
УСЛОВНЫЙЭКСТРЕМУМÌÃÒÓdy = 0.В точке (0, −b) подпространство H описывается тем же уравнением. Легко увидеть, что квадратичная формаb2 2k(dx) = d L(0, ±b)= 2 1 − 2 dx2 ,ady=0являющаяся сужением d2 L(0, b) (или d2 L(0, −b)) на подпространство H, положительно определена, так как a > b. Значит, точки (0, b) и (0, −b) являются точками условного минимума.Во втором случае, когда λ = −a2 , в точках (a, 0) и (−a, 0) второй дифференциал d2 Lфункции Лагранжа имеет видa2 d2 L(±a, 0) = 2 1 − 2 dy 2 ,bа подпространство H описывается уравнениемdx = 0.L(x, y, z, λ, µ) = x + 2y + z + λ(2x2 + y 2 − z 2 − 2) + µ(y 2 + z 2 − 2).ÔÍ-12Целевая функция задачи и обе функции, задающие уравнения связи, являются по крайнеймере дважды дифференцируемыми.
Поэтому решение задачи можно искать с помощью функцииЛагранжа. В данном случае функция Лагранжа имеет видÌÃÒÓПример 14.5. Рассмотрим следующую задачу на экстремум:x + 2y + z → extr,2x2 + y 2 − z 2 = 2, 2y + z 2 = 2.ÔÍ-12Так как a > b, квадратичная форма d2 L(±a, 0) на подпространстве H (т.е. при dx = 0) отрицательно определена, и поэтому точки (a, 0) и (−a, 0) являются точками условного локальногомаксимума.Этот пример является иллюстративным, и приведенное решение в данном случае не самоелучшее.
Действительно, ограничение x2 /a2 + y 2 /b2 = 1 можно записать параметрически в видеx = a cos t, y = b sin t, t ∈ [0, 2π]. Это позволяет заменить исследование функции f (x, y) двухпеременных на условный экстремум исследованием на экстремумyf(x, y) =a2функции f (a cos t, b sin t) одного переменного. Кроме того, поставленная задача имеет простую геометрическую интерпретацию.Кривая ϕ(x, y) = 0 в данном случае представляет собой эллипсbс полуосями a и b. А линии уровня функции f (x, y) — это конa xOцентрические окружности, причем значение функции на каждойтакой окружности равно квадрату радиуса (рис. 14.3).
Максимальj(x) = 0f(x, y) =b2ный радиус окружности, пересекающей эллипс, равен большойполуоси эллипса. При этом окружность пересекает эллипс в еговершинах,расположенных на большой оси. Минимальный радиусРис. 14.3окружности, пересекающей эллипс, равен малой полуоси эллипса,а точками пересечения будут оставшиеся две вершины эллипса.ÌÃÒÓÔÍ-12ÌÃÒÓили с учетом равенств ϕ0x (0, a) = 0, ϕ0y (0, b) = 2/bÔÍ-12ÔÍ-12ϕ0x (0, b) dx + ϕ0y (0, b) dy = 0,ÌÃÒÓÌÃÒÓПодпространство H в точке (0, b) описывается уравнениемÌÃÒÓÔÍ-12ÌÃÒÓ68ÔÍ-12ÌÃÒÓÔÍ-12ÌÃÒÓÔÍ-12ÌÃÒÓÔÍ-12ÔÍ-12ÌÃÒÓÔÍ-12ЛЕКЦИЯ 14. УСЛОВНЫЙЭКСТРЕМУМÌÃÒÓÌÃÒÓ(14.12)Из первых трех уравнений заключаем, чтоλ 6= 0,Кроме того, находим1,4λλ + µ 6= 0,y=−1,λ+µλ − µ 6= 0.z=(14.13)1.2(λ − µ)(14.14)d2 L = 4λ dx2 + 2(λ + µ) dy 2 + 2(µ − λ) dz 2 .ÔÍ-12В точке (1, 1, 1) с учетом λ = −1/4 и µ = −3/4 дифференциал принимает видd2 L = −dx2 − 2 dy 2 − dz 2 ,а в точке (−1, −1, −1) будет отличаться знаком:ÌÃÒÓВычитая из четвертого уравнения системы (14.12) пятое и сокращая на 2, получаем x2 = z 2 ,что приводит к двум случаям x = z и x = −z.
Однако последний случай невозможен, так какиначе из равенств (14.14) будет следовать, что 4λ = 2(λ − µ) и λ + µ = 0, а это противоречитнеравенствам (14.13).1Итак, x = z. Учитывая это, из равенств (14.14) находим, что µ = 3λ и y = − = x, т.е.4λx = y = z. Используя четвертое или пятое уравнение, получаем два решения рассматриваемойсистемы:13x = y = z = 1, λ = − , µ = − ;4413x = y = z = −1, λ = , µ = .44Необходимые условия экстремума привели к двум точкам, подозрительным на экстремум.Исследуем эти точки, используя достаточные условия экстремума.
Вычисляем дифференциалвторого порядка функции Лагранжа:ÔÍ-12ÔÍ-12ÌÃÒÓ69ÌÃÒÓÌÃÒÓÔÍ-12Необходимые условия экстремума приводят к системе уравнений1 + 4λx = 0,2 + 2λy + 2µy = 0,1 − 2λz + 2µz = 0,2x2 + y 2 − z 2 = 2,y 2 + z 2 = 2.x=−ÔÍ-12ÌÃÒÓÔÍ-12ÔÍ-12ÌÃÒÓÔÍ-12ЛЕКЦИЯ 14. УСЛОВНЫЙЭКСТРЕМУМ14.4. Нахождение наибольшего и наименьшего значенийНапомним, что поиск наибольшего и наименьшего значений действительной функции одногодействительного переменного на заданном отрезке сводится к поиску всех критических точекфункции и к сравнению значений функции в критических точках и на концах отрезка. Функция нескольких переменных, непрерывная на компактном множестве K, достигает на этомÔÍ-12ÌÃÒÓÔÍ-12ÌÃÒÓÔÍ-12ÔÍ-12Видно, что в первом случае второй дифференциал является отрицательно определенной квадратичной формой, а во втором — положительно определенной квадратичной формой.
Этосвойство сохранится и на подпространстве H, которое в данном случае определяется уравнениями 2dx + dy − dz = 0, dy + dz = 0. Учитывая это, заключаем, что точка (1, 1, 1) являетсяточкой условного максимума, а точка (−1, −1, −1) — точкой условного минимума.ÌÃÒÓÌÃÒÓd2 L = dx2 + 2 dy 2 + dz 2 .ÌÃÒÓ(14.15)Чтобы проанализировать способы поиска точек x∗ и x∗ , рассмотрим некоторые частные случаи.Пример 14.6.