В.М. Алексеев, Э.М. Галеев, В.М. Тихомиров, Сборник задач по оптимизации (теория, примеры, задачи) (1155771), страница 3
Текст из файла (страница 3)
рис. 1): х д — х с=~ сов ~р1 — — сов ~р~ <=э- ~р 1'а +х КЬ +(д — х) Из сказанного вытекает, что если абсолютный минимум существует, то пм может быть лишь точка х; другие точки пе могут быть даже локальпымп минимумами. Можно доказать, что в задаче (з,) минимум действительно существует. (Доказательство «теоремы существования» решения в (з,) осуществляется, как и в большинстве подобных случаев, с помощью теоремы Вейерштрасса— см. далее п.
1.2.1.) Таким образом, задача (з,) решена и х есть ее решение. Все вышесказанное дает повод наметить план действий для решения задач без ограничений и при наличии некоторых простейших ограничений (такого рода задачи мы далее называем влементарными). 1. Формализовать задачу. 2. Выписать необходимые условия экстремума. 3. Найти все критические точки. 4. Отыскать решения среди критических точек (например, доказав, что решение существует, и перебрав значения функционала в критических точках) или показать, что решения нет. Принцип Лагранжа — это правило исследования задач с ограничениями путем сведения первоначальной задачи к отысканию и исследованию критических точек некоторой элементарной задачи. Покажем, в чем состоит принцип Лагранжа, на примере конечномерных задач с ограничениями типа равенств.
Рассмотрим задачу (Х=В") Д(х) — ехйг; ),(х) = О, ..., ~„,(х) = О, (з) где х (х„..., т„), Здесь ограничение задается системой равенств С =(х«-=В"!~,(х) =О, 1=1, ..., т). Функционал Д, и функции ~„задающие уравнения связи ~,(х) = О, будем предполагать непрерывно дифференцируемыми (иначе говоря, такими, что все их частные производные первого порядка непрерывны). Посмотрим, как предлагал решать эту задачу сам Лагранж. Он пишет; «Можно высказать следующий общии принцип. Если ищется максимум пли минимум некоторой функции многих переменных при условии, что между этими переменными имеется связь, задаваемая одной или несколькими функциями, то нужно прибавить к функции, экстремум которой ищется, функции, задающие уравнения связи, умноженные на неопределенные множители, и искать затем максимум илп минимум построенной суммы, как если бы переменные были независимы.
Полученные уравнения, присоединенные к уравнениям связи, послужат для определения всех неизвестных». 14 Воспользуемся правилом Лагранжа (несколько уточнив его). 11срвое, что нужно сделать согласно Лагранжу, это «прибавить к функции, экстремум которой ищется, функции, задающие уравнения связи, умноженные на неопределенные множители». Составим функцию т Ю= Я~,х, Х) = ~~~ Х,~, (.т), Х = ~Х„...
Х ), которую будем называть функцией Лагранжа. Числа Х, называются множителями Лагранжа. Первое уточнение состоит в том, что и функция, экстремум которой ищется, домножена на неопределенный множитель. Если не сделать этого уточнения, то рецепт Лагранжа может оказаться неверным (см. далее пример 1). При этом в задаче на минимум следует брать Х, ~ О, в задаче на максимум брать Л« ~ О. Второе, что необходимо сделать согласно Лагранжу, это «искать максимум или минимум построенной суммы, как если бы переменные были независимы».
По замыслу Лагранжа, следовательно, надо рассмотреть задачу 2'(х, Х) — ех1г (по х) (з,) (мысленно зафиксировав Х). Задача (з,) проще, чем исходная, так как здесь ограничений нет. Она относится к классу элементарных. Не будем искать ее максимумы и минимумы (ибо может оказаться, что ее максимумы и минимумы не имеют отношения к максимуму и минимуму исходной задачи — см.
далее пример 2). Поступим несколько иначе, будем искать стационарные точки а задаче (з,), т. е. напишем для элементарной задачи (з,) необходимое условие минимума или максимума, выражающееся все в той же самой теореме Ферма. Согласно этой теореме должны удовлетворяться уравнения 2'х (х, ~) = О ~=~..Ух, (т1, ° ° °, ~и„Х»,..., Хш) = О, ~ = 1, ...,и (в которых не все множители Лагранжа равны нулю). Полученные и уравнений, дополненные и уравнениями связи, и «послужат для определения всех неизвестный».
В самом деле, хотя неизвестных (х, Х) на одно болыпе, чем количество уравнений, но надо учесть то обстоятельство, что множители Лагранжа можно умножать на любое число, отличное от нуля, И именно в силу этого чис- 15 ло уравнений равно числу неизвестных. В подобных случаях мы будем говорить о полноте набора условий для определения стационарных точек. Надо иметь в виду, что наибольший интерес имеют те случаи, когда Х, ~ О, ибо при Х, =О. соотношения принципа Лагранжа указывают лишь на некоторую вырожданность ограничений (от которой зачастую легко избавиться) и оказываются не связанными с функционалом. Решения полученных уравнений (Ух, = О, 1= 1, ..., и, 1,(х) = О, у = 1...т) и образуют совокупность стационарных точек.
Таким образом, для решения задачи (з) следует: 1. Составить функцию Лагранжа: ю(,))- .'~ ),у,(). 1=0 2. Выписать необходимые условия экстремума: г~ д~, (х) Ы' (т, Х) — О ~=в- А; — — О, у — 1,..., п. ~=о 3. Найти стационарные точки, т. е. допустимые точки, являющиеся решениями уравнений п.
2, в которых не все Х„1= 0, 1, ..., т, равны нулю. При этом бывает полезно рассмотреть отдельно случаи Л, =О и Х, Ф О. Во втором случае можно в задаче на минимум положить Х, равным единице или любой другой положительной константе, в задаче на максимум — равным минус единице или любой другой отрицательной константе. 4. Отыскать решения среди всех стационарных точек или доказать, что решений нет. Описанная процедура и называется принципом Лагранлеа. Этот принцип применим не только к задаче (з), но и к очень широкому кругу экстремальных задач.
Большинство задач из этого задачника можно решить с помощью этого принципа. Но при этом важно иметь в виду следующее: а) Принцип Лагранжа применим, вообще говоря, не всегда. В примере 3, приведенном ниже, решение задачи существует, но принцип Лагранжа к нему не приводит. б) Сфера применимости принципа Лагранжа достаточно широка. Иногда к задаче нельзя применить имеющуюся теорему, однако принцпп Лагранжа (примененный без обоснования) тем не менее приводит к некоторым точкам, подозрительным на экстремум, из которых можно выделить решение.
Решим теперь с помощью принципа Лагранжа зада- чу 2 и. 0.1. у с~ 1. Рассмотрим более простую формализацию ~з,1 (где множитель 4 прп функционале отброшен): ху — зпр; х'+ у'- г' = О, Составим функцию Лагранжа: Ы = Л,ху+ Л,(х'+ у' — г'). 2. Выпишем необходимые условия: У =О, Ы',=О'=- Лоу+2Лрх=О, Лех+2Л~у=О 3. Найдем стационарные точки.
Если Л, =О, то Л, чь О (ибо не все множители Лагранжа равны нулю) и, значит, х=у =О. Но тогда условие х'+ у'=г' не удовлетворя- ется. Следовательно, в случае Л, =-О стационарных точек нет. Положим Л, = — 1. Необходимые условия переписы- ваются в виде у = 2Л,х, х = 2Л,у. Из атпх уравнений определяются 4 стационарные точки: (г/У2, г/У2), (г/У2, — г/У2), ( — г/У2, г/У2), ( — г/У2, — г/У2).
4. Максимальное значение доставляют точки (г/У2, г/У2) и ( — г/У2, — г/У2). Соответствующие прямоугольни- ки являются квадратами. Обе точки действительно явля- ются решениями, но зто необходимо еще обосновать. Для обоснования можно сослаться на теорему Вейерштрасса о существовании решения в задаче. Можно поступить и по-другому. Пусть х = (г/У2+ а), у = (г/У2+ р) и х'+ + у' = г'. Тогда а'+ р' = — 2(а + р) г/У2 и, следовательно, ху = (г/У2 + а) (г/У2 + р) = г'/2 + ар — а'/2 — р'/2 ~ г'/2, т, е.
(х, у) = (г/У2, г/У2) есть решение задачи. Аналогич- ные рассуждения можно провести и для второй точки. О т в е т. Решением задачи является квадрат. В общем случае принцип Лагранжа применяется так: 1. Формализовать задачу к виду ~(х, и) — 1п1; Г(х, и) =О, ия'У, /: ХХЯ вЂ” В, г": ХХ% — У, где Х и У вЂ” нормирован- ные пространства. Это — задача с ограничениями типа равенств, параметризованных некоторым множеством %. Еще можно сказать,-что зто задача с ограничениями типа равенств и внлючекий.
2 В, М. Алексеев и др. Составить функцию Лагранжа: 2' у(х, и, уе, Х,) Х,~(х, и) + <у*, Г(х, и)>, где у* — элемент сопряженного, пространства Г". В функцию Лагранжа ограничения типа включений и ~а% не входят. 2. Для задач Ы(х, и, у*, М вЂ” 1п( (по х), Ы(х, и, у~, Х,) — 1п(, и~Я, выписать необходимые условия. 3. Найти критические точки, т. е. допустимые точки, являющиеся решениями уравнений и. 2, в которых у* и Х, одновременно не равны нулю. При этом удобно бывает рассмотреть отдельно случаи Х, =0 и Х0 ФО. Во втором случае можно положить Х, равным единице или любой другой положительной константе. 4, Отыскать решения среди всех критических точек или доказать, что решения нет. В заключение приведем те три примера, о которых говорилось выше.
П р и м е р 1 (показывает, что в правиле множителей Лагранжа не всегда можно полагать Х, =1). ~0 (х1, х~) = х1-+ 1п$; ~1 (х1, хй) = х1 — х, = 0 (Х = В ). З 2 К а~ Функции ~, и ~, непрерывно дифференцируемы. Легко понять, что решение задачи х = (О, 0). Если прямо следовать Лагранжу, то надо составить сумму Ы = х1+ 3 21 + Ц~х1 — х21 и далее решать уравнения х 0) Ях 0 с=~. 1+ ЗХх, = О, — 2Хх,= О. Но эти уравнения несовместны с уравнением связи х',— — х, = О. е П р и м е р 2 (показывает, что экстремум функции Лагранжа как задачи без ограничений может не совпадать с экстремумом исходной задачи с ограничениями). ~0 (х11 Х2) = Хр — Х1 — 3 1ПГ, 2 ~ (х„х,)=х +х~~=О (Х=К').
Ясно, что решение задачи х (О, 0). Функция Лагранжа: .У = Х, (х,' — х,) + А(х, + х~1). Необходимое условие 18 экстремума: Ых = О, 2'х = 0 «=»- — ) е + Х(1 + Зх',) = О, 2Хетз = О. Если Л, = О, то Х Ф 0 и, следовательно, Х + Зхг = 0— 2 противоречие. Значит, л,, чь О. Полагаем Х, = 1, Тогда функция Лагранжа примет вид Ы = хз — х, + Х (х, + х',). Однако ни при каких А эта функция в точке г= (О, О) не имеет даже локального минимума.