Галеев Э.М., Тихомиров В.М. - Краткий курс теории экстремальных задач (1050553), страница 3
Текст из файла (страница 3)
Одна и та же задача может быть формализована разными способами, и простота решения зачастую сильно зависит от того, насколько удачно она формализована. Любая формализованная задача включает в себя следующие элементы: функционал 1: Х- К (Х вЂ” область определения функционала 1) и ограничение, т. е. подмножество Сс:Х. Поясним некоторые встретившиеся здесь обозначения и термины; 11 — это расширенная действительная (вещественная) прямая, т.
е. совокупность всех действительных чисел, дополненная значениями +со и — со; запись Р: Х- У означает, что отображение Р имеет область определения Х, а Р(х) для каждого элемента х из Х лежит в множестве У Таким образом, формализовать экстремальную задачу — значит точно описать ее элементы 1, Х и С. Для формализованной задачи употребляется запись 1(х) — !п1(зпр); х~С. (з) Точки хенС называются допустимыми. Если С=Х, то задача называется задачей без ограничений.
Задачу на максимум всегда можно свести к задаче на минимум, заменив задачу 1(х) — зпр; хенС, задачей 1(х) — ш1; хенС, где !(х)= — 1(х). И наоборот, задачу на минимум можно аналогичным образом свести к задаче на максимум. Для определенности в тех случаях, когда формулировки необходимых условий экстремума в задачах на минимум и максимум разные, выписываем нх только для задачи на минимум.
Если необходимо исследовать обе задачи, то пишем 1(х)- ех!г; х~С. Допустимая точка х называется абсолютным (или глобальным) минимумом (максимумом) в задаче (з), если 1(х) =. 1(х) для любого хенС (соответственно 1(х) <1(х) для любого хенС). Прн этом пишем х~аЬзсп!пз (аЬзшахз). Абсолютный минимум (максимум) задачи называем решением задачи. Величина 1(х), где х — решение задачи, называется численным значением задачи (иногда для сокращения говорим просто значение задачи). Эту величину обозначаем Яа, илн 5ш!и (5тах).
Кроме глобальных экстремумов также рассмотрим локальные экстремумы. Дадим нх строгое определение. Пусть в задаче (з) Х вЂ” нормированное пространство. Говорят, что точка х доставляет в (з) локальньсй мийимум (максимум), и пишут хя!оспс!из (!оспсахз), если хенС и существует б)0, такое, что для любой допустимой точки х, для которой (!х — х!!<б, выполняется неравенство !(х))1(х) (!(х) «с(х)). Иными словами, если хек!осси!пз (1осспахз), то существует окрестность 0 точки х, такая, что хе=аЬзпппз' (аЬзшахз') в задаче 1(х) !п((з р); Сди. (з') 11 Переформируем понятие локального экстремума в важнейшем конечномерном случае. Пусть в (з) Х=К".
Говорят, что х=(х„...,х„)я!осш!пз (!осшахз), если хенС н найдется такое б>0, что для любого х=(хь...,х„)~С, для которого п 1/э ! х — х ! ( б «:» Д (х; — х;)') ~ 6, выполнено неравенство в=а 1(х) ъ!(х) (!(х) «)(х)). Теория экстремальных задач дает правила нахождения решений экстремальных задач. В большинстве своем эти правила выделяют некоторое подмножество точек, среди которых должно содержаться решение задачи. Это множество точек, которое называем критическим, возможно, несколько шире, чем множество абсолютных н даже локальных экстремумов. После нахождения всех критических точек надо выделить нз них решения. 3.
Принцип Лагранжа исследования задач с ограничениями. Сущность принципа Лагранжа состоит в редукции задач с ограничениями к ряду задач более простой структуры (в большинстве случаев — к задачам без ограничений). Покажем, в чем состоит принцип Лагранжа, на примере конечномерных задач с ограничениями типа равенств.
Рассмотрим задачу (Х=й") 1«(х) - ех1г; 1~ (х) =О,..., („, (х) =О, (з) где х=(х„...,х„). Здесь ограничение задается системой равенств С=(хан)1" !1;(х) =О, 1=1,..., т). Функционал («и функции 1ь задающне уравнения связи 1;(х) =О, предполагаем непрерывно дцфференцнруемымн (иначе говоря, такими, что все нх частные производные первого порядка непрерывны). Посмотрим, как предлагал решать эту задачу сам Лагранж. Он пишет: «Можно высказать следующий общий принцип. Если ищется максимум нлн минимум некоторой функции многих переменных прн условии, что между этими переменными имеется связь, задаваемая одной илн несколькими функциями, то нужно прибавить к функции, экстремум которой ищется, функции, задающие уравнения связи, умноженные на неопределенные множители, н искать затем максимум нлн минимум построенной суммы, как если бы переменные были независимы.
Полученные уравнения, присоединенные к уравнениям связи, послужат для определения всех неизвестных». Воспользуемся правилом Лагранжа, несколько уточнив его. Первое, что нужно сделать согласно Лагранжу: «прибавить к функции, экстремум которой ищется, функции, задающие уравнения связи, умноженные на неопределенные множители». Составим функцию Я=Я(х, 1.)=~Г Ч;(х), 1,=(), Х„..., Х ), ь=а 12 которую называем функцией Лагранжа. Числа Ц называются множителями Лагранжа. Первое уточнение состоит в том, что и функция, экстремум которой ищется„домножена на неопределенный множитель.
Если не сделать этого уточнения, то рецепт Лагранжа может оказаться неверным (см. далее пример 1). При этом в задаче на минимум следует брать Х«~0, в задаче на максимум брать Хо«0. Второе, что необходимо сделать согласно Лагранжу: «искать максимум или минимум построенной суммы, как если бы переменные были независимы». По замыслу Лагранжа, следовательно, надо рассмотреть задачу Ы(х, Х)- ех1г (по х) (з.) (мысленно зафиксировав К).
Задача (з,) проще, чем исходная, так как здесь ограничений нет. Она относится к классу элементарных. Не будем искать ее максимумы и минимумы (ибо может оказаться, что ее максимумы и минимумы не имеют отношения к максимуму и минимуму исходной задачи — пример 2). Поступим несколько иначе. Будем искать стационарные точки в задаче (з,), т. е. напишем для элементарной задачи необходимое условие минимума или максимума, выражающееся все в той же теореме Ферма: Согласно этой теореме должны удовлетворяться уравнения Я„(х, Л)=Ос»Я„(хм...,х„, З,ы...,Л ) =О, ю'=1,:,и (в которых не все множители Лагранжа равны нулю). Полученные и уравнений, дополненные гп уравнениями связи, и «послужат для определения всех неизвестных».
В самом деле, хотя неизвестных (х, Х) на одно больше, чем количество уравнений, надо учесть то обстоятельство, что множители Лагранжа можно умножать на любое число, отличное от нуля. И именно в силу этого число уравнений равно числу неизвестных. В подобных случаях будем говорить о полноте набора условий для определения стационарных точек. Надо иметь в виду, что наибольший интерес имеют те случаи, когда Х«чьО, ибо при Х«=0 соотношения принципа Лагранжа указывают лишь на некоторую,вырожденность ограничений (от которой зачастую легко избавиться) и оказываются не связанными с функционалом. Решения полученных уравнений (Я„,=О, 1= = 1,..., и, ~; (х) = О, 1 = 1,..., тп) и образуют совокупность стационарных точек.
Таким образом, для решения задачи (з) следует 1. Составить функцию Лагранжа: 13 2. Выписать необходимые условия экстремума: .х„. (х, М = О ол ~~ )ч — ' = О, у = 1,..., п. ху ~=о 3. Найти стационарные, т. е. допустимые, точки, являющиеся решениями уравнений п. 2, в которых не все Ц, 1=0, 1,..., гп, равны нулю. При этом бывает полезно рассмотреть отдельно случаи ),о=О и лоФО. Во втором случае можно в задаче на минимум положить )оо равным единице или любой другой положительной константе, в задаче на максимум — равным минус единице или любой другой отрицательной константе.
4. Отыскать решения среди всех стационарных точек или доказать, что решений нет. Описанная процедура и называется пр~Гнципом Лагранжа. Этот принцип применим не только к задаче (з), но и к очень широкому кругу экстремальных задач. Большинство задач из нашей книги можно решить с помощью этого принципа.
Но при этом важно иметь в виду следующее. а) Принцип Лагранжа применим, вообще говоря, не всегда. В примере 3, приведенном ниже, решение задачи существует, но принцип Лагранжа к нему не приводит. б) Сфера применимости принципа Лагранжа ' достаточно широка. Иногда к задаче нельзя применить имеющуюся теорему, однако принцип Лагранжа (примененный без обоснования) тем не менее приводит к точкам, подозрительным на экстремум, нз которых можно выделить решение.
В общем случае принцип Лагранжа применяется так. 1. Формализовать задачу к виду 1(х, и) ш1; Р(х, и) =О, ие-:У. 1:ХХс1- К Р:ХХУ- У, где Х и У вЂ” нормированные пространства. Это задача с ограничениями типа равенств, параметризованных некоторым множеством У. Еще можно сказать„ что эта задача с ограничениями типа равенств и включений. Составить функцию Лагранжа: Ы(х, и, Ло, у*) =Ло1(х, и) +(у*, Р(х, и)), где у' — элемент сопряженного пространства У*. В функцию Лагранжа ограничения типа включений иен(т" не входят.
2. Для задач .У(х, й, ло, у*) — ш1 (по х), 2'(х, и, ло, у') 1п1, иенУ выписать необходимые условия. 3. Найти критические, т. е. допустимые, точки, являющиеся решениями уравнений п. 2, в которых у* и Л> одновременно не равны нулю. При этом удобно бывает рассмотреть отдельно слУчаи Ло=О и )аэьО. Во втоРом слУчае можно положить Ха равным единице или любой другой положительной константе.