Ф.П. Васильев - Методы решения экстремальных задач (1125244), страница 52
Текст из файла (страница 52)
Тогда 1!гп )о» вЂ” и„'=О. Доказательство теоремы 2 получается нз доказательства теоремы 1, если в последнем положим Р(и)=0, А„=1, И=О, 1, ..., и проведем небольшие очевидные 286 изменения. В качестве (а»с здесь мох!но, например, прел. ложить ш» =- В (/с+ 1) ', ]с =- О, 1, ..., В=-!пах(47!а'; 27.(!о„!, (27.1~ У'(о„)':)!'»). О других спосо, ах итеративной регулярпзапии метода Ньютона см. в !24, 25, 551. 3. 1!ерейдем к излогкению итеративно» регуляризации метода, описанного в 3 !.4, и. 7, для задачи минимизации Функции / (и) на множестве (1).
Будем предполагать, что функции У (и), ис (и), 1=1, з, принадлежат классу С' (Н) н существуют разделенные рс зною и сп (и, о), Р' (и, а! -радисвтов функнии л'(и) и соответственно штрафной функции Р(и) из (3). Напоминаем, что согласно определению ! 4.4 разделенные разности Н (и, о), Р'(и, о) представляют сабо~ линейные операторы, еиствуюшие из Н в Н и такие, что Р (и, о) (и — о)=Н (и) — сп (о), (23) Р' (и, о) (и — о) Р' (и) — Р' (о) (24) при всех и, о св Н Тогда градиент фуннцни Тихонова (4) также обладает разделенной разностью Т» (и, о), причем Т»(и, о)=Р(и, о]+А»Р'(и.
о)н в»Е, и, ош Н, (23] где Š— единичный оператор. Предположим, что существует обратны! оператор (Т» (и, о])» прн всех ч, о ш Н и рассмотрим итерационнып процесс (67] В»=о» вЂ” Г»Т»(о»] (26) о»ы — — ⻠— Г»т» (о»), »=О, 1, где Г» = (Т» (о», о»)), б» = о» вЂ” 6»Т» (о») (27) о,— заданное начальное прийди>кение, ()» — параметры метода. Нетрудно видеть, что процесс (26), (27) представляет собой сператнвную регуляризв ню метода (! 4 42]: к функции Тихонова Т» (и) приме.
няется один шаг метода (! 4.42), везем совершается переход к еле. дующей функции Т», (и), к которой снова применяетса один шаг метода (1.4 42] н т д. Справедлива Творе и з 3. Пусть фу»лини У(и), Гп(и), 1=1, з, принадлезкапс Сз (Еп и тако и, что граоиентм л (и), Р (и) функлип л (и) и гитрасы над фен»Чин Р (и) иэ (3] аоладал л~ разделгниыии разностлни сп (и, о), Р' (и, о), лрич, лс (Г(и, с)3 з]»0, ',Р'(и, о)3, 3)»0 (23! ари лет и о )сиЛ, »пах (; ср (и, о) —.Г' (о, в) „;, Р' (и, о)-Р' (о, в),) ( ( !. (!' и — о 1+]с о — в 1) (29) 267 при всех и, о, вы Н, Е =сонэ!»О, ! Р' (и) 1~ Е„(1-)-, и !), и гы Н, Ез = сопз!» О1 пусть последооательность (Оь) такова, что (Оь)аксая', а=О, 1, ..., с=сопя!»О! (30) кроме того, пусть выполнены условия 2) — 5) теорелгы 1 с заменой неравенства 1» 96 на неравенство 576(1+с)з(1-э+21-з) -! (31) еде число с взято из (30), ! — гриксированное положительное число, участвующее в неравенствах (!0).
Тогда погледовояьльность (оь), определяемая из (26), (27), сходится по норме Н к нормальному решению и, задачи минимизации г'(и) на множестве (1). До к аз а тельство. Положим в (28) 5=и — о. С учетом равенств (23), (24) получим (,!' (гг, о) (и — о), и — о) =(г" (и) — Л (о), и — о)» О, (Р' (и, о) (и-о), и — о) =(Р' (и) — Р' (о), и — о) =»0 при всех и, о ш Н. В силу теоремы 1 2 1 отсюда следует выпуклость функций г (и), Р (и) на Н. Отсюда и из (1), (3) получим, что множество У= (и гы Н: Р (и) =0) = (и ш Н: Р (и) 0) выпукло. Согласно теореме !.2.3 тогда У, выпукло. Из непрерывности функций г'(и), Р(и) в метрике Н следует, что У, замкнуто.
Конечно, еще надо оговорить, что множество У, непусто — это вытекает из существования седловой точки функции Лагранжа рассматриваемой задачи и теоремы !.2.7. Согласно теореме 1.3.8 сильно выпукяая функция (г(и) =,и Н2 на выпуклом замкнутом множестве У, достигает своей нижней грани в единственной точке и, гы У, Существование и единственность нормального решения задачи мийиыпзацин функции 7 (и) на множестве (1) установлено.
Далее, из условий (28) и формулы (25) следует, что (Ть(и, о)$, В)=(/'(и, о)5, В)+Аз(Р'(и, о)З, $)+ -(-аь(Ей, й)»аь",$ з пРи всех 5 ш Н, у=О, 1, ... (32) Покажем, что при всех и, о гы Н существует обратный оператор (Тз(и, о)), причем 1(Ть(и, о)) (=!/аы у=О, 1, ... (33) С этой целью возьмем произвольную точку вгыН и рассмотрим функцию 6ь(г)=(Ть(и, о)г,г)/2 — (в, г) переменной гшН. Так как 6» (г) = Тз (и, о), то неравенство (32) можно переписать в виде г(6ь (г) в, з)»аь" Ц'(з, г, а ш Н.
Согласно теореме 1.2 2 фуннция 6„(г) сильно выпукла йа Н, а по теореме !.3.8 достигает на Н своей нижней грани в единственной точке гз. В силу теоремы !.2.5 это возможно тогда и только тогда, когда 6ь (гь)= Ть (и, о) гь — в =О. Таким образом, уравнение Та (и, о) г=в при каждом в гы Н имеет н притом единственное решение г=гь, что равносильно существованию обратного оператора (Тз (и, о)) з. Полагая в (32) й=(Та (и, о))-'в, 286 приходим к оценке (33). Отсюда же следует, что при фикснройанных р„и «()») условия (25), (27) однозначно определяют последовательность (6»). Далее, нз (32) при 9=и — о с учетом формулы Т» (и, и) (и — и)=Т»(и) — Т» (о), и, о ен Н, (84) получим (Т» (и) — Т»(о), и — о))а»! и — о(з, и, вен Н. (35) Согласно теореме 1.2.2 функция Т»(и) сильно выпукла на Н и по теореме !.3.8 достигает на Н своей нижней грани в единственной точке и», причем Т»(и») О.
Из теоремы 8.2 (при 6» т»=е»=0, (7з Н), которая остается справедливон прн выполнении условий доказываемой теоремы, вытекает, что !!и» вЂ” и, !-ьО при й-ьсо. Тогда из неравенства (о» вЂ” и, )(!)о» вЂ” и»)+!!и» вЂ” и, 1! следует, что нам осталось убедиться в сйраведлнвости равенства !пп ((о» вЂ” и»,')=О.
» чь С этой целью введем последовательность а» =) Т» (о») ), й = О, 1, ... Имеет место неравенство а»„( 4 (а»,г/а») ) Т» (о»,) !+ +Й(и» вЂ” а»ы)+(з(1+)7)(А»+т — А»). й=О ! " (35) которое доказывается дословным повторением доказательства неравенства (15). Далее, из условия (29), формулы (25) с учетом неравенства А» ) 1 получаем ) Т»(и, и) — Т»(о, ю) )» (2У А»((и — о!(+ )о — ю)!), и, о, и ш Н. (37) Из формул (25), (27), оценки (33) и условия (30) следует 1, о» вЂ” о» )(сс»'а», /)о» вЂ” 6» ()(! 8» , 'а» са»иа»', (38) (о» г — 6» )/(а» ) Т»(6») )! ) о»»,— 6»)((! о» вЂ” о» /)+! 6» ! а»+ +2сс»' )! Т» (и») ) ( сг»~ (1+ с) а»+ сс»' «Т» (6») ) (39) С помощью формул (25), (34) можно написать следующее равенство Т»(6»)=Т»(о»)+Т» (6», о») (о» вЂ” о»)= =Г»~Г»Т» (о») — Т» (6», о»)Г»Т» (и») = =(Т» (о», 6») — Т» (6», о»)) Г»Т» (о»).
Отсюда с помощью оценок (33), (37), (38) имеем ! Т» (о») ) ( 2Е А» (!! 6» — о» )!+ ) о» вЂ” 6» !) и»'а» ( ~ 21.А» (!+с) а»тп»з. (40) Снова воспользуемся формулами (25), (34) и напишем равенство Т» (о»+,) = Т» (6»)+Т» (о»»м 6») (у»„— 6») = =(Т» (о», 6») — Т» (6», о»тт)+Т» (6», о»»т)— — Т» (о»»м 6») Г!Т» (6»). 1О Ф. П. Васильев 289 Отсюда с помо;пыо оценок (33), (37) — (40) получим )' Тд (од„,) ~! «21 Ад (, ид — од ! + 2, дд — оды -ф+„оды — од() ад' !' Тд (од);! « «!2!. Ад !1+с)" сед'ад (!+2адгад/.Аь). Г!одставим эту оценку в (Зб).
Учитывая условия (!0), для последова. тельности (ад) получим рекуррентное неравенство адд, «48Е'Ад (1+с)' ид'алтан (! +2ЕАдадгад ) + +(2/3) (Е/) 'ссдддАдды /г=О, 1, Тогда для последова~ел~ности сд= ад/ид, 4=0, 1, ..., имеем сд„«48ГгАдг(!+с)г адтсдг(!+2ЕАдидисд)+ +(2/3)(Ы/) 'ссд,,Ад+и й=О, 1, ... (41) Докажем по индукции, что сд«ад(АдЕ/) ', Д=О, 1, ... (42) При д=О справедливость оценки (42) следует из условия (1!).
Пусть (42) верно для некоторого д)0. Тогда из (4!) с учетом условий (9), (3!) илгеем сд т«48(!+с) / 'Е 'адАд' (1+2/ ')+2ад+д (ЗЕ/Адгл) '= =ад, (Ад+гй/) ' (48 (1+с)'(/ я+2/-г) (ид/ид,) (Ад+ /Ад)+2/3) « «ады (АдлгЕ/) ц Оиенка (42) доказана. Наконец, из неравенства (35) при и=од, о=ад с учетом условия Тд (ид) =0 получив ! од — ид ) «ад/ад = се «а дДАд/Л) -ь 0 при д -ь оп, что и требовалось Если задано какое-либо начальное приближение о„ и зафиксированы некоторые положительные /, с из условия (3!), то в качестве последовательностей (ад), (Ад), удовлетворяющих условиям теоремы 3 (или, иначе, условиям (8) — (!1)), можно еыбрать те же последовательности (18) с постоянными а, А, В из (19), (20).
4. Отдельно остановимся на случае (/ Н, когда в (!) ограничения уг (и) «О, у/(и)=0 отсутствуют. Теор е м а 4. Пусть 1) (/=Н, выполнены условия (2), л'(и) ы гж Сз(Н), градиент П (и) обладает разделенными оазностялги П (и, о) ири всех и, о гж Н, причем (Р (и, о) ~, в) ) О, в гн Н, (Х'(и, о) —,/' (о, ш) ) «С(!и — о,,'+", о-ш(), яри всех и, о, ш гж Н; /.=сапа! )0; 2) для нормального решения и„зидачи минимизации функции / (и) на Н известна априорная оценка (и 1,«с/; 290 3) числовые последовательности (иь), (Оь) таковы, что 1'пп ссг,=О,,' Оа (( сссь' а ьо 1 -- аь)иьчг(ш!и (2; 1+аь, г((2ЕЯ), й=О, 1, .„, где положительные постоянные с, 1 связаны неравенством 36 (1+ с)г (1-$+ 1-3) (1; (43) 4) начальное приближение о„для последовательности (оь), определяемой формулами (26), (27) для функции (21), и число аг удовлетворяют неравенству ЕГ,' е" (оь)-1-а„о„,' ( аь.
Тогда 11щ ' оь — и, "= О. ь сь Доказательство теоремы 4 получается из доказательства теоремы 3, если в последнем положить Р(и) =:- О, Аь= 1, я = О, 1, ..., и внести небольшие очевидные изменения В качестве (аь) здесь можно, например, взять последовательность (22), где Г берется из условия (43). Таким образом, регуляризания (итеративная или непрерывная) существенно расширяет возможности методов: регуляризованные методы позволяют строить мивимизируюшие последовательности, сходящиеся по норме ко множеству точек минимума, менее чувствительны к выбору начального приближения, и их сходимость удается доказать при меньших требованиях на исходные данные.
Заметим, наконеп, что в этой главе мы всюду пользовались штрафными функциями вида (3) Как показывают работы (64, 117), здесь возможно использование других классов штрафных функций, а также барьерных функций. ГЛАВА 3 АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ Численная реализация многих методов решения задач оптимального управления процессами, описываемыми системами обыкновенных дифференциальных уравнений нли уравнений с частными производными, невозможна без использования тех или иных методов приближенного решения возникающих здесь начально-краевых задач, приближенного вычисления встречающихся интегралов.
Для решения начально-краевых задач часто применяют такие методы, как разностный метод, метод конечных элементов, метод прямых, метод характеристик, методы Ритца или Галеркина и т. д., для приближенного вычисления интегралов используют формулы численного интегрирования [2, 32, 33, !53, 154, 190, 193 — 198~. В результате исходная задача оптимального управления заменяется некоторой последовательностью вспомогательных аппроксимирующих экстремальных задач. Здесь возникают естественные вопросы: будут ли сходиться решения вспомогательных экстремальных задач к решению исходной задачи, каким условиям должны удовлетворять аппроксимирующие экстремальные задачи для обеспечения сходимости? Аналогичные вопросы возникают, когда исходные данные— целевая функция и множество — известны с погрешностью. В этой главе мы ограничимся рассмотрением разностных аппроксимаций для простейших задач оптимального управления и, кроме того, приведем общие условия аппроксимации экстремальных задач.