Ф.П. Васильев - Методы решения экстремальных задач (1981) (1158203), страница 18
Текст из файла (страница 18)
Пусть функции Х(и), д;(и), 1=1, в, определены на множестве Б„а последовательность (ид) определена из условий (45) — (48). Тогда ! пп У (ид) ч=! нп Фд (ид) = 1нп Фд, (,) . (49) д са д со д ж Если, кроме того, / = 1п12 (и) - — со, то и, Рд(и)=0(Ад'), )г=1, 2, ..., (50) ПшУ;(ид)~0, ~'=), т! 1ппуй(ид)=0, (=т+1,в. (51) д ж д оэ Доказательство атой теоремы проводится дословно так же, как и теоремы 5.12.! из !41. В у 5.12 !41 приведен пример, показывающий, что в (49) неравенства могут быль строгими. Теорема 8. Пусть Уь — выпуклое замкнутое множество из рефлексивного банахова пространства В, функции г'(и), д,(и), ..., д (и), !д,т(и)!, ..., !д,(и)! слабо полу- непрерывны снизу на Уь (например, эти функции выпуклы и полунепрерывны снизу в метрике В), Х =ьп( г' (и)'- — со; и.
множеспмо ()(6)=!иеп Уь' д;(и)«6, 1=1, т; !д,(и)) «6, (=т+.1, з) еьтукло и ограничено при некогпором 6) О. Тогда последовательность (иь), определенная условиями (45) — (48), слабо в В сходится к У.„, и, кроме того, 1!ш /(и,) = ),. ь со Д о к а з а т е л ь с т в о. При сделанных предположениях для (и,) соотношения (49) — (51) сохраняют силу. Из (5!) следует, что иь ~ У(б) при всех )г)йп Однако согласно теореме 3.4 множество () (6) слабо компактно.
Тогда существует хотя бы одна точка о„~ У (б), к которой слабо сходится некоторая подпоследовательпость (иь ). В силу слабой полунепрерывности снизу указанных в теореме функпий и соотношений (51) имеем рд(о„) «1ип ©(и, )«!пп рд(иь)«О, 1=1, т', ь са !дс(о,) ! «1пп !рд(иь„) / «=.11ш !дс(иь)' ,=О, К=т1-1, з. Г ОР Это значит, что о„спи. Тогда с учетом (49) получаем /„«г' (о „) =.!(ш г (иь ) «1пп ) (иь) «У„,, г и ь сю так что У(о,)=1пп У(иь)=У, или о, епУ,, =о Таким образом, показано, что любая точка о.„являющаяся слабым пределом какой-либо подпоследовательности (иь ), принадлежит У, и!!ш У(иь )= У„. Отсюда следует, г Ю что (и„) сходится к множеству (), слабо в В и )пп г' (и„) = У„,.
ь со Доказанная теорема является аналогом теоремы 5.12,2 из (4). Читателю предлагаем самостоятельно исследовать возможность обобщения других теорем из 9 5.12 14) на случай банаховых пространств. Для иллюстрации метода штрафных функций рассмотрим зэдачу (1) — (3) при дополнительных фазовых ограничениях вида !о---.(=Т, 1=1, ~п; т=-п, (52) а; х'(1, и) =-Ь;, или х'(Т, и)=х~, 1=1, э', з(п, (53) где аь Ь;, х, '— заданные числа. Для учета ограничений (52) можно взять штрафную функцию !и 7 Р»(и) =А» '», '~ !(шах )х'((, и) — Ь;; 01)'+ ~=! и +(шах (а; — х'((, и); 0)!" а!1, где А») О, !пп А»= +ос; ограничения (53) можно учесть с помощью штрафной функции Р» (и) = А» ~х~ ~(х' (Т, и) — х|), й = 1, 2, ... Тогда задача (1) — (3), (52) или (53) сведется к решению последовательности задач минимизации функции ср»(и)=)х(Т, и) — у!»+Р»(и), Ь=1, 2,, (54) при условиях (2), (3).
Вопрос о том, как определить градиент функции (54) при условиях (2), (3) и как минимизировать функцию (54), будет обсужден в следующем параграфе. 9. Предлагаем читателю самостоятельно дать обобщения методов множителей Лагранжа, барьерных и нагруженных функций из Я 5,11, 5.13, 5.!4 (4) на случай задач минимизации на множествах из гильбертовых или банаховых пространств, исследовать сходимость этих методов. Заметим, что в ряде приведенных выше теорем о сходимости методов (см., например, теоремы 1 — 3) сильная (по норме) сходпчость указанных в них минимнзируюгцих последоьигсльностей гараитирустся лишь для сильно 90 выпуклых функций; если же минимизируемая функция не является сильно выпуклой, то эти последовательности будут сходиться к множеству точек минимума, вообще говоря, лишь слабо.
О том, как нужно видоизменять методы минимизации для получения сильно сходящихся минимизирующих последовательностей, речь пойдет в следующей главе. У п р аж не н и я. 1. Пусть У=(и(!)=(ит(!), ..., и'(!)) ы ~н ь'~!ы т): и (!) )О почти всюду нв отрезке 1в(1~ т, 1=1, г!). Найти проекцию любой точки из 5'1'Гв, Тт на множество У. Описать метод проекции градиента для задачи (!) — (3) с этим множеством. 2. Описать метод сопряженных градиентов для задачи (!) — (3) при У =!.г(!в, Т1 3.
Описать градиентный метод, методы проекции градиента, условного градиента, сопряженных направлений для задач минимиаации функций т ,!(в)=~я(Т, и) — у,'-"+а) (и(1),'об а=сопя!)О, ь т У(и)=( ~х(б и) — уб) Рж, у(!) ~й,в(1„, т( т Х(и) = ~ ~ х(1, и) — у (!),'э и!+а ~ ~ и (!),' от, а = сопэ1 ) О при условиях (1) — (3). Исследовать сходимость методов. 4. Описать метод возможных направлений для задачи (31) в предпологкении, что и ~ Н вЂ гильберто пространство, взяв во вспомогательной задаче (32) поиска возможного направления убывания условие нормировки (е (= 1. 5. Описать градиентны метод, методы проекции градиента, условного градиента, сопряженных направлений для задач минимизации функций из примеров 2.! — 2.4, счнтая, что и ы Н, Н вЂ гильбертово пространство (в случае примера 2.4 Н р- йэ(а, Ь)). Рассмотреть случаи, когда У = Н, или У вЂ ш или гиперплоскость в Н. 6.
Сформулировать и доказать теоремы сходимости методов барьерных, нагруженных функций иэ 45 5.13 — 5.14 (4) для множества из гильбертовых пространств. 9 5. Градиент в задаче оптимального управления со свободным правым концом рассмотрим следующую задачу оптимального управления: минимизировать функцию т .I(и)= ~)о(х(!), и(!), !)+!Э(х(Т)) (1) 91 при условиях х(1)=)(х(1), и(1), 1), 1о(Р =.Т; х((а)=х„(2) и= и(л') е=Н ы Ел[1», Т), (3) где х = (х', х', ..., х"), и = (и', ..., и'), функции Г"'(х, и, 1), [(х, и, 1) = (Р (х, и, 1), ..., Г'" (х, и, 1)), Ф (х) переменных (х, и,() енЕ»хЕ'м[(„Т) считаются известными, У вЂ” заданное множество из Е;[(„Т), моменты времени („Т и начальная точка хл заданы.
Определение решения (пли траектории) х=х(1) =х(1, и), 1,~Л(Т, задачи Коши (2), соответствующего управлению и=-и(1) ~1,'л[1„Т), а также условия его существования обсуждались в гл. 6 из [4) (см. теорему 6.1.1 [4)); там же был доказан принцип максимума для задачи (1) — (3) (ель 5 6.3 из [4)). 1. Ниже будут сформулированы достаточные условия дифференцируемости функции (1) на Ц[1„Т) и получена формула для ее градиента.
Примем обозначения х (!», )» [»= ! г 1=0,п; Ф»= дР Здесь ),, = — — частная производная функции /' по дхУ переменной х), Т вЂ” знак транспонирования матрицы. Напол~нилц что нормой матрш!ы А=(ац, ( —— 1, и; 1=1, ш) порядка пхи называется число ',А(=зир(Аг(а», где верхняя грань берется по единичному шару !г,'аж=--1. Справедливо неравенство,' Аг (в ~ ';, А ! ( г , 'а~ при всех генЕ'". Введем знаколлую нам по гл. 6 из [4) функцию Гамильтона — Понтрягина Н (х, и, 1, ф) = — /л (х, и, 1) + () (х, и, 1), ф), (ф)г = (фл, 'Фл ", 1Р») 99 Обозначим Теорема 1. Пусть функции )', ~, Ф непрерывны по совокупности своих аргументов вместе со своими частными производными по переменным х, и при (х, и, () е= ~ Е" х Е' х ()ы Т) и, кроме того, выполнены следующие условия: ! ~ (х+ Лх, и + Ь, () — 7'(х, и, 1) ~ ==. Е (~ Лх '+ / Ь /), (5) )7„(х+Лх, и+Ь, () — ~„(х, и, 1)(~Е(~Лх/+)Ь~), (6) / („" (х+ Лх, и+ Ь, 1) — 7,' (х, и, 1К = Е (/ Лх /+ / й !), (7) 17„(х+ Лх, и+Ь, () — 1„(х, и, 1)1~! (~ Лх /+,'й /), (8) ! Д (х+ Лх, и+ Ь, 1) — Д (х, и, 1) ~ ( Е ( ,'Лх !+ / Ь ~), (9) /Ф„(х+Лх) — Ф,(х)/(У.'Лх~ (10) при всех (х+Лх, и+Ь, )), (х, и, 1) ~ Е" хЕ'х((„Т~, где Е = сопз1 ) О.
Тогда функция (1) при условиях (2) непрерывна и диф. феРенЦиРУеми по и = и (1) в ноРме Ц (гь, Т) всюдУ на Ц((ы Т), причем ее градиент Г(и)=/'(и, 1)е=Ез((ь, Т~) в точке и =и(1) представим в виде в'(и) = — Н„(х, и, (, ~Р) ~,=,о ю „=щп ч ва ю = = )„' (х (1, и), и (1), () — д, (х ((, и), и (1), 1)) г $ ((, и), го ~ ( ~ Т (11) где х (1) = х (1, и), 1, ~ г ( Т, — решение задачи (2), соответствующее управлению и=и((), а ~р(() =ф((, и), )ь( (((Т, является решением сопряженной системы ф(1) = — Н,(х, и, 1, зр(1)) к=хи, ю, и=иц) = = )", (х ((, и), и (1), () — (7„(х (г, и), и ((), 1)) ' чр ((), ~0~(» 7 ~ (12) при начальных условиях $(Т) = — Ф„(х)~,= <т, ии (13) Д о к а з а т е л ь с т в о. Пусть и =и (1), и+ Ь = и (1) + +Л(1) я(;(1м Т', а х((, п), х((, и+Ь) (в(((Т,— соответствующие зтим управлениям решения задачи (2). 83 Из условия теоремы следует !7 (х, и, 1) ! «! [ (х, и, 1) — ) (О, О, 1) !+ ! 7 (О, О, 1) ! « «Е(!х!4 !и,,)+ знр !)(О, О, 1)!, (х, и, 1)енЕ" хЕ" х[1о, Т) и:сс~т ,'14) Отсюда и из теоремы 6.1.1 [4[ и замечания 2 к ней сле- дует существование и единственность решения задачи (2) при всех и=и(с) ецио[с„Т1.
Обозначим Лх(() = х (Г, и+ Ь) — х (с, и), го»1«Т. В 5 6.3 из [4] было установлено (см. оценку (6.3.13)), что т !Лх(()!«С,$ !Ь(1)!сй«С,(Т вЂ” Го)сс'~)Ь)с„ со 10 «1 «Т (16) здесь и ниже через фф... будем обозначать константы, не зависящие от выбора и= и(1) сна',[с„Т). Кроме того, в ~ 6.3 [4) было получено следующее представление для приращения функции (1) (см. фор- мулу (6.3.17) из [4)): Ы (и) = с'(и+Ь) — У(и) = т = — ~ [Н(х(1), и(1)+Ь(1), 1, ф(())— с, — Н (х (1), и (с), с, ф (1)) с(с+ стс+ Яо, (16) тде ссс = (Ф„(х (Т) + чс Лх (Т) ) — сР„(х (Т)), Лх (Т) ), т Ро= — )(Н„(х+восох, и+Ь, с, ф) — Н„.(х, и, Г, ф), сох) с(с, сь причем ст '2 !)тс+ сто ! «Со 1 ! Ь (() с(Г ) «Со (Т вЂ” 10) $Ь[1,.
(17) ср С помощью формулы конечных приращений имеем Н(х, и+Ь, Г, ф) — Н(х, и, г, ф) =(Н„(х, и+ВоЬ, 1, ф), Ь), 0«йо«1. Подставим это равенство в (16) и получим т со,с'(и)= — ~ (Н„(х((), и(с), с, ф(1)), )с(с))с(с+Я, (18) где й = й, + Р,+ й„величины )(и й, определены выше, а г Я,= — ~ (Н„(х, и+О,й, г, ф) — Н„(х, и, (, ф), Ь(()) г(Е Так как Н„= — 1ц+(гр) ф, то с учетом условий (8), (9) и оценки (15) имеем 1 т !)са!==-((+ зцр,ф(г, и)!~г.~(!лх(0~',й())!+ п<г< г 1 +!и((), ) г(( С ';;й|,. Суммируя оценки для йп Я„ )га, получим т ~г~. С,~~Ь((),'((=С, й(ь„с (19) Из формулы (18) и оценки (19) следует дифференцируемость функции (1) и формула (11) для градиента. Теорема доказана. Таким образом, для вычисления градиента функции (1) прн условиях (2) нужно последовательно решить две задачи Коши: сначала из задачи (2) нужно определить х((, и), затем из (12), (13) ф((, и) и, наконец, по формуле (1!) найти искомый градиент. При решении упомянутых задач Коши (2) и (12), (13) можно использовать различные приближенные методы !2, 32, 81, 153, 193, 194!.