Ф.П. Васильев - Методы решения экстремальных задач (1125244), страница 18
Текст из файла (страница 18)
Напол~нилц что нормой матрш!ы А=(ац, ( —— 1, и; 1=1, ш) порядка пхи называется число ',А(=зир(Аг(а», где верхняя грань берется по единичному шару !г,'аж=--1. Справедливо неравенство,' Аг (в ~ ';, А ! ( г , 'а~ при всех генЕ'". Введем знаколлую нам по гл. 6 из [4) функцию Гамильтона — Понтрягина Н (х, и, 1, ф) = — /л (х, и, 1) + () (х, и, 1), ф), (ф)г = (фл, 'Фл ", 1Р») 99 Обозначим Теорема 1. Пусть функции )', ~, Ф непрерывны по совокупности своих аргументов вместе со своими частными производными по переменным х, и при (х, и, () е= ~ Е" х Е' х ()ы Т) и, кроме того, выполнены следующие условия: ! ~ (х+ Лх, и + Ь, () — 7'(х, и, 1) ~ ==. Е (~ Лх '+ / Ь /), (5) )7„(х+Лх, и+Ь, () — ~„(х, и, 1)(~Е(~Лх/+)Ь~), (6) / („" (х+ Лх, и+ Ь, 1) — 7,' (х, и, 1К = Е (/ Лх /+ / й !), (7) 17„(х+ Лх, и+Ь, () — 1„(х, и, 1)1~! (~ Лх /+,'й /), (8) ! Д (х+ Лх, и+ Ь, 1) — Д (х, и, 1) ~ ( Е ( ,'Лх !+ / Ь ~), (9) /Ф„(х+Лх) — Ф,(х)/(У.'Лх~ (10) при всех (х+Лх, и+Ь, )), (х, и, 1) ~ Е" хЕ'х((„Т~, где Е = сопз1 ) О.
Тогда функция (1) при условиях (2) непрерывна и диф. феРенЦиРУеми по и = и (1) в ноРме Ц (гь, Т) всюдУ на Ц((ы Т), причем ее градиент Г(и)=/'(и, 1)е=Ез((ь, Т~) в точке и =и(1) представим в виде в'(и) = — Н„(х, и, (, ~Р) ~,=,о ю „=щп ч ва ю = = )„' (х (1, и), и (1), () — д, (х ((, и), и (1), 1)) г $ ((, и), го ~ ( ~ Т (11) где х (1) = х (1, и), 1, ~ г ( Т, — решение задачи (2), соответствующее управлению и=и((), а ~р(() =ф((, и), )ь( (((Т, является решением сопряженной системы ф(1) = — Н,(х, и, 1, зр(1)) к=хи, ю, и=иц) = = )", (х ((, и), и (1), () — (7„(х (г, и), и ((), 1)) ' чр ((), ~0~(» 7 ~ (12) при начальных условиях $(Т) = — Ф„(х)~,= <т, ии (13) Д о к а з а т е л ь с т в о.
Пусть и =и (1), и+ Ь = и (1) + +Л(1) я(;(1м Т', а х((, п), х((, и+Ь) (в(((Т,— соответствующие зтим управлениям решения задачи (2). 83 Из условия теоремы следует !7 (х, и, 1) ! «! [ (х, и, 1) — ) (О, О, 1) !+ ! 7 (О, О, 1) ! « «Е(!х!4 !и,,)+ знр !)(О, О, 1)!, (х, и, 1)енЕ" хЕ" х[1о, Т) и:сс~т ,'14) Отсюда и из теоремы 6.1.1 [4[ и замечания 2 к ней сле- дует существование и единственность решения задачи (2) при всех и=и(с) ецио[с„Т1. Обозначим Лх(() = х (Г, и+ Ь) — х (с, и), го»1«Т. В 5 6.3 из [4] было установлено (см.
оценку (6.3.13)), что т !Лх(()!«С,$ !Ь(1)!сй«С,(Т вЂ” Го)сс'~)Ь)с„ со 10 «1 «Т (16) здесь и ниже через фф... будем обозначать константы, не зависящие от выбора и= и(1) сна',[с„Т). Кроме того, в ~ 6.3 [4) было получено следующее представление для приращения функции (1) (см. фор- мулу (6.3.17) из [4)): Ы (и) = с'(и+Ь) — У(и) = т = — ~ [Н(х(1), и(1)+Ь(1), 1, ф(())— с, — Н (х (1), и (с), с, ф (1)) с(с+ стс+ Яо, (16) тде ссс = (Ф„(х (Т) + чс Лх (Т) ) — сР„(х (Т)), Лх (Т) ), т Ро= — )(Н„(х+восох, и+Ь, с, ф) — Н„.(х, и, Г, ф), сох) с(с, сь причем ст '2 !)тс+ сто ! «Со 1 ! Ь (() с(Г ) «Со (Т вЂ” 10) $Ь[1,.
(17) ср С помощью формулы конечных приращений имеем Н(х, и+Ь, Г, ф) — Н(х, и, г, ф) =(Н„(х, и+ВоЬ, 1, ф), Ь), 0«йо«1. Подставим это равенство в (16) и получим т со,с'(и)= — ~ (Н„(х((), и(с), с, ф(1)), )с(с))с(с+Я, (18) где й = й, + Р,+ й„величины )(и й, определены выше, а г Я,= — ~ (Н„(х, и+О,й, г, ф) — Н„(х, и, (, ф), Ь(()) г(Е Так как Н„= — 1ц+(гр) ф, то с учетом условий (8), (9) и оценки (15) имеем 1 т !)са!==-((+ зцр,ф(г, и)!~г.~(!лх(0~',й())!+ п<г< г 1 +!и((), ) г(( С ';;й|,. Суммируя оценки для йп Я„ )га, получим т ~г~. С,~~Ь((),'((=С, й(ь„с (19) Из формулы (18) и оценки (19) следует дифференцируемость функции (1) и формула (11) для градиента. Теорема доказана.
Таким образом, для вычисления градиента функции (1) прн условиях (2) нужно последовательно решить две задачи Коши: сначала из задачи (2) нужно определить х((, и), затем из (12), (13) ф((, и) и, наконец, по формуле (1!) найти искомый градиент. При решении упомянутых задач Коши (2) и (12), (13) можно использовать различные приближенные методы !2, 32, 81, 153, 193, 194!. Заметим, что дифференцируемость функции (1) в теореме 1 доказана при довольно жестких ограничениях на исходные данные задачи (1) — (3). На самом деле. формулу (18) с остаточным членом )г, )т ~'и 'ь,-эО, при 16!!ь,-~-О, можно получить при несколько меньших требованиях.
Например, вместо условия (!0) можно требовать Ф (х) е= С'(Е"), а вместо условий (6) — (9) для производных ),', 1'„, ( = О, и, можно ограничиться условиями типа ~)',(х+Лх, и+8, () — )',(х, и, () ( (Е,'й ~т+о(~ Лх!), где 0<у(1, о(а)/а- 0 при а-~0. Существование производной Гато (см.
определение 2.12) и производной по направлению функции (1) удается доказать еще при более слабых требованиях к данным задачам (1) — (3). 95. Заметим, что формулу градиента функции (1) иногда записывают в несколько ином виде: вместо функции (4) берут Н(х, и, 6 (()) =!и(х, и, О+()(х, и, (), ф), (20) сопряженную задачу (12), (13) заменяют на задачу Ф(!) = Нх(х~ и (, (р(()) !»= и, и), »=и(!) (о( С( Т, (21) Ф(Т) =(1)х(х) !»=»(т, и), (22) и тогда вместо формулы (11) будем иметь й'(и) = Ни(х, и ( Ф) )»=»(), и), и=ип), е=е((, и) (и -( Т. (23) Нетрудно видеть, что функции Н и (()(1, и) и, следова- тельно, производная Ни из (4), (11) — (13) и (20) — (23) отличаются друг от друга лишь знаком.
Пользуясь формулами (20) — (23), найдем градиент. в задаче (2.7) — (2.10), являющейся частным случаем за- дачи (1) — (3) прн )и=О, ) (х, и, () = А(() х+В(() и+)" (т), Ф (х) = / х — у ". Тогда Н (х, и, (, (р) = ((р, А (() х+ В (() и + + ) (()) = (Ат (() ф, х) +(Вт (1)(р, и) + (((), ) (()); сопря- женная задача имеет вид (р= — Н„= — А (()(р((), (о(((Т; (()(Т)=2(х(Т, и) — р), а градиент равен у'(и)=Вт(()(()(1, и), (и()(Т.
Как ' видим, получившиеся формулы совпадают с теми, кото- рые были выведены в 9 2. Для иллюстрации теоремы 1 приведем пример задачи оптимального управления для нелинейной системы. П р и м е р 1. Рассмотрим задачу об оптимальном успо- коении математического маятника (см. примеры 6.1.1 и 6.2.6 из 141): и»(и)=(х'(Т))'+(хх(Т))'=(х(Т)!'-и)п1; (24) х' (1) = хх (1), х' (() = — з(п х' (() — рх' (() + и ((), 0--((Т; (25) х (0) = (х'(0), х'(0)) = хи —— (хй, хй!); (26) и —.-(((1) я(»"-(.)((о, Т); (27) здесь момент Т ) О, постоянная 6, начальная точка хе считаются известными.
Задача (24) — (27) является частным 96 случаем затачи (1) — (3), когда ) =-О, Ф(х) =Ф(х', х') =- = (х')ь+ (хз)ь, )1(х, и, () =-хь, 1е (х, и, 1) = — з(ох~†— рх'+и, 1,=0, п= 2, г=-1. Все условия теоремы 1 для задачи (24) — (27) выполнены. Для вычисления градиента функции (24) составим функцию Гамильтона — Понтрягина Н (х, и, ф) =- ф,х'+ ф, ( — з1п х' — рх'+ и). Поскольку Н„, = — ф, соз х', Н; = ф, — ~фм Ф,. = 2х', Ф„~ = 2х', то сопряженная задача (21), (22) запишется в виде ф,=ф,созх'(1, и), ф,= — 'ф1+~фм 0~(~Т, ф,(Т)=2х" (Т, и), ф,(Т)=2х'(Т, и). Так как Н„=ф,, то согласноформуле (23) градиентравен г" (и) = фз (1, и), 0 = ( ~ Т.
2. Имея формулу градиента, нетрудно расписать градиентный метод, методы проекции градиента, условного градиента — это делается так же, как было сделано в З 4 для задачи (4.1) — (4.3). Заметим, что в задаче (1) — (3) в общем случае, конечно, нельзя ожидать, что функция 7(я) = 7(и+ай) переменной а будет квадратным трехчленом, и поэтому параметр иь из условий типа (4.5), (4.22) будет определяться не так просто, как в задаче (4.1) — (4.3). Во многих теоремах о сходимости методов минимизации требуется, чтобы минимизируемая функция принадлежала классу С' ' (Н). Приведем достаточные условия принадлежности Сгл (У) для функции (1) при условиях (2).
Теорема 2. Пусть вьтолнены все условия теоремы 1 и (7=(и=и(1) ей!.,'(т„Т): и(1) я'г'(() почти всюду на 1(„Т]), где $'(1) — заданные множества из Е', причем зпр ацр (и(~Я(сю. н < ~:ц т ч ~ и (о Тогда )г" (и) — У'(о))с,(1.,)и — о)с„Е,=сопз1'=О, (28) и бых и, не=и. Доказательство. Возьмем произвольные и=и(1), о= о(1) еи(7. Из оценки (15) для Лх(т) =х((, и) — х(1, о), 4 Ф, ГЬ васчльев 97 (о =1(Т, следует 1 Лх (Г) (с = п)ах > сох (() ' < Со( и — У )г, (29) с,<с< т Лалее, с учетом неравенства (14) имеем (.и. )(-Щ*,с-1)(. (., ).
(.), )с Ц~ г ( Е )с( ,х (т, и) ' с(т + Ь ~ ! и (т) ! с(т+ ~ хо ~ + Си с. + зпр (~(0, О, ()~((Т вЂ” со)< с,<с<т ( Ь ~ ~ х (т, и) ) с(т + 1. (Т вЂ” (о)Р. + Со. Отсюда с помощью леммы 2.2 получим зпр ,'(х(с, и),'с -е~(г "(С,+Е(Т вЂ” (о))с) =С,. (30) иеУ Оценим,с()(1, и)(. С этой целью заметим, что (х((, и), и(1), () ен6=((х, и, Г) ен Е" х.Е'хД, Т):,(х(<С„!и(< со~ с' < Т) при всех и е= (с. Так как функции Ф„Д, )„г„непрерывны по совокупносги аргументов на замкнутом ограниченном множестве 6, то п)ах псах Ц Ф,,), (с'и~ !'Ги) (с'и(() =Со~со (31) Отсюда и из (!2), (13) имеем !)р(Г, и) '= Ф,(х(Т, и))+~ 1Г",'(х(т, и), и(т), т)— — ()и(х(т, и), и(т), (т))гф(т, и))с(т(< т '~ Со+Со(Т (о)+Со ~! сР(т, и) ~ с(т, Го=('< Т, Тогда из леммы 2.2 следует зпр ф (Г и),:!с (Со (1+ Т вЂ” Го) ес) (г-с)) С, (32) ияУ 98 Далее, оценим Лгр(1) =-ф(!, и) — гр(!', о), !а«(:.,= Т.
Из (12), (13), оценок (29) — (32) и условий (6), (Т), (10) имеем т ~ Лгр(1)!,,«,!Ф„(х(Т, и)) — Ф,. (х(Т, о)) )+~ (Д(х(т, и), и (т), т) — ~„' (х (т, о), о (т), т)',!(т + т +~ (~ ф(т, и) — ф(т, о) ~ ))".„(х(т, и), и(т), т) ~,'+ ! +(ф(т, о) (1)„(х(т, и), и(т), т) — ) (х(т, о), о(т), т) !) !(т« т «= ( ! Лх (Т) (+ Л ~ (~ Лх (1) ~ + ) и (1) — о (1) !) !(1+ и т +Се~ ~ф(т, и) — ф(т, о) ~!(т+ т + СгЕ ~ (! Лх Я !+ ! и (1) — о (1) () Ш « т «Сг~ ~ф(т, и) — ф(т, о))~й+С,г,',и — т (~„(о«(«Т.