Ф.П. Васильев - Методы решения экстремальных задач (1981) (1158203), страница 19
Текст из файла (страница 19)
Заметим, что дифференцируемость функции (1) в теореме 1 доказана при довольно жестких ограничениях на исходные данные задачи (1) — (3). На самом деле. формулу (18) с остаточным членом )г, )т ~'и 'ь,-эО, при 16!!ь,-~-О, можно получить при несколько меньших требованиях. Например, вместо условия (!0) можно требовать Ф (х) е= С'(Е"), а вместо условий (6) — (9) для производных ),', 1'„, ( = О, и, можно ограничиться условиями типа ~)',(х+Лх, и+8, () — )',(х, и, () ( (Е,'й ~т+о(~ Лх!), где 0<у(1, о(а)/а- 0 при а-~0. Существование производной Гато (см. определение 2.12) и производной по направлению функции (1) удается доказать еще при более слабых требованиях к данным задачам (1) — (3).
95. Заметим, что формулу градиента функции (1) иногда записывают в несколько ином виде: вместо функции (4) берут Н(х, и, 6 (()) =!и(х, и, О+()(х, и, (), ф), (20) сопряженную задачу (12), (13) заменяют на задачу Ф(!) = Нх(х~ и (, (р(()) !»= и, и), »=и(!) (о( С( Т, (21) Ф(Т) =(1)х(х) !»=»(т, и), (22) и тогда вместо формулы (11) будем иметь й'(и) = Ни(х, и ( Ф) )»=»(), и), и=ип), е=е((, и) (и -( Т.
(23) Нетрудно видеть, что функции Н и (()(1, и) и, следова- тельно, производная Ни из (4), (11) — (13) и (20) — (23) отличаются друг от друга лишь знаком. Пользуясь формулами (20) — (23), найдем градиент. в задаче (2.7) — (2.10), являющейся частным случаем за- дачи (1) — (3) прн )и=О, ) (х, и, () = А(() х+В(() и+)" (т), Ф (х) = / х — у ". Тогда Н (х, и, (, (р) = ((р, А (() х+ В (() и + + ) (()) = (Ат (() ф, х) +(Вт (1)(р, и) + (((), ) (()); сопря- женная задача имеет вид (р= — Н„= — А (()(р((), (о(((Т; (()(Т)=2(х(Т, и) — р), а градиент равен у'(и)=Вт(()(()(1, и), (и()(Т.
Как ' видим, получившиеся формулы совпадают с теми, кото- рые были выведены в 9 2. Для иллюстрации теоремы 1 приведем пример задачи оптимального управления для нелинейной системы. П р и м е р 1. Рассмотрим задачу об оптимальном успо- коении математического маятника (см. примеры 6.1.1 и 6.2.6 из 141): и»(и)=(х'(Т))'+(хх(Т))'=(х(Т)!'-и)п1; (24) х' (1) = хх (1), х' (() = — з(п х' (() — рх' (() + и ((), 0--((Т; (25) х (0) = (х'(0), х'(0)) = хи —— (хй, хй!); (26) и —.-(((1) я(»"-(.)((о, Т); (27) здесь момент Т ) О, постоянная 6, начальная точка хе считаются известными.
Задача (24) — (27) является частным 96 случаем затачи (1) — (3), когда ) =-О, Ф(х) =Ф(х', х') =- = (х')ь+ (хз)ь, )1(х, и, () =-хь, 1е (х, и, 1) = — з(ох~†— рх'+и, 1,=0, п= 2, г=-1. Все условия теоремы 1 для задачи (24) — (27) выполнены. Для вычисления градиента функции (24) составим функцию Гамильтона — Понтрягина Н (х, и, ф) =- ф,х'+ ф, ( — з1п х' — рх'+ и). Поскольку Н„, = — ф, соз х', Н; = ф, — ~фм Ф,. = 2х', Ф„~ = 2х', то сопряженная задача (21), (22) запишется в виде ф,=ф,созх'(1, и), ф,= — 'ф1+~фм 0~(~Т, ф,(Т)=2х" (Т, и), ф,(Т)=2х'(Т, и).
Так как Н„=ф,, то согласноформуле (23) градиентравен г" (и) = фз (1, и), 0 = ( ~ Т. 2. Имея формулу градиента, нетрудно расписать градиентный метод, методы проекции градиента, условного градиента — это делается так же, как было сделано в З 4 для задачи (4.1) — (4.3). Заметим, что в задаче (1) — (3) в общем случае, конечно, нельзя ожидать, что функция 7(я) = 7(и+ай) переменной а будет квадратным трехчленом, и поэтому параметр иь из условий типа (4.5), (4.22) будет определяться не так просто, как в задаче (4.1) — (4.3). Во многих теоремах о сходимости методов минимизации требуется, чтобы минимизируемая функция принадлежала классу С' ' (Н).
Приведем достаточные условия принадлежности Сгл (У) для функции (1) при условиях (2). Теорема 2. Пусть вьтолнены все условия теоремы 1 и (7=(и=и(1) ей!.,'(т„Т): и(1) я'г'(() почти всюду на 1(„Т]), где $'(1) — заданные множества из Е', причем зпр ацр (и(~Я(сю. н < ~:ц т ч ~ и (о Тогда )г" (и) — У'(о))с,(1.,)и — о)с„Е,=сопз1'=О, (28) и бых и, не=и. Доказательство. Возьмем произвольные и=и(1), о= о(1) еи(7.
Из оценки (15) для Лх(т) =х((, и) — х(1, о), 4 Ф, ГЬ васчльев 97 (о =1(Т, следует 1 Лх (Г) (с = п)ах > сох (() ' < Со( и — У )г, (29) с,<с< т Лалее, с учетом неравенства (14) имеем (.и. )(-Щ*,с-1)(. (., ). (.), )с Ц~ г ( Е )с( ,х (т, и) ' с(т + Ь ~ ! и (т) ! с(т+ ~ хо ~ + Си с. + зпр (~(0, О, ()~((Т вЂ” со)< с,<с<т ( Ь ~ ~ х (т, и) ) с(т + 1. (Т вЂ” (о)Р. + Со. Отсюда с помощью леммы 2.2 получим зпр ,'(х(с, и),'с -е~(г "(С,+Е(Т вЂ” (о))с) =С,. (30) иеУ Оценим,с()(1, и)(. С этой целью заметим, что (х((, и), и(1), () ен6=((х, и, Г) ен Е" х.Е'хД, Т):,(х(<С„!и(< со~ с' < Т) при всех и е= (с. Так как функции Ф„Д, )„г„непрерывны по совокупносги аргументов на замкнутом ограниченном множестве 6, то п)ах псах Ц Ф,,), (с'и~ !'Ги) (с'и(() =Со~со (31) Отсюда и из (!2), (13) имеем !)р(Г, и) '= Ф,(х(Т, и))+~ 1Г",'(х(т, и), и(т), т)— — ()и(х(т, и), и(т), (т))гф(т, и))с(т(< т '~ Со+Со(Т (о)+Со ~! сР(т, и) ~ с(т, Го=('< Т, Тогда из леммы 2.2 следует зпр ф (Г и),:!с (Со (1+ Т вЂ” Го) ес) (г-с)) С, (32) ияУ 98 Далее, оценим Лгр(1) =-ф(!, и) — гр(!', о), !а«(:.,= Т.
Из (12), (13), оценок (29) — (32) и условий (6), (Т), (10) имеем т ~ Лгр(1)!,,«,!Ф„(х(Т, и)) — Ф,. (х(Т, о)) )+~ (Д(х(т, и), и (т), т) — ~„' (х (т, о), о (т), т)',!(т + т +~ (~ ф(т, и) — ф(т, о) ~ ))".„(х(т, и), и(т), т) ~,'+ ! +(ф(т, о) (1)„(х(т, и), и(т), т) — ) (х(т, о), о(т), т) !) !(т« т «= ( ! Лх (Т) (+ Л ~ (~ Лх (1) ~ + ) и (1) — о (1) !) !(1+ и т +Се~ ~ф(т, и) — ф(т, о) ~!(т+ т + СгЕ ~ (! Лх Я !+ ! и (1) — о (1) () Ш « т «Сг~ ~ф(т, и) — ф(т, о))~й+С,г,',и — т (~„(о«(«Т.
Отсюда и из леммы 2.2 следует )ф(1, и) — гр((, о) )с«Сг,ес <т-!л(и — о)с,= = С„( и — о )с,. (33) Наконец, из формулы (11), оценок. (29) — (33) и условий (8), (9) получим требуемое неравенство (28): ),)'(и) — Г (о)(!у., = т = ~ ~Н„(х(1, и), и(1), 1, ф(1, и)) — Н„(х((, о), !. (1) 1 Ч (1 )) !г Ю!!г )т 1нг «У.(1+!1Я(1, и) !1с)Д (/ Лх(1)~+/и(() — о(() /)г!((~ + Й~ )т ~!/2 +С,((~Лф(()~ (1) (.,1 — ~,„и, о -=и.
Теорема 2 доказана. 3. Отдельно остановимся на одном частном случае задачи (1) — (3), когда система (2) линейна по х, и, т. е. х (Г) = А (1) х (Г) + В (Р) и (1) + Г (У), гь < 1-= Т, х (1,) = х„ (34) где А(1), В(г), 1(1) — заданные матрицы порядка пхп, пхг, пх! соответственно. Для задачи (1) — (3), (34) принадлежность классу Сгл (У) может быть установлена при меньших требованиях, чем в теореме 2, и, кроме того, удается сформулировать условия, гарантирующие выпуклость и сильную выпуклость функции (1).
Теорема 3. Пусть функции гь(х, и, 1), Ф(х) удовлетворяют условиям теоремы ! и матрицы А(1), В(Г), Г(!) кусочно непрерывны на отрезке 1Г„Т). Тогда функция (Ц при условиях (34) принадлежит классу Сгл на всем пространстве Ц[Гь, Т1 причем ее градиент Г(и) в точка и=и(1) ен Ц 1г„Т! вычисляется по формуле Г(и)=Г„"-(х(Г, и), и(1), 1) — Вп(1)ф(1, и), гь(Г(Т, (35) где х (1, и) — решение задачи (34), ф (1, и) — решение задачи ф(г)=~,'(х(1, и), и(1), г') — Аг(1)ф(1) (ь=-1-=Т; ъ'~(Т) = — Ф„(х(Т, и)). (36) Доказательство. В рассматриваемой задаче условия (6), (8), очевидно, выполнены. Далее, оценка (29) совпадает с ранее доказанной оценкой (2.!8). С помощью оценки (29), дословно повторяя доказательство теоремы 1, приходим к соотношениям (35), (36). Для Лф (1) = ф(1, «)— — ф(1, о) с учетом условий (7), (10), (36) будем иметь Ьф (г) ! ~ А вал ~ ! пф (т) ! с(т+ Е ! Лх (Т) ! + г + Ь ~ (~ Лх (1) (+ ! и (1) — о (1) !) д(.
Отсюда и из леммы 2.2 следует опенка (33). Наконец, из формулы (35) и условия (9) с учетом оценок (29), (33) 100 получим ,',,l' (и) — Г (о)[с, ~ ~т !!/г ~~~![1(х(1, и), и(С), 1) — [1(х(1, о), о(1), (!)ос(1) + !т ~ пг +В.„~~!ф(1, и) ф((, о)!гд!) Укажем достаточные условия выпуклости и сильной выпуклости функции (Ц при условиях (34), кратко обсудим условия оптимальности в задаче (1) — (3), (34). Теорема 4. Пусть матрицы А (С), В(!), !'(С) кусочно непрерывны на отрезке [йь Т), функция Ф (х) выпукла на Е", а то(х, и, () выпукла по совокупности переменных (х, и), т.
е. [о (ах+ (1 — а) у, сои + (1 — а) о, 1) ( ~а[о(х и ()+(! — а)[о(у о, () (37) при всех (х, и, (), (у, о, 1) енЕокЕ'х[1„Т1, 0(а-=.1, и, кроме того, T(х((), и(!), !) онЕ,[(„Т! при каждой непрерывной функции х (!), !о((( Т, и (() еп Ь; [~о, Т) Тогда функция (1) при условиях (34) будет определена и выпукла на Ь,'[(„Т~.
Если при этом функции [о(х, и, !), Ф(х) удовлетворяют условиям теоремы 1, то функция (1) при условиях (34) достигает своей нижней грани на всяком выпуклом замкнутом ограниченном множестве У с: Е.,[!о, Т) причем для оптимальности управления и„= ио (!) е= У необходимо и достаточно выполнение неравенства т ~ (7„'(х ((, и ), и (1), !)— и — В (()ф((, ио), и(() — и (())с(!)О (38) при всех и(!) ен У. Если и — внупгренняя точка множества (7, то условие (38) равносильно условию )о(х(1, и,), и,(1), !) — В (игр(1, и„)=0, !о-=(=-Т. (39) Если же вместо (37) справедливо неравенство [о (ах + (1 — а) у, аи+ (1 — а) о, !) ( ~а[о(х и !) 1 (1 а)[о(у о т) а(1 сс)я!и о!о х= — сопз1)0 (40) !О! при всех и, 0(а(1, (х, и, г), (у, о, () ен Е" хЕ" х[йь Т) то функция (1) при условиях (34) является сильно выпуклой на Ц[гь, Т'1 и будет достигиепь свогй нижней грани на любом вьнуклом замкнутом множестве (I: — Е.,[~ь, Т) причем оптимальное управление единственно.
Показательство. В 4 2 было доказано, что решения задачи (34) обладают свойством х(С, аи+(1 — а) о) с ах(1, и)+(1 — а)х(1, о) при всех и, о яЦ[ть, Т'1 и аен [О, 11. Тогда выпуклость (сильная выпуклость) функции (1) при условиях (34) является простым следствием выпуклости Ф(х) и условия (37) (условия (40)). Остальные утверждения теоремы вытекают из теорем 2.6, 3.6, 3,8. Пр имер 2. Пусть требуетсяминимизироватьфункцию г ,) (и) = — ~ ( ' (1) + и' Я) а( ь при условиях х(() = — ах(1)+и(Р), 0((( Т; х(0) =х,; и=и(1) енЬ,[0, Т~=(7, где а, х„Т) 0 — заданные числа. Эта задача является частным случаем задачи (1) — (3), (34) при )ь=(х'+и')/2, бз(х) — О, )= — ах+и, п=г=1 и к ней применимы теоремы 1 — 4.