Алексеев В.М., Тихомиров В.М., Фомин С.В. - Оптимальное управление (1050536), страница 53
Текст из файла (страница 53)
Положение спасают простые топологические соображения, основанные на компактности. Применяя «лемму о центрированиой системе», мы можем выбрать «универсальные» множители Лагранжа, пригодные для всего множества иголок. А) Существование «универсальных» множителейл ей Л а г р а нж а. Изучим подробнее условия (8) — (13) п. 4 2.4, внеся в них значения производных функций Р, и Ч'„вычисленные при помощи двух лемм п.
4.2.3, и уделяя особое внимание членам, в которые входят параметры иголок (т„, о»). Производные функций Р; даны прямо в' лемме об интегральных функционалах и, обозначив Аг(т, о) =-1;(т, х(т), о) — 1',(т, х(т), й(т))— — рм(т)~«р(т, х(т), о) — ч (т, х(т), й(т)1= =ЬГ(т, о) — рм(т) Ь<р(т, о), мы видим, что г1а» =Ау(т»1 о») а ии в одну из остальных производных параметры иголок ие входят, так что эти производные имеют одно и то же значение для любого «пакета иголок» п.
4.2.3. Аналогично производные функций Ч',(1„(„х„, а) =ф,(1„х„(о х(1„1„х„а, т, о)) вычисляются по теореме о суперпозиции и лемме о пакете иголок, причем от параметров иголок зависят лишь Ч",„. Если обозначить '8~ (т4 о) Д (Го~ х(Г») (1 х(1~)) 12 (Го т) ~ф(т> х(т), о)— — Ч>(т х(т), Й(т))1' =ф,,»«(го т) Аср(т, о), (2) то Ч'«„=В,(т,, о,), а значения производных Ч'ио Ч',и, Ч«„, одни и те же для любого «пакета иголок». 329 Теперь имеем Л. = Х Л,р,. + Х Лч ° +р,= о=о ' " =е =,У', Л,(А,(т„, и„)+В;(тм и„))+Р».
и=о Поскольку, согласно условиям (12) и (11) п. 4.2.4, р„ ~ 0 н Ле„ =-О, должны выполняться неравенства ~ Л,~А,(т,, ие)+В,(т, и,)~=ьО. (3) о=о Рассмотрим теперь в пространстве К'"+'и следующие множества: лз ((Л Ла) ~ Х Л~ 1Ь ю=о К(т, и) =((Л, Ле)( ~~'„, 'Ле(А, (т, и)+В;(т, и))) О), ,=е Т,=((Л, Л,)~Х Л,(Р„, +Ч„,)=О), 1=0, 1, ~=о х=((л, л,)( ~ л,(Р„, +р„,)=о), и, наконец, множество Я, состоящее из тех (Л, Л,), для которых Л,) О, а Л„(=-1, ..., гп, удовлетворяют условиям согласования знаков и дополняющей нежесткости (12) и (13) п. 4.2.4, тождественных условиям (13) и (14) п. 4.2.2.
Все этн множества замкнуты, а сфера 5 еще и компактна, как замкнутое ограниченное подмножество конечномерного пространства К'"+'". Условия стациоиарности (8) — (10) п, 4.2.4 соответствуют включениям (Л, Л,) Е Т„Т„Х, условия согласования знаков и дополняющей нежесткости — включению (Л, Л,) Е Я (все эти условия одинаковы для всех пакетов иголок). Зависящие от иголок условия (11) п. 4.2.4 выполняются, когда (Л, Л,)еК(т„, и„), к=1, ..., У. Наконец, по- ззо скольку множители Лагранжа определены с точностью да пропорциональности н не могут одйовременно обращаться в нуль, их можно пронормировать так, чтобы было (Х, Х,) ~Я. Поэтому утверждение леммы предыдущего пункта означает, что ЯПТ«ПТ,ПХПЕП й К(тю о«)Ф.З' (4) «=! Рассмотрим систему замкнутых подмножеств К(т, о) =ЯйТ,ПТ,йХПЯПК(т, о), т Е )го 1«]~ о 6 ]г~ (5) компактного множества Я.
Лемма о центр и ров анной системе. Система множеств К(т, о) имеет непустое пересечение. Доказательство. Согласно (4) любое конечное число множеств К (т, о) имеет непустае пересечение. Такая система множеств называется центрированно]1. По известной теореме 1КФ, стр. 99] пересечение центрнрованной системы подмножеств компакта непусто. ° Таким образом, существуют (), Х,)Е й К(, о)= ' ' "(],,7,], ««а =ЯПТ«ПТ,ПХПКП й К(т, о). (6) «е!г», «и ю«а ~ Х,(А,(т, о)+В,(т, оЯ)О ] о (7) для всех т~[]", ] ]1 о 611. Это и есть искомые «универсальные«множители Лагранжа. Действительно, еч неравны нулю одновременно((й, Х«) б Я), удовлетворяют условиям согласования знаков и дополняющей нежесткости ((Х, Х«) Е х), удовлетворяют условиям Л« =О, 1=-0, 1, и Л„, =О ((), Х«)ЕТ«ПТ,ПХ) и, наконец, Б) Вывод принципа максимума.
Подставив (1) и (2) в неравенство (7), преобразуем его к виду Оя~ Х Х;~Ь~, (с, о) — ро,(т)Л~р(т, о)1+ с=а ЛЪ +~ч'. Л,— "" а(г„)(лр(, ~=о =1(т, х(т), о) — 1(т, х(т), й(т))— — р(т)(ср(т, х( ), ) — ср(т, х(т), й( )))= = — Н(с, х(т)„о, р(т))+Н(т, х(с), и(т), р(с)), (8) где р'(т, х, и) = '5", Х,р,(т, х„ и), с=о лг ГИ вЂ” — и(1, .) (10) с=о с=о — решение уравнения Эйлера — Лагранжа (8а) п. 4,2.2, как мы увидим далее, и Н(т, х, и, р)=рср(т, х, и) — 1(с, х, и) (!1) — функция Понтрягина (ср.
(7) в п. 4 2 2). Неравенство (8), справедливое при всех т~11„(с( и о~И, равносильно принципу максимума (11) п 4.2.2 Н(т, х(т), й(т), р(т))= снах Н(т, х(т), о, р(с)). (12) В) Вывод условий стационар ности п о х ( ). Дифференцируя (1О) и учитывая, что ро, (т) удовлет- воряют уравнениям (18) п. 4.2.3, а = — й (1, с) ср„(т), дС2(С т) (см. теорему п. 2.5.4), имеем ж с(р(тИт= Е )с ( — Ро (т)ср,(т)+~ (т))— в=о Ш О$ 4''д» в=о !=о 332 т. е р(:) является решением уравнения Эйлера — Лагранжа (8а) и.
4.2.2. Далее, прямо из (10) 3И Ж Р(1 ),~'У,ро,(1 ),'~, З. ГЗ(1, 1) 1=0 ~=о Р$ дф, д! — — = —, (13) дх» )х„ ' =о поскольку ро,(Г,)=0 в силу (18) п 4.2.3, а я(1, 1)=Е. Здесь, как и в (6) п. 4.2.2, 1(го х„1о х»)= Х ХМ (1о* хо 1~, х,) (14) — терминант, а полученное равенство (13) равносильно первому равенству (9а) из и. 4.2.2 . Наконец, условие Л,,=О, т. е. (10) п, 4.2.4, дает после подстановки значений производных (12) и (1б) п, 4.2.3 т О$ О=Л„,= ~чд Х,Р,„,+ 2; ).,Ч'„,= г=о =о т ~Л = —",»;. ~.,ро, А)+,'», Х.
~Ф .. +Ф., —,'" ~ = ,=о !=о т т ~И = — ~ Л,ро,(1,)+ Х )», Р,„, + ~ Х, Р.„,а (1„~,) = =- — р(г.)+1.„ так что верно и второе условие трансверсальности (9а) п. 4 2.2. Г) Вывод условий стацн опар ности по 1о После подстановки значений производных (10), (11), (14), (15) и. 4.2.3 в условия Ли=Ли=-0 (8) и (9) п. 4.2.4 получаем с учетом обозначений (9) — (11) и уже доказанного равенства (13) ~Л П2 О=Л,= Х ),Рд, + К х,грп = о=о ' ' ,=о П~ О2 = ~Ч; З.,Р,(У,)+~~'. )., ~~„,+~„, д," ~ = =о .=о » 1 =7М+1 .+1.Л(М =7(1») — р (1,) т(1,)+дч = — Н(1,)+Т,, ЗЗЗ О=А„= Х Х,.Ри,+ 2; Х,ГРи,= Сеа ы=в ~П /П =~ Х(1 —,Й(1.)+ри(1.) ср(1.)]+с'.~ ~ ~ф ~. +Фи, — „1 = а=О с О = — Пг,)+ 2 Х;р (1,) р(1,)+1),+1.,à — 11(1„1.) у(1,)] = = — Р(1.)+р(1.) а(1.)+16=Й(1.)+(еи Этим доказаны обе формулы (12а) п.
4,2.2, Д) Непрерывность функции Й( ). Вместе с управлением й(1) функция. Й(1)=Н(1, х(1), й(1), р(1))= = — )'(1, х(1). и(1))+рЯ)р(1, х(1), й(1)) = = — ~ Ъ4)(1, х(1), й(1))+р(с) ср(1, х(8), й(1)) )=о непрерывна справа. Кроме того, каждая из функций Н(1, х(1), о, р(1)) непрерывна по 1 н, переходя к пределу в неравенстве Н(1, х(1), и, Р(т))(Н(1, х(1), и(1), р(1))=Н" (1) (И) мы получаем Н (т, х (с), о, Р (т)) ~ Ип) Й (1) = Й (т — 0), -0 откуда Й(т) =зпрН(т, х(1), и, р(т)) (Й(т — О). (16) ЮЕП С другой стороны, Й (т — О) = 1пп Н (1, х (1), и (1), р (1)) = с-о = Н(с, х(т), и(т — О), р(т))= 1пп Н(т, х(т), и, р(т))- ю йи-а) ( Н (т, х (1), й ( с), р (т)) =- Й ( с) в силу того же неравенства (15).
Вместе с (16) это означает, что Й(т — 0)=Й(т), т. е. Й(1) непрерывна и слева. ° 4.2.6. Доказательство леммы о пакете иголок. Напомним, что игольчатая вариация х (с; Г„х„а, т, о) оптимальной фазовой траектории х ( ) — это решение задачи Коши х=ср(С, х„и((; сс, т, и)), (1) х(1,) =х„(2) где в свою очередь вариация и(1; а, т, и) оптимального управления и(с) определяется при а,. ) О формулами о„т Е Лс = (тс+ са, тс+ са +ас), й(1), с ( вессс; а= ч~~~ ~ас. с с с=с Доказательство леммы о пакете иголок (лемма п.
4.2.3) удобно разбить на две части. В первой из них, выделенной в отдельное утверждение, мы доказываем равномерную сходимость проварьированных фазовых траекторий к х( ). Существенную роль здесь играет не столько кусочная непрерывность управлений, сколько интегральная сходимость соответствующих правых частей дифференциальной связи (см. ниже формулу (5)). Чтобы оттенить это, мы распространяем утверждение также и на случай измеримых управлений (определив сначала подходящим образом понятие измеримости в случае, когда управления принимают значения в произвольном топо- логическом пространстве).
Вторая часть доказательства леммы о пакете иголок непосредственно связана с кусочной непрерывностью и. опирается, на классйческую теорему о гладкой зависимости решений от начальных условий. О п р е д е л е н и е. Пусть И вЂ” произвольное топологическое пространство и 1 — отрезок числовой прямой. Отображение ьс 1 11 называется измеримым (в смысле Лебега), если существует конечная или счетная последовательность непересекающихся измеримых подмножеств А.