Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 111
Текст из файла (страница 111)
Положим д$ = О, дхо = — е ~аскух(хек с сх с=о хк(Т)) — сук(се)), где число е ) О столь мало, что выполняется первое ив неравенств (29); тогда ди(с) = О и из (42), (44) получимО< а кдФк —— Х аыух(хек' хк(Т)) — чйк(йе) + ок (с) плп >с=о Ю )а Ч)' аыях(хок хь(Т)) йск(С ) < с=о Отсюда при с-1-О имеем (с ) = "~~ аскус (х „, хк(тс), К~ К . (46) — Н„(хк [с), и (с, ь ), с, сук (с), а ), Дх (с)) сйс. Напомним, что управления и(с, $к), и(с, йк + дй) определены согласно (13).
Отсюда и из неравенств (21), (22), (28), (29), (31) следует, что аргументы *, и, с, 9 функции Н, в формулах (45) принадлежат ограниченному замкнутому множестзуОк =((х, и, с, ф): )х>< шах (хк(с) )+с ((х (+1)+ с,айат +с~Нас, )и)< звр (и(с)(+ шах )и ! с <с<Т, (ф)~ сараи < шах !ср (С) !. Непрерывная функция Н,(х, и, С, 9, а,к) переменных сеасат (х, и, с, 9) ва компактном множестве Оки будет равномерно непрерывна иа етом множестве. Отсюда и из оценки (31) следует, что Лак = = ок()Дх,)+ )Дз!). Далее, с учетом определения (13) управлений и(с, йк), и(С, йк+дй) имеем 470 ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА б'л.
з Далее, положим в (42) Ьхо =О, матрицу Лз = Дср) возьмем так, чтобы элемент, находящийся на пересечении произвольным образом фиксированных С-й строки и с«го столбца, 1 < 1, р < У, равнялся а) О, а остальные элементы равны нулю, причем е возьмем столь малым, чтобы выполнялось второе неравенство (29). Тогда согласно (13) р — ид (С) = р — и (с) с(и(с) = и (с, сд-(-Л$) — и(С, од) = при Сср+ Ес < С< Сс + сс + з, 0 в остальных точках из [С, Т], о' и иэ (42), (44) получим Сср+йср+з О~аедАФ = ~ [Н(хд(с) "р С' СР (С)' аод) Сср+$ср — Н(х (С), ио(С), С, СР (С), а д)] ссс+ад(е). (47) Заметим, что подынтегральная функция уд(с) = Н(хо(с), рр, с, оуд(с), аоП— — Н(хо(с), иа (с), С, орд(с), а д) непрерывна на отрезке [Сср+ зср, сср+ асср+ +е1.
Применяя теорему о среднем, из (47) имеем 0~ (— уд(сср+$ср+ + Озе) е+ од (е) (0 <ОС< 1). разделим это неравенство на е ) 0 и совершим предельный переход при з — «О. Получим 0~ (— уд (Сс + вдс„) или [Н(хс,(с), р, С, фс,(с), аод) — Н(х,(с), ио(С), С, ф (С), а )], <О од, сс +йд (48) ] а (У) (э = ~Ч~~ азс (У) = 1. (49) 0 < а (У) < 1, а (У) ) О, ..., ам (У) )~ О, Далее, пользуясь непрерывностью ус (х, у) и равенствами (25), (26), из (38) при й-«оо получим о 11 орд(73С У) = о) (Т; У) = — ~~~~ ас(У) ус (х, х (т)].
д о о=о (50) при всех й ) йо, С = 1,..., У, р = 1, ..., № Заметим, что соотношения (35), (37), (38), (46), (48), представляющие собой необходимое условие оптимальности в задаче (19) — (22), вполне аналогичны соотношениям (2.7) — (2ЛО) иа теоремы 2.1. Соотношения (35), (37), (38), (46), (48) получены при фиксированном У) 1 и справедливы при каждом й ) й,. Для завершения докааательства теоремы 2.1 остается сначала перейти в этих соотношениях к пределу при й-«оо, считая У фиксированным, аатем совершить предельный переход при У-«оо. Поскольку построенные выше последовательности (ао), (орд(с)) зависят от У, то их предельные точки, вообще говоря, также будут аависеть от У. В дальнейшем нам будет полеано явно подчеркнуть эту зависимость и поэтому упомянутые последовательности и их предельные точки ниже будем снабжать индексом № Согласно (35) последовательность ад = (аод, ам, ..., а.д) = ад(У) (й = О, 1, ...), ограничена и, пользуясь теоремой Больцано — Вейерштрасса, из нее можно выбрать подпоследовательность, сходящуюся к некоторой точке а = а(У) = (а,(У), ас(У), ..., ад(У)).
Без умаления общности дальнейших рассуждений можем считать, что сама последовательность (ад(У)) сходится к а(У). Из (35) следует 471 9 31 ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМРМА Покажем, что последовательность (ср»(с)) = (фь(с, Н)] равномерно на [сь Т] сходится к решению ф(1; Н) системы уравнений су(С; ЛС) = — Н„(х» (С), и» (С), С, су(С; Н), а (Н)], С ~ (С (Т, (51) с начальным условием (50). Как и в задаче (37), (38) решение задачи (51), (50) существует, единственно, является непрерывным решением интегрального уравнения т су(С; Л') = ] Нх(х» (т), и (т), т, сР(т; Лс), а (Н)) дт+ су (Т; Н), (52) с во всех точках непрерывности оптимального управления и (с) непрерывно дифференцируемо и удовлетворяет уравнению (51). Обозначим Л(ь(с) = ф»(ц Н) — ср(ц Н) (с,< с < Т). Из (39), (52) с учетом определения (36) функции Н н ее производной Н имеем т Лсра (с) = ] ~ Л1усь (т) 1„(хь (т), и„(с), с) с(т+ Ьь (с; Н) + Лсуь (Т), (53) с 1=1 где и Ьс, (с; У) = — ] (азс, (Н) — а, (Н)) сех (хз ( с), иь ( с), т) с(т— т -ао(Н) ~ [1»е(хь(т) и,(с) т) -ухе(х.
(т), и. (т), т)] 3т— т — а, (Л) ~ [(хе(х (т), ис,(т), т) — ф(х (т), и» (т), т)] Ис+ с е +] ~~~ 1РС(М Н) [1. (ха(т) иа(т) т] — ух(х»(т) из(') т)] "т+ с 1=1 т о +] ~~ срс(т; Н) [ух(х» (т), ис (т), т) — 7~ (х» (т), и» (т), 'с)] Ис. (54) с 1=1 Покажем, что (Ьь(С; У)) -»0 при Ь-» о» (У фиксировано!) равномерно на отрезке [с», Т]. О атой целью заметим, что в силу (21), (22), (28), оценки (24) при $ =О, Л$ = $1 к определения (13) управления и»(1) = и(., 51) аргументы (х, и, с) функций 7~~(х, и, с), входящих в (53), (54), принадлежат компактному множеству чн —— ((х, и, с): (х) ( шах (х» (1) ) + +е (]х ~+1)+с нн 3н, ]и]< зпр (и (с)(+ зпр (р !, 1(с~т с,агат сирин при всех Ь) Ь». Непрерывные функции ух(», и, с) на Д» будут ограничены и равномерно непрерывны по совокупности аргументов (х, и, с) сн О».
Следовательно, шах шах ~ 7„(х, и, 1) ~ = 5 < со. Отсюда и из еасао (х,и.с)ИОЕ (ааь(Н)) -»а»(Н) получаем, что 1-е слагаемое из правой части (54) стремится к нулю равномерно на [с», Т]. Равномерная сходимость к нулю 2-го ПРИНЦИП МАКСИМУМА ПОНТРЯРИНА 472 [тл. з слагаемого из (54) следует из равномерной непрерывности )е(з, и, с) на Дл и равномерной сходимости (зь(1)) к за (1), вытекающей иа оценки (24) при 3 = О, 3$ = $1. Для 3-го слагаемого иа (54) с учетом определения (13) управлений из(1) = в(1, 31), ие (1) = и (1; 0) имеем [т 1[р+В[р ее ([У) Х ! ! )ех (зе (г)' Рр' т) )ез (зе (т), ие(1) т 1 ст < [,Р=1 [р ~ ое(А1) ! $а !'2 гпах ! )хо (з, и, с) (-еО [хлсбаЕИ [ч при Ь-~оз равномерно на ([„Т[, так как ($А(= чз !са[ (-~.0 в силу 1,р 1 (25).
Аналогично доказывается равномерная на (ге, т) сходимость при А -~- сс 4-го и 5-го слагаемых из (54). Таким образом, 11ш зпр ! Ь„(1; А[) ! = О. (55) а мгеССЛТ Далее, из (53) имеем Т о ! Д1)а (1) ! < 1 ь[т Х ! А1ра (т) ! от+ ! Ьа (ю[ А[) !+ ! Иа (Т) ! < 1 1 +!Ь,(Г; Л) (+)Афа(Т) !, [,<1<Т. Отсюда и из (50), (55) следует 1пп шах !'Та(0 А') — 1Р(1; Ат) ! =О. а- [еи[СТ (56) Из (46) с учетом (26), (аь(А[)) н-а(А[) при Ь-~ со тогда имеем Пш 'Ра ([е А') 'г (го А') = Х о[ ([У) Юз (лее зе (Т)) (57) [=о Перейдем к пределу при Ь -~ со в неравенстве (43); с учетом (25), (26), (56), (аеа(Н)) -«ае([У) и непрерывности функции Н по совокупности своих Т <Те[[о([613(т)14т+)Ьа([А[)(+)41)а(Т))[о<1~(Т с как видно, функция ~р(1) (Афа(1) ! удовлетворяет неравенству (6) с а = Ля[и, Ь(с) = !Ьь(г; А[) [+ (63а(Т) !.
Тогда в силу (7) получаем (Афа([) ! =)фа(1; А[) — ф(1; А[) )< т < Ттг ~/и ~ ()Ьд (т; А[) ! + ! 61РА (Т) !) ехР (5 г )г и (г — 1) ! 3т + ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА 473 аргументов получим (н(х (с), о, с, су(с; У), а (77)) — н(х (с), и (с), с, 9(с; ст), аз(тс))ис с <О (58) длявсехс,р 1,...,У. Наконец, совершим предельный переход при У-~ со в соотношениях (49) — (51), (57), (58).
Выбирая при необходимости подпоследовательность из (а(бс)), можем считать, что сама последовательность (а(Н))-~-а= = (а„аь ..., а,). Тогда из (49) сразу получим а 0(ае((1, а ))О, ..., аю~)0, )а(~=~~', аз=1. (59) с=о Из (50) при У-е со имеем Иш 9 (Т; У) = 9 (Т) = — ~ асу„(хоо, хе (Т)). (60) се~ се с=о Покажем, что последовательность (ср(С; Н)) равномерно на (Се, Т) сходится к респению 9(с) системы уравнений 9 (с) = — н„(х„(с), иа (с), с, с) (с), а ), с ~ с(т; (61) с начальным условием (60).
Существование и единственность решения за- дачи (61), (60) следует из теоремы 1И. Выпишем интегральное уравнение, которому удовлетворяет решение задачи (61), (60): т 9 (с) = ~ Н„(х (т), ие (т) „тсу (т), а ) бт+ ~> (Т), Отсюда и из (52) для рааности бф(с) = 9(с; У) — ф(с) имеем т а т (с) = ) (( ае (Н) + ао) 7~ (хе (т) ие (т) т) + + ~ с(9,. (т) (с (х, (т), и, (т), с) ~ бт+ 89 (Т), с, < с ( Т. с=с где 5 = шах зир ~ ~'„(хе (т), ие (т), 'с). Отсюда и из неравенств оасаис асат (6) — (8) следует (сср (с) ~ (ср (с; су) — 9 (с) ! ( < ехр(Ци(Т вЂ” со))(ЦТ вЂ” се)(аз(Н) — ае(+ ~89(Т))), с, < с < Т.
Тогда в силу (60), (ае(У) ) -е. а, будем иметь нш шах (9с(с; и) — 9(с) ) = О. (62) н с,асат Иа (57) с учетом (62), (а(У)) -~ а получаем а )сш 'г (Сос М) т (Со) Х асах(хе ' хе (Т0' н-~аа (63) Тогда Т ( с(9 (с) (( ) ь |/и(89 (т) ) аз+ с (Т вЂ” Со) ( е(С(г) е(+(Ь~ф (Т) (, с Со < С < Т, 474 ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА [ГЛ. $ Перейдем к пределу при [У- » в неравенстве (58), Поскольку в силу (12) (сср)-»сс при су-» о, (а»([у))-»а» то из (58) с учетом (62) имеем н(х (сс), Рр, сс ф(сс), ао) н(х»(с!)' и»(сс)' сс' ф(сс)' ао)~(0' с 1'2 В силУ плотности последовательности точек (Рр) во иножестве У отсюйа получаем и (х» (сс), Р, сс' ф (сс), а ) < н (х (сс), и» (сс), сс, ф (сс), аэ) 1УР си У, [=1, 2..., Последовательность (сс) рациональных точек интервала (сь Т), являющих ся точками непрерывности оптимального управления и»(с), всюду плотна на отрезке [си Т).