Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 109
Текст из файла (страница 109)
11, Показать, что аадача: Х(и) = ) и (С) (и(С) — Ц с(С-+ (п(; *' = и(С), о и(С)сир=(иснЕсс 0(и<Ц (0<С<Т); х(0) =О, х(Т) =1 при Т = 1 имеет единственйое решение, а при Т ) 1 — бесконечно много решений. Изменится ли этот вывод, если У = Е'? Если х(Т) = — 1? 12. С помощью принцийа максимума исследовать задачу: Х(и) = (хс(ц (з + (п(; хе = хс, ам = и(с), и(с) сн р = (и сн е'. ) и( < ц, а (0) = (с зт о~ о 13. Пусть задача оптимального управления автономна (см.
4 Ц, (и( ), х( )) — ее решение, а 9( ), а„аь ..., а„определены из принципа максимУма (теоРемы 1, 1). Покаэатьо что тогда Е(х(С), и(С), ф(С), с?с) =сопзс (сз < с (Т). Указ а пиес воспользоваться теоремой 3. 14. Сформулировать принцип максимума для задачи оптимального управления с параметрами: т х (и (.), са) = ) 7 (х (с), и (с), с, сг) ас + д (х, х (т), с, т, са) -~ 1п(, з ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУЫА й 3. Доказательство принципа максимума 1. Доказательство теорем 21, 2.2 проведем при дополнительном предположении, что вектор-функция 1(х, и, с) = (1'(х, и, с), . ° 1" (х и с)) удовлетворяет условию Липшица по переменным (х, и), т. е.
)1(х, и, с) — 1(у, о, с)) < Е()х — у(+ (и — о)), Е > О, (1) пРи всех (х, и, С), (У, о, С) ш Е" )( Е" Х (С»ь Т). Покажем, что тогДа Решение задачи Коши х=1(х,и(С),С), Со<С<Т, х(»о) =хо, (2) непрерывно зависит от начальной точки хо и управления и = и(С). Сначала докажем одно утверждение, которое часто приводится в учебных пособиях по дифференциальным уравнениям и в литературе известно как неравенство Гронуолла. Лемма 1.
Пусть Яункции»р(С), Ь(С) неотрицательны и непрерывны на отрезке Со < С < Т, а = сопзг. Пусть р (И < а )р»р (т)»ст + ь (уд с < с < т. о Тогда 0<»р(с)<а)р ь(т) е (с т)»ст+ь(с), с < см;т, о (4) В частности, если Ь(с) иа Ь = сопзс) О, то 0<»р(с)<Ьв (с-со) с <с<Т (5) Если гее Т (»р (С) < а ~ »р (т) дт + Ь (С), с с„<с<<Т, (б) х (с) = 1(х (с), и (с), с, и ), со < с < т, х (со) = хо, у'(х„х(Т), С„Т, т) <О, »=1, ..., т, у'(хо, х(Т), Со, Т, »о) = О, С = т+1, ..., г, и(с)»ну, со<с<т, »о»нит, где»о = (»о»...т ю») — параметры (они не зависят от времени), ру — ааданное множество из Е»; остальные обоаначения см. выше.
Рассмотреть случаи И'= Е и И' = (ю: у»(ю) = О, » = 1, ..., Ц, где у»(»о) — заданные гладкие функции на Е', С = 1, ..., Ь, У к а а ание: ввести новые переменные х"+» посредством условий х"2'(с) = 0 (со < с < т), х"+'(со) = »о» (С 1, ..., Ь) в пространстве (х', ..., х"+") воспользоваться теоремой 1 или 2, а затем исключить переменныех"»», »р„ь» (с 1,..., й). 15. Сформулировать принцип максимума для задачи получающейся иа задачи (1) †(4) или (37) †(40) добавлением условий (133), У к а з а н и е: ввести новые переменные х" +' посредством условий х"+» (с) = 1' (х (с), и (с), с) (с, < с < т), х"+'(с,) = 0 (с = 1, ..., г ); х"+ (Т) + уо» (х, х (Т), с, Т) к', 0 (» = 1, ..., т ); х"+ (Т) + уе» (х, х (Т), с, Т) =0 (» =т +1, ..., г) в пространстве(х~, ..., х '), воспольаоваться теоремой 1 или 2, а затем исключить переменные х"+', ф„+» (» = 1, ..., г»).
принцип млкснмумл понтгнгнпл 1ГЛ. З 482 т ОИ;гр(г)<а)рЬ(т)ев(т г>бт+Ь(г), 1 (1<Т, (7) а при Ь(г) ио Ь сопя$) О будем иметь О (~Р(с) < ьещт гг, го( е (т. (8) Доказательство. Пологким В(г) =а) ср(т) бт. Заметим, что го В(го) = О, В(г) ) О, В(г) = аЯ) (го <я <Т). С учетом (3) имеем В(г) < аВ(г) + аЬ(г) или В(г) — аВ(г) < аЬ(г), го < Е < Т.
умноьтая обе части последнего неравенства на е Мг го1,получим у(В(г)е ( о))~<аЬ(г)е ( о), 1 <г~<Т. Интегрирование атого неравенства от го до г с учетом В(г,) О приводит к оценке В(г) е ( о)<а~ Ь(т) е ( о)Ыт го или В(г) <а ~ ь(т) е О т1бт, г (г(т. о Подставив зту оценку в правую часть (3), сразу получим требуемое неравенство (4). Если Ь(г) = Ь = сопзд то непосредственно вычисляя интеграл в правой части (4),придем к оценке (5).
Неравенства (7), (8), вытекающие иа (6), доказываются аналогично с Т помощью вспомогательной функции В (г) = а ) цг(т) Ыт (г,( г( Т). Лем- г еде х(й и, хо) — решение вадаыи Коши (2), соответствующее управлению и=и(г) вн 7~~(го, т): и(г) щ У(го<~ г~ т) и наыальномУ Условию х„; с Д ока а ательств о. Существование траекторий х(г, и, х,), х(г, о, уо), го ( с < т, следУет из теоРемы 1.1. Обозначим длЯ кРаткости йи(г) = о(с)— — и(г), йх(г) =х(г, о, уо) — х(г, и, хо), Ьхо= уо —,ео.
Тогда из (1й2) ма 1 доказана. Те о р е ма 1. Пусть вектор-функция 7(х, и, г) непрерывна по совокупности переменных (х, и, г) щ Е" Х УХ [го, Т), удовлетворяет условию (1). Тогда Т гоа* (х(г о* уо) х(' и хо)!<Сг)уо ~о)+Ся ~)о(г) и(г)(бг гоаект (9) 468 ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА 9 3) следует Ах (О = ) [с (х (т, о, ус), и (т), т) — 7 (х (т, и, х ), и (с), т)) сст+ Ах . со Отсюда с учетом условия (1) имеем с т [Ах(с) [<Б) (А (т)) 4 +Ь) [А (т)) И+[Ах (. со со Это неравенство Запишется в виде (3), если принятыр(с) = [Ах(с) [, а ао Т Ь (с) ии Ь = Б ) [ Аи (с) ) с(с+ [ Ахе [. Отсюда и ив леммы 1 следует оценка (9).
со При доказательстве принципа максимума для аадачи с невакрепленным временем наряду с Задачей (2) нам ниже понадобится также еадача Коши, еаписаяная в виде х = )(х(с), и(с), с), со < с < Т, х(Т) = хс. (10) При выполнении условий теоремы 1 для решения х(с, и, хс) вадачи (10) справедлива оценка т шах ~ х(С, и, у ) — х(С, и х ))(С [у — х )-)-С ~)о(С) — и(С)) 41, о~~~ с о (11) которая доказывается так же, как (9), но с использованием неравенств (6)— (8); постоянные Сь Со в (11) те же, что и в (9). Более тонкие теоремы о непрерывной аависимости решения аадач (2), (10) от исходных данных, справедливые без дополнительного требования (1) и удобные для использования при докааательстве принципа максимума, читатель найдет, например, в [2, 77, 104). 2.
Приступим к доказательству теорем 21, 2.2. Приводимое ниже про. стае и изящное доказательство этих теорем принадлежит А. В. Арутюнову и М. Д. Марданову [206). Докааательство теоремы 2Н будет состоять иа трех этапов. Вначале исходная задача (2.1) †(2.4) аппроксямируется семейством конечиомерных еадач. Затем к конечномерной вадаче будет применен метод штрафных функций для учета ограничений на концах траекторий и выведено необходимое условие оптимальности для получившейся штрафной Задачи. Наконец, будет совершен предельный переход в полученных необходимых условиях и установлена справедливость принципа максимума.
Сначала докаеательство проведем в предположении, что решение (х, ио (С), хо (С)) задачи (2.1) — (2.4) единственно. Через Сь С,,... обозначим каким-либо обрааом занумерованные рациональные точки интервала (С„Т), являющиеся точками непрерывности оптимального управления и„(С). Выберем во множестве У всюду плотную последовательность точек ои ио, ... Зафиксируем произвольный номер Ас) 1 и для любого натурального числа 1<дс выберем такие точки сса = ссо(р)) сн (с„Т) (р = 1, ..., )у+1), что с,=сс,«...ссо«...сс ., Пи+с — сс<1с77, (12) [си сс~+1) и [с„со + ) = йс Ус, ь, с,а ь, 1< с, ь < су, причем оптимальное управление и(С) непрерывно на отрезках [сс, Сс +1) (с = 1, ..., сУ). Обозначим чеРез $ квадРатнУю матРицУ $ = (Ьсо) РазмеР- ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА [ГЛ. б ности д[, злементы которой удовлетворяют ограничению 0 < 3[р < Й]я Ш1П (1[рт1 1[ ) 1»[,РХГ[ Для каждой такой матрицы $ определим управление и(, $) следующим образом: рро 1[а<1~~1[в+ б[р [я»[ Р<[У~ и (1, $) = (13) и (П в остальных точках отрезка [[о, Т[.
Нетрудно видеть, что управление (13) кусочно-непрерывно, и(д $) ои у при всех [ш [[о, Т). Рассмотрим задачу: минимизировать функцию Т х[ч(хе, 3) = У (хо, и(, 'ь)) = ) У~ (х(1), и (ц $), [) о[[+ а~ (х, х(т)) (14) о (16) (20) (21) (22) при условиях: хИ = М(х(1), и([,3), [), го<1<Т, х(го) = хо, (13) я'(хь х(Т)) <О, 1=1, ..., т, яо(хо, х(Т)) = О, 1= »»+ 1, ..., о, 3=(3ор): 0($ор<о[ю [, р 1, 2..., 3[, (17) где управление и = и(ц $) определяется согласно (13). Подчеркнем, что при каждом фиксированном [о') 1 задача (14) — (17) является конечномер- ной задачей минимизации в пространстве переменных (х, б)1 х о' е =(хр, ...,х>), $=($~»,[,у=1,...,17).