Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание), страница 17
Описание файла
DJVU-файл из архива "Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание)", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "оптимальное управление" в общих файлах.
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 17 - страница
»08 доказатвльство пгинципа мл»»симгмл»гл, е следующий вид: Ьх, = (1 — — ~» Р'~) с+ »» + — '",й'(р')( +;)+ — '„й (Р')('+й= » ! »=» — ~~Р( (р»(+)»+(р»)+Ь (р»)))»с+ »-» И и -„'- — ~)» [Ь+(р») — Ь (р»)) с; = с+ — ~,Р»с». »=1 » 1 Следовательно, если точка (р', ..., р") пробегает в и-мерном числовом пространстве единичный шар (30) (р')'+" + (р")'==1 то вектор Лха (точнее, конец этого вектора) также пробегает и-мерный шар в пространстве Х„а именно шар х»ю радиуса — г с центром в точке 1 п А, ортогональный лучу Ь. При тех же условиях конец вектора е»1ха (все векторы исходят из точки х (т), т.
е. иа начала ко4 . ординат пространства Х ) пробе- '1 гает и-мерный шар Е, радиуса е —, ортогональный лучу Ь; центр шара Е, расположен в точке А, луча Т, находящейся на расстоянии е»» от точки х(т), где »( — длина вектора с (рис. 31). Рис. 3». Так как в нашем рассужде- нии рассматриваются лишь такие символы а, которые являются линейными комбинациями (с неотрицательными коэффициентами) к о н е чи о г о числа символов а„а», а», » = 1, 2, ..., и, то точки т,, с,, 1 = 1, 2, ..., е, входящие в определение ОСНОВНЫЕ ЛЕММЫ з!4\ символа а = с (р', ..., р"), одинаковы для всех этих символов, т.
е. не зависят от р', ..., р"; точка т также фиксирована. Числа же й„..., й, и й (определяющие проварьированное управление и* (1)) зависят, причем непрерывно, от р', ..., р". Поэтому мы будем писать из (») и й„чтобы подчеркнуть аависимость величин и* (~) и й от р', ..., р". Траекторию х* (»), исходящую ив точки х, и соответствующую управлению и* (~), будем обозначать через х,' (г), так что соотношение (2«) (в котором зе = О, ибо начальная точка совпадает с х, при всех с) даст нам х,а(т+ сйа) = х(т) + зЛх, + о(с).
(3$) Отметим, что траектория ха (~) н сир е р ы в но зависит от параметров р', ..., р; точно так же число йа н епрерывно зависитотр', ..., р". Поэтому и точка х (т + зйа) н ел р е р ы в н о зависит от р', ..., р", а величина о (е) имеет равномерно по р', ..., р" более высокий порядок малости, чем е (см. замечание на г„' стр.
103). Следовательно, когда Л точка (р', ..., р") описывает г. шар (30), точка (31) пробегает (прн любом фиксированном с) некоторый «диск» Е, (т. е. непрерывный обраа '~г шара (30); этот диск может иметь Ркс. 32. самопересечения и т. п.). С точностью до малых более высокого порядка, чем е, диск Е, «совпадает» с шаром Е, (см. (За)); точнее говоря, точки диска Е, отстоят от соответствующих точек шара Е, на величину более высокого порядка малости, чем з (равномерно для всех точек шара Е,). Точка же пересечения этого шара с линией Л (существующая при достаточно малых е) отстоит от точки х (т) и от границы шара Е, на величину порядка з. Следовательно, при достаточно малом з диск Е, и е р е с е к а е т линию Л в некоторой точке е) (рис.
32). Выберем такое е. Так как а) Факт существования такой точки яересечевпя представляется наглядно «очеапдкмм»; строгое докааательстзо легко проводится алемептарпммп средствами т о и о л о г и и (с помощью понятия 1»О доказатвльство пгинципа максимума ~гл, г весь диск Р» состоит ив точек вида (31), то доказанный факт пересечения Р, с линией Л означает: существуют такие р', ..., р" (лежащие в шаре (30)), что хр (т + еб)«) ь — Л. Иначе говоря, обозначив величины иб (1), хэ (1), соответствующие выбранным вначениям р', ..., р", через и (1), хе (1) и полагая т + ебг« = т', мы получим х (»с) = хе, хе (т') (- Л, и лемма 3 докавана.
Л е и м а 4. Если управление и (1) и соответствующая ел«у траектория х(1), ге ( 1 ( 1„оптимальны, то для любой правильной точки т (1« ( т ( 1,) луч л.«, исходящий из точки х (т) и идущий в направлении отрицательной полуоси хе, не принадлежит внутренности конуса К« (т. е. проходит либо вне этого конуса, либо по его границе) . Д о к а в а т е л ь с т в о. Допустим, что прн некотором т луч Ь, принадлежит внутренности конуса К,. Применим лемму 3, принимая ва линию Л (и аа луч Е) луч Ес Тогда мы получим, что существует такое управление и (1), для которого соответствующая траектория х (1) (исходящая ив той же точки х„) проходит в некоторый момент т' ) ге черев точку, лежащую на луче Ео Иначе говоря, х',' (т') = х«(т), 1 = (, 2,..., п; х» (т') ( хс (т).
Определим на отрезке 1» =. 1 ~ 1» + (т' — т) управление и „(1), положив ие (1) прн 1 (1 =т', "(1) = и (1 — (т' — т)) при т'(1( 1, + (т' — с). Траектория х е (1), соответствующая управлению и „(1) и исходящая иа точки х„совпадает, очевидно, на отревке индекса пересечения; см., например, В.
Г. Б о л т я н с к н й, Гомотопкческая теория непрерывных отображений н векторных полей, Труды Матем. института нм. В. А. Стеклова, т. ХЬЧ11, 1955; определение индекса пересечения «отображенных», т. е. искривленных цепей дано в п. 5:2 этой книги, а существование прн достаточно малом е точки пересечения диска Р, н линии Л вытекает нз предложения (г) на стр. 69). 1 !о! ДокАЗАткльство пРинципА мАксимумА !!! 1, = ! ( т' с траекторией хо (!), так что, в частности х' (т') = х' (т), 1 = 1, 2, ..., п (32) х (т') ( х' (т). Далее, на отрезкет ( ! ( 1, + (т — т) траектория хоо (!) имеет вид хо„(!) = х(! — (т' — т)) +р, где р — постоянный вектор (33) р = (х',„(т') — хо(т), О, О,..., О).
(Это получается непосредственной подстановкой решония (33) в уравнения (7) с учетом того факта, что правые части системы (7) не зависят от ! и х', вектор р определяется тем условием, что в точке т' — точке «стыка» двух кусков траектории х о (!) — эта траектория должна быть непрерывна.) При ! = 1, + (т' — т) получаем хо о (!1 + (т' — т)) = х (! ) + р. хо (! + (т т)) .о (! ) + о ( ) о (т) < о (! ) (см. (32)).
Но это противоречит оптимальности траектории х (!) и управления и (!). Таким образом, предположение, сделанное в начале доказательства, приводит к противоречию, и лемма 4 полностью доказана. 5 15. Доказательство принципа максимума В этом параграфе мы будем предполагать, что х (!), !о ( ! ~ 1„— оптимальная траектория (соединяющая точку х, с некоторой точкой прямой П, см. э 11), а и (!) — соответствующее оптимальное управление. Пусть т — некоторая правильная точка управления и (!). Согласно лемме 4, луч Х, не принадлежит внутренности конуса К„так что этот конус не заполняет всего пространства Х. Поэтому существует опорная гиперплоскость к конусу К, в его вершине, т. е. такая гиперплоскость Г, что весь конус К.
Иначе говоря, точка хоо (1, + (т — т)) лежит на прямой П, определенной в з 11 (ибо вектор р параллелен оси хо), и, кроме того, 112 доклзлтвльство пгинципл млксимгмл 1гл. 1 лежит в одном из двух замкнутых полупространств, определяемых гиперплоскостью Г. (Гиперплоскость Г, обладающая этим свойством, может быть не единственной; последующие рассуждения справедливы для любой такой гиперплоскости.) Уравнение гиперплоскости Г (в пространстве Хр) можно записать в виде ~', а„ха=О, где а=о х', х', ...,х" — текущие координаты. Так как умножение всех коэффициентов а„ на одно и то же отличное от нуля число не меняет гиперплоскостн Г, то мы можем считать (изменив, если нужно, знаки всех чисел а„ на обратные), что конус К,лежит в о т р н ц а т е л ь н о м полупростр (~ .
~0) и ° °,р,р р ° *р ~а=с Лх, определяемого формулой (22), выполнено неравенство (34) (а, Лх) ~ О (Лх ~ Ки), где через а обозначен вектор (аа, а„..., а„) (ибо сово- купность векторов (22) и есть конус К,). Полагая в фор- муле (22) 61, = 61, = ... = 61, = О, мы получим Лх = = г'(х (т), и (т)) 61, и, в силу (34), (а, у'(х(т), и(т))61)(0. Так как зто неравенство справедливо прн любых 61 (как положительных, так и отрицательных), то (а, )Р(х(т), и(т))) = О, т.
е., иначе говоря а2.""(а, х(т), и(т)) = О (35) (это соотношение выполняется, если вектор а удовлетворяет условию (34)). Обозначим через рр(1, а) = (рга(1, а), фг(1, а),..., р(р„(1, а)) решение системы уравнений (8) (соответствующее изучаемым оптимальным и (1) и х (1)) с начальным условием рр (т, а) = а. (36) Решение ~Р (1, а) определено на всем отрезке 1О ~ 1( 1ю так как система (8) линейна. 5!М доклзлтельство пРинципА мАксимумА Л е м м а 5.
Если вектор а удовлетворяет условию (34), то во всякой правильной точке управления и (5), лежащей на полуинтервале 55 ( С ~ т, выполнено соотношение ой (5Р (8, а), х (5), и (5)) = 55 (5]5(5, а), х (с)). Пусть т, — правильная точка управления и (с), расположенная на полуинтервале 55 ( С ( т, а у, — произвольная точка пространства У. Рассмотрим символ и (см.
$14) с единственной точкой т, (т. е. в = 1) и с числами бт„б1, соответственно равными единице и нулю: а = (~~ ум т, 1, О). Тогда вектор йх (см. 22)), соответствующий этому символу а, будет иметь значение Ьх = А... [у'(х(т,), о,) — )'(х(т,), и(т5))]. В силу соотношений (34) и (36) получаем отсюда (5р(т, а), А, в [У(х(т,), о,) — у(х(т5), и(т,))])(0, и потому, согласно лемме 1 и соотношению А, „= Е (см.
(17)) (5у(тп а), у(х(т,), Р,) — у(х(т,), и(т,)))(0. Это соотношение переписывается (в силу определения функции о2[ ) в виде яЗ"(5р (т„и), х (т,), У,) — ой (5у (т„и), х (т,), и (т,)) ( О, а так как это неравенство справедливо для любой точки Р, т- У, то мы получаем З" (5]5(т„а), х(т,), и(т,)) = шах 21" (5р(т„а), х(т,), У,) = пеи вт (5]5 (т, а), х (т ) ), и лемма 5 доказана. Соотношение, указанное в лемме 5, справедливо и при 5 = т (ибо т — правильная точка): Л" (5Р(т, а), х(т), и(т)) = вт(5[5(т, а), х(т)). Поэтому, в силу (35) и (36), мы получаем следующее утверждение. 114 ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА [ГЛ, З Л е м м а 6. Если вектор а удовлетворяет условию (34), то еЕ(~Р(т, а), х(т)) = О. Л е м м а 7. Если абсолютно непрерывная функция ф (1) почти всюду на некотором отрезке 1 удовлетворяет уравнениям (8) и соотношению о%" (ф(1), х(1), и(1)) = М(ф(1), х(1)), (37) то функция ае (ф (1), х (1)) постоянна на всем отрезке 1, Заметим прежде всего, что функция М (ф (1), х(1)) полунепрерывна снизу на отрезке 1.
Действительно, пусть 1 — произвольная точка етого отрезка, а е — положительное число. В силу определения верхней грани, существует такая точка и' Е=- У, что оуУ (ф(1), х(1), и) ~ ®(ф(1), х(1)) — —. Далее, в силу непрерывности функцииоЯ (ф (1), х (1), и) по 1 при фиксированном и = и', существует такое 6 ) О, что при (1 — Р ( ( 6 имеем ~.-~[ (ф(1) *(1), ') — ~ (Ф(у) х(у) ')!(2. Таким образом, при ~1 — 1'~ ( 6 справедливо неравенство ®(ф(1), х(1)) =- зпр Я" (ф(1), х(1),и)=» вЕО )е"' (т(1) х(1), и')) Ф(т(У), х(У)) — е, показывающее, что функция Ж (ф (1), х (1)) полунепрерывна снизу.
Далее, так как управление и (1) допустимо, то образ отрезка 1 при отображении и обладает в пространстве Е„компактным замыканием (см. 3 10), т. е. существует в Е, такое компактное множество Р, что и(1) т=- Р при[ ~ 1. Положим т (ф, х) = игах й" (ф, х, и). вЕР Очевидно, что имеет место неравенство (38) й(ф, х))т(ф, х), Е КЗ ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА 115 справедливое при любых х и ф Соотношение (37) озяачает, что почти всюду на огпрезке Х имеет место равенство т (1р (г), х (г)) = ев (1р (г), х (г)) (ибо и (1) ~ Р). Итак, .Ф (ф (г), х (г)) есть полунепрерывная снизу функция, почти всюду на отрезке 1 совпадающая с функцией т (ф (~), х (1)) и связанная с ней соотношением (38). Иэ этого следует, что если функция т (ф ((),х (1)) непрерывна, то функция Ф (ф (1),х (1)) в с ю д у на отрезке 1 совпадает с ней (и потому такхсе непрерывна).