Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 37
Текст из файла (страница 37)
Проварьированное управление обозначим через и'(1), а соответствующую этому управлению траекторию с той же начальной функцией ср(1) обозначим через х*(1). (Отметим, что при любом е ~ О траектория х'(1) представляет собой не п р ер ы в н у ю функцию от 1 в силу определенна решения уравнения (ЗЗ).) При достаточно малом е траектория х*(1) определена на всем отрезке 1с ( 1( 1! (теорема о непрерывной зависимости решения от параметров). Покажем, что для любой точки т непрерывности управления и(1) имеет место следующая формула (ср. формулы (21), (22) гл. 2): х'(с+ е 01) =х (т)+ ейх+ о(е), (40) где Лх — не зависящий от е вектор, определяемый формулой: Ьх=~(х(т), х(т — О), и (т))01+ ! + Х А... (О, ~(х(т,), х(т, — О), о!)— ! ! — ~(х(т!), х(т,— 0), и(т,)))б!!.
(41) Доказательство формул (40), (41) аналогично выводу формул (21), (22) в гл. 2. Прежде всего заметим, что имеют место формулы х(т+ еб1) =х(т)+ е)(х(т), х(с — О), и(т)) И+ о(е), (42) х" (т+ еб1) = х*(т) (- е1(х(т), х(т — 0), и(т)) 01+ о(е) (43) (при т, ( с). Эти формулы устанавливаются так же, как и формулы (23), (25) гл. 2 (с заменой ссылки на формулу (!) гл, 2 ссылкой на указанную выше формулу (39)). Далее, совершенно так же, как и в гл. 2, находится приращение функции х*(1) на полуинтервале 1с! х" ~ г! = е)(х(т!), х(с, — 0), о!)01!+ о(е) (44) (ср. формулу (26) гл.
2). Переходим к индуктивной проверке соотношений (40), (41). Прн з =0 эти формулы справедливы (см. 848 Рдзпыв эдна~[и [ГЛ 4 (42)). Предположим, что они доказаны для случая, когда число полуиптервалов 1[, 1м меньше, чем з, н докажем справедливость этих формул при наличии з полунптервалов 1[, 1[ь ..., 1.. Обозначим через й [акое целое число, что тд+, — — тдд,— — ... — — т,. и т, < т, при с(~(с (случай й = 0 не исключается). Заменяя точку т точкой т., число Й вЂ” числом 1д[[, а число з — меньшим числом и, мы, в силу индуктивного предположения, получим из (40), (41) х'(т,+ е(дд,) =х(с)+ е[(х(т), х(т,— О), сс(т,)) 1[„, + + е ~ А...! (О ~(х (т!) х(т! — О), и!)— ! †! — 1(х(т!), х(т! — О), и(с!)))6[с+о'.е). (45) Это есть значение функции х*(1) в левом конце полуиптервала 1д+!. Далее, так как полуинтервалы 1д+,, ..., 1, примыкают один к другому, то, суммируя соотношения (44) для 1= 1с+ 1, ..., з и складывая полученное соотношение с соотношением (45), найдем х (с, + е(1,+ Й,)) = = х (т,) + е1 (х (т,), х (т, — О), и (т )) (1„,, +61д+ [+...
-! 6[,.)+ 5 + е Х А,,т (О, ~(х(т!), х(т! — О), и!)— ! ! — 1(х(т!), х(т, — О), и(т!))) 6!! + о(е) (46) (ср. вывод формулы (28) в гл. 2; при этом ссылка на нерву[о из формул (17) гл. 2 заменяется ссылкой на свойство ! операции переноса, см. стр. 245). Если тд+! = т, = т, то соотношение (46) совпадает с (40), (41).
Если же т,( с, то 1, + 61, = О, 1ьс, + 61~~, + ... + 61, = О, и соотношение (46) принимает вид Я х'(т,)=х(т,)+е 2 А, „(О, 1(х(т,), х(т, — О), и!)— ! ! — 1(х(тс), х(т! — О), и(тс))) Ис+ о(е) (т; < т). (471 4 27~ оптимлльныа пгоггяссы с злпаздынлниам 949 Обозначим через г1(1) функцию х'(1) — х(!), рассматриваемую на отрезке т„— 8 < 7 < т,. Тогда (так как на отрезке т, < г < т управление и*(1) совпадает с и(()) функция х (Гу — х(1) с точностью до о(е) является на отрезке т„— 8 < ~ < г решением системы уравнений в вариациях (38) с начальной функцией Ч(1) и начальным значением х*(т„) х(т,) (напомним, что обе функции х(1), х'(1) непрерывны).
Иначе, говоря, с точностью до о(е) векторы х" (1) — х(() получаются друг из друга (на отрезке т« — О < 1-. т) с помошью переноса: х'(1) — х(1) = А! т (4, х'(т,) — х(т,))+ о(е), (48) т, — 8 ~~ 1 ( (т. Всюду, кроме конечного числа отрезков )ь функция т1(1), т,— 8 < 1 < т., имеет (в силу предположения индукции) вид л т)(!)=х*(!) — х(!) =е ~ А... (О, г(х(т!), х(т, — 8), п,)— ! 1 — 7(х(т!), х(г! — 8), и(г!))) 67!+ о(е). Поэтому, в силу свойства 1Ч (стр. 245 — 246), мы можем заменить формулу (48) формулой х' (~) — х (~) = Лг,, (Ч!, Ц+ о (е), т, (г ( т, (49) где т)!(г) = е ~ А... (О, )!(х(т!), х(т, — 8), о,)— ! 1 — 1(х(т,), х(т, — 8), и(т,))) и„ 4!=е ~ А„,, (О, ~(х(т!), х(г; — 9), о,)— ! ! — Р(х(т!).
"(т! — 8), и(т!))) 6г! (см. [47) ). В силу свойства Ш операции переноса (стр. 245) мы можем формулу (49) переписать в виде х'(1) — х(1) = е ~„Аг, (т)!ггг, $г!г!) 61!+ л +е 2 А,, (О, 8!,г!)61;+ о(,е), т,«~(~(т, (50) г=л+1 РАзныв злплчи [Гл 4 где 4~!!!!(1)=Акт (О, ~(х(т,), х(т,— О), ос)— — 1'(х(т!), х(с, — О), и(с,))), т, — О <Е(т4, 1 = 1, ..., й, Цв=А,, (О, К(х(т,), х(т,— О), о,)— — !(х(т!), х(сс — О), и(т!))), 1= 1, ..., е. Н операции переноса Наконец, в силу свойства (стр. 245) мы получаем А,, (4!11, ь4,п) = А,, (О, 1(х(т!), х(т,. — О), о,)— — 1(х(т!), х(т,— О), и(т!))), 1=1, ..., й, а в силу свойства 1 $!' = ! (х (сс), х (т, — О), ос)— — ~(х(т!), х(т, — О), и(т,)), с=О+1, ..., з.
Таким образом, формула (50) принимает вид х*(1) — х(1) = е Х А1, „(О, 7(х (тс), х(с; — О), о,)— 1-! — !(х(т!), х(т1 — О), и(с)))М!+о(е), т,с-1е„т В частности, при 1 = т, х (с) — х(с) =е )' А..с(0, Г(х(т!), х(тс — О), ос)— 1 1 — 1(х(тс), х (т, — О), и(тс))) М!+ о(е).
Складывая это соотношение с соотношением (43), мы н в этом случае (т. е. при т„(т) получаем соотношения (40), (41), что и завершает индукпин>. Тем самым, формулы (40), (41) полностью доказаны. Так как 1!†правильная точка управления и(1), то формулы (40), (41) применимы, в частности, при т = = 11!' х' (1! + е В) = х (1,) + е Ьх + о (е), (5!) ф ЗП ОПГИМАЛЬНЫС ПРОЦЕССЫ С ЗАПАЗДЫВАНИЕМ ЯВ! где Лх =1(х (1,), х(1! — 9), и(1!)151+ + 2„А!..!(О, К(х(т;), х(т! — 8), о!)— в=! — 1(х(т!), х(т! — 8), и(т;))) б!!.
(52) Обозначим теперь через К множество всех векторов (52), исходящих из точки х(1!). Дословно так же, как в главе 2 (стр. 107 — 112), устанавливается, что К— в ы и у к л ы й к о н у с пространства Х и что имеет место лемма 3 (при т = 1!). Справедлива также и лемма 4 для т = 1!, что следует непосредственно из леммы 3. Таким образом, если траектория х(1) оптимальна, то конус К пе содержит внутри себя луча 1.! . Поэтому через вершину х(1,) конуса К можно провести такую гиперплоскость Г, что конус К расположен в одном из двух замкнутых полупространств, определяемых гнперплогкость!о Г, а луч 1., — в другом. (Конус К здесь заменяет предельный конус, рассмотренный на стр.
121.) Это позволяет, как и в главе 2, определить нетривиальное решение зр(1) = (!)!В(1), зр!(1), ..., !)!„(1)) системы уравнений (34), (35), для которого выполнены соотношения зРо = сопз1 (О, (53) (з) (1!), Лх) (О при Ьх~ К. (54) Докажем, что зр(г) — искомая функция (существование которой утверждается в теореме 20). Пусть т!— произвольная правильная точка, т. е.
точка непрерывности управления и((), 1В ( т! (1ь Рассмотрим симяол а (см. 5 14) с единствсщюй точкой т! (т. е. з = 1) и с числами б(!, 51, соответственно равными единице и нулю. Тогда вектор Лх (см. (52) ), соответствующий этому символу а, будет иметь значение Ах = А,, (О, 1(х(т!), х(т, — 8), о,)— — 1(х(т!), х(т, — 0), и(т,))). (55) Положим а(1) =Апт (0,1(х(т,), х(т, — 8), о,)— — 1(.
(т,) х,т, — О), и(т,))), т, — 8~1<1,. сгл. 4 РАЗНЫЕ ЗАДАЧИ 252 Тогда, по определению, д(() = (йв(Г). дс((), . ° 8'"(с)) есть решение системы (38), соогветствующее начальной фуикпии, тождественно равной нулю (на всем отрезке тс — 0 ( с ( тс) и начальному значению й'(тс) =Э (х(тс), х(т, — 6), пс) — С (х(тс), х(т, — О), и (т,)). (бб) Кроме того, согласно (55) и (54), мы имеем (с) (сс), д'(сс)) к-'О. (57) Мы сейчас докажем, что имеет место равенство (Ф (тс) й' Ис)) = (Ф (Гс), а (Г )). (58) В самом деле, мы им<ем (в силу (34), (35) и (38)) сю И (Г ), д (Э )) †(4 (т Э, й (т )) = ~ †„, (4) (г), й' (()) ис( = 1, = ~ ~( ~'„","), д (э)) + ~ ( (г), "'и") ) ~ д( = с,— в ( дуу (4)с(С), х (С), х (С вЂ” ОЭ, и (С)) — 8" (г) + дх" а=а с, Эду(О(С+О), «(С+О), «(Рь и(С+Од 8-(э)'э (г— ду л аса (с) ДЭ + Г даа (4)с(С), х(С), х(С вЂ” О), и (С)) дха а-о с,-В л с[ л ~л д)а(х(С), х(С вЂ” О), и(С)) Э + д«Э и а Ч с-о л + тл сЭ)а (Х(С), Х(à — О), и(С)) С )~ с-а дуэ л с,-в дав (О (с + ОЭ, «(с + О), х (г), и (э+ О)) д"* (с) т(с + авт, дуа оптимальные пеоцяссы с запаздыванием чва ь + ~~» $ дж(4~(г), х(0, х(м — В), и())) дуа а-О П а ц — в даа (ч) () + В), х (1 + В), х ()), и (г + В)) --Х д а а-О т, а и-в даа И (( + В), к (Г + В), х (Г), и (г + В)) два а Ои — О (при вычислении мы использовали определение функ- ции М' и тот факт, что д(() — = 0 на интервале т1 — 0 ( (((т|), Таким образом, равенство (58) доказано.
Из (57) и (58) получаем (~Р(т,), д(т,)) (~0, откуда, согласно (56) и определению функции Ж, нахо- дим М(~) (т,), х(т,), х(т, — О), о,) ( (Я (ч'. (т,), х(т,), х(т, — 0), и (г,)). Так как это неравенство справедливо для всех точек о, ~ У, то при ( = г равенство (36) выполняется.
Итак, равенство (36) доказано для всех точек непрерывности управления и(() Так как функции и(() в точках раз- рыва непрерывна слева, а функции М и .Ж' непрерывно зависят от своих аргументов, то соотношение (36) спра- ведливо и в точках разрыва управления и(г). Таким образом, равенство (36) доказано полностью. Первое нз соотношений (37) нами также доказано (см. (53)). Далер, полагая в формуле (52) ИО = ... И, = О, мы получим Лх =~(х((~), х((, — О), и((~))И, и потому, в силу (54), М($((,), х((,), х((, — О), и((,))И (О. Так как это неравенство справедливо при любых И (как положительных, так н отрицательных), то Ж(ф(1,), х((,), х((, — О), и(г,)) =О, и второе из соотношений (37) установлено (см.
(36)). Разные злдА*!и !Гл 4 Итак, теорема 20 для случая закрепленного правого конца установлена. Условие трансвсрсальности (условие 3' в теореме 20) для задачи с подвижным правым концом устанавливается так же, как н в главе 2 (с очевидными изменениями).
Тем самым теорема 20 полностью доказана. 5 28. Одна задача преследования" ) Предположим, что в и-мерном фазовом пространстве Х движутся две управляемые точки, одну из которых мы будем называть «преследующей», а другую— «преследуемой». Движение каждой из этих гочек подчпняегся своев собственной системе дифференциальных уравнений со своим собственным управля>ощим параметром. Управляющий параметр, область управления н траекторию движения преследу>ошей точки мы б>едем обозначать соответственно через и, (/, х(1). Для преследуемой точки будем эти величины обозначать си м вол э м и в, 'и', у (1) .
Пусть и(1), в(1) — некоторые допустимые управления, а х(1), у(1) — соответствующие нм траектории с начальными условиями х (0) = хо, у (0) = уо. (бй) Если для некоторого 1! ) 0 выполняется равенство х(1!) = у(1!), то число 1, мы будем называть моментол! встречи, а сам факт выполнения равенства х(1,) = = у(1,) — встречей. Вообще говоря, если управления и(1) н в(1) выбраны произвольно, то встречи может не произойти ни при каком 1) О.
Если же встреча происходит, то мы будем говорить, что и(1) является преследующим управлением (для заданного управления в(1) и заданных начальных условий хо, уо). При этом для заданных хе, уо, в(1) и выбранного управления и(1) может произойти не одна встреча. Наименьи>се положительное число 1ь являвшееся моментом встречи, мы будем называть временел! преследования, соответствую- ') Результаты этого параграФа ирииадлеигат Д. Л, Келеид>иер идее. 2ьь Олнх зкдх~!А пгяглгловхння $26! щим управлениям и(С), о(С).