Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 38
Текст из файла (страница 38)
Время прсследоеания мы будем обозначать через Т, „. В дальнейшем начальные условия (59) предполагаются фиксированными (в связи с чем в обозначение времени преследования начальные условия кь, уь не входят). Мы будем в дальнейшем предполагать, что преследующая точка обладает следующим свойством: для любого заданного управления о(с) существует (при заданных начальных условиях (59)) преследующее управление сс (С).
Если управление и(с) преследуемой точки выбрано, то можно поставить вопрос о нахождении такого преследующего управления сс(С), чтобы соотвстствующее время преслсдовання Т„, принимало мишсмальное анас!ение. Мы будем предполагать, что для лсобого допустимого управления и(С) существует допустимое управление и(с), осушествляюшее м н н и м у м времени преследования. Этот минимум мы будем обозначать через Т,: Т„= пп'и Т„, „.
И Мы будем, далее, предполагать, что сушестнует допусти. мое управление н(с), осуществляющее м а к с и м у и величины Т„. Этот максимум мы обозначим через Т: Т = шах Т, = шах (пнп Т„,). (60) Задача заключается в том, чтобы выбрать такую пару допустимых управлений и((), п(с), что для соответствующего времени преследования Т„, выполняется равенство Т „= Т. Такую пару управлений и(с), о(с) мы будем называть оптимальной парой управлений, а соответствующую пару траекторий к(с), у(С) (с начальными значениями (59)) — оптимальной парой траекторий. Итак, управление и (при любом заданном управлении о(с)) выбирается таким образом, чтобы по возможности ус ко рить встречу преследующей точки с преследуемой; выбор же управления и подчинен задаче максимально отдалить (во времени) момент встречи. Отмстим еще, что при выборе управления и((), опрсде- (гл. 4 РАЗИ!!Н ЗАДАЧИ 256 ляющего движение преследующей точки, мы каждый раз предполагаем заранее н з в ес т и ы м управление а(1) для преследуемой точки; в соответствии с этим при определении величины Т с н а ч а л а берется минимум по всевозможным управлениям и(() при некотором фиксированном управлении о((), а затем берется максимум по всевозможным управлениям о(().
При решении поставленной задачи мы будем предполагать, что движение преследующей точки описывается в пространстве Х линейнат уравнением (в векторной форме) — =1'(х, и)= Ах+ Ви+ с, г(х Ж (61) для которого выполнено условие общности положения, а соответствующая область управления У представляет собой замкнутый выпуклый ограниченный многогранник в пространстве Е„переменной и = (и',..., и').
Движение преследуемой точки пусть описывается уравнением «) (векторным) (62) а соответствующая область управления $г является множеством з-мерного пространства переменной о = (о',... ..., о'). В качестве класса допустимых управлений (как для и, так н для о) примем множество всех кусочно-непрсрывных управлений. На координаты векторной функции у (у, о, () мы накладываем обычные условия (непрерывность по переменным у, о, 1 и непрерывная дифференцируемость по координатам у', ..., у" точки у).
Для решения поставленной задачи мы введем в рассмотрение два вспомогательных вектора тр = (чр ° ° * ф ). Х = Ь ° ° Х ) «) Разумеется, можно было бы ограничиться случаем, когда правая часть уравнения (62) автономна, т. е. не зависит явно ог времени. Однако проводимые ниже преобразования приводят (даже в автономном случае) к явному введению переменной ! в праву!о часть уравневвя движения преследуемого объекта. Поэтому никакого упрощения в случае автономности уравнения (62) ие происходит.
Олпл элдхчл ореол! ловлния $2Я чат и две гамильтоповы функции Н1 (ф, х, и) = ~ ф„~" (х, и) =(ф, 1 (х, и)), О ! л На(Х у о)= Х Хай (у о 1)=(Х Ы(у~ о 1)) с = 1, 2, ..., и В л Г п»ни'лрнр и р. соотвстствучощие преследующему н преследуемому объ- ектам. С помощью функций Нь Нх мы напишсм следую- щие две системы уравнений для вспомогательных нсиз- всствых 1к; и у д1р; дй, (63) ~и дх' ' ЛХ, дН„ (64) ар ду' ' Если заданы функции иИ), х(г), о(/), у(1), то, подстав- ляя нх в правые части системы (63), (64), мы получим линейные системы относительно неизвестных $; и Хь 1(ахкдое рсшснпс ф(1), Х(1) этих систем мы будем на- зывать соответствующим выбранным функциям и(1), (1), (1) у(1) Ниэксслсдуюшая теорема дает необходимое ус- ловие оптимальности для рассматриваемой задачи.
Теорем а 21. Пусть иЯ, о(1) — оититнальная нара управлений, х(1), у(1) — соответствующая оптимальная пара траекторий (ель уравнение (61), (62)) и Т вЂ” вргл~я преследования. Тогда существуют такие нетривиальные решения ф(1), Х(1) систем (63), (64), соответствуюи1ие функциям иЯ, х(1), о(1), у(1), что: 1' для всех 1, 0 (1 = Т, выполнены условия мак- ситнуиа птахН,(ф(У), х(1), и) =Нц(ф(1), х(1), и(1)), (65) и~о шах Н,(Х(1), у(1), о)=Нх(Х(!), уР), о(1)); (66) 2' в момент 1= Т выполняются условия Н,И(Т), х(Т), и(Т))--:Н,(Х(Т), у(Т), о(Т)), (67) ф(Т) = Х(Т).
(68) )ГЛ А РАЗНЫЕ ЗАДАЧИ Ло к азат сл ьст во. Пусть и0 — произвольная внутренняя точка многогранника У. Положим и=и — и. о Тогда уравнение (61) перепишется в виде — „, =Ах+ Ва+(Вин+с). их (с) Аха(1) + с Ю (69) и потому является аналитичсской функцией от Е Пусть и,(1), о,(1), О (1~ 1ь — произвольная допустимая пара управлений и х1(1), у,(1) — соответствующие траектории уравнений (61), (62) с начальными условпямп (59), т.
с. = Ах, (1) + Ви, (1) + с, (70) =к(у (г) о (1) г) х, (О) = хм у~ (0) = уа. (71) (72) Положим х(1) = х, (1) — ха(11, у(1) = у~ (1) — х0(1). (73) Таким образом, перенося начало координаг пространства Е, в точку и', мы лишь изменяем свободный член с в уравнении (6!); однако теперь начало координат пространства Е„ будет уже внутренней точкой многогранника (/. Мы будем предполагать, что такой перенос начала (если он нужен) уже сделан в уравнении (6!), так что начало координат является внутренней точкой многогранника К Обозначим, далее, через хз(1) решение уравнения (61), соответствующее управлению и 0 (это управление допустимо, так как начало координат принадлежит многограннику (7) н начальному значени|о ха(0) = ха (см. (59)).
Решение ха(1) удовлетворяет уравнению одна злдачл пгвслвдовлния Тогда, в силу (69)„(70), (71), мы имеем — = Ах(г)+ Вп, (1), дх (у) " = Ы (д (Г) + х'(Г), о, (Г), 1) — Аха (Г) — с = =а,(д(1) о,(Г), 1) где через д~ обозначена функция й (д, о, Г) =д(д+ х~(Г), о, 1) — Ахе(Г) — с (ср. сноску на стр. 256). Итак, функции х(1), д(1) удовлетворяют дифференциальным уравнениям — „= Ах+ Ви, (74) —,„- = д (д, о, г) ид (75) при и = и~(1), о = о,(1) н начальным условиям (см. (72)) х(0)=0, д(0)=д» вЂ” ха.
(76) Обратно, если функции х(1), д(1) удовлетворяют уравнениям (74), (75) и начальным условиям (76), то функции х,(1), д~(1), определяемые по формулам (73), удовлетворяют уравнениям (61), (62) и начальным условиям (59). Далее, из (73) ясно, что каждый момент встречи траекторий хь д, является также моментом встречи траекторий х, д и обратно (т. е.
если х~(д) = д~(д), то х(д) =д(д) и обратно). Поэтому в первоначальной задаче о преследовании можно заменить уравнения (6!), (62) и начальные условия (59) уравнениями (74), (75) и начальными условиями (76). Наконец, ясно, что если мы докажем теорему 21 для задачи (74), (75), (76) и затем в формулировке теоремы произведем замену (73), то получим теорему 21 для задачи (61), (62), (59). Таким образом, при доказательстве теоремы 21 мы можем рассматривать лишь задачу (74), (75), (76). Можно сказать и иначе: достаточно доказать теорему 21 (в первоначальной формулировке задачи, см.
(61), (62), (59)) для случая, когда а О. хе 0 (77) гхзн!.>г з>л> гн !гл. ! гсо и, кроме того, начало координа! пространства Е„переменных и>, ..., и' является внутренней точкои многограшшка (>. Переходим к доказательству теоремы 2! при выполнении этих упрощающих предположений. 71>>я любого 1! ) О обозначим через 1'! множество всех тех точек фазового пространства Х, н которые можно попасть, двигаясь из начала коорлнна.! в силу системы (74), зз время (1! (под воздействием надленгащсго уиравлеющ).
Мно>кесгво >>, является выпуклым огр>>пичснпыы м>ю>кестаом простране! Ва Х, соде(мкащим внутренние !очки (см. стр. 155). В любую точку множества Х>, можно попасть и за время, в точ н ости р а а нос 1, (ибо перед началом движения можно в течение лк>бого времени находиться в начале координат, считая н — = О). Гранину выпуклого тела Е! обозначим через >'>,. Покажем, что во нсякук> внутрен и ю ю точку множества - ! можно попасть (двигаясь нз начала координат в снл) системы (74)) за время, и е н ьп> ее чем 1,; обратно, сслн в некоторую точку можно попасть за время, меньшее чеч 1ь то она является внутренней точкой тела г:>, В самом деле, пусть а — произвольная внутренняя точка множества Е,, Пусть, далее, >(>,(!)— такое решенно уравнения (5) гл.
3, что упраалснис и,(1), определяемое уравненном (6) гл. 3, псреводнг фазону>о точку из начала координат в положение а. Обозначим через 1' момент времени, когда фазовая точка, движущаяся под воздействием этого управления, попадает в положение а. Мы рассмотрим функпн>о >р,(1), определяемое сю управление и,(1) и соогветстнующую фазовую траекторию х. (1) на отрезке времени О ( 1 " !", где 1": 1'.