Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 39
Текст из файла (страница 39)
При решении поставленной задачи мы будем предполагать, что движение преследующей точки описывается в пространстве Х линейным уравнением (в векторной форме) —, =у(х, и) = — Ах+ Ви+с, дх (6() для которого выполнено условие общности положении, а соответствующая область управления У представляет собой замкнутый выпуклый ограниченный многогранник в пространстве Е, переменной и = (и',..., и"). Движение преследуемой точки пусть описывается уравнением*) (векторным) +=у(р, г, 2), (62) р=('ры ", ~.), Х=(Х,",Х.) *) Разумеется, можно было бы ограничиться случаем, когда правая часть уравнения (62) автономна, т. е. Ве зависит явно от времени. Однако проводимые ниже преобразования приводят (даже в автономном случае) к явному введению переменной 2 в правую часть уравнения движения преследуемого объекта.
Поэтому никакого упрощения в случае автономности уравнения (62) не происходит. а соответствующая область управления )г является множеством ~мерного пространства переменной Р = = (Рг,..., и'). В качестве класса допустимых управлений (как для и, так и для и) примем множество всех кусочно-непрерывных управлений. На координаты векторной функции д(р, и, 2) мы накладываем обычные условия (непрерывность по переменным р, и, 2 и непрерывная дифференцируемость ПО КООрдИНатаМ уг,..., ре ТОЧКИ у). Для решения поставленной задачи мы введем в рассмотрение два вспомогательных вектора 250 РАЗНЫЕ ЗАДАЧИ 1гл.
1 и две гамильтоновы функции Н,(ф х, и) = ~Ч~ ф ~х(х, и) = Я,1'(х, и)), а=1 Нз(Х у о) = ~л~~ Хау~(у о 1) =(Х у(у о 1)) а=1 соответствугощие преследующему и преследуемому объектам. С помощью функций Н„Нз мы напишем следующие две системы уравнений для вспомогательных неизвестных $1 и Х1: ж~, ан, в'1 дх1 '= — —,-, 1=.1, 2,..., и, (64) — — — 1=-1, 2,..., и. д1 дуг ' Если заданы функции и(1), х(г), Р(1), у(1), то, подставляя их в правые части системы (63), (64), мы получим линейные системы относительно неизвестных 1р1 и Х, Каждое решение 1Р(1), Х(1) этих систем мы будем называть соответствующим выбранным функциям и(С), х(1), Р(1), у(1).
Нижеследующая теорема дает н е о б х о д и и о е условие оптимальности для рассматриваемой задачи. Т е о р е м а 21. Пусть и(1), Р(1) — оптимальная пара управлений, х(1), у(1) — соответствующая оптимальная пара траекторий (см. Уравнения (61), (62)) и Т вЂ” время преследования.
Тоеда существуют такие нетривиальные решения ф(~), Х(1) систем (63), (64), соответствующие функциям и(1), х(1), о(1), у(1), что: 1' для всех 1, 0 ( 1 ( Т, выполнены условия максимума гпах Н1(1Р(1), х(~), и)=Н1(ф(1), х(1), и(1)), (65) ахеи шах Н, (Х (1), У (1), о) = Н, (Х (1), у (1), Р (С)); (66) хз Р 2' в момент 1 = Т выполняются условия Н,(ф(Т), х(Т), и(Т)))Н,(Х(Т), у(Т), Р(Т)), (67) 1р (Т) = Х (Т). (68) ОДНА ЗАДАЧА ПРВСЛВДОВАНИЯ 251 з зо1 Д о к а з а т е л ь с т в о.
Пусть и — произвольная внутренняя точка многогранника У. Положим и=и — и . о Тогда уравнение (61) перепишется в виде — = Ах+ В и + (Ви'+ с). ш Таким образом, перенося начало координат пространства Е, в точку ио, мы лишь изменяем свободныйчлен с в уравнении (61); однако теперь начало координат пространства Е„ будет уже внутренней точкой многогранника У. Мы будем предполагать, что такой перенос начала (если он нужен) уже сделан в уравнении (61), так что начало координат является внутренней точкой многогранника У.
Обозначим, далее, через хо(~) решение уравнения (61), соответствующее управлению и = 0 (зто управление допустимо, так как начало координат принадлежитмногограннику У) и начальному значению х'(0) = х, (см. (59)). Решение хо(о) удовлетворяет уравнению л (о) А о(о)+ (69) и потому является аналитической функцией от г. ПУсть и,(~), Рг(Г), 0 ( Г ( ~ы — пРоизвольнаЯ ДопУстимая пара управлений и х, (г), р, (о) — соответствующие траектории уравнений (61), (62) с начальными условиями (59), т. е. '( ~ =Ах (~)+Вио (з)+с, (70) (71) х,(0)=х„у,(0)=у .
(72) Положим хЯ хгР) хо(С) У(Е)=У (Е) — хо(Е) (73) РАЗНЫЕ ЗАДАЧИ [ГЛ. А 252 Тогда, з силу (69), (70), (71), мы имеем =- Ах(2)+Ви,(г), =у(у(~)+ 'Я, Р,(~), ~) — А '(~) — с= =а (у(1), э (2), 1), где через у, обозначена функция уг (у, Р, Ц =у(у+ хэ (1), и, Π— Ахэ(1) — с (ср. сноску на стр. 249). Итак, функции х(г), у(~) удовлетворяют дифференциальным уравнениям —,=Ах+Ви, Ых (74) (75) с=О, хе=О (77) при и = иэ (Г), Р =- э,(~)) н начальным условиям (см. (72)) х(0)=0, у(0)=уз — х,. (76) Обратно, если функпии х(~),у(~) удовлетворяют уравнениям (74), (75) и начальным условиям (76), то функции х,(~), у,(г), определяемые по формулам (73), удовлетворяют уравнениям (61), (62) и начальным условиям (59). Далее, из (73) ясно, что каждый момент встречитраекторий х„ут является также моментом встречи траекторий х, у и обратно (т.
е. еслих, (У) = у,(У), то х(У) = = у(У) и обратно). Поэтому в первоначальной задаче о преследовании можно заменить уравнения (61), (62) и начальные условия (59) уравнениями (74), (75) и начальными условиями (76). Наконец, ясно, что если мы докажем теорему 21 для аадачи (74), (75), (76) и затем в формулировке теоремы произведем замену (73), то получим теорему 21 для аадачи (61), (62), (59). Таким образом, при доказательстве теоремы 21 мы можем рассматривать лишь задачу (74), (75), (76).
Можно сказать и иначе: достаточно доказать теорему 21 (в первоначальной формулировке задачи, см. (61), (62), (59)) для случая, когда 253 ОДНА ЗАДАЧА ПРВСЛВДОВАНИЯ 5 ЗЫ н, кроме того, начало координат пространства Е„переменных ит,..., и" является внутренней точкой многогранника Г7.
Переходим к доказательству теоремы 21 при выполнении этих упрощающих нредположеннй. Для любого 1г ) 0 обозначим через Х,, множество всех тех точек фазового пространства Х, в которые можно попасть, двигаясь из начала координат в силу системы (74), за время — 1, (под воздействием надлежащего управления). Множество Еь является выпуклым ограниченным множеством пространства Х, содержащим внутренние точки (см. стр. 150). В любую точку множества Х,, можно попасть и за время, в точности равное ~, (нбо перед началом движения можно в течение любого времени находиться в начале координат, считая и = 0). Границу выпуклого тела Е,, обозначим через Яь.
Покажем, что во всякую в н у т р е н н ю ю точкумножества Х,, можно попасть (двигаясь из качала координат в силу системы (74)) за время, м е н ь ш е е чем т,; обратно, если в некоторую точку можно попасть за время, меньшее чем 1„то она является в н у т р е н в е й точкой тела Х, В самом деле, пусть а — произвольная внутренняя точка множества 2 1,. Пусть, далее, ~р (~) — такое решение уравнения (5) гл.
3, что управление и (1), определяемое уравнением (6) гл. 3, переводит фазовую точку из начала координат в положение а. Обозначим через момент времени, когда фазовая точка, движущаяся под воздействием этого управления, попадает в положение а. Мы рассмотрим функцию ф (1), определяемое ею управление и (8) и соответствующую фазовую траекторию хэ (~) на отрезкевремениО ~ 1( 8", где у') 1'.Таккакх (8') = а, то при 1" достаточно близком к ~' точках„(8") лежит внутри тела Х,, Но траекториях„, (1), 0 =. 1(1™, является о п т и м а л ь н о й траекторией системы (74) (единственной в силу теоремы 12), ведущей из начала координат в точкух (Р'), и, таккакхэ(~")~ Ха, то 1" ( 1,. Следовательно, Р ( 1,.
Обратно, пусть в точку а можно попасть за время ~' ( т, при помощи некоторого управления и (1). Рассмотрим множество Хп-р состоящее из точек, в которые можно попасть (с помощью какого-либо управления) аа время — оно содержит начало координат в н у т р и себя. Двигаясь из различных точек множества ЕО-~ с 254 РАЗНЫЕ ЗАДАЧИ «гл. 4 помощью управления и„, («) в течение времени «', мы получим множество И', содержащее точку а внутри себя (рис. 87). В любую точку множества И" можно попасть из начала за время ( «, (двигаясь сначала в течение времени «, — «' внутри множества ХЬ и. а затем в течение времени «' от Рис.