Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 20
Текст из файла (страница 20)
о координату точек хо,хь т. е. хо = (О, хо), х~ — — (хо((,), х~). Обозначим через Т, касательную плоскость к многообразию 5, в точке хь а через У'~ — плоскость (гнмерную) пространства Х, состоящую нз всех точек нида (хо(1~), х), где х~ Ть Г!ревелем через каждую точку плоскости У 1 луч, идущий в направлении отридательной полуоси х', н обозначим множество точек, заполняемое всеми этими лучами, через О. Множество О представляет собой (г~+1)-мерную полуплоскость; ее граничными точками являются точки плоскости У ь Обозначения То н У о вводим аналопшно.
Обозначим через Л.'и выпуклую оболочку множества Аь, и(У о) () Кь. Таким образом, конус Л'~ с вершиной х(!) онрсделсн для любой правильной точки ! = т управления и((), а также для ! = (ь Если !" > у то Аос ~ (.% ) с: Ж. (сч. лемму В). Лом м а !1. Конусы Хи н 1~, имеющие общую вершину в точке х((,), явля~отся разделяемыми. В самом деле, допустим, что конусы Хь и О не являются разделяемыми. Так как конус УТь является объединением конусов Аи, т(у',), то найдется такая правильная точка т управления и(!), что конусы Аь,,(Я',) и О также не явля1отся разделяемыми.
Выберем такую точку т. Обозначим через Ль многообразие с краем, состоящее нз всех точек (х', х) я Х, для которых хо ( хо((,), х я в= 5ь Тогда касательная нолуплоскость многообразия Ль в точке х((~) совпадает с О. Для произвольной точки н он Ль мы обозначим через у((, т1) решение системы (7) с начальным условием у(6ь т)) = з1.
Мы будем рассматривать это решенно на отрезке т = ! ( 1ь где т — выбранная правильная точка управления и(!). Когда точка ц! пробегает многообразие Лш точка у(т, т1) также нробегает некоторое многообразие с краем, которое мы обозначим через Л,. Легко видеть, что касательная полу- плоскость многообразия Л, в точке х(т) совпадает с А ,(ц) Так как конусы Аь,(Х,) и Я нс являюгся разделяемыми, то конусы Аь, ~(Аь,,(УТ,)) = Уь'т и А~,,', ф) также не являются разделяемыми. Но так как А,„,Я) ссть $ >о1 вывод тсловии трлнсверсхльности 129 касательная полуплоскость многообразия Лт, то, в силу леммы 10, существует такое управление и,(1), что соответствующая ему траектория х,(1), исходящая из точки хо — — (О, хо), где хо ~ 5о, проходит через некоторую точку многообразия Л,, не лежащую на его краю.
Иначе го. вора, существуют такое У ) >о и такая точка т) ~ Лп, не лежащая на краю многообразия Л>й что х. (у) = у (т, т)). (46) Определим теперь управление и„(1) на отрезке (о <1( 1>+ (У вЂ” т), положив и.(1) при 1о~1(1', и (1)= и(1 — (у — т) при у <1(1> -(-(у — т). Траектория х„„(1), соответствующая управлению и„(1) и исходящая из точки хо, имеет следующий вид (ср. (46)); х,(1) при 1о(1(1', х (г) = у(1 — (у — т), о)) при у(1(1, +(у — т). В частности, х„(1>+ (У вЂ” т)) у(1>, т)) = т).
Но точка т) принадлежит многообразию Л>„т. е. имеет вид т1 (т)о, >)), где т1 из Я>. Так как, кроме того, точка т) не лежит на краю многообразия Лп, то т1" ( хо(1,). Таким образом, управление и„,(1) переводит фазовую точку из положения хо в положение т1 ен 5>, и для него функционал (6) принимает значение т)о, меньшее, чем для управления и(1). Но это противоречит тому, что управление и(1) и траектория х(1) оптимальны. Таким образом, лемма 11 доказана.
Теперь уже нетрудно закончить доказательство теоремы 3, Так как конусы >р'ь и Я являются разделяемыми, то существуют такие числа с„с>, ..., с„, что конус ,л>'И (а значит, и Кп~Ж,) лежит в полупространстве й ~, сах" ((О (где хо, х', ..., х" — координаты в проста-о раистве Хп), а конус Я вЂ” в полупространстве ~ сах" ) О. а-о л. с. Нонтрягнй и йр.
130 докхзлтельство пгинпипх мхкснмхмл 1гл. т В частности, луч !*.О, (лежащий в полуплоскости Я) расположен в полупространстве ~ с ха) О. Таким обраа-О ЭОМ, ЧИСЛа СО, С!, ..., Си ОбЛаДаЮт ВСЕМИ СВОйетВаМИ, указанными в $15, и потому решение !р(1) системы (8) с начальным условием !р(1!) = с (где с — вектор (са, с!, ..., с„)) удовлетворяет условиям, указанным в теореме 8 (или в теореме 1).
Покажем, что вектор Ор(1) удовлетворяет условию трансверсальностн в обоих концах траектории х(1). Плоскость т ! (содержащаяся в (,!) расположена целиком и в полупространстве Х с х' О, н, следовательно, в ги- «-О л перплоскостн ~, с х" = О, или, что то же самое, в гипера О и плоскости Х ОР, (г!) ха = О. Если теперь т) = (т)', ... а-1 ..., т1и) — произвольный касательный вектор многообразия 5! в точке х(1!), т. е.
вектор, лежащий в плоскости Т!, то вектор Ч = (О, т)) пространства Х расположен в плоскости У !, н, следовательно, в гиперплоскости л ~, Ф (!!) х =О. Иначе говоря, (Ор(1!), О1) =О. Но так а-О как «нулевая» координата вектора Ч равна нулю, то пол следнее соотношение принимает вид Х !г,(1,) т1' О. О-! Таким образом, вектор-функция !р(1) удовлетворяет условию трансверсальности в правом конце траектории х(1). Далее, плоскость А!„!,(У О) ~Х'!, расположена целил ком в полупространстве ~ с ха ~ О, а следовательно, в а-О гиперплоскости ~ с х' = О или, что то же самое, в гиа-О л перплоскости Х Ора(г!)х =О. Иначе говоря, для люа О бого вектоРа феЯУ О вектоР Ас»ОО(В) лежит в гипеРпло- вывод головни твлнсвввслльностн $!б1 131 скости ~, ф (г,)х'=О, т.
е. а-О (ФРю), А,.ь(В))=О. Из этого, в силу леммы 1, вытекает, что (ф((з), $) = О. По любой вектор $ ~ У в имеет вид й = (О, $), где $ = (~и, ..., $") — вектор, лежаший в плоскости Т,. Поэтому соотношение Я((Д, $) = О принимает вид Х ф,((„)$'=О. Таким образом, вектор-функция ~р(() ч-! удовлетворяет условию трансверсальности и в левом конце траектории х((). Тем самым теорема 3 полностью доказана. Вместе с тем доказаны и все остальные теоремы первой главы. ГЛАВА 3 линенные ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ В 17. Теоремы о числе переключений Важными для приложений и хорошо иллюстрирующими общие результаты примерами являются линейные оптимальные быстродействия, т.
е. оптимальные быстродействия в случае„когда уравнения, описывакнцие поведение объекта, линейны. Рассмотрению таких быстродействий и посвящена настоящая глава. Здесь мы не только изложим факты, вытекающие непосредственно из доказанных выше теорем, по и получим некоторые новые результаты, в частности, докажем теорему суи)ествованил для линейных оптимальных быстродействий. Уточним прежде всего п о от а н ов к у з а д а ч и. Мы будем рассматривать объект, закон движения которого записывается в виде линейной системы дифференциальных уравнений л — агх + ~~~ Ь!ио, 1=1, 2, ..., а. (1! Мы будем, далее, предполагать, что областью управления су является выпуклый замкнутый ограниченный многогранник*), расположенный в г-мерном векторном про- е) Выпуклый аамкнутый многогранник в Е, представляет собой пересечение конечного числа аамкнутых полупространств, т.
е. множество точек в Ео удовлетворяющих конечной системе линейных теоремы о числе пеРеключгний $ !и 1ЗЗ страпстве Е, с координатами и', ..., и". Таким образом, управляющий параметр и = (и', ..., и') является точкой многогранника Н. Наконец, мы будем рассматривать лишь задачу об оптимальном быстродействии, т. е.
задачу о минимизации времени перехода 1! — гя —— ~ Ж. Оптимальную за!, дачу в такой формулировке назовем задачей о линейных оптимальньгх быстродействиях, В векторной форме система (1) может быть записана следующим образом. ох = Ах+ Ви; (2) здесь А: Х-+-Х н В-Е,— Х вЂ” линейные операторы, определяемые (в координатах х', ..., х" н и', ..., ит) матрицами (а') и (Ь') соответственно. Во всех теоремах, доказываемых в этой главе, мы будем предполагать (це указывая этого каждый раз), что выполнено следу!оп!ее условие общности положения, накладываемое на коэффициенты уравнения (2) и на расположение многогранника У: если ге — вектор, имеющий направление одного из ребер многогранника У, то вектор Вю не принадлежит никакому истинному подпространству пространства Х, инвариантному относительно оператора А, т.
е. векторы В!в, АВтв, ..., А" 'Вге (3) линейно независилгы в пространстве Х. Функция Н (ф, х, и) (см. теорему 2) в рассматриваемом случае имеет вид Н (ф Ах)+(ф Ви)= 2 ф анх'+ ~ ф йнив, (4) л неравенств г аав а~() ! 1, 2, .... а. Если этот многогранник ! а а-! ограничен (и, следовательно, компактен), то ои явяяется выпуклой оболочкой своих вершин; очевидно, что число вершин конечно. 134 линейные Оптимллы!ые выстРОЛейстния [гл. 3 а вспомогательная система (см. формулу (19) гл. 1) за- писывается в виде Ефт — = — ~'"ф, 1=1,"., ' ш — 1,! т ! или, в векторной форме, — „, = — А"т), г)ф (5) где А' — опсратор, сопряженный к А, т.
е. оператор, оп- ределяемый (в той же системе координат) матрицей, по- лучающейся из матрицы (а',.) системы (!) транспониро- ванием. Очевидно, что функция П, рассматриваемая как функция переменного и ~ П, достигает максимума одно- временно с функцией (ф, Ви). Максимум функция (ф Ви), рассматриваемой как функция переменного и ~ П, мы обозначим через Р(т)!). Из теоремы 2 следует (см. формулу (20) гл.
1), что если и(1) — оптимальное управ- ление, переводящее фазовую точку из положения хо в по- ложение х!, то существует такое решение ф(1) уравне- ния (5), что (тр(1), Ви(1)) =Р (ф(1)). (6) Так как уравнение (5) ие содержит неизвестных функ- ций х(1) и и(1), то все решения этого уравнения легко могут быть найдены, после чего легко могут быть най- дены все управления и(1), явля!ощиеся решениями урав- нения (6); среди них, очевидно, содержатся все опти- мальные управления для уравнения (2).
Вопрос о том, насколько однозначно условие (6) определяет управле- ние и(1) через функцию эр(1), решается нижеследующей теоремой. Т е о р е м а 9. Для каждого нетривиального решения ф(1) уравнения (5) соотношение (6) однозначное) олре- э) Здесь, кан и в главе 1, мы предполагаем, что рассматриваемые управления полунепрерывны слева и непрерывны в концах отрезка 1э я~ 1 < 1! (ср. стр. 1Б). Без этого соглашения теорема 9 была бы неточной, а именно, значения функции п(1) в точках разрыва не были бы однозначно определены. Впрочем, ясно, что значения функции и(1) в точках разрыва пе играют никакой роли в рассматриваемых вопросах. гзв теОРемы О числе пеРеключений деляет управляющую функцию иЯ; при этом оказывается, что функция и(1) кусочно-постоянная и ее значениями являются лишь вершины мггогогранника сг.
Доказательств о. Так как функция (т)г(1), Ви), (7) рассматриваемая как функция вектора и, линейна, то она либо постоянна, либо достигает своего максимума лишь на границе многогранника С1. Это же соображение применимо и к каждой грани многогранника (7. Таким образом, функция (7) достигает своего максимума либо лишь в одной вершине многогранника с1, либо на целой грани этого многогранника*). Покажем, что в силу условия общности пологкения последнее возможно лишь для конечного числа значений 1. В самом деле, допустим, что на отрезке 1о ( 1 ~ 1, существует бесконечное число таких значений 1, для каждого из которых функция (7) переменного и~ 0 достигает своего максимума на некоторой (имеющей положительную размерность) грани многогранника 1г'. Так как У имеет лишь конечное число граней, то мы можем выбрать бесконечное множество М таких значений 1, для каждого из которых функция (7) достигает своего максимума на некоторой (одной и той же для всех 1~ М) грани Г многогранника (7.