Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 5
Текст из файла (страница 5)
Мы теперь объединим системы (11), (12) одной записью, для чего рассмотрим следующую функцию М пе- РЕМЕППЫХ Х', ..., Х, фа, фп ..,, фа, и', ..., й: Я (1р, х, и) = (ф, [ (х, и)) = Х ф,! (х, и). а О Непосредственно проверяется, что написанные вьппе системы (11) и (12) могут быть с помощью этой функции Я записаны в виде следующей гамильтоновой системы: с~х' дЯ дФ ' — — 1=0, 1,..., п.
~Хор дЯ' (15) а[ дх' Итак, взяв произвольное допустимое (т. е. кусочнопепрерывное) управление и(1), 1О(1 = [и и начальное условие х(1О) =ха, мы можем найти соответствующую (т. е. удовлетворяющую системе (14) ) траекторию х(!) = (хО(1), х'(1), ..., х" (1)). После этого мы можем ПРИНЦИП МАКСИМУМА находить соответствующую функциям и(!) и х(!) решения р(!) =(ф. (!), ф (1), "., ф. (т)) системы (15). Еще раз подчеркнем, что вектор-функции х(!) и ~р(!) непрерывны и всюду, кроме конечного числа точек, имеют непрерывные производные по б При фиксированных (постоянных) значениях ~р и х функция Я становится функцией параметра ив- =П; точную всрхнюю грань значений этой функции мы обозначим через л'(Ч, х): .й'(ф, х) = зпр Ж(~р, х, и).
и~о Если точная верхняя грань значений непрерывной функции Я достигается в некоторой точке области управления (7, то .К(ф,х) есть максимум значений функции Я при фиксированных ~р и х. Поэтому нижеследующую теорсму 1 (необходимое условие оптимальности), главным содержанием которой является равенство (!6), мы называем принципом максимума. Теорема 1. Пусть и(!), 1ь( ! < !ь — такое допустимое управление, что соответствуюи!ая ему траектория х(!) (см. (14)), исходящая в момент 1, из точки х,, проходит в момент !1 через некоторую точку прямой П, Для оптимальности управления и(!) и траектории х(!) необходимо существование такой ненулевой непрерывной вектор-функции ф(Г) = (фг(!), ф~ (!),..., ф„(!) ), соответствующей функциям и(!) и х(!) (см.
(15)), что: 1' пРи любом 1, !ь ( ! ( !и фУнкЦиЯ Ж (ф(!), х(!), и) переменного и~ П достигает в точке и = и(!) л~аксимума гв (ф(!), х(!), и(!)) = Х(ф(!), х(!)); (16) 2' в конечный момент !1 выполнены соотношения фь(!1) (О, М(Ф(11), х(!1)) =О. (17) Оказывается, далее, что если величины ф(!), х(!), и(1) удовлетворяют системе (14), (15) и условшо 1', то функции фь(!) и ЛГ(лр(!),х(!)) переменного ! являются постоянными, так что проверку соотношений (17) можно проводить не обязательно в момент !и а в любой момент ПРИНЦИП МАКСИМУМА !е ( ! ( !ь (Доказательство теоремы 1 приводится в гл.
2.) Выведем теперь из теоремы ! аналогичное необходимое условие для оптимальности по быстродействию. Для этого в теореме ! следует положить !Р(х,и) = 1. Функция Ж принимает в этом случае вид л Ж=фо+ Х Ы'(х, и). Вводя и-мерный вектор ~) =(~рным...,ф„) и функцию л Н (ф, х, и) = ~ ф„)'(х, и), мы можем записать уравнения (4) и (!2) (кроме уравнения (12) для ! = О, которое теперь не нужно) в виде гамильтоновой системы ах~ дН ~11 да,. ' — — — 1=1,2,...,п, д4ч дН (19) и! дх1 При фиксированных значениях ~р и х функция Н становится функцией параметра и; верхнюю грань значений этой функции мы обозначим через М®х): М (ф, х) = зпр Н Я, х, и). и~и В силу соотношения Н(ф х, и) Ж(ф, х, и) — ф мы получаем М (Ф х) = ил (Ф, х) — $0, и потому условия (16) и (17) принимают теперь вид Н (ф (!), х (!), и (!)) : М (ф (!), х (!)) = — фи Ъ О .
Таким образом, мы получаем следующую теорему. Теорема 2. Пусть и(Г), !ее Г(!ь — допустимое управление, переводящее 4азовую точку из положения ха в положение хь а х(!) — соответствующая траектория (см. (18)), так что х(!л) хо, х(1,) = хь Для оптимальности (по быстродействию) управления и(!) и траекто- з 4] овсу7кде1тие пРинципА мАксимумА 27 рии х(1) необходимо существование такой ненулевой непрерывной вектор-функции зр(1) = (зр1(1), з)»а(1), ... ...,ф„(1)), соответствующей функциям и(1) и х(1) (см. (19)), что: 1' для всех 1, (о(1 =1ь функция Н(ф(г'),х(г'),и) переменного и~ (У достигает в точке и = и(1) максимума Н(зР(1), х((), и(1))=М(зР(1), х(1)); (20) 2' в конечный момент 11 выполнено соотношение (2!) М(зр(1,), х(11)))0. Оказывается, далее, что если величины ф(1), х((), и(1) удовлетворяют системе (18), (19) и условию 1', то функция М(ф(1), х(1) ) переменного 1 постоянна, так что проверку соотношения (21) можно проводить не обязательно в момент 1„а в любой момент 1, 1о ( 1 ( 11.
9 4. Обсуждение принципа максимума") Теорема 1 позволяет из всех траекторий, начинающихся в точке хо и кончающихся в некоторой точке прямой 11, и соответствующих им управлений выделить лишь отдельные, вообще говоря, изолированные траектории и управления, удовлетворяющие всем сформулированным условиям. Действительно, мы имеем 2п+ 3 соотношений (14), (15), (16) между 2п+ 3 переменными»») х, ф„, и, т.
е, имеем «полную систему соотношений» *) Этот параграф имеет своей целью показать «достаточность» системы соотношений, указанной в теореме 1, для решения поставленной оптимальной задачи. Принодимые з этом параграфе рассуждения не претендугот на строгость и нигде и дальнейшем пе используются. "") Напомним, что «одна» переменная и может распадаться на несколько отдельных переменных, например, может быть точкой г-мерного векторного пространстна; в этом случае условие максимума (16) также можно считать содержащим г отдельных соотношений. Если, например, максимум достигается ао внутренней точке области управления (l (расположенной н г-мерном пространстве переменных и', ..., и"), то для выполнения услоаня максимума (16) [Гл. ! пн[лнцип млкснмуыл для определения всех этих переменных.
Так как, далее, соотношение (16) конечное (не дифференциальное), а дифференциальные уравнения мы имеем в количестве 2п + 2 (соотношения (14) и (15) ), то рсшсння системы уравнений (!4), (!5), (!6) зависят, вообще говоря, от 2п+2 параметров (начальных условий). Однако один из этих параметров является несущественным, так как функции ф,„([) определены лишь с точностью до общего множителя (пбо функция ре однородна относительно зр).
Кроме того, один из параметров связан условием, что в момент (с величина !пах Ж (ф ([а) х ((о) и) ион обращается в нуль Итак, все многообразие решений системы (14), (!5), (!6) зависит от 2н параметров. Этими 2п параметрами следует распорядиться так, чтобы траектория х(() проходила при заданном (=(э через точку хэ, а при к а к о м - н и б у д ь (! ) (э проходила через точку на прямой П, Число (, — (е также является параметром, так что всего у нас имеется 2л+1 существенных параметров.
Условие прохождения траектории через точку хе и прямую П дает 2п+! соотношений. Следовательно, можно ожидать, гго имеются лишь отдельные, изолированныс траектории, соединяющие точку х, с прямой П и удовлетворяющис условиям, указанным в теореме 1. Лишь эти отдсльпые, изолированные траектории и могут необходимо обращение в нуль г частных производных: дЯ(тр(1), к(1), и) ~ !и дп[ если максимум достигается на (г — 1)-мерной грани области управления [[, то должно выполняться условие принадлежности точки и([) этой грани (это дает одно соотношение) и должны обращаться в нуль частные производные функции Зэ" (ф([), х(Г), и) по всем направлениям в этой грани (это дает еще г — 1 соотношений!. Аналогичное положение вещей имеет место и на гранях меньшего числа измерений (илг на искривленных частях границы области управления [[).
Танич образом, во всех случаях можно считать, что если область управления [[ является г-мерной, то условие максимума (!6) содержит г соотношений. ПРИМЕРЫ ЗАДАЧА СИНТЕЗА оказаться оптимальными (ибо указанные в теореме ! условия необходимы для оптимальности). Если, в частности, условиям теоремы 1 удовлетворяет лишь о д н а траектория, соединяющая точку хе с точкой прямой П, а из технических соображений, приведших к постановке оптимальной задачи, «ясно», что оптимальная траектория должна существовать, то можно надеяться, что найденная траектория как раз и является оптимальной.
Следует, однако, отмстить, что матехштичегки вопрос о существовании оптимальной траектории представляется очень важным и трудным. В частном случае оптимальности по быстродействию для линейных систем (4) он решается в третьей главе. $ 5. Примеры. Задача синтеза В этом параграфе мы рассмотрим применение принципа максимума к решению некоторых простых задач об оптимальных бысгродействиях. Из рассмотрения этих примеров выясняегся новая важная постановка задачи об оптимальных процессах — задача синтеза оптимальных управлений. Пример ! Фх Рассмотрим уравнение,, = и, где и — вещественный управляющий параметр, подчиненный условию лх ~ и ~ ( !. В фазовых координатах х' = х, х' = — это уравнение переписывается в виде следующей системы: лх х лх хх ~й ' ш (22) Рассмотрим (для фазовой точки, движущейся по закону (22)) задачу о быстрейшем попадании в начало координат (О, О) нз заданного начального состояния х,.
Иначе говоря, мы будем рассматривать задачу об оптимальном быстродействии в случае, когда конечным положением служит начало координат: х, = (0,0). Функция П в рассматриваемом случае имеет вид Н=фх'+ ф,и. (23) 1гл. ! ПРИНЦИП МАКСИМУМА Далее, для вспомогательных переменных ф!, фз мы получаем систему уравнений (см. (19), (23)) ! — 0 д ! — Ф е4!! еФ! ~й е! откуда ф! = с!, фт = сг — с,1 (с!, ст — постоянные). Соотношение (20) дает нам (учитывая (23) и условие — 1!~и< 1) (а', з' — постоянные интегрирования), откуда получаем х' = — (х')'+ г, (25) 1 где з=з' — — (зт)' — постоянная.
Таким образом, кусок 2 фазовой траектории, для которого и аа1, представляет собой дугу параболы (25). Семейство парабол (25) показано на рис. 5,а). Аналогично, для отрезка времени, на котором и— а!а — 1, мы имеем х — 1+в, т рз х' - 2 +з'1+з' -7( — ~+~ )+(~ + 2 (~ ) ) откуда получаем х' = — — (х')'+ з' 2 (25) и (Г) = 3! 5п ф, (1) = $13п (с, — с1). (24) Из (24) следует, что каждое оптимальное управление и Я, 1ь ( 1 ( 1!, является кусочно-постоянной грунхцией, принил!ающей значения ~! и имеющей не более двух интервалов постоянства (ибо линейная функция се†с!1 не более одного раза меняет знак на отрезке 1а !~ 1~ 1,).
Обратно, любая такая функция и(1) мотает быть получена из соотношения (24) при некоторых значениях постоянных с„се. Для отрезка времени, на котором и — 1, мы имеем (в силу системы (22) ) х 1+8, х — ~ +з1+8 — — (г+3) +(я — — ) З1 ПРИМЕРЫ. ЗАДАЧА СИНТЕЗА Семейство парабол (26) показано иа рис. б,б). По параболам (25) фазовые точки движутся снизу вверх (ибо д х — -и +11. а по параболам (26) — сверху вниз и ( мхх 1) Рас 5. Как было указано выше, каждое оптимальное управление и(1) является кусочно-постоянной функцией, принимающей значения ~1 и имеющей не более двух интервалов постоянства. Если управление и(1) сначала, в течение некоторого времени, равно + 1, а затем равно — 1, то фазовая траектория состоит нз двух кусков па.- рабол (рис. 6,а)), примыкающих друг к другу, причем второй из этих кусков лежит на той из парабол (26) !гл. ! ПРИНЦИП МАКСИМУМА которая проходит через начало координат (ибо искомая траектория должна вести в Начало координат).