Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание), страница 5
Описание файла
DJVU-файл из архива "Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание)", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "оптимальное управление" в общих файлах.
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 5 - страница
во и Если точная верхняя грань значений непрерывной функции ой" д о с ти г а е т с я в некоторой точке области управления 1С, то 4Г(ор,х) есть максимум значений функ- ПРИНЦИП МАКСИМУМА ции оЯ" при фиксированных ф и х. Поэтому нижеследующую теорему 1 (необходимое условие оптимальности), главным содержанием которой является равенство (16), мы называем принципом максимума. Т е о р е и а 1. Пусть и (г), 1о (Г( гю — такое допустимое управление, что соответствующая ему траектория х (~) (см. (14)), исходящая в момент 1г из точки хз, проходит в момент г, через некоторую точку прямой П.
Для оптимальности управления и(г) и траектории х (Г) необходимо существование такой ненулевой непрерывной вектор-функции ~р (Г) = (1рг (г), ~р, (г), ..., ф, (Г)), соответствующей Функциям иЯ и х(г) (см. (15)), что: 1' при любом Г, 1, = Г~ Ю„Функциями" (ф (г), х (8), и) переменного и~Н достигает в точке и = и (г) максимума оЯ" (ф(1), х(г), и(г)) = ж(ф(г), х(1)); (16) 2' в конечный момент гг выполнены соотношения ф (г,) ( О, М (ф (г,), х (г,)) = О. (17) Оказывается, далее, что если величины зу (Ю), х (8), и (8) удовлетворяют системе (14), (15) и условию 1', то узункции фг(г) и зз (ър (Ю), х (Ю)) переменного 1 являются постоянными, так что проверку соотношений (17) можно проводшпь не обязательно в момент ~„а в любой момент г, гг ~ 8 ( гд.
(Доказательство теоремы 1 приводится в гл. 2.) Выведем теперь из теоремы 1 аналогичное необходимое условие для оптимальности по быстродействию. Для этого в теореме 1 следует положить 7г (х, и) = 1. Функцияеч принимает в этом случае вид 2с =то+ Х Ю'(х и). т 1 Вводя и-мерный вектор ~> = (ам ~р„..., ф,) и функцию Н (ф х, и) = '5', ф~'(х, и), ч ! мы можем записать уравнения (4) и (12) (кроме уравнения (12) для 1 = О, которое теперь не нужно) в виде ПРИНЦИП МАКСИМУМА Сгл. с гамильтоновой системы В**' дН вЂ” — — С = 1 2, ...
н дц дф ! ''' ~ ! В'тС дН ВС ОгС вЂ” — С = 1, 2,..., и. (18) (19) При фиксированных эначенияк ф и х функция Н становится функцией параметра и; верхнюю грань значений этой функции мы обозначим через М (ф х): М(ф, х) = варН(ф, х, и).
ибо В силу соотношения Н (ф х, и) = Ж (ф, х, и) — фг мы получаем М(Ф х) = "Ж(ф, х) — Фо, и потому условия (16) и (17) принимасот теперь вид Н (ф (С), х (С), и (С)) = М (ф (С), х (С)) = — ~Уг ~ О. Таким образом, мы получаем следующую теорему. Т е о р е м а 2. Пусть и (С), Сг ( С ( С, — допустимое управл нов, переводящее фазовую точку из положения хг в положение х„а х (С) — соответствующая траектория (см. (18)), так что х (сг) = х, х (сс) = хм Длл оптимальности (по быстродействию) управления и (С) и траектории х (С) необходимо существование такой ненулевой непрерывной вектор функции ф (С) = (ф, (С), фг (С), ..., ф„(С)), соответствующей функциям и (С) и х (С) (см.
(19)), что: 1' для всех С, Сг ( С ( С„функция Н (ф (С), х (С), и) переменного и ~: Н достигает в точке и = и (С) максимума Н(ф(С), х(С), и(С)) =М(ф(С), х(С)); (20) 2' в конечный момент С, выполнено соотношение М (~э (с,), х (с,)) ~ 0. (21) Оказывается, далее, что если величины ф (С), х (С), и (С) удовлетворяют системе (18), (19) и условию 1', то функция М (ф (С), х (С)) переменного С постоянна, так что проверку соотношения (21) можно проводить не обязательно в момент См а в любой момент С, Сг ( С = С,.
««1 ОБСУЖДЕНИЕ ПРИНЦИПА МАКСИМУМА 4 4. Обсуждение принципа максимума ") Теорема 1 повволяет из всех траекторий, начинающихся в точке х«и кончающихся в некоторой точке прямой П, и соответствующих им управлений выделить лишь отдельные, вообще говоря, изолированные траектории и управления, удовлетворяющие всем сформулированным условиям. Действительно, мы имеем 2п + 3 соотношений (14), (15), (16) между 2п + 3 переменными *е) к',«р„, и, т. е.
имеем «полную систему соотношений» для определения всех этих переменных. Так как«далее, соотношение (16) конечное (не дифференциальное), а дифференциальные уравнения мы имеем в количестве 2п + 2 (соотношения (14) и (15)), то решения системы уравнений (14), (15), (16) зависят, вообще говоря, от 2п + 2 параметров (начальных условий). Однако один ив этих параметров является несущественным, так как функции ф„(1) определены лишь с точностью до общего множителя (ибо функция ай" однородна относительно «р).
Кроме «) Этот параграф имеет своей целью показать «достаточность» системы соотношений, указанной в теореме 1, для решения поставленной оптимальной задачи. Приводимые в етом параграфе рассуждения ве претендуют на строгость и нигде в дальнейшем не используются. *«) Напомним, что «одна» переменная и может распадаться на несколько отдельных кеременвых, например может быть точкой г-мерного векторного пространства; в этом случае условие максимума (16) также можно считать содержащим г отдельных соотношений. Если, например, максвмум достигается во внутренней точке области управления «Г (расположенной в г-мерном пространстве переменных и«, и"), то для выполнения условия максимума (16) необходимо обращение в нуль г частных производных: д )1 («р(«), в(«), и) / дит и иш вели максимум достигается на (г — 1)-мерной грани области управления (Г, то должно выполняться условие принадлежности точки и(г) втой грани (зто дает одно соотношение) и должны обращаться в нуль частные производные функции «21"(»р(«), в(«),и) по всем направлениям в этой грани (зто дает еще г — 1 соотношений).
Аналогичное положение вещей имеет место и на гранях меньшего числа измерений (или на искривленных частях границы области управления У). Таким образом, во всех случаях можно считать, что если область управления Н является г-мерной, то условие максимума (16) содержит г соотношений. 28 ПРИНЦИП МАКСИМУМА ~гл. ! того, один из параметров свяаан условием, что в момент го величина (Ф(го) х(го) и) исп обращается в нуль. Итак, все многообрааие решений системы (14), (15), (16) зависит от 2к параметров. Зтими 2к параметрами следует распорядиться так, чтобы траектория х (о) проходила при заданном г'= го через точку х„а при к а к о м-н и б у д ь Г, > го проходила череа точку на прямой П. Число г, — го также является параметром, так что всего у нас имеется 2к + 1 существенных параметров.
Условие прохождения траектории череа точку х и прямую П дает 2п + 1 соотношений. Следовательно, можно ожидать, что имеются лишь отдельные, изолированные траектории, соединяющие точку хо с прямой П и удовлетворяющие условиям, укаэанным в теореме 1. Лишь эти отдельные, изолированные траектории и могут окаааться оптимальными (нбо указанные в теореме 1 условия н ео б х о д и м ы для оптимальности). Если, в частности, условиям теоремы 1 удовлетворяет лишь о д н а траектория, соединяющая точку х, с точкой прямой П, а из технических соображений, приведших к постановке оптимальной задачи, «ясно», что оптимальная траектория должна существовать, то можно надеяться, что найденная траектория как раз и является оптимальной. Следует, однако, отметить, что математически вопрос о существовании оптимальной траектории представляется очень важным и трудным. В частном случае оптимальности по быстродействию для линейных систем (4) он решается в третьей главе.
в 5. Примеры, Задача синтеза В этом параграфе мы рассмотрим применение принципа максимума к решению некоторых простых задач об оптимальных быстродействиях. Из рассмотрения этих примеров выясняется новая важная постановка задачи об оптимальных процессах — задача синтезл оптимальных управлений. пРимеРы. 3АдАЧА синтезА Пример 1 одх Рассмотрим уравнение —, = и, где и — вещественньдй ~йд управляющий параметр, подчиненный условию (и~ ~1 Ц фазовых координатах х' = х, х = — зто уравнение хх ед переписывается в виде следующей системы: ехд ехд — = х', — =и.
ш = й (22) Рассмотрим (для фазовой точки, движущейся по за кону (22)) задачу о быстрейшем попадании в начало координат (О, 0) из заданного начального состояния т, Иначе говоря, мы будем рассматривать задачу об оптв мальном быстродействии в случае, когда конечньдм положением служит начало координат: х, = (О, 0). Функция Н в рассматриваемом случае имеет вид Н = дрдх'+ $,и. (23) Далее, для вспомогательных переменных ф„др, мы полу чаем систему уравнений (см.
(19), (23)) ад( д — =0 ад ' од = — 'рд откуда дрд = с„д(дз = сз — сд1 (сд, с, — постоянные). Соотношение (20) дает нам (учитывая (23) и условие — 1(и(1) и(д) = з1апд(д,(д) = здяп(с, — с,(). (24) Из (24) следует, что каждое оптимальное управ ление и (д), 1е ( 1 = 1„лвлаетсЯ кУсочно-постоанной фУнк цией, принимающей значения -+.1 и имеющей не боле~ двух интервалов постоянства (ибо линейная функция с, — сд1 не более одного рава меняет знак на отрезке 8, ( д ( дд). Обратно, любая такая функция и (1) может быть получена из соотношения (24) нри некоторых зна чениях постоянных с„с,. Для отрезка времени, на котором и:— 1, мы имеем (в силу системы (22)) х' = 1+ з' х' = -'-+ Ч+ Ф = ~ (г+ з')'+ (И вЂ” ( ) ~ [ГЛ2 2 ПРИНЦИП МАКСИМУМА (х, Р— постоянные интегрирования), откуда получаем х' = — (хз)2+ з 1 2 (25) 1 где г= з' — -;(з')' — постоянная.
Таким образом, кусок 2 фааовой траектории, для которого и = $, представляет б) Рис. 5. собой дугу параболы (25). Семейство парабол (25) показано на рис. 5, а). Аналогично, для отрезка времени, на котором и = — т, мы имеем хз = — 2+ з'2, 22 '1 $ '22 х' = — — + з'22 + зч = — — ( — 2 + з")'+~2~ + — (з')'), пРимеРы. 3Ад~чА синтезА ам откуда получаем х' = — — (х')'+ г'. 2 (26) Семейство парабол (26) показано на рис. 5, б). По параболам (25) фазозые точки движутся снизу вверх (ибо Рве.
6. — = и=+1), а по параболам (26) — сверху вниз ~Ь~ Как было указано выше, каждое оптимальное управление и (~) является кусочно-постоянной функцией, принимающей значения -+ 1 и имеющей не более двух интервалов постоянства. Если управление и (~) сначала, в течение некоторого времени, равно +1, а затем равно — 1, то фаэовая траектория состоит из двух кусков парабол (рис.
6, а)), примыкающих друг к другу, причем второй из этих кусков лежит на той из парабол'(26),,которая проходит через начало координат (ибо искомая траектория должна вести в начало координат). Если же, наоборот, сначала и = — 1, а затем и = + 1, то фазовая кривая заменяется центрально симметричной (рис. 6, б)).