Понтрягин Л.С. - Принцип максимума в оптимальном управлении - 2004, страница 6
Описание файла
DJVU-файл из архива "Понтрягин Л.С. - Принцип максимума в оптимальном управлении - 2004", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "оптимальное управление" в общих файлах.
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 6 - страница
Умножая зто соотношение слева иа ср'(1) '(см. (14)). получаем сс(с) = с)сс(с) и'(с). Интегрируя зто соотношение от 1ь до 1, получаем с ос (с) сс (сь) + ~ чрьс (о) и' (о) сЬ, с откуда г) Управление и(1) называется экстремальным, если оно удовлетворяет принципу максимума, т. е. если существует такое неравное нулю решение ср(с) уравнения (11), для которого выполняется условие (ср(с), и(1))=ср(с) и(!) = — Р(ср(С)). (16) Ясно, что всякое оптимальное управление является экстремальным. Т е о р е м а 2. Экстремальное управление и(с) для линейной задачи быстродействия (4), в которой мносссество допустимых управлений й представляет собой вьспуклый многогранник, для которого выполнено условие В), представляет собой кусочно-постоянную функцию, значения которой равньс вершинам многогранника й; более точно, экстремальное управление и(1)„за исключением конечного числа значений г, однозначно определяется условием максимума как некоторая вершина многогранника й.
Локазательство. В силу г) значение управления и(1) определяется как величина и, дающая максимум произведения (сф(1), и) при и енй или, в виде формулы, (ср(1), и(1)) снах(ср(г), и), и ен й. (1с) Если соотношение (17) не определяет и(г) как некоторую вершину многогранника й, то зто значит, что при заданном значении т скалярное произведение (ср(1), и) достигает своего максимума иа некоторой грани Г многогранника й. Ес.ти ис' есть некоторое ребро грани Г, а ис — вектор, имеющий направление этого ребра, то (ср(г), ьэ) = О. (18) Действительно, если иь иэ — вершины многогранника й, образующие ребро в', то (ф (1), и, — иэ) = (ф (1), и,) — (ф (1), и ) = О. Если формула (17) не определяет и(1) как вершину многогранника й для бесконечного множества значений 1, то существует такой вектор тэ, имеющий направление некоторого ребра щ' многогранника й, что равенство ()8) имеет место для бесконечного множества значений 1, расположенных иа конечном отрезке переменного 1.
Так как ф(1) является решением линейной системы с постоянными коэффициентами, то (ф(1), ш) есть аналитическая функция 1, и (ф(1), ая)=0 (! 9) для целого интервала значений 1, а потому соотношение (19) можно дифференцировать по 1, и мы получаем последовательность равенств (Ф(1), зи)=0, (ф(1) А, та)=0, ..., (ф(1) А" ', аз) =О. Так как в силу предположения В) векторы юи, Ага, ..., А" 'ш (20) составляют базис пространства Я", то оказывается, что вектор ф(1) ортогонален каждому вектору базиса (20), т. е. любому вектору пространства й", а отсюда следует ф(1) =м О, что противоречит предположению о том, что ф(1) есть ненулевое решение уравнения (11).
Итак, доказательство теоремы 2 закончено. Сэ) Экстремальное управление и(1) для линейной задачи быстродействия (4), в которой многогранник (э удовлетворяет условиям В), С), и переводящее точку х„ в начало координат 0 пространства Я", единственно в той мере, в какой оно определяется равенством (16).
Докажем это утверждение. Выпишем прежде всего решение управляемой системы (15) для произвольного управления и(1) (см. Е)): *(>-и я('о,)~-(яг.)"с.>~.) Из этого равенства видно, что если начальное значение х(1,) есть начало координат пространства Р", то нулевое управление и(1) =— 0 не выводит из начала координат. Допустим теперь, что существуют два экстремальных управления ис (1), 1о ( Е ( сс и ис(1), 1о < 1 < 1ь пере.
водящих точку хц в точку О. Допустим для определенности, что 1с ) 1ь Доопределим >правление ис(1) на отрезок 1с с-1( 1м положив н, (1) =О при 1, (1(1,. Тогда управление и~(1) определено на отрезке 1о 1( ( 1с и переводит точку «о в начало координат О. Действительно, х(1с) = 0 является начальным условием для нулевого управления ис(1) О на отрезке 1с ~1(1с и, следовательно, не смешает начало координат. Так как векторы ус(1), ..., у„(1) линейно незави.
симы, о=*сс=ис (*'сс ~.(сс( )ими ). св о- ~~с=~.ф(и~~).и-$чм с( )ш ). с. то мы имеем с, х'(1,)+ $ сра(а)и~с(а)с1а=х (1о)+ ~ фа~(а)пса(а)с(а, с. с, откуда с, с, $ сиз (а) ис (а) с(а = ~ сРз (а) ис (а) с1а. (21) Пусть ср'(1) — то решение однородной системы (11), для которого управление ис(1) удовлетворяет равенству (16), т. е. ср'(1) и,(1) = Р(ср'(1)). Умножим соотношение (21) слева на с(с'(1) и просуммируем по 1". Тогда получим с, с, са ~ сР' (а) и, (а) с1а = ~ О' (а) ис (а) с(а = ~ Р (сР (а)) с(а. (22) с, с ° с, Так как Р(ср'(1) ) О, кроме, быть может, конечного числа точек 1, то 1с = 1с.
Действительно, если нс — направление некоторого ребра многогранника й, то так зв и е, как в доказательстве теоремы 2, <Т'((), и(> может равняться нулю только в конечном числе точек (. Далее, из равенства (22) получаем (ф ((), и, (()>=Р(ф'(()). Таким образом, экстремальное управление и(() единственно в той мере, в какой оно определяется равенством (1б). ГЛАВА 5 СИНТЕЗ НЕКОТОРЫХ ЗАДАЧ БЫСТРОДЕЙСТВИЯ В этой главе мы рассмотрим применение принципа максимума к решению некоторых простых задач быстродействия. Из рассмотрения этих задач выяснится новая важная постановка задачи об оптимальных процессах — задача синтеза оптимальных управлений.
й 1О, Быстрейшая остановка движущейся по инерции точки в заданном месте Пусть по прямой движется по инерции точ.ка. Задача состоит в том, чтобы наискорейшим образом остановить движение этой точки в заданном месте прямой, которое мы примем за начало координат, применением к ней силы, ограниченной по модулю. В виде дифференциального уравнения движение точки описывается следующим образом: «=и, (и(~(1. В фазовых координатах х=х, х=— а л( это уравнение переписывается в виде следующей системы: х'=х~, х =и (1) Мы рассматриваем задачу быстродействия нз заданного начального состояния хо в конечное положение «„кото. рым служит начало координат: х, = О. Функция Н в рассматриваемом случае имеет вид Н = ф,х'+ ~рэи, а матрица А записывается в виде .4-(,,). Далее, для вспомогательного вектора ф мы получаем уравнение Ф вЂ” фА, яли, в координатном виде, 1~=0.
Фз — Фм откуда ф~ сп фз сз — с~1 (сь сз — постоянные) Со- отношение (9) главы 4 записывается тогда в виде Фзи - (сз — с,1) и =) сз — с,1 ~ вткудз получаем и(С) з(нп фз (1) = з$рз (ст — с,С). (2) Из етого следует, что каждое оптимальное управление и(1), 10 ~ 1 а- 1п является кусочно-постоянной функцией, принимающей значения ~1 и имеющей не более двух интервалов постоянства (нбо линейная функция сг — с~1 ие более одного раза меняет знак на отрезке Соей 1 ( ~ 1~), Обратно, любая такая функция и(1) может быть получена нз соотношения (2) при надлежащем выборе констант сь сз. Для отрезка времени, на котором и 1, мы имеем (в силу системы (1)) х' 1+ з', х'= —,+з'1+ '- — (1+ ')з+(з' — — ), СВ 1 / (зй)3 з где з', з* — константы; отсюда получаем «' — (хз)'+ з, 1 (3) где з — константа.
Таким образом, кусок фазовой тра. екторни, для которого и 1, представляет собой дугу параболы (3) (рнс. 4, а). Аналогично, для отрезка времени, на котором и ~ ° м — 1, мы имеем «2 1 ( /2 Сэ 1 / (г~) ° з х' ° — — + /т1 + г' — — ( — 1+ гз)з + ~ /' + — ) Я 3 з ) (г', гт — константы), откуда получаем где г — константа (см. рис. 4,6). По параболам (3) фа- ях' зовые точки двихсутся снизу вверх (ибо — и +1), г <м~ а по параболам (4) — сверху вниз ~ — и — 1). Как было указано выше, каждое оптимальное управление и(1) является кусочно-постоянной функцией Ряс 4 принимающей значения ~1 и имеющей не более двух интервалов постоянства. Если управление и(г) сначала, в течение некоторого времени, равно + 1, а затем равно — 1, то фазовая траектория состоит из двух кусков па.
рабол (рис. 5), примыкающих лруг к друту, причем второй нэ этих кусков лежит на той из парабол (4), которая проходит через начало координат (ибо искомая траектория должна вести в начало координат). Если 41 же, наоборот, сначала и = — 1, а затем и = +1, то фазовая траектория заменяется цеи [рально-симметричной (см.
рис. 5). На рис. 5 написаны иа дугах парабол соответствующие значения управляющего параметра и. Ряс. б Рис. б На рис. 6 изображено все семейство полученных таким образом фазовых траекторий(АΠ— дуга параболы х'= — (хх)з, расположенная в нижней полуплоскости; ВО— ! 2 ! дуга параболы х' = — — (хс)', расположенная в верхней полуплоскости). На плоскости чертежа (рис.