XV Ванько В.И., Ермошина О.В., Кувыркин Г.Н. Вариационное исчисление и оптимальное управление (1081425), страница 28
Текст из файла (страница 28)
(7.26) Движение и в этом случае совершается по часовой стрелке с постоянной угловой скоростью 1. Искомая траектория строится из дуг окружностей (7.25), (7.26). Обратимся к начальным условиям (7.18). Отметим, что через данную точку проходят только две окружности, одна из первого семейства, другая из второго. Для заданной назальной точки — — начала координат первая окружность описывается уравнением (7.27) (х1 — 1) + (хг+ 1) = 2, 218 7. ПРИНЦИП 7ИЛКСИМУМЛ а вторая уравнением (х1+1) +(хз+1) =2. (7.28) Фазовая точка может начать движение из начала координат только по одной из этих окружностей (рис. 7.4). Рис. 7.4 Предположим, что стартовое управление равно — 1 и оптимальная туаектория на начальном отрезке времени идет по окружности (7.28).
В некоторый момент времени 1е = Се+ я Е Е (О, я1 в соответствующей этому моменту времени точке Р1 на полуокружности ОА (рис. 7.5) происходит переключение управления и движение продолжается по дуге другой окружности, относящейся к семейству (7.25). По этой, второй окружности фазовая точка пройдет пол-оборота, и если она не достигнет за это время конечной точки, то ровно через пол-оборота снова произойдет переключение управления в момент времени 1е+ я, соответствующий фазовой точке Рз, и фазовая точка продолжит движение по дуге окружности из семейства (7.26). Так как переключение происходит через пол-оборота, то точка Рз является симметричной точке Р1 относительно центра 219 7.3. Задача быстродействия Оы Значит, Ро находится на полуокружности МД7., симметричной полуокружности ОА относительно Оы то есть на половине окружности (х1 — 3) + (из+ 1) = 2.
Рис. 7.5 Из построения видно, что дуга Р1Рзо какой бы ни была точка Р1 на дуге ОА. не проходит через конечную точку Л(0, — 4), так как наименьшее значение ордипаты точки на этой дуге равно — 1 — ~/2 > — 4. Поэтому конечный участок траектории не может лежать на дуге Р1Рз. Фазовая точка достигнет Рз, и произойдет переключение управления, после которого фазовая точка начнет движение по дуге окружности 220 7. ПРИНЦИП МАКСИМУМА из семейства (7.26).
Окружность (и1 + 1) + (хэ + 1) = 10, (7.29) которая относится к этому семейству, пересекает дугу МХ и проходит через точку К(0, — 4). Поэтому, если переклк>ченис произошло в соответствующей точке дуги МХ, то, двигаясь по этой окружности, фазовая точка попадет в конечную точку К. Обратим внимание на то, что если после второго переключения движение пойдет по дуге окружности, отличной от (7.29), то далее фазовая точка пройдет мимо конечной точки К, а при последующих переключениях траектория разворачивается по спирали и фазовая точка уже никогда не попадет в нужную точку К: при каждом переключении радиус окружности возрастает и уже после третьего переключения будет превышать ~/10 расстояние от каждой из точек Ом 02 до точки К.
Итак, если стартовое управление равно — 1, то искомая траектория должна содержать дугу окружности (7.29) и точку Р2 переключения на дуге МХ. Оказывается., что окружность (7.29) пересекает дугу МХ в двух точках М(2, — 2) и С(2, О) (см. рис. 7.5). Каждой из них соответствует траектория, удовлетворяющая первому условию принципа максимума, т.е. управление, соответствующее такой траектории, доставляет максимум функции Н. Отметим, что если Рэ = М, то Рм будучи симметричной Р2 относительно Ом совпадает с началом координат. Это означает, что первое переключение происходит в стартовый момент времени. Другими словами, эта траектория соответствует стартовому управлению и = 1, а наше исходное предположение, что стартовое управление равно — 1, на самом деле не является существенным. Указанная траектория фактически содержит не три, а две дуги окружности, так как дуга первой окружности выродилась в точку.
Второй вариант с переключением в точке С содержит три дуги. Первое переключение происходит в точке Ю(0, — 2). 7.3. Задача быстродействия 221 Дальнейшее движение от Р к С идет по дуге окружности (х1 — 1)Я + (хя + 1)Я = 2, на которой лежит начало координат, т.е. в процессе перемещения от Р к С фазовая точка возвращается в начало координат. Значит, на самом деле есть еще одна, третья траектория, которая представляет собой участок второй траектории от начала координат до точки переключения в точке С и далее до точки К.
Эта траектория также удовлетворяет первому условию принципа максимума., но, в отличие от первых двух, соответствует начальному управленик> н = 1. Очевидно, что время движения по третьей траектории заведомо меньше времени движения по второй траектории, потому что какое-то время затра~ивается на движение по петле. Поэтому далее вторую траекторию можно не рассматривать. Анализ случая с на шльным управлением и = 1 показывает. что других траекторий, удовлетворяющих первому условию принципа максимума и заданным краевым условиям, нет.
Итак, использование принципа максимума выявило две траектории, которые удовлетворяют краевым условиям поставленной задачи. Первая х*(1) заключается в движении по дуге ОМ окружности (7.27) и последующем после переключения движении по дуге МК окружности (7.29). Вторая траектория х**(с) представляет собой движение по дуге ОС окружности (7.27) с переходом на дугу СК окружности (7.29) (рис. 7.6). Поскольку движение по окружностям происходит с постоянной угловой скоростью 1, время, затрачиваемое на движение по общим участкам двух траекторий., одинаково. Время различается лишь на прохождении от точки С до точки М, так как движение происходит по дугам разных окружностей. Наилучший вариант соответствует дуге, имеющей наименыпее угловое расстояние., и на рис. 7.6 видно, что это дуга окружности (7.29), так как угол СО2М меньше угча СО1М.
Таким образом, траектория х**(1) более предпочтительна. Тот же вывод можно сделать, используя условие 2' принципа максимума. 222 7. ПРИНЦИП М4КСИМ/МА х2 4 и х, М / / — 3 / -4 К Рис. Т.в 11роверим выполнение условия 2' теоремы 7.2 для траекторий а*(4) и и*'(4). Это условие на самом деле можно проверять в любой момент времени, и в данном случае в качестве такого момента удобнее всего взять начальный. Имеем М(-~ (41)~а (41)) 41(~1)(т2(~1) + 1) — у'2(41)Х1(41) + !ф2(44)/ ф1(41) + !ф2(Й1)/. Учитывая, что, согласно (7.21), фд — — — ф2*., и используя (7.22), получаем М(Ф*(44), и'(4~)) = — С~ сов(~1 — С2) + С1 ~ в|п(41 — С2) ~.
Точка переключения С траектории ж**(4) соответствует моменту времени 4 = 44+ л/2, так как угловая длина дуги ОС 223 7.3. Задача быстродействия окружности (7.27) равна гг/2 (угол ООгС равен 90'), В то же время, согласно (7.23), переключение с и = 1 на и = — 1 происходит при 1 — С2 = (2Й+ 1)гг, т.е. можно считать, что С2 = бг — гг/2. Тогда М = Сг > О, т.е. Условие 2' теоРемы 7.2 выполнено. Для траектории х'(2) точка переключения М соотвстствует моменту времени 1=1г+гг. В этом случае С =1г и М = — Сг ( О. Условие 2' теоремы 7.2 нарушено. Найдем время движения по траектории х**(1).
Для этого нужно подсчитать угловые длины двух дуг окружностей. Дуга ОС, как уже отмечалось, имеет угловую длину гг/2. Дуга СК окружности (7.29) также имеет угловую длину я/2: эта длина измеряется углом между векторами О2г ' и Озт1, а они., как нетрудно увидеть, ортогональны. Значит, общее время равно: гг 7Г Т=12 — 1г = — + — =я 2 2 Движению по траектории х**(1) соответствует управление и*'Я = а1бпапг(1 — 8г + — ) = алисон(1 — 1г) (рис.
7 7). 2 Задача (7.16) - (7.19) имеет единственный допустимый проиесс (х'*(с), и"*(с)), удовлетворяющий принципу максимума. Однако нельзя утверждать, что о г, ~ г,-г ~ ггч- т ~ этот процесс на самом деле оптимален. Такое утверждение обоснованно, если известно,что поставленная задача имеет реРис. 7.7 шснив. Приведенный пример показывает, какие трудности возникают в случае применения метода, базирующегося на принципе максимума. Главная трудность состоит в том, что при использовании принципа максимума возникает краевая задача для системы обыкновенных дифференциальных уравнений (7.15), 224 7. ПРИНЦИП МАКСИМУМ4 7.4. Линейная задача оптимального быстродействия Вернемся к линейной задаче оптимального быстродействия (см.
6.4), к которой неприменимы методы классического вариационного исчисления. Проанализируем эту задачу, используя принцип накеимума. Но прежде всего уточним ее постановку. Пусть закон движения рассматриваемой системы имеет вид 0х — = Ах+ Ви, ат (7.30) где х=(хм ..., х„) еКн; и=(им ..., и„) 61с', А=(а>з) числовая квадратная матрица порядка и; В = (б>ь) числовая матрица типа п х г. В качестве области управления Г рассмотрим множество, описываемое системой нестрогих неравенств причем краевые условия задаются только для фазовых переменных. Отсутствие краевых условий для функции Ф(1) существенно осложняет задачу.
Ясно, что оптимальное управление и оптимальная траектория, выходящая из точки х, зависят от 1 на яального вектора Ф(1>), но, к сожалению, условия максимума для функции Й явно не указывают, как выбирать этот вектор. ъ1исленный поиск начального условия для ял(г) можно организовывать, опираясь на условие 2' теоремы 7.2. Однако одного этого условия недостаточно, чтобы организовать сходящийся итерационный процесс последовательного уточнения вектора Ф(~1 ).
Успех аналитического решения задачи, рассмотренной в примере 7.1> во многом объясняется тем, что система (7.16) линейна. Именно в линейных задачах проявляются преимущества принципа максимума. 7.4. Линейная задача оптимального быстродействия 225 и представляющее собой замкнутый ограниченный многогранник в Б!'.
В качестве целевого функционала возьмем время перехода объекта из положения х' в положение х~, т.е. 1 = 1т — 1н Кроме того, предполагаем (не оговаривая это каждый раз), что многогранник Г удовлетворяет условию общности положения по отношению к системе (7.30), т.е. для любого вектора и Е Кг, параллельного какому-либо ребру многогранника У., система векторов Ви., АВи, ...., А" 'Ве (7.32) линейно независима. Напомним, что система векторов ин ич, ..., и„в Ж" линейно независима тогда и только тогда, когда матрица, столбцами которой являются столбцы координат этих векторов, не вырождена, т.е.