Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения, страница 14
Описание файла
PDF-файл из архива "Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения", который расположен в категории "". Всё это находится в предмете "вариационное исчисление" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 14 страницы из PDF
Найдём сопряжённую переменную ∗1 0ψ10ψ10ψ(t) = e−tA ψ(0) ==;−t 1ψ20−t ψ10 + ψ20 ψ10= 0 – вектор начальных значений сопряжённойздесь ψ(0) =ψ20переменной. Таким образом,ψ1 (t) ≡ ψ10 ,ψ2 (t) = −t ψ10 + ψ20 .(5)Функция ψ2 (t) линейно зависит от времени t и имеет не более одногокорня. Поэтому управление u2 (t) однозначно определяется сопряжённой переменной при всех t, кроме того t, для которого ψ2 (t) = 0,см. (4). Итак,(6)u2 (t) = sign ψ2 (t).Принцип максимума, таким образом, позволил нам установить следующееоченьважное качественное свойство оптимального управлениясм. (6) : оптимальное управление u2 (t) является кусочно-постояннойфункцией времени t, принимающей значения ±1 и имеющей не болееодной точки переключения.
В зависимости от начальных значений сопряжённой переменной ψ10 , ψ20 управление u2 (t), определяемое формулой (6), может иметь только один из следующих типов (см. рисунок 13.2):−1, 0 t < τ(одна точка переключения τ ),I. u2 (t) =+1, τ < t+1, 0 t < τII. u2 (t) =(одна точка переключения τ ),−1, τ < t117III. u2 (t) ≡ −1(точек переключения нет),IV. u2 (t) ≡ +1(точек переключения нет).I+1 uψ2 (t)0ψ20τ0τtψ2 (t)−1u = u2 (t)III+1 ut0−1u = u2 (t)ψ20t−1+1 uII+1 u0u2 (t) = −1IVu2 (t) = +1t−1Рисунок 13.2Упражнение 13.1. Выяснить, при каких условиях на ψ10 , ψ20 реализуется каждый из четырёх типов I–IV управления u2 (t), t 0.В точке переключения τ = ψ20 /ψ10 управление u2 (t) условиеммаксимума не определяется однозначно, см. (4).Таким образом, оптимальное управление u2 (t) может иметь толькоодин из указанных четырех типов I–IV.
Нам пока неизвестно, какойименно тип оптимального управления u2 (t) соответствует заданномуначальному состоянию объекта x0 .Чтобы решить последний вопрос, мы найдём сначала траекториирассматриваемой управляемой системы при u2 = +1, т.е. системыẋ1 = x2 ,(7)ẋ2 = +1 .118Имеемdx1= x2 , откудаdx2x1 =1 2x + c1 ,2 2(8)где c1 – постоянная интегрирования.
Уравнением (8) определяетсясемейство парабол, изображённых на рисунке 13.3.x2c1 < 0c1 = 0c1 > 0x10Рисунок 13.3Движение фазовой точки системы (7) по параболам семейства (8)происходит снизу вверх при возрастании времени t, в силу того, чтоẋ2 = 1 > 0; направление движения фазовой точки с ростом времени tотмечено на рисунке 13.3 стрелками.При u2 = −1 вместо семейства парабол (8) получаем семействопарабол1(9)x1 = − x22 + c2 ,2изображённых на рисунке 13.4. Движение фазовой точки по параболам семейства (9) происходит сверху вниз, в силу того, что теперьx˙2 = −1 < 0.Поставим вопрос: из каких точек фазовой плоскости можно попасть в начало координат за конечное время при помощи постоянногоуправления u2 (t) ≡ +1, т.е. по траекториям (8) системы (7)? Рассмотрение рисунка 13.3 позволяет получить следующий ответ: такие точкирасположены на части AO параболы семейства (8), проходящей черезначало координат (c1 = 0), см.
рисунок 13.5.119c1 < 0c1 = 0c1 > 0x2x10Рисунок 13.4Те точки фазовой плоскости, из которых можно попасть в началокоординат за конечное время при помощи постоянного управленияu2 (t) ≡ −1, заполняют часть BO параболы семейства (9), проходящейчерез начало координат (c2 = 0), см. рисунок 13.5.1=+u20x2u2Bx=−III1x10u2=+1y0u2=−1AРисунок 13.5Из точек фазовой плоскости, не лежащих на линии AOB, попастьв начало координат при помощи постоянных управлений u2 ≡ +1 илиu2 ≡ −1 невозможно (проверить!).Рассмотрим теперь случай, когда точка x0 (начальное состояниеобъекта) расположена выше линии AOB. При движении фазовой точ120ки из начального состояния x0 при помощи любого управления u2 (t)типа II, см.
рисунок 13.2, фазовая точка никогда (при любом выбореточки переключения τ ) не попадет в начало координат, см. пунктирную кривую II на рисунке 13.5. Если же, начиная движение изначального состояния x0 , использовать управление u2 (t) типа I, см.рисунок 13.2, то на начальном интервале u2 (t) = −1, t ∈ (0, τ ), и движение фазовой точки будет происходить по параболе семейства (9),проходящей через точку x0 , см. кривую I на рисунке 13.5.
Эта парабола I пересекается с линией AO в точке y 0 . В момент τ , когда фазоваяточка попадает в точку y 0 , изменим знак управления u2 (t), положивu2 (t) = +1. Тогда фазовая точка продолжит движение из точки y 0по линии AO вверх и через некоторое конечное время попадает в начало координат. При переключении управления u2 (t) до попадания вточку y 0 , либо после прохождения точки y 0 , управление типа I неприводит к попаданию фазовой точки в начало координат.В случае расположения начальной точки x0 ниже линии AOB,называемой линией переключения, задача попадания в начало координат при помощи управлений u2 (t), удовлетворяющих принципумаксимума, решается аналогичным образом при помощи управленийтипа II, см. рисунок 13.5.Итак, для любой точки x0 фазовой плоскости существует пара(x(t), u(t)), удовлетворяющая принципу максимума Понтрягина, причём эта пара единственна.
Из сказанного в начале раздела 3.13 следует оптимальность построенной пары.0Найдем оптимальное время T (x ) = T (a, b) перехода из точкиax0 =в начало координат. Пусть точка x0 лежит выше линииbпереключения AOB. ТогдаT (a, b) = τx0 y0 + τy0 0 ,где τx0 y0 – время движения из точки x0 в точку y 0 , а τy0 0 – времядвижения из точки y 0 в начало координат.Для нахождения координат точки y 0 рассматриваем систему уравнений111x1 = x22 , x1 = − x22 + a + b2 ,222и находим ординату (x2 )y0 точки y 0 :/1(x2 )y0 = − a + b2 .2121Теперь находим/1a + b2 ,21a + b2 ,2τx0 y0 = (x2 )x0 − (x2 )y0 = b +/τy0 0 = (x2 )0 − (x2 )y0 =/1T (a, b) = b + 2 a + b2 .2 a0лежит ниже линии переключения AOB, тоЕсли точка x =b(проверить!)/1T (a, b) = −b + 2 −a + b2 .2Окончательно,⎧)⎨ b + 2 a + 1 b2 , если x0 лежит выше линии AOB,2)(10)T (a, b)=⎩−b + 2 −a + 1 b2 , если x0 лежит ниже линии AOB.2Вид оптимальных траекторий для различных начальных точек x0 показан на рисунке 13.6.Bx20u2 = +1u2 = −1x1AРисунок 13.6Выпишем формулы для оптимальногоуправленияu2 (t) и оптиaмальной траектории (в случае точки x0 =, лежащей выше линииb122AOB):−1,u2 (t) =+1,/если0 t < τ (a, b),если τ (a, b) < t T (a, b),/1 21τ (a, b) = b + a + b , T (a, b) = b + 2 a + b2 ,22⎛⎞t⎜ a + bt + (t − s) u2 (s) ds ⎟⎜⎟⎜⎟0⎜⎟, 0 t T (a, b).x(t) = ⎜t⎟⎜⎟⎝b +u2 (s) ds ⎠(11)0Из рисунка 13.6 видим, что оптимальное управление⎧если точка x лежит выше⎪⎨−1,линии AOB или на BO,u2 = v(x) = v(x1 , x2 ) =⎪⎩+1, если точка x лежит нижелинии AOB или на AO.(12)Формулой (11) оптимальное управление определяется как функция времени t (или, как говорят, в программной форме, в форме программы).
Формулой (12) оптимальное управление определяется какфункция фазовых координат объекта (или, как принято говорить, вформе синтеза или в форме обратной связи). Знание управления вформе синтеза важно для построения оптимальных регуляторов. Приподстановке управления (12) в уравнения движения объекта получаемсистемуẋ1 = x2 ,(13)ẋ2 = v(x1 , x2 ),траектории которой изображены на рисунке 13.6.
Система (13) нелинейна. Для реализации управляемого движения с использованиемсинтезирующей функции v(x1 , x2 ) к объекту необходимо присоединить измерительные устройства для нахождения текущих значенийфазового вектора x = (x1 , x2 ).В заключение рассмотрим изохроны рассматриваемого управляемого объекта, т.е. линии уровня функции оптимального времениT (x1 , x2 ), определяемой формулой (10). Семейство изохрон определяется уравнением(14)T (x1 , x2 ) = T,123где T 0 – параметр. При T = 0 уравнению (14) удовлетворяетединственная точка (0, 0).
При T > 0 вид изохрон изображён на рисунке 13.7.Bx2TRT (x1 , x2 ) = TQx10S−TPAРисунок 13.7Для всех точек x0 , лежащих на линии P QRSP (рисунок 13.7),определяемой уравнением (14), оптимальное время перехода из x0 вначало координат одинаково и равно T . Дуга P QR изохроны, лежащая выше линии переключения AOB, является частью параболыx1 = −T2(x2 + T )2+,42(15)ветви которой направлены влево, а её вершина совпадает с точкой2P ( T2 , −T ), лежащей на линии AO. Дуга RSP изохроны, лежащаяниже линии переключения AOB, является частью параболыx1 =T2(x2 − T )2−,42(16)ветви которой направлены вправо, а её вершина совпадает с точкой2R( −T2 , T ), лежащей на линии BO.
Параболы (15) и (16) пересекаютсяв точках P и R, причем пересечение происходит под ненулевым углом.Изохрона P QRSP в точках P и R имеет изломы.Упражнение 13.2. Получить уравнения (15), (16), привлекая (10),(14). Построить изохроны при T = 12 , 2, 4.124Упражнение 13.3. Доказать непрерывность функции T (x1 , x2 ),определяемой соотношением (10). Проверить, что функция T (x1 , x2 )недифференцируема на линии переключения AOB.Упражнение 13.4.
Выяснить, какая существует связь между изохронами и множествами управляемости.Пример 13.2. Этот пример отличается от примера 13.1 только за0. Вид оптимальных траекторий в примеданием множества M1 =1ре 13.2 показан на рисунке 13.8, где AM1 B – линия переключения.Упражнение 13.5. Для примера 13.2 построить аналитическоеоптимальному временипредставление функции T (x1 , x2 ),равной пеx10рехода из начальной точки M0 =.в конечную точку M1 =1x2Является ли функция T (x1 , x2 ) непрерывной? Построить изохроны.x2BM1u2 = −10x1u2 = +1AРисунок 13.8более подробно задачуперехода из начальной точкиРассмотрим−10Cв конечную точку M1за минимальное время (см. ри11сунок 13.9).
Точкалежит на параболе семейства (9), проходящей C−1/2через точку E, в которой линия переключения пересекает0ось x1 . Для начальной точки C существуют две траектории, удовле-125творяющие принципу максимума:+1,CDM1 ∼ u2 (t) =−1,−1,CEM1 ∼ u2 (t) =+1,√√0 t 2√− 1,2 − 1 < t 2( 2 − 1),0 t 1,1 < t 2.x2B2DM1C−10−1/2D √2−1/2E0C−1 E 0CDM1 ∼ u2 (t) =CEM1 ∼ u2 (t) =x1√A+1,−1,0t< 2−1√√2 − 1 < t 2( 2 − 1)−1,+1,0t<11<t2Рисунок 13.9√Время перехода по траектории CDM1 , равное 2( 2 − 1) ≈ 0.82,меньше времени перехода по траектории CEM1 , равного 2.