Э.М. Галеев, В.М. Тихомиров - Оптимизация - теория, примеры, задачи (2000) (1125255), страница 31
Текст из файла (страница 31)
(5) Глава 4. Задачи оптимального управления назовем элементарной июльчатай вариацией управления й. Пусть ха()— решение уравнения х(1) = (р(1, х(1), в (1)) с начальным условием х(1е) = хе. По локальной теореме сушествовання [АТФ, с. 186-189] функция х определена при малых о в некоторой окрестности точки зе, но нз леммы 1, формулируемой ниже, следует, что на самом деле вектор- функция х, определяется единственным образом на всем отрезке [1е, 1(], Функция х называется элементарной игольчатой вариацией функции й, а пара (х,в ) — элементарной игольчатой вариацией процесса (х, 0) Тройку (т,»,а), определяюшую эту вариацию, будем называть элементарной июлкай.
В) Лемма 1 (о свойствах элементарной игольчатой вариации). Пусть в элементарной иголке (т, », а) точка т Е Т и управление» Е У фиксированы. Тогда суи(ествует число е > 0 такое, чта длл лн(дага о Е [О, е] отрезок [т — о, т] С Т, а функция х — игольчатая вариация функции— У определена на всем отрезке [1е, 1(]; при этом нри а — +О 1) функция х (.) — ~ У( ) в метрике пространства С([1е, 1(], В"); х:() -й() 2) функция — у( ) в метрике врастранства С([т, 1(], Ка), а где функция у кусочно диффергнцируеиа на отрезке [т, 1(] и удовлетворяет дифференциальному уравнению Доказательство леммы следует из двух основополагаюших фактов теории обыкновенных дифференциальных уравнений; локальной теоремы существования и теоремы о непрерывной дифференцируемости решения по начальным данным. Мы не приводим их здесь, отсылая к книге АТФ, с.
89 — 91. С) Лемма 2 (о прирашении функционала). Пусть в элементарной июлкв (т,е,а) точка т Е Т и управление» Е У фиксированы, В(а): = В[х (),» ()). Тогда функция В дифференцирувма справа в нуле и В'(+0) = г (т, й( г), ») — [(т) — р(т) ((р(т, й (т), ») — ф(т) ) . Докааатвпьогво лваивы 2. Используя теорему о среднем длв определенных интегралов, правило перехода к пределу под знаком инте(рала, дифференцируемость по Фреше и лемму 1, получим В(п) — В(0), В(х, ка) — В(й, й) В(+0) = 1нп = 1ип а +е а а +О а б 2.
Принцип максимума а частном случае йго -[ 1(У(1, (1), (1))-У(1))де)+1 1 у Г . ~ ф(х.(1,))-ф(й(1,)) г 1> й -'( 1(1(ш,*.(((р(-1(е()а~~(1(ш,*.фа(а((-ущ)а)+ (~ г-а г ф'(й(1())[х (1() — х(С()]+о(х (1() — й(1()) + йго +о а 1" (У'[ [х — У]+а(х — У))(1) = 1нп (у(1,х (1),»)-у(1))~ + 1нп ~[ г ' дз+ г +ф'[У(1())у(11) = у(т,й(т),») — ~(т)+ / / (1)у(1)д1 — р(1()у(1()„ г Выражая ~, из уравнения (2), учитывая уравнение (4), н начальное условие (5) для у(т), имеем 11 1~ 1) ь (1 У.рдз= [(Р+Рф.)У и= 1(РУ+Р1))дг= 1 — (РУ)дз= т ы р(1()у(11) — р(т)у(т) = р(1()у(й() — р(т)(р(т, У(т),») — ф(т)).
1) Подставляя найденное значение [ у,уд1 в выражение для В'(+0), получим искомое представление. 11) Завершение доказательства. Из леммы 1 следует, что если и Е [О, е], то (х,о ) — допустимый управляемый процесс и х,(.) Равномерно стремится к х(.). Поскольку (х, й) — оптимальный процесс, то при малых а > 0 В(х,и,) > В(У, О) ~о В(а) > В(0). Отсюда по лемме 2 В'(+0) Э О, и из выражения для В'(+0) вытекает, г (т,х(т),») — р(т)р(т,й(т),») > г(т) — р(т)ф(т) ч т Е Т, ч» Е У, т.е.
выполняется соотношение (1). Теорема полностью доказана. ° 200 Глава 4. Задачи ептнмальиего управления $ 3. Избранные задачи оптимального управления 3.1. Простейшая задача о быстродействии Т 4 пнп; [х[ < 1, х(0) = «(, а(0) = «г, х(Т) = х(Т) = О. Аналогично формализуется задача о машине, дви:кущейся прямолинейно без трения по горизонтальной дороге. Машина может двигаться в любую сторону с ускорением, не превышающем единицу.
Требуется остановить машину в определенном месте за кратчайшее время. Решение. Приведем задачу к виду задач оптимального управления, вводя вместо функции х вектор-функцию (х„хг), управление и и обозначения: х, = х, хг =. х, и = х, х =и, иб [ — 1,1[, х,(О) = «„хг(0) = «2, х((Т) = хг(Т) = О. Т -4 ппп; Функция Лагранзка: А = / (Р ("И*' — '2) + Рг(1)(хг — и)) "'+ 0 + ЛОТ+ Л((х((0) — «~) + Лг(хг(0) — «г) + Лзх((Т) + Л4хг(Т) Необходимые условия: а) система уравнений Эйлера лля лагранжиана Т = р((1)(х( — хг)+ Рг(1)(хг — и) (( — — Ц, +ТА — — О, 4( с=э 1 1." ' с=э рг(1) = С(1+ Сг, (-рг — р|=0 4И ~аз + ~о — О Ь) трансверсааьность по х для терминанта 1 = ЛОТ+ Л((х((0) — 6)+ Лг(хг(0) «2) + Лзх ( (Т) + Л4хг(Т! 2(ч(0) =14,(0), ге(Т) = — 1,,(г) <==-» р~(О) = Лп р)(Т) = — Лз, Рассмотрим задачу о наибыстрейшей остановке лифта в шахте, во шедшую во многие монографии по оптимавьному управлению, Лифт управляется под воздействием внешней силы, которая может изменяться в заланных пределах, регулируемых человеком.
Предположим, что воз можности действующей силы, а следовательно, и ускорения, ограничены какой-то величиной, например, ускорение может изменяться от до +1. Требуется за кратчайшее время Т остановить (х(Т) = 0) лифт, для определенности в начале координат (х(Т) = О). Нетрудно вилеть, что задача может быть формализована следующим образом: 20! $ З.Избранные залачи оптимального управления г ю(0) = 144(0), 4 гр(Т) = 144(т) с=' Р2(0) = Л2, Р2(Т) = — Л4( с) оптимальность по и (не зависящие от и слагаемые не выписываем) 51йп !)2 (1), Р2(1) Ф ппп ( Рг() ) = Рг() () () — (любое из [ — ! 1[ Рг(1) =0' 4)) стационарность по Т Ат(Т) = 0 С=о Л0 + Лзх~(Т) + Л(хг(Т) = О; е) неотрицательность ЛЯ>0.
Учитывая то, что из начального условия следует х((Т) = О, а из Ь) Л( = -рг(Т), получаем, что ()) равносильно условию Л0 = рг(Т)й(Т). Поэтому если Л0 = О, то р,(Т). = 0 либо й(Т) = О, но тогда из с) вновь рг(Т) = О. При этом рг не может быть тождественным нулем, ябо иначе все мнозкители Лагран:ка были бы нулями.
Значит, из а) рг(1) = С(1 — Т), а тогда из с) следует, что й(1) э— в 1 или й(1) = — 1. Множество начальных условий, соответствующих таким управлениям, описывается уравнением — „/2«п «~ > О, Ю(Т)=0 4 (Т)=0 действительно, пусть й(1) = ! «5 хг(1) =. ! =г хг(1) =1 — т ~ х~(1) = (1 — Т) /2 ~ «~ — — «г/2 > 0 ~ «. = — з/2(, (при извлечении квадратного корня берем знак минус, поскольку «г = хг(0) = -Т < О, при этом минимальное время лвнжения Т = — «г > 0). В случае и(1) == — 1 ~налогично полУчаем, что «г —— ,/-2«,, «~ .. О. Ниже покажем, что найденное время движения действительно доставляет минимум в залаче. "аким образом, в нашей задаче в этих случаях минимум достигается при "а = О.
Если зке «г ~ )2(«,), то Л0 )5 О, и мы полагаем ЛЯ вЂ” — !. Тогда из 4() вьпекает, что /Рг(Т)! = 1, т. е, имеютсЯ две возможности: р,+(1) = С(1 — Т)+ 1, Р,(1) = С(1 — Т) — !. им возможностям в силу Ь) соответствуют такие управления: Рассмотрим траектории, соответствующие оптимальным управлениЯм и и ' на плоскости (хнхг), называемой фазоеой ила<костью.
203 202 т х(т) = 31 (т — в)х(в) Ув+Сзт+С!. в т х(т) = /(в — т)х(в)т!в. Глава 4. Задачи оптимального уиравлеиия Для тех значений Г, для которых в(Ф) = 1, имеем г 2 Ф в Х2 хз= ! ~х! =хз =!+С >х! = — +С!+С = — +С. 2 2 Таким образом, фазовая траектория, соответствующая этим значениям 1, является куском параболы х! — — -22 + С. Направление движения по такой параболе определяется из условия возрастания х2, так как в этом случае хз = 1. Аналогично получаем, что для тех значений 1, для г котпрых в(Г) = — 1, фазовая траектория — кусок параболы х! = — -22 + С, а направление движения определяется из условия убывания хз, так как Х2 = — 1. Укажем теперь то место на фазовой плоскости (х„х2), где должно совершаться переключение управления.
В искомую точку (0,0) (х!(Т) = х2(Т) = 0) мы должны попасть не более чем с одним переключением, двигаясь по фазовой траектории по разрешенному направлению. Совокупность начальных условий, соответствующих управлениям и+ и в, описывается неравенствами сз > !2(с!) (для я+) и С2 < ттв(С!) (лла и ). ПеРеключениЯ совеРшаютсЯ на кРивой С2 = У!(С!). При этом, как нетрудно видеть, для каждого начального условия имеется единственная фазовая кривая, приводящая в точку (0,0).
Рис. 7. Поскольку всегда [х2[ = 1 на оптимальной траектории, то хз = [![+С и, значит, время движения Т = Уат хз (вариация функции хз). Однако проще находить оптимальное время Т, строя функцию х(.) класса РС ([гет 1! [), удовлепюряюшую необходимым условиям экстремума и начальным условиям. В примере 2 пункта 3.3 будет приведено решение одной из конкретных задач быстродействия. 5 3. Избранные задачи овтимального управления Покажем, что оптимальная траектория, начинающаяся в точке (т „'), вост ля решение задаче. Пус ь э й трае рии с гветствует управление б (для определенности б ), функция У и время Т. Предположим, что имеется некоторый лругой лопусгимый управляемый процесс (х, и, Т), Т < Т.
Доопрелелим функцию х( ) нулем на отрезке [Т, Т[. Воспользуемся следующей формулой восстановления функции по ее и-й производной в — 1 в ,(,) = ' )'(т — в)"-'х!"!(в) Ув+ ~~~ 'х!"!(О) — ',. о По этой формуле прн и = 2 в силу условий на левом конце функции х и У в точке т можно представить в виде Г1оскольку У(в) = ! > х(в) т в Е [О, т[, то У(т) — х(т) = 3[ (т — в)(1 — У(в))яв > О, о причем равенство здесь возможно только, если во всех точках непрерывности У(в) ьэ 1, а тогда х(1) = У(1) У ! Е [О, т]. Аналогично с учетом условий на правом конце функции х и У в точке т можно представить в виде Поскольку У(в) = — 1 < У(в) У в Е [т, Т), то Р У(т) — х(т) = ~(в — т)( — 1 — У(в))т!в < О, т причем равенство и здесь возможно только, если У(в) = — 1, а тогда х(Ф) = У(Г) У 1 Е [т, Т).
Таким образом, имеем, что х(т) = У(т) н, следовательно, х(1) =— У(1) 22 ! Е [О, Т[. Отсюда Т = Т. 204 История задачи Рис. 9. Формализация задачи Глава 4. Задачи оптимального управления 3.2. Аэродинамическая задача Ньютона Задача Ньютона — это залача о сопротивлении движению тела вращения в «редкой» среде.
Необходимо выбрать форму тела вращения так, чтобы сопротивление движению было минимально. В 1б87 году вышли «Математические начала натуральной философии» Ньютона. В седьмом разделе, озаглавленном «О движении:кидкостей и сопротивлении брошенных теле, Ньютон рассматривает задачу о сопротивлении шара и цилиндра в «редкой» среде. Затем в «Поучении», при исследовании сопротивления усеченного конуса, Ньютон делает следующее утверждение. Пусть Х)лг ЕС вЂ” неко- В торая кривая.