Галеев Э.М., Тихомиров В.М. - Оптимизация (теория, примеры, задачи) (1050557), страница 32
Текст из файла (страница 32)
Принцип максимума а частном случае йго -[ 1(У(1, (1), (1))-У(1))де)+1 1 у Г . ~ ф(х.(1,))-ф(й(1,)) г 1> й -'( 1(1(ш,*.(((р(-1(е()а~~(1(ш,*.фа(а((-ущ)а)+ (~ г-а г ф'(й(1())[х (1() — х(С()]+о(х (1() — й(1()) + йго +о а 1" (У'[ [х — У]+а(х — У))(1) = 1нп (у(1,х (1),»)-у(1))~ + 1нп ~[ г ' дз+ г +ф'[У(1())у(11) = у(т,й(т),») — ~(т)+ / / (1)у(1)д1 — р(1()у(1()„ г Выражая ~, из уравнения (2), учитывая уравнение (4), н начальное условие (5) для у(т), имеем 11 1~ 1) ь (1 У.удз= [(р+рф.)у и= 1(фу+р1))дг= 1 — (ру)де= т ы р(1()у(11) — р(т)у(т) = р(1()у(й() — р(т)(р(т, У(т),») — ф(т)). 1) Подставляя найденное значение [ у,уд1 в выражение для В'(+0), получим искомое представление.
11) Завершение доказательства. Из леммы 1 следует, что если и Е [О, е], то (х,о ) — допустимый управляемый процесс и х,(.) Равномерно стремится к х(.). Поскольку (х, й) — оптимальный процесс, то при малых а > 0 В(х,и,) > В(У, О) ~о В(а) > В(0). Отсюда по лемме 2 В'(+0) Э О, и из выражения для В'(+0) вытекает, г (т,х(т),») — р(т)р(т,й(т),») > г(т) — р(т)ф(т) ч т Е Т, ч» Е У, т.е. выполняется соотношение (1).
Теорема полностью доказана. ° 200 Глава 4. Задачи оптимального управления $3. Избранные задачи оптимального управления 3.1. Простейшая задача о быстродейстани Т 4 ппп; [х( < 1, х(0) = 12, х(0) = Сг, х(Т) = х(Т) = О. Аналогично формализуется задача о машине, дви:кушейся прямолинейно без трения по горизонтальной дороге.
Машина может двигаться в любую сторону с ускорением, не превышающем единицу. Требуется остановить машину в определенном месте за кратчайшее время. Решение. Приведем задачу к вилу задач оптимального управления, вводя вместо функции х вектор-функцию (х„хг), управление и н обозначения: х, = х, хг = х, и = х, хг = и, и б [ — 1, 1(, х,(О) = Еп хг(0) = 6, х~(Т) = хг(Т) = О. Т -4 пгзп; Функция Лагранзка: / (Р!(1)(х2 х2) +Р2(1)(х2 и)) г11 + о + ЛоТ+ Л<(х>(0) — Е2) + Лг(хг(0) — Ег) + Лзх2(Т) + Лохг(Т) Необходимые условия: а) система уравнений Эйлера лля лагранжиана 1 = р2(1)(х~ — хг) + Рг(1)(хг — и) а Ьь +Гж О 41 с=2 1 '." ' 4=5 рг(1) =С,1+Сг! 1-рг — р2 = 0 й! ~'ьг + ~'ю — О Ь) трансверсаяьность по х для терминанта 1 = ЛоТ+ Л2(х2(0) — 6)+ Лг(хг(0) 52) + Лзх~(Т) + Лгхг(Т) ггч(0) = 14,!о), 2„(Т) = -1ьпг) <==э Р~(0) = Лп р~(Т) = — Лз, Рассмотрим задачу о наибыстрейшей остановке лифта в шахте, во шедшую во многие монографии по оптимальному управлению, Лифт управляется под воздействием внешней силы, которая может изменяться в заданных пределах, регулируемых человеком.
Предположим, что воз можности действующей силы, а следовательно, и ускорения, ограничены какой-то величиной, например, ускорение может изменяться от до +1. Требуется за кратчайшее время Т остановить (х(Т) = 0) лифт, для определенности в начале координат (х(Т) = О). Нетрудно вилеть, что задача может быть формализована следующим образом: 201 б 3.
Избранные задачи оптимального управления ью(0) = 144!о), 242(2 ) = 144!т) е=' Р2(0) = Л2, Р2(Т) = — Л4! с) оптимальность по и (не зависящие от и слагаемые не выписываем) ( 51ЯП Рг(1), Р2(1) т ~ любое из ( — 1 1( рг(1) =0' 4)) стационарность по Т Ат(Т) = 0 «==о Ло + Лзх~(Т) + Лзхг(Т) = 0; е) неотрицательность Ло>0. Учитывая то, что из начального условия следует х,(Т) = О, а из Ь) Л4 = -рг(2'), получаем, что 4)) равносильно условию Ло = рг(Т)й(Т).
Поэтому если Ло = О, то р,(Т). = 0 либо й(Т) = О, но тогда из с) вновь рг(Т) = О. При этом рг не может быть тождественным нулем, ибо иначе все множители Лагран:ка были бы нулями. Значит, из а) рг(1) = С(1 — Т), а тогда из с) следует, что й(1) э— а 1 нли й(1) = — 1. Множество начальных условий, соответствующих таким управлениям, описывается уравнением — „/2(~, (~ ) О, кнт)=о 4 (2)2о действительно, пусть й(1) = 1 «2 хг(1) =. 1 =г хг(1) =1 — Т ~ х~(1) = (1 — Т) /2 ~ ~~ — — сг/2 ) 0 ~ 6 = — ~/2(, (при извлечении квадратного корня берем знак минус, поскольку Ег = хг(0) = -Т < О, при этом минимальное время движения Т = — Ег > 0).
В случае и(1) == — 1 аналогично получаем, что сг — — /-2Г, 1~ "- О. Ниже покажем, что найденное время движения действительно доставляет минимум в залаче. "аким образом, в нашей задаче в этих случаях минимум достигается при "о =- О. Если же Ег р- ог(1,), то Ло )5 О, и мы полагаем Ло — — !. Тогда из й) вытекает, что (Рг(ТЦ = 1, т. е. имеютсЯ две возможности: р,+(1) = С(1 — Т)+ 1, Р,(1) = С(1 — Т) — !. им возможностям в силу Ь) соответствуют такие управления: Рассмотрим траектории, соответствующие оптимальным управлении и ' на плоскости (хнхг), называемой фпзоеой лласкослгью.
203 202 т х(т) = 31 (т — в)х(в) Ув+Сзт+С!. в т х(т) = /(в — т)х(в)т!в. Глава 4. Задачи оптимального управления Для тех значений Г, для которых в(Ф) = 1, имеем г 2 Ф в Х2 хз= ! ~х! =хз =!+С >х! = — +С!+С = — +С. 2 2 Таким образом, фазовая траектория, соответствующая этим значениям 1, является куском параболы х! — — -22 + С.
Направление движения по такой параболе определяется из условия возрастания х2, так как в этом случае хз = 1. Аналогично получаем, что для тех значений 1, для г котпрых в(Г) = — 1, фазовая траектория — кусок параболы х! = — -22 + С, а направление движения определяется из условия убывания хз, так как Х2 = — 1. Укажем теперь то место на фазовой плоскости (х„х2), где должно совершаться переключение управления. В искомую точку (0,0) (х!(Т) = х2(Т) = 0) мы должны попасть не более чем с одним переключением, двигаясь по фазовой траектории по разрешенному направлению. Совокупность начальных условий, соответствующих управлениям и+ и в, описывается неравенствами сз > !2(с!) (для в+) и С2 < ттв(С!) (лла и ). ПеРеключениЯ совеРшаютсЯ на кРивой С2 = У!(С!).
При этом, как нетрудно видеть, для каждого начального условия имеется единственная фазовая кривая, приводящая в точку (0,0). Рис. 7. Поскольку всегда [х2[ = 1 на оптимальной траектории, то хз = [![+С и, значит, время движения Т = Уат хз (вариация функции хз). Однако проще находить оптимальное время Т, строя функцию х(.) класса РС ([гет 1! [), удовлепюряюшую необходимым условиям экстремума и начальным условиям. В примере 2 пункта 3.3 будет приведено решение одной из конкретных задач быстродействия. 5 3. Избранные задачи овтимальиого управления Покажем, что оптимальная траектория, начинающаяся в точке (т „'), вост ля решение задаче.
Пус ь э й трае рии с гветствует управление б (для определенности б ), функция У и время Т. Предположим, что имеется некоторый лругой допусгимый управляемый процесс (х, и, Т), Т < Т. Доопрелелим функцию х( ) нулем на отрезке [Т, Т[. Воспользуемся следующей формулой восстановления функции по ее и-й производной в — 1 в ,(,) = ' )'(т — в)"-'х!"!(в) Ув+ ~~~ 'х!"!(О) — ',. о По этой формуле при и = 2 в силу условий на левом конце функции х и У в точке т можно представить в виде Г1оскольку У(в) = ! > х(в) т в Е [О, т[, то У(т) — х(т) = 3[ (т — в)(1 — У(в))яв > О, о причем равенство здесь возможно только, если во всех точках непрерывности У(в) ьэ 1, а тогда х(1) = У(1) У ! Е [О, т]. Аналогично с учетом условий на правом конце функции х и У в точке т можно представить в виде Поскольку У(в) = — 1 < У(в) У в Е [т, Т), то Р У(т) — х(т) = ~(в — т)( — 1 — У(в))т!в < О, т причем равенство и здесь возможно только, если У(в) = — 1, а тогда х(Ф) = У(Г) У 1 Е [т, Т).
Таким образом, имеем, что х(т) = У(т) н, следовательно, х(1) =— У(1) 22 ! Е [О, Т[. Отсюда Т = Т. 204 История задачи Рис. 9. Формализация задачи Глава 4. Задачи оптимального управления 3.2. Аэродинамическая задача Ньютона Задача Ньютона — это залача о сопротивлении движению тела вращения в «редкой» среде. Необходимо выбрать форму тела вращения так, чтобы сопротивление движению было минимально. В 1б87 году вышли «Математические начала натуральной философии» Ньютона. В седьмом разделе, озаглавленном «О движении:кидкостей и сопротивлении брошенных теле, Ньютон рассматривает задачу о сопротивлении шара и цилиндра в «редкой» среде. Затем в «Поучении», при исследовании сопротивления усеченного конуса, Ньютон делает следующее утверждение. Пусть Х)лг ЕС вЂ” неко- В торая кривая.
Из произволь- ~~ Е ной точки йг кривой опустим С перпендикуляр на ось АВ и и из заданной точки С проведем прямую, параллельную касательной к кривой в точ- Н ке лГ. Эта прямал пересе- 1 чет ось АВ в точке Р. То- гда если имеет место пропорРис.
8. ция — = — »г, то темя сР1 сл «лг вР ' ло получающееся вращением кривой О7УЕС около оси АВ, будет испытывать наименьшее сопротивление в вышеупомянутой редкой среде среди других тел такой же длины и ширины. Ньютон не дал объяснения тому, как он пришел к этому результату. Опубликованные в наше время материалы Ньютона показывают, что он владел элементами многих конструкций, которые потом были использованы при создании вариационного исчисления. Но, как будет видно в дальнейшем, задача Ньютона относится даже собственно не к вариационному исчислению, а к оптимальному управлению, теория которого начала разрабатываться только в середине этого века. Сопротивление движущегося тела зависит от законов сопротивления среды.
Ньютон представлял себе среду состоящей из неподвижных частиц фиксированной массы гп, являющихся абсолютно упругими шарами. Мы также будем придерживаться этого предположения. $ 3. Избранные зааачи оптимального управления 205 Пусть тело вращения вокруг оси х движется в направлении, обратном оси х в описанной выше среде со скоростью е. Элемент дг на оси г при вращении вокруг Ох описывает кольцо Ап. Этому кольцу соответствует пояс АЕ на теле вращения.