Алексеев В.М., Тихомиров В.М., Фомин С.В. - Оптимальное управление (1050536), страница 18
Текст из файла (страница 18)
1.5.3. Можно показать, и ато будет сделано в гл. 11(, что в такой ситуации к урав- нениям (4) — (6) следует-добавить еще и условие.Уг= О (стационарность функции Лагранжа по Т), вполне согла- суиицееся с общей идеологией принципа Лагранжа. Диф. ференцируя (3) по Т и учитывая равенствах,(Т)=и(Т), ха(Т)=х,(Т)=0, получаем Уг — — Л, + т, й4Т) = О. (7) ' 4. Обращается ли Е, в нуль или нет — специальной роли в данной задаче не играет, поскольку Л, не входит в (4) — (6).
5. Из уравнений (4) заключаем, что р((()=сонэ(, а р,( ) — произвольная линейная функция. При этом р,(1) ~0, ибо (4) (б) „(7) р (1)— = О~р((г) — Оьор(=р =т =й =О=ФЛ =0 и все множители Лагран)ка оказываются нулями. ,Линейная функция, отличная от тождественного нуля, обращается в нуль на отрезке (О,Т'1 не более одного раза. Поэтому из (6) получаем следующие возможности для оптимального управления: а) и(1) = 1; б) й(1) — = — 1 ()),(.) не обращается в нуль иа 10, Т)), 1, 0~((<т, в) й(()=~ 1 т< 1(Т ( — 1, О.'=; ( < т, г) й(1) =~ 1', <, (р,( ) обращается в нуль в точке (=т, значение управ- ления в точке т несущественно, так как изменение его в одной точке не оказывает влияния на функцию х ( ) (почему?); по той же причине можно опустить случай т=Т и т=О.) Дальнейшие рассмотрения удобно вести на фазовой плоскости (х„х,) .(рис.
28). Решая задачу Коши х,=х„х,=й((), хг(Т)=х,(Т)=0 (8) 105 для одного из управлений а) — г), получаем единственное решение, а с ним и единственную начальную точку (х„о,) =(х,(0), х,(0)), которая этому решению соответствует. Нетрудно проверить, что при всевозможных т и Т эти' начальные точки однозначно покрывают всю плоскость. Прежде всего, х,=х„х,=! =эх,=х',(2+С„ (9) х,=х„х, = — 1 =эх, = — х3/2+С„(10) и, таким образом, фазовые траектории на участках постоянства управления лежат на параболах одного из семейств (9) или (10). Рис. 28. Управлению а) соответствуют начальные точки, лежащие на дуге ОРА (рис. 28): х, = 4/2, о, < 0; управлению б)— точки на дуге О))В: х,= — о3!2, о,) О.
Начальные точки С, лежащие слева от разделительной линии ВООЕА (х, = — о, ~ о, 1/2) отвечают управлениям в): на дуге СО семейства (9) й(Г)=— 1, в момент (=т попадаем в точку Е), происходит переключение управления, и далее движемся по дуге ОО с й(1)= — 1. Аналогично начальным точкам Е справа от разделительной кривой соответствуют управления г). б, Остается показать, что найденное единственное решение х(1)=х,((), отвечающее заданной начальной точке (х„ о,), действительно доставляет решение задаче (2). Предположим, что некоторая функция х( ) определена на отрезке 10, Т], имеет кусочно-непрерывную вторую производную и х(0) =х„х (0) =о„х(Т) = х(Т) =О, причем Т=Т.
При Т < Т мы доопределим х( ), положив х(()= — О, (Е~Т, Т]. После этого обе функции х(.) нх( ) 106 будут определены иа одном и том же отрезке [О, Т'1 и будут иметь одинаковые граничные значения х(0) =х(0)=к„х(0) =х(0)=о„ х (Т) = х (Т) = х (Т) = к (Т) = О. Покажем, что если ! х ( (1, то х ( ) = х ( ) и, в частности, неравенство Т( Т невозможно. Тем самым будет доказана оптимальность функции х( ). Ввиду симметрии задачи ограничимся управлением в) (или его предельным случаем а)). Если (х~~1, то, интегрируя дважды неравенство х(1)(1 и учитывая (11), получаем х(т) — х(т) = ~ ~ (1 — х(з))дзЖ)0, (12) о о причем равенство здесь возможно, только если во всех точках 'непрерывности х(з)= 1, а тогда х(1)=х(1), Е[О, .1. Аналогично, интегрируя дважды неравенство х (1)) — 1, получаем тт х(т) — х(т) =~) ( — 1 — х(з))йзЖ(0, (13) причем и здесь равенство возможно лишь, если х(з) = — 1 и х(Г)— = х(1), (Е[т, Т1.
Сравнивая (12) и (13), находим, однако, что х(т) = =х(т), а тогда, как уже было сказано, х(1)= — х(1), (Е О, Т1. римечание. Из соотношепий (5) — (7) следует равенство з,=~р,(Т)(, и, таким образом, равенство Х,=О в этой задаче оказывается возможным, когда р,( ) обращается в нуль при (=Т. Тогда функция р,( ) Зй 0 (ибо иначе все множители Лагранжа были бы нулями) и вследствие равенства р,(Т) =О, р,(.) ие меняет знака и, значит, переключений управления нет вовсе.
Следовательно, случай "ь,=О соответствует движению по линиям переключения АЮ и В00. 1.6.4. Классическая изопериметрическая задача и задача Чаплыгина, Стариннейшая экстремальная задача— первая из двух названных в заголовке — была поставлена 107 в п. 1.1.1 и формализована разными способами в и. 1,2.4. В частности, формализация (2) и, 1.2.4 сводит ее к более общей задаче, охватывающей также и задачу Чаплыгина. Исходя из этой формализации, приведем сейчас решение обеих задач, следуя нашей стандартной схеме.
Итак: т 1. Б = з ) (хо — уи) с($ — зпр; 1/ (1) х=и, у=о, (и, о) Е А, х(0) =х(Т), у(0) =у(Т). Множество допустимых скоростей А будем считать замкнутым выпуклым ограниченным множеством в Ка. Упражнеане. Покажите, что для разрешимости поставленной задачи необходимо, чтобы ОЕА. Указание: можно воспользоваться результатом упражнения 2 в и.
2.2.3, т 2. Я=~Т.Ж+р,(х(0) — х(Т))+т(у(О) — у(Т)), (2) о где 1.= — — '(хо — уи)+ р(х — и)+4(у — о). 2 3. Уравнения Эйлера — Лагранжа: Ф ьз — — Т.. +.(., = 0 ~ — р — — о = О, (3) Н хз — — Е +С =О=о — д+ — и О, Ж а и 2 Условия трансверсальностн: р(0)=р(Т)=1ь, д(0)=д(Т)=м. Принцип максимума: (Р(г) — и-У(г))й(г)+) 9(г)+ 2 х(г)) о(г) = 1пах ЯР(1) — 2 У(1)) и+Я(1)+ 2 х(Г))о) . (4) 4.
Если допустить, что ль=О, то из уравнений Эйлера — Лагранжа р (1) = — сопз1, д (1) = сопз1, причем р'+да > О, ибо иначе вайду условий трансверсальности все множители Лагранжа оказались бы нулями Теперь 10В принцип максимума приобретает вид рй(!) + д о (Г) = тах (ри + оо), иь мел откуда видно, что (и(!), о(!)) все время принадлежит од- ной и той же прямой, а именно одной нз двух опорных к множеству А прямых,. перпендикулярных вектору (р, д) (рис.
29). Поэтому х(() =и(()=и(0) — а(()д, у (г) = о (г) = о (0) +а (г) р, откуда, интегрируя, получаем хЯ=х(0)+и(0) à — ~а(Г)Н д, о у(!) =у(0) -)- о (0) 8 +~ а(г) г(!. р. (5) 109 Полагая в (5) (=Т и используя краевые условия х(0) =х(Т), у(0) =у(Т), убеждаемся, что вектор (д,— р) пропорционален (й (0), о (0)), после чего из (5) видно, что Йу> (х (г), у (()) все время лежит (й(6,8Ю на прямой, проходящей через (х(0), у(0)) параллельно вектору (д, — р). Следовательно, замкнутая кривая ((х(г), у(Г)),0 (ч' Т) вырождается (лежит на прямой) и ограничиваемая ею площадь равна нулю (покажите это аналити- Рнс, 29.
чески, исходя из указанного выше выражения для 5!), Следовательно, эта кривая не может быть оптимальной. 5. Из этапа 4 следует, что можно положить Х,=1. Тогда из (3) р + ~ — — 0 зо р (г) + — = Ь = сонэ(, и х(0 у — х 0~: д(Г) — =и=сонэ(. 2 Подставляя эти выражения в (4), получаем (хЯ вЂ” а) о(1) — (у(1) — Ь) й(1) = п)ах ((х (!) — а) о — (у (1) — Ь) и) . (6) (и, Р) ел Оставляя теперь в стороне общий случай, ограничимся двумя частными вариантами. а) Классическая изопериметрическая зад а ч а. Здесь А =((и, о))и'+о' 1) и из (6) находим х(1)=й(1) = — — "(-,—, у(1) =о(1) =, (7) где Я = ((х (1) — а)' + (у (1) — Ь)')и* (скалярное произведение векторов (х — а, у — Ь) и(о, — и) будет наибольшим, когда онн одинаково направлены и второй имеет максимально возможную длину, т.
е. 1). Из (7) имеем т. е. на оптимальной траектории Я(х(1), у(1)) =((х(1) — а)'+(у(1) — Ь)')н = = п)ах ((х(1) — а) о — (уЯ вЂ” Ь) и) =)(=сопз1. (8) (н, о) е А Отсюда заключаем, что оптимальная траектория является окружностью с центром в точке (а, Ь) и радиусом 1( Поскольку угловая скорость движения по этой окружности равна — = —, ((х — а) у — (у — Ь) х) = — —, ар т )(' и через время Т мы должны возвратиться в ту же точку (быть может, совершив несколько оборотов), 2яи= — и Т Т Р = — „„. Площадь, ограниченная найденной кривой, 11О будет при этом равна т т т 1 Р ! Р ° ° ! Г Б = — ~ (хо — уи) Ж = — ) (ху — ух) вЫ = — ) ((х — а) у— 2 о 2 2 ю « « р«т т — (у — Ь) х) !(1 = — — =— 2 Я 4пп Следовательно, п = 1 (окружность обходится только один раз) и Я= Т'~4и.
Заметим, что здесь Т вЂ” это длина кривой, 6) 3 а д а ч а Ч а п л ы г и н а. Здесь А =((и, и) !(и — и,)'+о'(У'), (им О) — вектор скорости ветра, У) (и,! — максимальная скорость самолета. Для решения вспомогательной экст- ремальной задачи (х(1) — фо — (у(1) — Ь) и зпр, (и — и,)'+ о'(У', можно, например, сделать подстановку и=и«+$, и= !) и воспользоваться тем же геометрическим соображением, что и в предыдущем случае. Это дает уравнения х(1)=иЯ=и — У~~) у(1) о(1)=Ух(!1 где теперь уже величина 14 (1) =((х Я вЂ” а)*+(у Я Ь)«)ч« не будет постоянной.
Однако ((х(1) — а) х(1)+(у(1) — Ь) у(1))= х!!) — о и«ву я = — и = — —, л(!) «=У Вт ° так что Ю( Я у(1)) =)~(1) — ~'у(1) =((х(1) — )'+(у(1)+Ь)') '— — — 'у(1)=У шах ((х(1) — а) о — (у(1) — Ь) и) =сопз1. (9) !и, «!«л Следовательно, оптимальная кривая — вто эллипс с уравнением ((х — а)'+ (у — Ь)') ь — — ' у = сопз(. (10) У 111 Как и в предыдущем случае„можно показать, что он обходится траекторией (х(1), у(1)) ровно один раз. Заметим, что если бы скорость самолета была меньше скорости ветра (У< ~и«~), он не мог бы вернуться внсходную точку (докажите это и сравните с упражнением в начале этого пункта), а кривая (1О) была бы гиперболой, т. е. незамкнутой. Примечание.
Вопреки принятой схеме, мыобошли молчанием вопрос о существовании решения. Это не случайно: простой ссылкой на теорему Вейерштрасса здесь не обойдешься. Наметим вкратце возможный путь рассуждений. Прежде всего без ограничения общности можно считать, что х (О) = у (О) = О. Используя теорему Арцела [КФ, с. 110-1111, можно установить, что множество пар функций ((х( ° ), у( ))), удовлетворяющих на отрезке [О, Т1 обобщенному условию Липшица [хг — х1 *Ш.-*.Ю, йИ=.«««) «», ~,,~~,, О«~, ~1«««» и краевым условиям х(0)=х(Т)=0, у(0)=у(Т)=0 компактно в пространстве С([0, Т1)хС([0, Т)). Далее, на этом множестве функционал «площадь» определен и является полунепрерывной снизу функцией. Применяя соответствующее обобщение теоремы Вейерштрасса, убеждаемся в существовании решения(х( ), у( )).