Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 104
Текст из файла (страница 104)
Если множество )с имеет вид Р= ияЕ': !и[= ~ (и)' ((Н, то, пользуясь известным неравенством Коши — Буняковского, также нетрудно вь1писать функцию (13) в явном виде: ф(г,о,ф,а) и(х, С, ф ао) = ~ (х, 1, ф, о ))Н' ф = (ф1 . фо) о) Ряд задач, в которых удается получить явное выражение для функции (13), приводятся ниже в примерах. Допустим, что функция (13) нам уже известна. Тогда можем рассмотреть следующую систему из 2п дифференциальных уравнений х=С(х, и(х, С, ф, а,), С), (15) ог = — Н„(х, и(х, С, ог, а,), С, фд а,), С, ( С ( Г, относительно неизвестных х( ), ор( ). Как известно [172, 251, 295] общее решение системы (15) зависит от 2п произвольных числовых параметров (например, такими параметрами могли бы служить начальные условия х(С,), ф(С,)) и для определения этих параметров нам нужно иметь 2п условий.
Кроме того, параметры а„ао ..., а„встречающиеся в теореме 1, также неизвестны и для их определения нужно еще а+ 1 условие. Таким образом, для определения 2п+ г+ 1 неизвестных числовых параметров нам нужно 2п+г+1 условие. Где нх взять? Оказывается, эти условия также могут быть извлечены из теоремы 1. А именно, условия трансверсальности (10) и дополняющей нежесткости (11) нам дают 2п+ т уравнений; еще г — т уравнении д'(х„х(Т))=0, ]=т+1, ..., г, (16) вытекают из условий (3).
Для получения еще одного уравнения заметим, что функция Н(х, и, С, ф, а,), определенная соотношением (5), линейна .и однородна относительно переменных фо ... ..., ф„, а,, т. е. Н(х, и, С, иф, соа,) = иН(х, и, С, 1[1, а,) при любых ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА 440 [ГЛ. З а. Отсюда и из условия (14) тогда имеем и(х, С, и[у, аа,)= — и(х, С, [р, а,) [Са)0. (17) Из (8), (10), (11), (17) следует, что если некоторый набор а„..., а„ф, ..., ф„удовлетворяет условиям теоремы 1, то этим условиям удовлетворяет также набор аа„..., иа„а[ро ..., и[[[„ при любых с[) О.
Это означает, что теорема 1 определяет величины а„..., а„[)ч, ..., [Г„лишь с точностью до положительного множителя, и этим множителем мы можем распорядиться по своему усмотрению. Например, опираясь на первое из условий (8), можно положить [а [' = „~~ а; = 1. (18) [=о В тех задачах, в которых удается показать, что а,) О, вместо условия нормировки (18) часто берут а, = 1. Таким образом, для определения 2п + г + 1 параметров — 2п параметров общего решения системы (5) и параметров а„а„...
..., а, — у нас имеется система 2п+ а+ 1 уравнений (10), (11), (16), (18). Разумеется, этп уравнения надо решать совместно с неравенствами а )О, ..., а >О, д(х„х(Т))<0, 1=1, ..., и. (19) Если исходная задача (1) — (4) имеет решение, то согласно теореме 1 система (10), (11), (16), (18), (19) также имеет решение. Попутно заметим, что для тех С (1 < [< т), для которых д,(х„х(Т))<0 (неактивные ограничения), из (11) вытекает, что а, = О, и неопределенными остаются лишь а; с номерами [, для которых д;(х„х(Т))=0 (активные ограничения). Это означает, что из уравнений (11) существенное значение имеют лишь подсистемы д,(хо х(Т))=0 ([и 1), состоящие из активных ограничений.
Итак, основываясь на теореме 1, от исходной задачи (1) — (4) мы пришли к специальной краевой задаче, состоящей из условия максимума (14), системы дифференциальных уравнений (15) и условий (10), (11), (16), (18), (19). Такую краевую задачу естественно назвать краевой задачей принципа л[аксимума для задачи оптимального управления (1) — (4). Можно ожидать, что имеются лишь отдельные, изолированные функции (х(С), [[[(С)) (С,<С<Т), н значения параметров а„а„..., а„удовлетворяющие условиям (10), (11), (15), (16), (18), (19).
Возьмем один из таких наборов х(С), [([(С), а,, а„... ..., а„п подставим их в (13); получим функцию и(С)= и(х(С), С, [([(С), а,), С,< С< Т. (20) Пусть эта функция оказалась кусочно-непрерывной на (С„Т). Из (13), (14), (20) тогда следует, что полученное таким обрааом управление и(С) (Сз < С < Т) удовлетворяет условию (9) ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА 441 и, следовательно, согласно теореме 1 может претендовать на роль оптимального управления задачи (1) — (4), а функция х(1)=х(1, и( ), х(1,)) (го~1(Т) — на роль оптимальной траектории этой задачи.
Будет ли найденная пара (и(1), х(1) ) (го < 1 ~ Т) в самом деле решением задачи (1) — (4), теорема 1 не гарантирует, так как эта теорема, вообще говоря„дает лишь необходимое условие оптимальности. Более того, ниже на примерах мы увидим, что бывают случаи, когда пара (и(1), х(1)) удовлетворяет условиям теоремы 1, но не является решением задачи (1) — (4) . Однако, если из каких-либо соображений известно, что задача (1) — (4) имеет решение, а краевая задача принципа максимума однозначно определяет функции (х(1), оР(1)) и параметры а„а„..., а„то управление (20) будет оптимальным. Если информации о существовании решения задачи (1) — (4) нет или краевая задача принципа максимума имеет несколько решений, то для выяснения вопроса об оптимальности получаемых адесь управлений требуется дополнительное и порою весьма сложное исследование.
Заметим также, что в задаче (12) верхняя грань может достигаться в нескольких точках, и тогда функция (13) будет определяться неоднозначно. В этом случае для получения всех подозрительных на оптимальность управлений нужно найти все наборы (х(1), оУ(1), а„а„..., а,) и управления и(1) (1, <1~ ~ Т), удовлетворяющие условиям (10), (11), (15), (16), (18)— (20), для всех функций и = и(х, 1, ~У, а,) из (13).
Таким образом, схема использования принципа максимума— теоремы 1 — для получения решения задачи (1) — (4) описана. Как видно, принцип максимума дает просто и иаящно выписываемые необходимые условия оптимальности для задачи (1) — (4) и сводит ее к специального вида краевой задаче. 3. Посмотрим, как выглядит краевая задача принципа максимума для задач оптимального управления (1) — (4) для некоторых конкретных классов функций ~'(х, у), соответствующих рааличным режимам на левом и правом концах траектории. Начнем с рассмотрения случая, когда концы траектории зан еплены: р х(1,) = х„х(Т) = х,, (21) Если положить д'(х, у) = х' — хо (1 = 1,..., п), у'(х, у) = у'— — х', (1 = п + 1, ..., 2п),то условия (21) запишутся в виде (3): д'(х„х(Т))=0 (1=1, ..., 2п г, гп=0).
Поэтому условия (11) здесь отсутствуют, а условия трансверсальности (10) дадут оу(1о) = ~о аЯ,'(хо, х(Т)) = аоУх(хю х(Т)) + (а„..., а„), (22) з=о оп оу(Т) = — ~~Э ~аздак(хо, х(Т)) = — а д„"(хо, х(Т)) — (а„+,..., а „). о=о пгинцип максимгмл понтгягинл 442 [гл. з Оказывается, условие аФО из (8) здесь может быть заменено условием [а [ + !ф(Е)! чьО у1 еБ [Кю Т!. (23) В самом деле, если (23) не выполняется, то а,=О, ф(1)— = О (Г < Ю < Т).
А тогда в силу (22) ф(Г,) = 0 =(а„..., а„), ф(Т) = = 0 = (а ь„ ..., а,„) и, следовательно, а = (а„ а„ ..., а, ) = О, что противоречит (8). Это значит, что для задачи (1), (2), (4), (21) выполняется условие (23). Тогда условие нормировки (18) можно заменить условием [ а,[ + [ ф (1,) [ = 1, (24) где Е, — какая-либо подходящая точка из отрезна [Е„ Т] (часто здесь берут Г~ = 1, или ~, = Т). Таким образом, краевая задача принципа максимума для задачи (1), (2), (4), (21) состоит из системы (15), граничных условий (21), (22), неравенства а, ~ 9 и условия нормировки (24). Так как неизвестные параметры аь ..., а,„ входят лишь в условие трансверсальности (22) и нв входят в (15), (21), (24), то зти параметры и условия (22) можно исключить из дальнейшего рассмотрения.
В итоге, для определения функций (х(1), ф(1) ) (г, < 1< т) и параметра а,>0 будем иметь краевую задачу принципа максимума, состоящую из системы 2п дифференциальных уравнений (15), 2п граничных условий (21) и условия нормировки (24). Конечно, при необходимости исключенные параметры а„..., а,„могут быть определены из условий (22) после того, как уже будут найдены х(1), ф(~), а, из (15), (21), (24). Теперь рассмотрим задачу (1), (2), (4) при условиях, когда левый конец траентории закреплен: х(1,)=х„а правый конец свободный.
Этот случай граничных режимов соответствует задаче (1) — (4), в которой д' (х, у) = х' — хз (1 = 1,..., п = г, т = 0). Поэтому условия (11) здесь отсутствуют, а условия трансверсальности (10) запишутся в виде: ф(1,) = а д~. (х, х (Т)) + (а„..., а„), ф(Т) = — а дд(х„х(Т)). (25) Покажем, что в рассматриваемом случае также выполняется условие (23) и, более того, можно гарантировать, что а,> О. В самом деле, если а,=О, то, как видно из (25), ф(Т)=0 и система однородных уравнений (6) будет иметь лишь тривиальное решение ф(1)— = О, а тогда ф(1,)=0=(а„..., а,).
Пришли к противоречию с первым условием (8): а =(а„а„..., а„)ФО. Следовательно, а0'х О, и можем принять условие нормировки а,=1. Таким образом, краевая задача принципа максимума для задачи (1), (2), (4) с закрепленным левым концом и свободным правым концом состоит из системы (15), граничных условий (25), 443 ФОРМУЛИРОВКА ПРИНЦ1ША МАКСИМУМА 2 М х(г,) = х, и условия нормировки а, = 1. Так как параметры а1, ..., а„входят лишь в первое из условий (25), то это условие и параметры аь ..., а„можно исключить из дальнейшего рассмотрения, и в результате краевая задача принципа максимума сведется к системе 2и дифференциальных уравнений (15), которая решается при условиях х(2о) = хо, 1Р(Т) = — дгд(хо, х(Т)), а = 1.