Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 113
Текст из файла (страница 113)
Для доказательства условия (68) нужно провести те же рассуждения, поменяв ролями левый и правый концы траектории, вафиксировав в (2.37) — (2.40) Т = То, пользуясь вместо задачи (2) аадачей Коши (10) и ваРьиРУЯ Ге в Достаточно малой окРестности Г . ТеоРема 2.2 Донована пгинцип мАксюитмА понтРяГинА [ГЛ. З 480 й 4. О методах решения краевой задачи принципа максимума 1. Выше в з 2 было показано, что задача оптимального управления (см. задачи (21) — (2.4), (2.37) — (2.40)) с помощью принципа максимума может быть сведена к краевой задаче, состоящей из условия максимума (2 14) зпр Н(х, и, 1, ~р, а,)=Н (х, и (х, 1, ф а,), 1, ~р, а,), (1) ин У определяющего функцию и = и(х, 1, ф, а,), системы 2п диффе- ренциальных уравнений х=7'(х, и(х, г, ф а,), 1), ф= — Н„(х, и(х, 1, ф а,), 1, ф а,), (2) 1,(т(Т, граничных условий (см.
условие (2.18), ограничения типа равенств из (2.39), условия (2.41) — (2.44)), которые могут быть записаны в следующем виде ~ф(те х(1,), ~Р(1,), ае ..., а„Т, х(Т), ~~(Т))= О, 1=1, ..., 2п+г+3, (3) и неравенств (см. (2 19), (2.39)) а,~О, а,~О, ..., а„>0, д'(ХЯ, х(Т), т„Т)<0, 1=1, ..., т. (4) Для численного решения такой краевой задачи могут быть приспособлены известные методы, такие, как метод стрельбы, метод прогонки, различные итерационные методы [4, 13, 20, 39, 54, 209). Здесь мы кратко остановимся на методе стрельбы, с помощью которого краевая задача (1) — (4) сводится к решению задачи Коши и некоторой задаче минимизации функции конечного числа переменных.
Для применения этого метода сначала из набора т„х(1,)=хе ~(1,)=ф, а=(а., ао ..., а,), Т, х(Т) х„ ~(Т)=ф выделяют величины, называемые параметрами стрельбы, задав которые можно сформулировать и однозначно решить какую-либо задачу Коши для системы (2)'. В качестве параметров стрельбы часто берут те х„ф, а.
Затем задают какие-либо конкретные числовые значения этих параметров и решают аадачу Коши для системы (2) с начальнымн условиями Х(1о) = Хе $(1о) = ф (5) При численном решении задачи (2), (5) можно пользоваться известными методами Эйлера, Адамса, Рунге — Кутта и др. (4, 13, 39, 54, 258). о методАх Решения НРАевои 3АдАчи 482 3 «! Допустим, что решение этой задачи х(1; 1„х„«р„а,), «Р(1; »„х„«Р«1 а,), соответствующее взятым значениям параметров стрельбы, уже найдено. Тогда можно вычислить значения функций Ч2 иэ (3), ваяв в качестве аргументов этих функций выбранные значения параметров стрельбы и соответствующие им х(Т) = х(Т; 1„ х„ 2Р„ ао), $(Т)= 2р(Т; 1„ х,, ~Ъ, а,) при некотором Т ) »„ и значение функции 23-~.3+3 'р(»о о 2го а, Т) = Х Ж(»о то Фо,а, Т,х(Т),«Р(Т)), (6) называемой функцией невязки системы (3).
В случае удачного «выстрела», когда выбор параметров»„х„ф, а, Т обеспечивает выполнение неравенств (4) и функция невяэки (6) обратится в нуль, что равносильно условиям (3), краевая задача принципа максимума (1) — (4) будет решена. Однако вряд ли с первого «выстрела» удастся добиться выполнения с нужной точностью неравенств (4) и обратить невязку (6) в нуль — скорее всего придется продолжать «стрельбу» с другими значениями параметров »„х„ор„а, Т, которые дают меньшее значение функции (6) при соблюдении условий (4).
Таким образом, для выбора наилучших параметров стрельбы нужно решить задачу минимизации функции невязки (6) при ограничениях (4); здесь возможно использование известных методов минимизации, например, методов из главы 5. Конечно, вместо этой задачи минимизации можно непосредственно решать систему уравнений ф(»„х„«Ро, а, Т, х(Т; »„х„«ро, а,), «р(Т; »„х„2ро, а,))=0, (7) 2=1, ..., 2п+3+3, относительно 2п+ г+ 3 неизвестных »„х„~„а, Т с учетом ограничений (4); здесь могут быть использованы подходящие модификации известных методов решения нелинейных систем уравнений (4, 8, 13, 20, 22, 39, 42, 45, 54, 73, 76, 106, 209, 221, 238, 239, 296, 301).
Подчеркнем, что вычисление значений функции (6) и левых частей системы (7) в каждой отдельно взятой точке (»„х„«р„а, Т), вообще говоря, весьма трудоемко — для этого всякий раэ нуя«но решать задачу Коши (2), (5). Аналогично может быть описан метод стрельбы для случая, КОГДа В КаЧЕСтВЕ ПаРаМЕтРОВ СтРЕЛЬбЫ бЕРУтСЯ Т, Х„ «Ро а И задача Коши для системы (2) решается с начальными условиями х(Т) = хо «Р(Т) = «Р,. РазУмеетсЯ, описаннаЯ схема метоДа стРельбы при применении к конкретным задачам оптимального уравнения каждый раз должна модифицироваться с учетом граничных режимов на концах траекторий (см., например, '(2.21) — (2.36)) пРинцип мАксимумА понтРяГинА [ГЛ.
З т Х (и) = ~ 7э (х ([) и ([), [) [[[ + дэ (х (Т)) -э ш1, [а й([)=1(х([), иЯ, [), [,<Е<Т, х([,)=ие и = и([) е [г, [, < [ < Т, (8) (9) (10) где и = и([) кусочно-непрерывное управление; обозначения взяты иэ 3 2. Как показано в $ 2, краевая задача принципа макси- и других особенностей решаемой задачи; количество параметров стрельбы по возможности нужно стараться уменьшить. Следует заметить, что краевая задача (1) — (4) принципа максимума имеет ряд специфических особенностей, затрудняющих применение метода стрельбы и других стандартных методов решения краевых задач.
Такие методы обычно разрабатываются для краевых задач вида (2), (3) при отсутствии каких-либо дополнительных ограничений на переменные; здесь же задачу (2), (3) приходится решать совместно с дополнительными неравенствами (4). Наличие числовых параметров аь ао ..., а, также осложняет краевую задачу (1) — (4). Далее, функция и= =и(г, [, [р, а,), определяемая из условия (1), вообще говоря, нелинейно зависит от своих аргументов, и поэтому система дифференциальных уравнений (2), как правило, нелинейна относительно (х, [Э) даже в том случае, когда исходная система й= = 7'(х, и, [) была линейка относительно (х, и). Кроме того, функция и = и(х, [, ф а,), вообще говоря, не обладает хорошими дифференциальными свойствами и даже может быть разрывной (об этом говорят функции вида и=з[яп[р из примеров 2.7 — 2.11), что влечет за собой плохие аналитические свойства правых частей системы (2). Краевая задача (1) — (4) су[цественно осложняется в тех случаях, когда из условия (1) функция и =и(х, [, [у, а,) определяется неоднозначно.
Указанные обстоятельства весьма затрудняют исследование вопросов существования, единственности, устойчивости решения краевой задачи принципа максимума, сходимости методов ее решения. При численном решении прикладных задач оптимального управления трудности, связанные с плохой сходимостью методов, с их неустойчивостью, обычно преодолеваются на основе учета специфики конкретно решаемой задачи, ее физического смысла и т. и. [14, 38, 68, 80, 217, 326). Некоторые приемы преодоления возможной неустойчивости в краевых задачах принципа максимума описаны, например, в [14, 81, 204, 217, 326).
2. Для некоторых классов задач оптимального управления разработаны специальные методы решения краевой задачи принципа максимума. Здесь мы кратко остановимся на следующей задаче с закрепленным левым и свободным правым концами траектории: О методАх Рюпения кРАевои зАдАчи мума для задачи (8) — (10) имеет вид (см.
(2Л5), (2.26)): х=1(х, и, 1), $,«1<Т; х(ц,)=х„(11) ф= — Нх(х, и, 1, »)»), то(т(Т; »Р(Т) = — д'„(х(Т)), (12) где Н(х, и, 1, »~»)= — ~'(х, и, т)+ <»)»» ((х» и, 1)>, функция и= = и(х, г, »)») в (11), (12) определяется из условия зпр Н(х, и, 1, »(») = Н(х, и(х, 1, »)»), 1, »(»). (13) »»е и Попутно сделаем замечание, касающееся возможностей применения метода стрельбы к краевой задаче (11) — (13). В этой задаче начальное условие х„моменты те Т известны, поэтому в качестве параметра стрельбы здесь достаточно взять »)»,; систему (2) нужно решать с начальными условиями х(г,) = х„ »(»(Ь)»)» при а, = 1; функция невязки (6) будет иметь вид »р(Фо) = ~»р(Т' »)»»») + у„'(х(Т; »)»,)) 1'; ограничения (4) здесь отсутствуют.
Если же за параметр стрельбы взять х(Т)=х„то систему (2) нужно решать с начальными условиями х(Т) = х„ »)»(Т) = — а»„'(х») при а, = 1; функция (6) будет иметь вид »р(х») = »х(г,; х,) — х,»'. Перейдем к описанию итерационного метода, специально предназначенного для решения краевой задачи (11) — (13) (326). Пусть и,=и,(1)ж У (1,<Г<Т) — начальное приближение. Допустим, что уже найдено й-е приближение и„=и,(1)ш г" (1,< < Г < Т).
Тогда, решая задачу Коши (11) при и = и„(1), находим ее решение х»,(1) = х(1, и„) (т, <» < Т). Затем, приняв в (12) и=и,(1), х=х„(т), из (12) определяем ф,(1)=»р(Е; и,). Наконец,из условия зпр Н (1 (Г), и, 1, »)» (1)) = Н (хь (г), ЕА+, (1), 1, р у)), 1, < ~ < Т, ЗОР (14) получаем следующее приближение и„+, = и,+» (г) ш У (г, < г < < Т) и т. д. Метод описан. Таким образом, на каждом шаге метода нужно решить две задачи Коши — задачи (11) и (12) — и конечномерную задачу максимизации (14) при каждом 1ш(г„ Т).
Предполагаем, что все получаемые этим методом функции и„(1) кусочно-непрерывны на отрезке (1„Т). Может случиться, что при некотором й имеет место равенство и„(1) = и„+»(1) (1, <1< Т). Согласно (14) это будет означать, что управление и,(1) удовлетворяет принципу максимума (теорема 2Л) и, следовательно, является подозрительным на оптимальность. В этом случае итерационный процесс прекращается, а управление и„(1) при необходимости подвергается дальнейшему исследованию для выяснения того, будет ли оно на самом деле оптимальным.