XV Ванько В.И., Ермошина О.В., Кувыркин Г.Н. Вариационное исчисление и оптимальное управление (1081425), страница 24
Текст из файла (страница 24)
Однако линейная задача (6.45) — (6.49) без дифференциальных связей (6.47) бессодержательна и экстремэлей не имеет. Но если экстремалсй не существует, то экстремум может достигаться лишь на функции, график которой целиком находится на границе области, т.е. либо и = 1., либо и = — 1. Таким образом, либо оптимальное решение соответствует постоянному управлению, либо его можно найти, только если считать допустимыми разрывные управления и(1) (далее мы покажем, что зада ~а имеет решение в классе кусочно непрерывных управлений).
Как видим, вариационные методы, работающие в классе непрерывных функций, в случае линейной зада ~и не позволяя>т, вообще говоря, найти решение. Расширение класса дояусптмых функций требует изменить и методы решения задач. Даже если рассматривать кусочно непрерывные управления и использовать напрашивающееся допущенио, что оптимальное управление принимает лишь два значения х1, мы решения задачи все-таки не получим.
с1тобы полностью определить кусочно постоянное упра- ,'1,',1., .. ,'1 вление и®., нужно указать точки Кь, в которых управление меняет значение на противоположРис. 6.7 нос (рис. 6.7). 6.5. Обсуждение методов вариационного исчисления 189 6.5. Обсуждение методов вариационного исчисления Из изложенного в 6.3 и 6г4 ясно, что применение методов вариационного исчисления в зада лах оптимального управления приводит к различного рода трудностям.
Проанализируем причины этих трудностей. Задача Лагранжа в форме Понтрягина наиболее близка к задаче оптимального управления. С помощью метода Лагранжа для нее удалось получить полную сиете,иу необходимых условий и тем самым решить задачу в классе гладких функций х(т) и непрерывных управлений и(г). Но при этом уровне. ния Эйлера для управлений вырождаются в алгебраические соотношения ((6.23) или (6.33) ). Эти алгебраические соотношения представляют собой необходимые условия экстремума функционала и могут и не иметь решений, как, например, в линейных задачах.
В этом случае задача оказывается неразрешимой: функционал не достигает экстремумов в рассматриваемом классе функций. Что может дать расширение класса допустимых функций' ! В связи с этим интересно сравнить задачу Лагранжа и задачу оптимального управления в случае, когда в последней нет ограничений на управление и фазовые координаты, т.е. когда Г = Кг и Я = Кв. В этом случае каждый допустимый процесс (х(1), и(1)) задачи Лагранжа является таковым и для задачи оптимального управления.
Обозначим через Л функционал (6.17) в задаче Лагранжа (6.16)-(6.18), т.е. Л[х,и] =1[х,и), х Е С [ь1,ьх], и Е С[11.,1х]., а через Π— этот же функционал в задаче оптимального управления*: О[х,и] =1[х,п], х Е С[1мХэ], и Е ЛС[11,1з]. Очевидно, что функционал Л является сужением функционала О. Пусть в обеих задачах ищется наименьшее значение це,левого *Обозначение КС(емсз) относится к классу функций, кусочно нецрерывных на отрезке (Сь Ел). 190 6. ВАРИАЦИОННЪ|Е МЕТОДЫ е)«ункппонилп по всему классу допустимых управляемых процессов, т.е. не локальный, а глобальный минимум. Так как Л есть сужение О, то шГЛ[х, и] > |п| О[х, и]. При определенных дополнительных предположениях относительно функций Т ' [г = О, и), О, «к, достаточно естественных в постановке задачи, можно утверждать, что на самом деле ш|Л[х,и] = ш|О[х,и].
Например, в простейшем случае дифференциальных связей х = и указанное равенство будет выполняться, если лагранлсиан задачи непрерывен по совокупности переменных**. Если в рассматриваемой задаче шГЛ[х,и] ) шГО[х,и], то очевидно, что существование решения в одной задаче не связано с существованием решения в другой. Если шГЛ[х,тл] = = шГО[х, и], то возможна одна из трех ситуаций: а) задача Лагранжа имеет решение. Тогда зто решение одновременно является решением и задачи оптимального управления [правда, возможно, не единственным), так как решение задачи Лагранжа является допустимым процессом для задачи оптимального управления, дающим минимальное значение целевого функционала; б) задача Лагранжа не имеет решения, а задача оптимального управления имеет, т.е.
точная нижняя грань значений функционала достигается на управляемом процессе, в котором либо х(1) не является непрерывно дифференцируемой. либо и(~) не является непрерывной; в) ни задача Лагранжа, ни задача оптимального управления не имеют решения, т.е. точная нижняя грань значений целевого функционала не достигается и на более широком классе допустимых процессов.
Пример 6.3. Следующая задача иллюстрирует ситуацию б): 1[хси] = (1 — нв) с|е — «ппп, х = и, х(0) =х(1) = О. о "*Доказательство см. в книге: Алексеев В.М., Тихолтрое В.М., Фомин С.В. 192 6. НАРИАЦИОННЫЕ .ЧЕТОДЫ Пример 6.4. Ситуацию в) иллюстрирует следующий пример Больца: В этой задаче решения не существует. Действительно, точная нижняя грань значений функционала в классе кусочно гладких функций равна нулю, так как значения целевого функционала неотрицательны, а нулевое значение достигается в пределе по с следующей последовательности кусочно гладких функций (рис.
6.8): Рис. 6.8 я„(1) = 816п81п2яитс)т, п = 1, 2, ... а Последовательность функций (хв(1)) равномерно сходится к нулю, при этом и~,(1) = й~(~) = 1 всюду на [О, Ц, кроме конечного числа точек. Значит, 1[т,,и) > хэ(1)М ) О. а Однако нулевое значение не достигается функционалом ни на одной кусочно гладкой функции. Для х(г) = О и(1) = О и 1[я,и] = 1. А если и(1) ~ О хотя бы в одной точке, то в силу непрерывности этой функции 6.5. Обсужденне методов варнацнонного нсчнсленнн 193 Мы сравнили задачу Лагранжа и задачу оптимального управления с точки зрения глобального экстремума целевого функционала. с1тобы провести такое сравнение для локальных экстремумов, нужно ввести соответствукьщее понятие для задачи оптимального управления.
Допустимый процесс (х'(~), и" (с)) будем называть локально оптпимальиым в задаче с фиксированным отрезком ~1ы йя), если найдется такое е > О, что для всякого допустимого процесса (х®, и®), удовлетворяющего условию (6.56) )х(с) — х (с)) < е, у Е ~~~,.
~я), верно неравенство 1~х, и) > 1~х*, и*) . Если отрезок [1ы 1з) не является фиксированным, то каждому допустимому процессу соответствуют свои моменты времени ~~ и ~~. В этом случае локально оптимальным процессом будем называть допустимый процесс (х*(Х), и*(с)) с промежутком времени ~арф, для которого найдется такое е > О, что для лк>бого процесса (х(с), и(с)) с промежутком времени ~Ад, Аэ)., удовлетворяющего условиям )81 — 11) <е, )Сз — Ц) <е, )х'(8) — х(У)) <е при ~Е ~11,8а) Л~Д*,1з), выполнено неравенс гво Т~х,и) > Т~х*,и*).
Отметим, что в задаче Лагранжа, как и в любой другой задаче вариационного исчисления, различают сильный экстремум и слабый экстремум. Точка слабого экстремума (х*(с), и" (с)) доставляет экстремум целевому функционалу среди всех допустимых процессов (х(с), и(с)), для которых х(с) попадает в некоторую слабую е-окрестность х*(у)., а и(с) попадает в некоторую сильную е-окреетноеть и*(~). Локально оптимальный процесс в задаче оптимального управления ограничивает 6.
ВАРИАЦИОННЫЕ МЕТОДЫ сравнение некоторой сильной окрестностью в*(г), а на управления ограничения не накладываются вообще. Это соответствует сильному экстремуму в задаче Лагранжа. Поэтому могут возникать ситуации, когда локальное решение задачи, Лагранжа не является оптимальным процессом соответствующей задачи оптимального управления. Если же в задаче оптимального управления найден оптимальный процесс с непрерывным управлением, то (в рамках предположений относительно функций, входящих в задачу) этот процесс будет являться тгльным минимумом в задаче Лагранжа, т.е. давать ес локальное решение.
Итак, задача оптимального управления является в указанном смысле расширением задачи вариационного исчисления. Однако если область У допустимых управлений открыта, то ничего нового в действительности мы не получим. По-настоящему новой задача оптимального управления становится, если в ней присутствуют ограничения в виде нестрогих неравенств (например, [из[ ( ЛХ, у = 1, т), когда область управления Г является замкнутой.
Именно этот дополнительный элемент делает задачу оптимального управления существенно отличной от вариационной и приводит к необходимости нового подхода к ес решению, связанного с изменением понятия допустимой вариации. Не углубляясь в детали такого подхода [об этом речь далее), отметим лишь очевидньге факты, вытекающие из замкнутости области управления. Вернемся к задаче, Лагранжа (6.16) (6.18). Введение множителей, Лагранжа позволяет рассматривать переменные вспомогате,львово функционала (6.19) как независимые (множители Лагранжа при этом считаем фиксированными функциями).
При таком подходе зада ге об экстремуме функционала 1'[ж, и] можно поставить в соответствие две задачи 1 1*[в, и'[ — ~ ехгг, (6.57) г'*[.в*,и[ — г ехгг. Другими словами, осли х*(1)., и*(1) — решение задачи 1*[яци[ -+ — + ех1г, то ж*(1) решение первой задачи в (6.57), а и'(1) 6.5. Обсуждение методов варианионного иечиеленин 195 решение второй задачи в (6.57).
Поэтому можно объединить необходимые условия двух этих задач, чтобы получить необходимые условия в задаче об экстремуме функционала 1'[х, и]. Однако в рамках задачи оптимального управления с замкнутой областью управления Г система необходимых условий (6.23) уже не является полной, так как не учтено ограничение и(г) Е Г (множители Лагранжа позволяют учесть ограничения только в виде равенств). Изменяется характер второй из двух задач (6.57). Она формулируется следующим образом: Ее Необходимое и достаточное условие экстремума в сформулировашюй задаче состоит в следующем. Кусочно непрерывная функция и*(е) со значениями в замкнутой области У доставляет минимум в зада ~е (6.58) тогда и только тогда, когда всюду на отрезке [1ы 1а], кроме точек разрыва и*(1), выполнено соотношение ппп ь(1,х*(й),х*(1),и(1)) = 7 (1,х*[й),х'(~),и*(~)).
арден В канонических переменных то жс соотношение выглядит следующим образом: шах Н(с х'(~) р'(~),ир)) = Н(~ х*(~) р'(~) тв*[г)) [6 59) Для получения полной, сисепемы усдонпй к (6.59) нужно добавить необходимые условия экстремума для задачи 1*[х,и*] — > шш, х Е С[1~,.1з]., которые в канонических переменных имеют вид (6.32).