Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 123
Текст из файла (страница 123)
Один из подходов, с помощью которого можно получить до, статочные условия оптимальности, связан с методом динамического программирования [65, 81, 101, 124, 125, 188, 189, 199, 263). Этот подход уже был использован в $ 1 для получения достаточных условий в дискретных системах. Покажем возможности зтого подхода для вадач оптимального управления с непрерывно меняющимся временем. 1. Начнем с рассмотрения задачи (1.1) — (1.4) с закрепленным временем. Будем пользоваться обозначениями и некоторыми формулами из 1 3. Согласно (3.24) и (3.28) для каждой допустимой пары (й(с), х(с)) (с,( ( с ~ Т), х(с,) = хо, задачи (1.1) — (1.4) справедливы формула т У(С х, и( ))= ) Я(х(С), и(С), С)о)С+о(х(Т), Т)+К(х, С) (1) со ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 523 рывными производными К„, Ко а функция К(х(т), т) переменной т для любой допустимой пары (и( ), х( )) задачи (1Л) †(1.4) была непрерывной и кусочно-гладкой на отреэйе [ам Т).
теор ем а 1. Для того чтобы допустимая пара (и(г), х(!)) (сп <<! < <т), И(гп) = йп, задачи (1.1) — (1,4) была решением атой задачи, достаточно существования функции К(х, г), для которой формула (1) верна для любой допустимой пары задачи (1Л) — (1.4) и Ю(хх(!), й(с), с) =К щ(!), ге < с<Т, г(х(Т), Т) =гпмнп, К(хп, гп) =Ксп!и, (6) (7) гдв д(х, и, с), г(х, Г), дю;п(с), гт;и, Коапп определяются (3) — (5). Доказательство этой теоремы следует из того, что при выполнении условий (6), (7) правая часть оценки (2) обращается в нуль и л (!е, *о, й ( )) = уе. С помощью оценки (2) нетрудно также получить условия, достаточные для того, чтобы та или иная последовательность допустимых управлений и траекторий была минимизирующей для задачи (1.1) — (1.4). Теорема 2.
Для того чтобы некоторая последовательность (ин(!), х (г)) (ге~ (! ~ ~Т), хн(!о) = хпы (щ = 1, 2, ...) допУстимых паР задачи 1Л) — (1.4) была минимизирующей, достаточно существования функции (х, !), для которой формула (1) верна для любой допустимой пары задачи (1.1) — (1.4) и т т ( д (хп, (!), ию (г), г) бг = ~ дщж (!) йг, щ о го о !!ш г(х,„(Т), Т) =гщ!д, !!шК(х щ, ! ) = Кещ!и.
щ-и т (8) (9) Доказательство. В оценке (2) вместо й(!), х(г) подставим и (с), хн(!) и перейдем к пределу при щ-топ. С учетом условий (8), (9) по- лучим !!ш г (го, х, и,„( )) = Ую что и требовалось, щ-тсо Чтобы польаоваться приведенными в теоремах 1, 2 достаточными усло- виями оптимальности, нужно знать функцию К(х, !), с помощью которой строятся функции (3) — (5). Как найти такую функцию К(х, г), каким условиям она удовлетворяетр Всякую функцию К(х, !), удовлетворяющую условиям теоремы 1 [тео- ремы 2), назовем функцией Кротова аадачи (1.1) — (1.4), соответствующей допустимой паре (й(!), х (!) ) (гп < г < т) [нли последовательности (и (с), хы(!) ) допустимых пар) .
Заметим, что если существует какая-либо функция Кротова К(х, !), то функцией Кротова является также функция К(х, с) =К(х, с) +се(г), где а(!) — произвольная непрерывная, кусочно-гладкая (или абсолютно нег прерывная) на [го т) Функция. В частности, если и(!) = — ~ дщ1„(г) йт— т — гщг„, то функции д(х, и, !), г(х, Т), построенные по формулам (3), (4) с заменой К на К=К+и, таковы, что д(х, и, с) =д(х, и, с) — д и!п(Г), У(х, Т)= з(х, Т) — гю~п и, следовательно, [п1 ш1 б(х, и, !) юа О хы т!г; ини!х,г! (со<~!<(Т), !п1 з(х, Т) =О, а !В1 К(х, го) =Кещ!и+ос(го) отликых!тЪ хых(! ) ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 524 сгл, т чается от Кошс на постоянную и(со). Поэтому в теоремах 1, 2 беа ограниЧсиня ОбщНОСтИ МОЖЕМ ПрИНятЬ Я 1»(С) ш О, О»я» = О. С учетом этого замечания заключаем, что функция Кротова, соответствующая допустимой паре (й(1), й(1)) или последовательности (и (С), хш(с)) допустимых пар задачи (1.1) — (1.4), согласно теоремам 1, 2 удовлетворяет условиям 8(х, и, с) = <К»(х, с), с(х, и, с) >+ Кс(х, с) + со(х, и, «) >~ О, (10) иомР(х, с), хопХ(с), со(с(Т; о(х, Т) = Ф(х) — К(х, Т) ) О, хш Х(Т), (И) К(Х, Со) )К»шо», ХОМХ(СО) причем неравенства (10), (И) должны обратиться в равенства ири и = й(с), х = х (с) или при и = и (с), х = х (с) в пределе при ео -» оо.
Задача (10), (И) для определения функции Кротова несколько необычна тем, что, во-первых, здесь мы имеем дело не с дифференциальным уравнением, а с дифференциальным неравенством (10) в частных производных, во-вторых, начальное условие при С = Т также задано в виде неравенства и, наконец, аадача (10), (И) тесно связана с конкретной допустимой парой (и( ), х( )) или последовательностью (и ( ), хш( )) допустимых пар, нодоареваемых на оптимальность. Сравнение соотношений (10), (И) с (3.5), (3.6), (3.14) покааавает, что функция Беллмена всегда является функцией Кротова.
С другой стороны, функция Кротова определяется иэ более широких условий (10), (И), и она может существовать даже тогда, когда функция Беллмана не существует. Б тех случаях, когда отсутствует удобное для работы конструктивное описание множеств Р(х, с), Х(с), функцию Кротова можно попытаться определить из условий, получающихся из (10), (И) при замене Р(х, С), Х(с) на У(с), 6(с) соответственно. Проиллюстрируем вышесказанное на примерах. Пример 1.
Пусть требуется минимиаировать функцию о (и())= 1 = ) (х (с) — и(с)) йс при условиях х(с) = и(с), х(0) = х(1) =О, и(с) см о ои У(с) = (и оп К'. (и( ( 1» (0(с(1). Здесь фаэовые ограничения Р(с) такие: Р(0) = С(1) = (О), С(с) ш» Кс (О ( «( 1). Очевидно. пара (й(с) ш» О, х(с)»ш 0) являетсн допустимой для этой задачи. Покажем, что она является решением аадачи, Для этого возьмем функцию К(х, С)»ш х. Тогда о (х, и, С) = хо ~~ 0 = 8(х (С), й(С), С) = Яшс»(с), г(х, 1) = — х=О=»(х(1), 1) = сп1 з(х, 1), х-О«1) К (., О) = х = О = К ( (О), О) = Спс К (х, О). хыо«о) Кроме того, ясно, что формула (1) здесь будет верна для любой допустимой пары.
согласно теореме 1 тогда пара (й(с) = О, х(с) = 0) оптимальна. Предлагаем читателю найти функцию Беллмана и синтезирующую функцию этой задачи. П р и м е р 2. Пусть требуетсн минимизировать функцию о' (и ( )) = 1 = ~ (хз (с) — й (с)) йс при условиях й(с) = и(с), х(0) = О, и(с) см У(с) о = (и сп Р: (и) ( 1) (О ( С ( 1). ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 525 Здесь фавовые ограничения О(!) такие: С(0) = (0), 6(с) мпЕ' (0< ( 1(1). Возьмем последовательность пар функций (и„( ), х„(.)), где 1, — (!( — +— р р т т 2т' () р 1 р — 1, — + — <1< — + —, т 2т -т т' ~ р р р — — — < !< »вЂ” + —, т' ги т 2т' +1 — С -(- —, — -)- — < 1< — + —, т ' т 2т п» п» ' р = О, 1, ..., т — 1, т = 1, 2, при условиях х(!) =7(х(!) и(!) !) ге » (! ( т' х(!») х»» х(г) ж 6(г), !» ( ! ( Т; х(Т) ж Я»(Т)»= П(Т), и = и(!) щ Р(!), и(!) — кУсочно.
непРеРывна, Гэ ( С < Т, и(!)=и(!+0)= !!ш и(т), ! <!<Т, т- г+е (13) (14) (15) где моменты с», Т, в отличие от задачи (1,1) — (1.4), неизвестные и тако. вы, что О., Т 00 (16) 0„0» — некоторые множества на числовой оси — сс ( г < оп; остальные обозначения см. в 1 6.1. В частности, если 7»ам1, Ф=О, то вадачэ (12) — (16) превратится в задачу быстродействия. Всюду ниже будем предполагать, чта !» ( Т. Нетрудно проверить, что пара (и ( ), * (.)) допустима для рассматриваемой задачи при всех т = 1, 2, ... Покажем, что последовательность этих пар является минимизирующей.
Длн этого возьмем функцию К(х, !) = — тогда Я(х, и, 1) =хе+1 — и >О= ш!и ш!и Я(х, и, 1)=» хыет (и)хт !пп Я(хт(!), и,„(!), !), г(х, 1) = — К(х, 1) — 0= ш( К(х, 1) »и-»» амит = !!ш з(х (1), 1), К(х, 0) — — 1 = ш1 К(х, 0) = !!ш К(хт(0), 0), и»-»»» хна(Е) т.„» Согласно теореме 2 последовательность (и ( ), х ( )) будет минимиаирующеи: Пш»' (ит ( )) = — 1 = »'». Заметим, что в этом примере !и!1(и) = — 1 не достигается ни на какой допустимой паре. В самом деле, если х'(!) О, то в силу уравнения 1 и = и(!) = 0 и 1(0) =О > — 1.
Если же х'(!) ча О, то У (и) > — ~ й(г)»71~ е > — 1. Таким образом, 1(и( )) > — 1 для всех допустимых управлений и траекторий. В этой задаче мы имеем дело с так называемым скользящим режимом (37, 77, 104, 124, 125, 188, 189, 304). Предлагаем читателю найти функцию Беллмана и приближенную синтезирующую функцию этой задачи. 2.