Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 122
Текст из файла (страница 122)
Это аначит, что приближенное решение (й( ), х( )) задачи (1) — (4) будем оссределять из условий н, кроме того, положим з(х, Т) = Ф(х) — К(х, Т), хси С(Т). Возьмем проиавольную допустимую пару (и( ), х( )) В силу уравнения (2) тогда имеем йК (х (т), т) = В (* (.), (.), .) — У' (* (.), (.), ), (23) задачи (1) — (4). Сз ( т ( Т Учитывая непрерывность и кусочно-гладкую функцию К(х(т), с), проинтегрируем это тождество по т от с до Т. Получим формулу т з (с, х, и ( )) = ~ Я (х ( с), и (т), т) Ыт + г (х (Т), Т) + К (х, с). (24) с Если К(х, с) = В(х, с), то Я(х, и, т) = В(х, и, т) з(х, Т) = О, и ата формула превратится в выведенную выше формулу (9).
Предположим, что каким-то образом мы получили пару (й(т), х(т)] (с< с < Т), удовлетворяющую условиям (3), (4) и уравнению (2) с на- х(т) =1(й(т), и(х(т), т), с), С<т<Т, х(Т) =х, х(т) ш С(т), й(т) = и(х(т), т), с <т < Т. Приближенное решение исходной аадачи (13) — (1.4) находится анало. гично: сначала определяем точку хь на которой точно или приближение реализуется нижняя грань функции В(х, се) на множестве Х(се) или С(се), а затем решая задачу (21) при с = с„х = й„находим траекторию х(т) и управление й(т) = и(*(т)) (се < с< Т). Найденную пару (й( ), *( )) примем за приближенное решение аадачи (1.1) — (1.4).
Спрашивается, ка- кая при этом будет допущена погрешностьУ Приводимая ниже оценка по- грешности дает некоторый ответ на этот вопрос. Пусть К(х, с) — какая-либо функция, которая определена и непрерывна при всех х см Х(с) (с, < с < Т), обладает кусочно-непрерывными производ« ными К„, Кс н такова, что для любой допустимой пары (и( ), х( ° )) зада- чи (1) — (4) при всех х сн Х(с) (сз < с < Т), функция К(х(т), т) перемен- ной т — кусочно-гладкая (или абсолютно непрерывная) на [С, Т). На прак- тике в качестве функции К(х, с) обычно берут какое-либо приближенное решение В(х, с) задачи (5), (6) или (15).
По аналогии с (10) введем функцию 8(х, и, с) = (К,(х, с), с(х, и, с)) + Кс(х, с) + (с(х, и, с), х а Х(с), сз < С < Т, (22) ДИНАМИЧВСКОБ ПРОГРАММИРОВАНИИ $20 (ГЛ, 1 чальным условием х(с) = х сн х(с). согласно (24) тогда т э (С, х, и ( )) — э (С, х, и ( )) = ) [Я (х (с), и (т), т) — Я (х (с), и (т), с) [ йт + +[с(х(Т), Т) — э(х(Т), Т)]+[К(х, С) — К(х, С)] (25) для любой допустимой пары (и( ), х( )) задачи (1) — (4). Из (25) уже нетрудно получить требуемые оценки погрешности для задач (1) — (4) и (1.1) — (1.4) . Обозначим Яю(и(т) = 1п1 )п1 Я (х, и, т), эщ)в — — 1п1 э(х, Т), хеХ(т) иесцх,т) хеХ(т) К „= (п1 К(х, С).
(26) ею(и Пусть (й( ), й( )) — некоторая допустимая пара задачи (1) — (4), которую мы хотим взять в качестве приближенного решения атой задачи. Учитывая, что для любой допустимой пары (и( ), х( )) задачи (1) — (4) имеют место включения х(с) = х си Х(с), и( ) гид(х, с), х(с) сэ Х(с), и(с) ш ш Р(х(т), т) (С < г < Т) из 25, 26 получим требуемую оценку погрешности: О < э' (С, х, и ( )) — ш1 э (С, х, и ( )) < Мх,() т < ~ [Я (* (т), и (т), т] — Я, Св (т)] йт+ [э (.
(Т), Т) — эю(в]. (21) С Если же (й(т), х(т)) (Сэ < г < Т) — допустимая пара задачи (1Х) — (1.4), й(со) = хо, которая берется эа приближенное решение этой задачи, то из (25), (26) имеем такую оценку погрешности: О~<У(Се, х, и()) — (п( 1п1 г()е, х, и(.))~ *еХ((о) и( )ед(х Со) Т < ~ [Я (х(т), и(т), т) — Ящш(т)] йт+ [с(х (Т), Т) — э ж]+ С + К (хе' Са) Ко шса Если К(х, С) = В(х, с), то Ю(х, и, С) = В(х, и, с), э(х, Т) = 0 и, кроме того, иа (11) следует, что 1п1 В(х, и, с)= 0 при всех хеХ(с), так что «еп(«,С) ш1 ш1 В(х, и, с) =О. Поэтому при К(х, С) = В(х, С) из (21), (28) «ЕХ(С) «ЕО(«,С) соответственно получим т 0(У(С, х, и( )) — )п1 э" (С, х, и( )) < ] В(х(т), и(т), т) йт, (29) «(.
) Е д(х,С) <у(С, хо, и (» — 1))1 (п1 у(Со, *, и ( )) < хЕХ(С,) и( )ЕД(х.С,) т ] В (х (т), и (т), т) йт+ В (х, с ) — 1п1 В (х, Со)' (30) о (Се) ПРОБЛЕМА СИНТЕЗА 521 иэ оценок (29), (30) следует, что если определить й(х, с) сне(х, с) [хеш евХ(со) — для задачи (1.1) — (1,4)] так, чтобы Е(х, 6(х, с),С) было поближе к 1п? Е(х, и, С) ГВ(х, С ) — поближе к (п? В(х, С )] и ватем г хыл(се) найти пару (й(т), х(т)) из условий х(т) = С(х(т), й(х(с), т), т), х(т) си 6(т), с <т < т, х(С) = х, й(т) = й(х(т), т) [для эадачи (1А) — (1.4) здесь надо ваять с = сь х(са) = хе], то величина у(с, х, й( )) [в случае вадачи (1А) — (1.4) — величина ?(с, ео, й(.))] будет мало отличаться от искомого оптимального эначения, а функция й(х, с) будет хорошим приближением для синтезирующей функции. Заметим, что оценки (28), (30) являются аналогами оценок (1.28) и (1.29).
Заметим также, что в приложениях могут окаэаться удобнее более грубые оценки, получающиеся ив (26) — (30) при замене неконструктивно определенных множеств й(х, с), х(с) на множества у(с), е(с) соответст. евино. У п раж н он и я. 1. Решить проблему синтеза для эадачи минимиэат ции функции у(х, и( )) = ] (х (с)+й(с)) ссс при условиях х(с) о = — х(с) + иЯ, х(0) хо, Здесь с(с) = е', у(с) вэ е' при всех с св ш [О, Т]. 2. Решить проблему синтева для задачи минимизации функции У(ть и( )) = хт(1) при условиях х(С) = и(С) (О < С < 1), х(0) = хь и(с) еэ еэ ум= [иске'. 0 < и < 1], х(с) си с(с) вес при 0 < с < 1.
Покавать, что в этой вадаче сннтевирующил функций бесконечно много. Убедиться, на- пример, что синтезирующими являются функции СО, х>0, СО, х>С вЂ” 1, и(х,С)=~ ' ' или и(х, С)=С х<О, х< С вЂ” 1. 3. Решить проблему синтеза для вадачи минимизации функций т У (х, и ( )) = хт (Т) или У (х, и ( )) = ] хэ (С) с?С т Х (С, х, и ()) = ~ (<о (С), *(С)>+ 5 (в (С), С) ] 3С + (с, х (Т)> - ш?, е ЦС) А(С)х(С) + СЯо(С) +!(С), Се < С < Т, х(С ) =хи в = в(С) ен У(С), в( ) — кусочно-непрерывна, (31) (32) при условиях х(с) = иЯ (О < с < т); х(0) = хь и(с) ш У(с) = [и ш у: — 1 < в < 1), х(с) сн С(с) вв Ес (О < с < Т).
Будет ли в этих эадачах синтеэирующая функция единственной? 4. Написать уравнения Беллмана (5), (6) для Задачи быстродействия: ?(х„гм о( )) = Т вЂ” Со- ш?, х(С) = С(х(С), в(С), С), С,< С <Т, х(Се) = х„х(Т) = хо и(.) — кусочно-непрерывна и принадлежит множест ву У:-Е", С) Сь 5. Показать, что функция Беллмана для вадачи ив примера 6.2.4 не является непрерывно дифференцируемой. 6. Найти функцию Беллмана для вадачи ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 1ГЛ. т 522 считая иавестными моменты времени с„Т, матрицы А(с), С(с) порядка и )о' и и и Х г соответственно, и-мерные вектор-функции и(С), С(С), скалярную функцию Ь(и, с), и-мерные векторы с, х, и множества У(с) сиЕ' (со ( со- Т). Указание: пользуясь уравнениями (5), (6) искать функцию В(х, с) в виде В(х, с) =49(с), х) — многочлена первой степени относительно переменных х = (х', ..., х").
7. Исследовать уравнения (5), (6) для задачи минимизации функции Т Х (с, х, и ( )) = а, ~ х (с) сгс + а,х (Т), а,, а, = сопзс ) О, о при условиях (31), (32). Рассмотреть случаи У(с) =Е', р(с) = (иш Е'. ( и [ ~ (1), Р (с) = (и = (и', ..., и'): — 1 ( и' ( 1, с = 1, ..., г). 3 4. Достаточные условии оптимальности и оценка т 0 ( з (С, х, и ( ° )) — о'» < ~ [Я (х (С), и (С), С) — Я„С, (С)) АС+ со + [о ('т (1) 7) »1всп) + [К (хо' Со) Ко шт) (2) где Я(х, и, С) =(К(х, С), С(х, и, С)) + К~(х, С) + Со(х, и, С), Е(х, Т) = Ф(х) — К(х, Т), Яшсв(С) = сп( 1п( Я(х, и, С), о,св = ш( о(х, Т), хахСсс инОС»,сс '" »ах(т) К .„= (п( К(х, С), у»= ш( спь у(С, х, и()); х х(с ) хмх(со) ис ° )ыс(х,со) (3) (4) (5) остальные обозначении см. в 1 3.
Напомним, что для справедливости соотношений (1), (2) достаточно было, чтобы функция К(х, с) была определена и непрерывна при всех х ш С(с), с ш [с„Т), обладала кусочно-непре- При решении задач оптимального управления часто возникает следующий вопрос: будут лн па самом дслс оптимальными те управления и соответствующие им траектории, которые найдены с помощью каких-либо точных или приближенных методов) Такой вопрос, например, естественно возникает, когда управление и траектория найдены из краевой задачи принципа максимума, поскольку принцип максимума выражает собой необходимое условие оптимальности, не являясь, в общем случае, достаточным для оптимальности.