Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 124
Текст из файла (страница 124)
Перейдем к рассмотрению следующей задачи оптимального управления с незакрепленным временем: минимизировать функцию т У(ге, Т, х, и( )) = ) 7' (х(!), и (!), !)»!!+ Ф(х(Т), Т) (12) е ДИНАМИЧЕСКОЕ НРОГРАММИРОВАНИЕ 626 !Гл, т Череа Ь(х, С, Т) обоаначим множество всех управлений и( ), определенных на отрезке [с, т], удовлетворяющих условиям (15) и таких, что траектория системы х(т) = с(х(т), и(т), т), х(с) = х сн С(с) также определена на отРезке [с, т], пРичем х(т) сн с(т) (с < т < т), х(т) сн Яс(т).
положим х(с, т) = (х: *яб(с), с!(х, с, т) ~щ при с < т; х(т, т) ~ = Яс(Т). Введем также множество П(х, с, Т) всех тех и си У(с), для которых сузцествует хотя бы одно управление и(т) шб(х, с, Т) со значением и(с) =и(с+ 0) = и. Пару (и(с), х(с)) назовем допустимой парой задачи 12) — (16), если функции и(с), х(с) определены па каком-либо отреаке с«, Т], где са сэ Ом Т ш Оь и такие, что х(са) = ха ш Б(са), и( ° ) ш Ь(ха, св Т), х( ) — траектория системы (13), Если (и(т), х(т)) (с«<т < Т) является допустимой парой вадачи (!2) — (16), то и( ) еи Л(х(с), с, Т), х(с) ш Х(с, Т), и(С) ш П(х(С), С, Т) для всех С (С, < С < Т). моменты времени с си О, т*сн Ос и допустимую пару (и«(с), х«(с)), определенную на отрезке [С, Т*1, наеовем решением аадачи (12) — (16), если (со, Т,, (С,), и«( )) = 1п1 !п1 !и! !п1 У(С, Т, х, и( )) 4 У«.
с ееа тес хоех(са,т) и! ° )еа(хе,са,т) Скажем, что последовательности моментов (сс ) си Оа, (Т ) ш О, и допустимых пар (и, (с), х,„(с)), определенных на отреаке [са, Т '], являются минимиаирующими для аадачи (12) — (16), если 1сш У(с ~, т, х (с ), ит ( )) = Т«. Для формулировки достаточных условий оптимальности снова воспользуемся функциями Я(х, и, с), с(х, Т), определяемыми равенствами (3), (4), причем для случая рассматриваемой задачи (12) — (16) в (4) вместо Ф(х) будем брать Ф(*, Т). Будем считать, что функция К(х, с) такова, что формула (1) остается верной для любых допустимых пар задачи (12) — (16)— для атого достаточно, чтобы функция К(х, с) была определена и непрерывна при всех х си б(с), с ш [!п10„апрО,], обладала кусочно-непрерывными К„Ко а функция К(х(с), с) переменной с для любой допустимой пары (и(с) *(с)) (со < с < Т) аадачи (12) — (16) была кусочно-гладкой на отрезке [с„Т!.
Пусть (и«(с), х«(с)) и (и(с), х(с)) — какие-либо допустимые пары аадачи (12) — (16), определенные на отрезках [с, Т«1 и [см Т] соответственно. Тогда из формулы (1) получим т« "г(со' т ' х«(со)' и (')) г(со' т, х(се), и( )) = ~к(х (с)), и (с), с) а!в о Т вЂ” ] Я (х (с), и (с), с) ис+ [с (х«(т*), т ) — в (х (т), т)]+ се +[К(х«(с«) С«) К(х(С,), Со)]. (12) Обозначим т ошсв= сп1 сп1 ! !п1 !п1 Я(х, и, С) НС, С«мао тиас,' ХЫХ!С,т> «жоСХ,С,Г) (18) с „!и! РАС ° (х, Т), К,,„= о! пП !и! К(., с,), тыес хынс!Г) ' ' '" с .е, тые, хк х(с,т) ДОСТАТОЧНЬСВ УСЛОВИЯ ОПТИМАЛЬНОСТИ 527 6 41 Учитывая, что для любой допустимой пары (п(с), х(с)) (се < с<Т) аадачи (12) — (16) имеют место включения и(с) зн Р(х(с), с, Т), х(с) зн Х(с, Т) при всех с (с, < с < т) и и( ) ш й(х(сз), сз, т), х(сз) пв х(сз, т), х(т) ш зн Х(Т, Т) = дс(Т), сз зн 6з, Т си Оь иэ (17), (18) получим следующие неравенства: Пш ~ д(х (с), шыз сою 1!ш г (х„, (Т„,), Т„,) = зюсп ю-т зь и (С), С)бей К (22) "ш К('зп('отл) 'отл) = Коюсп (23) зп Доназательство.
В оценке (19) вместо и (с), хв(с), с*, Ть подставим соответственно и (с), хы(с), сс, Т и перейдем к пределу при тл- со. С учетом условий (22), (23) получим утверждение теоремы. Предлагаем читателю самостоятельно выписать условия, аналогичные условиям (10), (11), для определения функции Кротова К(х, с) для аадачи (12) — (16). П р и м е р 3. Требуется наибыстрейшим обпааом перевести точку (х, у) емЕз из начала координат (О, О) в точку (1, О), предполагая, что Тз 0<у(с~, Тв, (с ) и ( )) — у < 1 8(х (с) и (с), с) йс — д с + о +(г(х (Т'), Тч) — г ш]+(К(х (со)' со Коюсп]' (19) Неравенства (19) обобщают формулу (2) на случай задач оптимального управления с незакрепленным временем и представляют собой оценку погрешности, которая будет допущена, если допустимую пару (ич (С), хе (с)) (с < с < Т*) задачи (12) — (16) возьмем эа приближенное решение этой задачи.
Оценка (19) станет более конструктивной, если в формулах (18), определяющих величины дипю з сю Кзпш, множества Р(х, С, Т), Х(С, Т) заменим на У(с), С(с) соответственно. Опираясь на оценку (19), нетрудно сформулировать достаточные условия оптимальности для задачи (12) — (16). Т е о р е м а 3. Для того чтобы допустимая пара (и (С), х (С)) (С < ( (С< Ть) задачи (12) — (16) была решением втой задачи, достаточно существования узунксрии К(х, С), для которой Формула (1) верна для любой допустимой пары задачи (12) — (16) и Т' ) Ю (. „(с), и, (с), с) бе =дюсп, (20) с' о '(х*(Т") Т') ='тсп К(х*('о) 'о) =Копъсп (21) Д о к а з а т е л ь с т в о.
При выполнении условий (20), (21) правая часть оценки (19) обращается в нуль, откуда и следует утверждение теоремы. Т е о р е м а 4. Для тово чтобы некоторая последовательность (и (С), х (с)) (сзы < с < Т, и = 1, 2, ...) допустимых пар задачи (12) — (16) была минимизирующей для этой задачи, достаточно существования функиии К(х, с), для которой формула (1) верна для любой допустимой парез задачи (12) — (16) и ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИИ [Гл т движение точки подчиняется условиям й(с) = — у'(с) + иг(С)а у(С) в(с), и(с) ои У(с) = (и гней )и) (1) (О( с( т). ЗДесь [С(0) =((О, 0)), С(С) юЕ' пРи 0< Е(Т, Я,(т) ((1, О)) О, =(с,=о),О =(т т~о),)' [,е= — о,у(т, (с)) =т.
Пусть Т вЂ” корень уравнения (Т вЂ” 1)1 = 12(Т вЂ” 1) — и-', расположенный в пределах 1( Т < 1+ и-осг (и =1, 2, ...). Положим 1 при — <с<~ + и 1(с<< р р 1 т+1 пг ог 2т 2 и (с)= в = р 1 р 1 т+1 — 1 при + — <с< — + — и и <с(Т па р=О, 1, ..., и — 1, и=1, 2, ... Через (х (С), у (с)) (0(с(Т ) обоаначим траекторию точки, соответствуюсцую управлению и ( ) и начальным условиям х„(0) =у„(0) =О.
Нетрудно видеть, что х (Т„) 1, у„(Т, ) О, (1 — и асг)с <хи(е) < с, 0( у„(с) < и гсг при 0< 1(т„„' и=1,2,... Покажем, что Пш Т = 1 = То — оптимальное время. Для атаги в аа возьмем функцию К(х, у, с) = — х. Тогда Я(х, у, иа с) =у — й+1, [п( [и[ Я(х, у, и, с) 0 (х,орина [и[лс тв тв ,) Е(' (с) у () (~),)б, у е о тв т Ч в(') 1)'СС= ~ у' (С) де о о — — серн (х, у) ш Е,(т) серн (х у) ои гс(0) К( Ко ась (пг = 1 Кроме того, очевидно, формула (1) для данной аадачи будет справедлива при всех допустимых (х( ), у( ), и( )).
Таким образом, для последовательностей (Т ), ((х„(с), у„(с), и (с))) (0( с( Т„) все условия теоремы 4 выполнены. Следовательно, аж Х (Тв, и„,( )) = 1[ш Тв =1— ан-ОО ва-Оа оптимальное время. Остается ааметить, что в рассмотренной аадаче [в[1(т, и) = 1 ие достигается — здесь, как и в примере 2, мы имеем дело со скользящим режимом. 3. Приведем еще одно достаточное условие оптимальности, касающееся задачи быстродействия. Теорема 5. Пусть в гадаче (12) — (16) Со ам 1, Ф 0; Оо = (со), т. е.
начальный момент Со закреплен; Ос ~(Т: Т ) Со). Пусть имеется некоторая последовательность (п»(с), х,„(с)) (со ( с ( т, и = 1, 2, ...) допустимых нар рассматриваемой задачи быстродействия, причем 1[ш Тв = ТО. в аа Тогда для того, чтобы ТО была оптимальным временем, достаточно существования функции К(х, Ц, для которой формула (1) верна для любой допустимой вары и, кроме того, ттл Т Е(хв(С)а ив(С) С)бе( ~ Ятсп(С 7) бс+Т» 7 (24) оа-ав с о для любого Т (Со ( Т ( ТО), 1сш г(хв(тв), тв) =гиен, 1[ш К(хв(сс,), Се) Кошева (25» в-ааа в»аа ЗВ ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 529 оде Ешсв(с, Т) = !п1 !и! Е(х, и, с), хНХСС,ТС иИРСх,о,т) 'юсп= !и! !п( '(" 1) Коппп= !"1 !п1 К(х со).
оетхто хнэ Ст! с хтхто хых(снт) Для получения формулировки достаточного условия оптимальности для фиксиРованной допУстимой паРы (и (С), хо (с)) (со ( С < Т") в этой теоРеме надо пРинЯть т, = т*, и (с) = ио (с), х (с) = хо (с) (ю = 1, 2, ...) и в (24), (25) всюду опустить знак 1!ш. Доказательство. Пусть вопреки утверждению теоремы То не является оптимальным временем, Тогда существуют момент Т (Со(Т < < То) и допустимая пара (и(с), х(с)) (с, < с < Т). В формуле (17) вместо со, то, (ио(с), хо (с)) (со (с(то) примем соответственно со, т (и (с), х (С)) (Со(с(Т ) и перейдем к пределу при пс — оо. С учетом условий (24), (25) будем иметь 1сш Х (Со' Тв, х (Со) ит ( )) — У (со Т * (Со) и ( )) = Т' Т ( т т < 1!ш " 8(х (С), и,п(с), С) йс — ~ Е (х(с), и(с), С) ос < Т" — Т.
гп оо со со Полученное противоречивое неравенство доказывает теорему. Пр ни е р 4. Пусть требуется наибыстрейшим образом перевести точ- ку (х, у) ш Е' иа положения (1, 0) в начало координат (О, 0), предполагая, что движение точки подчиняется условиям х(с) = у(с), у(с) = и(С), и(с) ен сн У(с) = (и сн Е'. (и( < 1) (О < с < Т). Здесь 6(0) = ((1, 0)), С(с) — Е при 0 < с ( Т, 8,(Т) = ((О, 0)), Е, = =(с,=О), Е,=(Т~О).' В примере 6.2.4 с помощью принципа максимума была найдена допу- стимая нара ((х,„(с), у„(с)), и (С) (О ( с ( Т* = 2), где — 1, 0(с(1, (1 — с~/2, 0„~(с~(1, и (с)= ' ' „(с)=~ 1<!<2, " ((С вЂ” 2)зс2, 1<с<2, — С, 0<1<1, у,(с) = С вЂ” 2, 1(С(2. Покажем, что эта пара является решением рассматриваемой задачи быст- родействия. Возьмем функцию К(х, у, с) = х — (с — 1)у.