Ф.П. Васильев - Методы решения экстремальных задач (1981), страница 6
Описание файла
DJVU-файл из архива "Ф.П. Васильев - Методы решения экстремальных задач (1981)", который расположен в категории "". Всё это находится в предмете "методы оптимизации" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 6 - страница
Далее, из теоремы 5 и результатов примера 4 следует, что о |о !2 l (и) = ~ ( ) А (з, 1) и (1) |11 — Ь (з)) г(э с 'а достигает своей нижней грани на множестве У=(.о(а, Ь) в точке и = и, (1) ен Ло(а, Ь] тогда и только тогда, когда и,(1) является решением следующего интегрального уравнения Фредгольх а первого рода Ь || ~ ~ ~ А (э, $) А (э, 1) о(з ) и (1) с(1 = ~ А (з, 2) 1 (э) о(э, а !с с а($(Ь. 7. Как увидим ниже, условие оптимальности (6) применимо к широкому классу задач оптимального управления. Здесь мы для иллюстрации ограничимся рассмотрением следующей простейшей задачи оптимального управления: минимизировать функцию ,((и) = ! х(Т, и) — у!аа (7) при условиях х(1)=А(1)х(1)+В(1)и(1)+~(1), 1о(1 =Т, (8) х (1о) хо (9) и = и (1) еи () ~ ('о (1о' Т) (10) где А (1) = (ау (1)) — матрица порядка и ма, В (1) =(Ьг| (1))— матрица порядка п хг,,с(1) =(1|(1)) — матрица порядка и х 1, т.
е. и-мерный вектор-столбец; моменты времени 1„Т, а также точки х„у ен Еа заданы; У вЂ” заданное множество 29 из !.'о[(„Т]; х(1, и)=х(!)=(х'(!), ..., х" (!)) — решение (траектория) задачи (8), (9), соответствующее управлению и=и(!) =(и'(!), ..., и'(!)) ~ !.;[(„Т]. Будем предполагать, что элементы ау(!), Ьу(!), !)(!) матриц А (!), В (!) и соответственно ! (!) кусочно непрерывны на отрезке [(„Т] (или принадлежат !., [(,, Т]).
Тогда согласно теореме 6.1.2 из [4) прп каждом и = и (!) ен ~1.;[(„Т] существует, и притом единственное, решение х(1, и) задачи (8), (9). Напоминаем (см. определение 6.1.1 в [4]), что п)раекторией — решением задачи (8), (9), соответствующим управлению и= и(!) е= 1.с ,[р„Т], называется непрерывная функция х((, и), !о(! Т, удовлетворяющая интегральному уравнению х(1, и)=)(А(т)х(т, и)+В(т) и(т)+р(т))от+хо. (11) !, Согласно теореме 6.1.2 из [4] функция х(1, и) абсолютно непрерывна и почти всюду иа [(„Т] удовлетворяет уравнению (8), ее производная х((, и) принадлежит !..",[1,, Т], а также справедливо равенство (9).
Таким образом, функция (7) определена при всех и= и(!) он !о[1„Т]. Задача (7) — (10) имеет простой физический смысл; среди всех траекторий задачи (8), (9), соответствующих всевозможным управлением сс ~!/, ищется такая, правый конец которой удален от заданной точки у иа возможно меньшее расстояние. Эта задача тесно связана с так называемой проблемой управляемости, заключающейся в выяснении того, существует ли хотя бы одно управление и=и ~(l, для которого правый конец траектории х(Т, и„) совпадает с данной точкой у.
И если в задаче (7) — (10) окажется, что существует управление и„= и„(!) ен ен У такое, что У(и ) = 1п17(и) = е', =О, то такое управ. и ление решает проблему управляемости. Покажем, что функция (7) при условиях (8), (9) диффереицируема на 7.; [(„Т]. Для этого нам понадобится следующая Лем м а 2. Пусть функции ср (!), Ь (!) неотрица)пельны и непрерывны на отрезке 1,( !(Т, а=сонэ(. Пусть ср (!) ( а ~ ср (т) йт+ Ь (!) (о < ! = Т. 30 Тогда 0 ~ р (1) < а с) Ь (т) е'<'-"' Нт+ Ь (1), 1, ( 1 ~ Т. В частности, если Ь(1)=Ь=сопз1)0, то 0 =.<р(1)~ ~Ье'и ">, 1,"=1(Т.
Если же т 0 ==. ор (1) = а ) ор (т) о(т+ Ь (1), 1о ( 1 ( Т, 1 т О ( ор (1) == а ~ Ь (т) го<'-'~ о(т+ Ь (1), 1о (1( Т, и при Ь(1) =Ь =сонг()0 имеем Оа р(1) Ь~т- >, 1, 1 Т. (13) (14) (здесь Ат, Вт — транспонированные матрицы А, В). Функция (7) при условиях (8), (9) принадлежит классу Со 'на Е~[1о Т[, т. е.
[/ (и) — Г(о),с, (Е" и — о[с„ (15 где А,„= знр (А(1)(, В,„= знр )В(1)[. и<~~т и<с<т Д о к а з а т е л ь с т в о. Возьмем произвольные управления и, и+6 енЦ[1м Т) н соответствующие им решения х(1, и), х(1, и+Ь), 1,(1( Т, задачи (8), (9). Обозначим Ьх(1)=х(1, и+Ь) — х(1, и), 1о(1~Т. Из (8), (9) сле- 31 Локазательство приведено в [4), см. лемму 6.3.1 из [41. Теорема б. Пусть матрицы А(1), В(1),7(1) кусочно непрерывньл на отрезке [1о, Т). Тогда функция (7) дифференцируема во всех точках и е= Е'„[1о, Т) и ее градиент имеет вид .1' (и) = /' (1, и) = Вт (1) ор (1, и), 1о(1-== Т (12) где ~р=ор(1, и)=(~р,(1), ..., ор„(1)), 1о==1(Т, является решением задачи от (1, и ) = — А т (1) зр (1, и), 1о ( 1 ( Т, ЯТ, и) = 2 (х (Т, и) — у) дует, что Лх(!) является решением задачи Коши Лх (!) = А (!) Лх (Г) + В (!) Ь (!), )о( )~Т, Лх((о) =О, (16) или с учетом (11) ! Лх (!) = ~ (А (т) Лх (т) + В (т) й (т)) о(т, ь оооо ~ Т Тогда , 'Лх (г) ' ==" А „~ ' Лх (т) ! от + В,„~ ~ й (т),' о(т.
Отсюда с помощью леммы 2 получим т ~ Лх(!) ~ В е тох( о) ~!)г(т) ~ Дт (о ~ ! ~ Т. (17) т т ~,1/2 Так как ~ ,'Й!!),'иг((Т вЂ” (о)'~'~~ ,')г(!),"й), то из (!7) и ь следует оценка ! Лх(!) ! ~ Сг(й х„ )о «! ~ Т (18) где С,=(Т вЂ” го)итВ,„е~ ""(т '). Приращение функции (7) имеет вид Л,7(и) = 7(и+А) — /(и) =,,'х(Т, и)+Лх(Т) — у!о— —,'х(Т, и) — у,"=2(х(Т, и) — у, Лх(Т)),+ +,' Лх (Т) ~ао (!9) Покажем, что т 2(х(Т, и) — у, Лх(Т),'' ° =~ (Вт(!)ф(), и), й(!))в,г)1, (20) где оР(), и) — решение задачи (13), (!4). Заметим, что под решением задачи (13), (14) в соответствии с определением 6.1.! пз )4) здесь естественно понимать непрерывную функцию ф(Г, и), удовлетворяющую интегральному зв уравненшо т ф(Е, и)=) Аг(т!фгт, в)От+2(х(Т, и) — у), (21) Ев~ Е Существование и единственность решения задачи (13), (14) доказывается так же, как в теоремах 6.1.1, 6.1.2 из 14).
Функция ф(Е, и) абсолютно непрерывна, почти всюду на ~Ем Т! удовлетворяет уравнению (13) и начальному условию (14). Поэтому, учитывая условия (13), (14), (16), имеем 2 (х(Т, и) — у, Лх(Т)) = Еф(Т, и), Лх (Т)) = т г = ~ — (ф(Е, и), Лх(Е))е(Е=~ ((ф, Лх)+(ф, Лх))г(Е= ь ь т = ~ ((ф А Лх+ В)е) — (А гф Лх)) г(Е = т = ~ (В (Е) ф (Е, ), й (Е)> ЕЕ. Равенство (20) доказано. Подставляя (20) в (19), получим т ЛЕ(и) =$ (Вг(Е) ф(Е, сс), 6(Е))в,г(Е+/Лх(Т) >~. (22) Сравнивая формулу (22) с (1) и учитывая оценку (18) при ( =Т, приходим к выводу, что функция (7) дифференцируема на Е,.',(Е„Т) и ее градиент представим в виде (12). Докажем неравенство (15). С этой целью положим Лф(Е)=ф(Е, и) — у)(Е, о).
Оценим /Лф(Е)!. Из равенства (21) имеем т !Лф(Е) ~= ~ А (т) Лф(т)е(т+2Лх(Т))( т : = А,„( ~ Лф(т) )ах+2 ~х(Т, и) — х(Т, о)(. Отсюда с помощью леммы 2 и оценки (18) получим )Лф(Е)! 2е~спах( о) ~х(Т и) х(7' о)!( .- 2„~~пах(' ~ВАС (и о ~ (23) 2 Ф. и, васнл~ев за Из формулы (12) следует, что г т ! Г (и) — 7' (о) ',ь = ~ 1Вг (1) Лф (!) !с с(! ( В ',„~ Лср (!) !с Ж сю !и Подставляя сюда оценку (23), придем к неравенству (15). Теорема 6 доказана. Таким образом, для вычисления градиента функции (7) в некоторой точке и =и(!) ~Е.;()„Т) сначала нужно решить задачу Коши (8), (9) и определить х(1, и), затем подставить найденное значение х(Т, и) в (14) и, решая задачу Коши (13), (14), определить ф(с, и) и, наконец, по ормуле (12) найти ('(и). помощью градиента нетрудно написать условие оптимальности в задаче (7) — (!0) для случая выпуклого множества У.
А именно, если в точке и = и, (!) ен У функция (7) при условиях (8) — (10) достигает своей нижней грани", то согласно условию (6) необходимо выполняется неравенство г $ (В (1) ф ((, и, ), и (!) — и,, (!))а, с(! ) 0 сс при всех и=и(!) ~ (/. (24) Покажем, что функция (7) прп условиях (8) — (9) выпукла на Ь'„(бь Т). С этой целью заметим, что х(У, аи+(1 — а) о) =ах((, и)+(1 — а)х(1, о), (ч ~ ! ( Т> (25) при всех и, о енЕ,''!1„Т! и всех вещественных а.
В самом деле, левая и правая части этого равенства, как нетрудно видеть, представляют собой решение одной и той же задачи Коши (8), (9), соответствующее управлению аи+(1 — а)о. Отсюда и из единственности решения задачи (8), (9) следует равенство (25). Далее, с учетом выпуклости функции д(х) =,' х — у ~с переменной х ен Е" и равенства (25) имеем ,7 (аи + (1 — а) о) = ! х(Т, сси + (1 — а) о) — у," =- =)а(х(Т, и) — у)+(1 — а) (х(Т, о) — у) /с( (а /х(Т, и) — у!с+(! — а) 'х(Т, о) — у/с= =а/Ь)+(1 — а) 7(сс), асв10, >', и, о~Ус((о Т~. Выпуклость функции ) (и) усгановлена.
34 Согласно теореме 6 тогда условие (24) является и до- статочным для оптимальности управления и= и, (1) в за- даче (7) — (10). Условие (24) перепишем в виде т ппп $ (В (1))р(1, и„,), и(1)) ..с(1 = исс)ь и с, т = ~ (В (1) ф (1, и.„), и„(1)) г, с)1. (26) со Если ввести функцию Гамильтона — Понтрягина Н (х, и, 1, )р) = (ср, А (1) х+ В (1) и+ ) (1) ), то условие (26) можно записать в так называемой форме интегрального принципа минимума: т ппп ~ Н(х(1, и ), и(1), 1, )р(1, и )) с(1= исосви с т =~ Н(х(1, ич), и, (1), 1, ф(1, ич))с(1. с Если множество (1 имеет вид и=(и=и(1) ен1,'(1)ь Т]: и(1) ~ У почти всюду на 11)ь ТЯ, (27) где У вЂ” выпуклое множество из В', то из (26) имеем ппп (В (1)ф(1, и„), и) =,(В (1))Р(1 и„), и„(1)), и~т 1, ~1== Т.
Взяв здесь вместо ф(1, и„) функцию ( — )Р(1, и„)), получим принцип максимума Понтрягина для задачи (7) — (10), (27). Заметим, что в теореме 6.3.1 из [4) принцип максимума был доказан для более общей задачи оптимального управления без предположения выпуклости множества У. С другой стороны, условие (26) справедливо для всех выпуклых множеств (1 из 1.',(1„Т), необязательно имеющих вид (27). Отметим, что формула приращения (22) на самом деле означает, что функция (7) дважды дифференцируема на 1.с '11ь, Т) так как ) Лх (Т) )~ = )схх (Т, и, ))) )' является квадратичной функцией переменной Ь, порожденной сима* Л5 метричной ограниченной билинейной функцией (Лх(Т, и, й,), Лх(Т, и, й,)) переменных й„й,.
При необходимости можно выписать и явную формулу для оператора Г(и)еп е= ~(1- [1о Т) И[та Т]), порождающего квадратичную функцию ~ Лх(1, и, й) !'. Для этого нужно воспользоваться формулой Коши х(1, и)=Ф(1, 1,) ха+~ Ф(1, т)[В(т)и(т)+)(т)]ит (28) для решения задачи (8), (9), где Ф(1, т) — матрица порядка лхп, определяемая условиями — — =А(1)Ф(1, т), 1е(У, т~Т, Ф(т, т)=Е, (29) Š— единичная матрица порядка их л. Из (28) следует Лх(1, и, й) =] Ф(1, т)В(т)й(т) г(т.