Беллман Р. Прикладные задачи динамического программирования (2013) (1246769), страница 40
Текст из файла (страница 40)
Например, если мы хотим минимизировать функционал ь 1(у) =- ) й (у, у', у", х,) Ых, по всем функциям у, удовлетворяющим условиям у (х) = уь у' (х) =ум (5.61) то мы вводим новые переменные у,=у(х), у, =у'(х). (5.62) Тогда задача превращается в задачу минимизации функционала ь 1(уь уа) = ~ Р (уь у,', у,', х) с(х (5 63) при ограничениях у, =у„у, (х) = с„у, (х) = см (5.64) В целях упрощения записи рассмотрим только простоя случая, когда в числе ограничений нет дифференциальных уравнений.
коаорое, если воспользоваться уравнением (5.49), принимает вид Е(х, у, 1") — т'(х, у, у') — (У' — у') Рт ) О. (5.57) 252 (гл. ч ВАРИАЦИОННОВ ИСЧИСЛЕНИЯ Следуя рассуждениям й 15, получим уравнение л О= ппп (Р+д +,».у!ад !' »л 1=! которое в свою очередь приводит к уравнениям Г~+ — =О, 1=1,, л, ду ддй Р+ — + '~У,' — =О. дУ ° ду (5.67) !=1 Отсюда, как выше, получим: д, д-'у, 'Чл длу ихг'»; ' ду;дх ! „» ду ду У) — — О, 1=1...„л, (5.6Я) l (5.66) и, взяв частные производные по уь л л 'Д дР ду! д"У 'Д, д"У »!+ л» ду' ду;+ дх ду! +,~ УУ ду, дуу+ /=! /=! ъ~ д» дУ'.
+» д — д — ' — — О, ! = 1, ..., и. (5.69) л'. ду ду! г= ! Таким образом, мы получили систему уравнений Эйлера — !'»,— Г'».=О, !=1, ..., л. (5.70) 17, ИЗОПЕРИМЕТРИЧЕСКАЯ ЗАДАЧА Добавим ограничение ь ~ 0 (хь У, У') Ых! = «, где « — заданная величина. Наша основная функция, значе- ние минимума, является теперь функцией от трех величии х, у и «. Иными словами, «является дополнительным парамет- ром состояния. Следовательно, имеем: ь у(х, У, «)=пт(п~Р(хь у, у)в!х! (5.72) У к при ограничении (5.71).
253 18] множитяль лагианжл Действуя как ранее, получим уравнение в частных производ- ных О=ппп]й(х, у, у)-+ — +у' — — О(х, у, у) — ~. (574) дУ, дУ, дУ! Дифференцирование приводит к соотношению , ду' ду у т г ду ' дг' (о.75) Кроме того, имеет место уравнение О = Г+ — -т-У вЂ” — Π—. дУ , ду дУ дх ' ду дг' (5.76) Используя теперь производную (5.75) по х, частную производную (5.76) по у и уравнение (5.75), получим; д д/ дУ ' д( дУ ихду''~ дг 1 ду( дг — —, «и — — О~ — — (Р— — 0~=0.
(5.77) Взятие частной производной по и от выражения (5.76) приводит к следующим результатам; о= +у — — а— д'-'У д«У д«У дк дг ду дг дг' ' дУ вЂ” = сопят. (5.78) (5.79) (5.80) !8. МНОЖИТЕЛЬ ЛАГРАНЖА Таким образом, мы показали, что производная — играет дУ дг роль множителя Лагранжа. Кроме того, устзновлен хорошо известный факт, что в изопериметрической задаче оиа постоянна, т. е. не зависит от х.
Уравнение (5.77) есть уравнение Эйлера для вариационной задачи с множителем Лагранжа )ч Аналогом уравнения (5.45) будет 1(х, у, г)=пи'п(т'(х, у, у') 5— — у (х — 5, у — у'5, г — О(х, у, у') 5)]. (5.73) (гл. у ваяиационнов исчислвнив где в качестве основного функпионала берется ь $(Р(хь у, у) — ЛО(х„у, у)) дхг.
(631) к !9. ЕСТЕСТВЕННЫЕ ГРАНИЧНЫЕ УСЛОВИЯ 20, УСЛОВИЕ ТРАНСВЕРСАЛЬНОСТИ Предположим теперь, что левый конец искомой кривойу должен лежать где-нибудь на заданнои кривой у=у(х). Чтобы решить эту задзчу, рассуждаем следующим образом. для оптимальной кривой изменение в у при движении начзльной точки вдоль заданной кривой должно быть рваным нулю. Это эквивалентно тому, что в начальной точке мы имеем: дг, ду д. +К ду О.
Обрашаясь к (о.50), получим: дг дУ Р+ у' — — д' — = О, ду ду (о.84) (5.85) а из (5.49) следует: Р+(,Р у) Рх =О. (5.86) Это условие, связываюпгее угловые коэффициенты касательной к экстремали и касательной к кривой гг(х) в начальной точке (х, у), есть классическое условие трансверсальности. Предположим, что у(а) не определено. Тогда онгималь- ное начальное значение для у обладает тем свойством, что изменение в минимальном значении интеграла, взятого до ко- нечной точки (Ь, у (Ь)), вызываемое изменением в начальной точке у (а), разно О. В противном случае имелась бы лучшая начальная точка.
Значит, дг" — =О, дуЬ а что вместе с (5.49) дает: Р' ° 1„, = О. (5.83) Это естественное граничное условие, связанное с' неопреде- ленностью в граничном знзчении. пяявныг, втгиапионныв задачи 21. УГЛОВЫЕ УСЛОВИЯ ЭРДМАННА Задздим теперь вопрос, при каких условиях оптимальная функция может терпеть разрыв производной у'. Из (5.49) дУ и непрерывности — следует, что функция 7 у в точке излома ду непрерывна, а тогда из (5.50) видно, что функция Р— у'Ру (5.87) непрерывна в точке излома.
Это есть угловые условия Эрд- манна. 22. НЕЯВНЫЕ ВАРИАЦИОННЫЕ ЗАДАЧИ Рассмотрим очень важныи класс вариационных задач, в которых не существует какого-либо простого явного выражения для подлежащего минимизации функционала. В качестве примера рассмотрим следующую задачу. Пусть задана система дифференциальных уравнений — „' = Д (Уп У„,..., У,; г; 1), Уг (О) = сп 1= 1, 2, ..., АГ, (5.88) и требуется определи~ь неизвестную функцию а так, чтобы минимизировать время, требуемое для перехода системы в состояние (4, 4, ..., дм). Здесь функционал Т= 7'(л) определяется условиями У;(Т)=г(п 1=1, 2... АГ, (5.89) Инымп словами, мы хотин перевести систему из первоначального состояния в желаемое состояние за минимальное время.
Очевидно, что многие задачи нз области техники и управления производством можно сформулировать таким образом. Чтобы определить структуру решения, введем функцию /(у, 1), равную времени, треб1емому для перевода системы из состояния у а момент г в желаемое конеч- (5.90) нос состояние. Тогда принцип оптимальности приводит к уравнению у(у, 1)=гп!и[А+7'(у+85, 1+5))+о(Ь).
(э91) л 1г) )гл. и заииационнов исчислвнив (а) (5.93) Из (5.93) можно теперь извлечь следуюшие выводы: (а) Т!=0 при Г = Т по определению у(у, Г). М (Ь) ~', У (Т) рл(Т) = — 1 в точке Т, по следует из (5.93) и условия (а). (с) Если функции д независимы от времени, то Х ,У, ухл!= — 1 всюду вдоль оптимального п>тн (это пер! =-! вый интеграл решения).
(б) Из определения у (у, г) следует, что лая функций у, значения которых в точке Т ис определены, т, (т)=о. (5.94) В классической литературе функции Тх обозначаются >! и называются функцоональнымо множителями "). Если множители т" известны в точке, то написанные ! выше уравнения показывают, как определить оптимальное решение х в этой точке. Остается выяснить, каким образом меняются множители как функции времени вдоль оптимального пути. Нам хотелось бы уметь вычислить атх(Ж. Дифференцирование покззывзет, что гух.=,~,[д — Т!'.),~,'=,5,(д —,У>.) 8! =,Т (д — Т>, ) 8!.
(5.95) *) В работах, связанных с принципом максимума Л. С. Понтрягина, функции >о именуются импульсами. (Прим. ред.) Вместо (5.88) использовано обозначение Ыу(й = д. Тогда, переходя к пределу при 5 — О, получим чисто формально, как и выше, (> = птуп [1 + ~, У„8, + У,1 . (5.92) х г=! Отсюдз следуют двз соотношения: ОГРАничБння В Видя нБРАВББСТВ 257 В ва'кном случае, когда дифференциальные уравнения не завпсяг от времени, взяв частную производную по у от (о.93), приходим к соотношенщо ! Из этих двух выражений и из (5.93,а) получим уравнения Эйлера для производной по времени функциональных множителей -Ус.+,~,—",Ь.=о, '=!, ..., Х. (5.9Т) /=! Эти Х дифференциальных уравнений первого порядка для множителей вмес~е с Х исходными уравнениями =8с(У» !) (5.98) и уравнением (5.93, а) образуют систему из 2Х-~- ! уравнений, которую можно разрешить относительно Х функциональных множителей, Х величин у„ув ..., у, и функции политики.
2Х постоянных ин~егрирования определяются с помощью Х начальных значений у, заданных конечных значений у и условий (5.94,!)). Как и в предшествующих параграфах, различные другие необходимые условия легко следуют из требования, чтобы значение г в (5.92) давало абсол!отный минимум. Указанная выше задача относится к типу так называемых «задач Майера». Обобщая, можно комбинировать задачи Лагранжа и Майера и пытаться минимизировать функционал, содержащий, кроме интеграла от функции, еше дополнительное слагаемое в виде функции, оцениваемой в концевой точке, причем эта функция содержит некоторые переменные, конечные значения которых не определены заранее.
Здесь применимы предыду!Ние рассуждения и результаты выводятся легко. Эта весьча общая задача называется «задачей Ьольца». 23. ОГРАНИЧЕНИЯ В ВИДЕ НЕРАВЕНСТВ Во многих современных приложениях мы встречаемся с задачами, где на искомые решения налагаются ограничения в Виде неравенств. 9 Р. Бес«я«н, С. Дасафус йбй )гл. н влгилппоппог исчнслзнив Обрзтившись к сформулировзнной в предыдущем парзграфе задаче, сделаем допущение о том, что управляющая функция з должна быгь выбрана таким образом, чтобы выполнялось ограничение 1й.99) И (у, -) < О. На границе эз ой области первое уравнение (5.99) не имеет силы. Таким образом (5.97) принимает внд л .и д дУ' Ъ дя дУ Г Ъ дбм дУ ~ да дГ ду; ,Г' дуа ду ~ Л'„ да ду 1 ду; т=! т=! На границе области, определяемой уравнением И (у, г) = О, имеем: — -~- — — = о.