Беллман Р. Прикладные задачи динамического программирования (2013) (1246769), страница 39
Текст из файла (страница 39)
В общем, чем меньше Л, тем более точным будет полученное таким пугем решение. С другой стороны, время, необходимое для определения знзчения у в некоторой точке х=хь очевидно, пропорционально 1/Ь. Кроме того, имеют место еще требования устойчивости. По этой причине приближение (5.30) является более предпочтительным, чем (5.29). Мы не будем вникать глубже в эти взжные вопросы, поскольку в связи с решением вариационных задач в этом направлении мало сделано.
Читатель, которого интересуют результаты, известные для дифференциальных уравнений, может обратиться к списку литературы в конце главы. Аналоги шый метод применяется для решения системы дифференцизльных урзвнений вида яуа ~' = г; (х, ун у,, ..., ум), у, (О) = сн 1 = 1, 2...,, Аг. (5.3 !) Если использовать векторные обозначения „— = У (х, у), у (О) = с, (5.32) 8. ДВУХТОЧЕЧНЫЕ КРАЕВЫЕ ЗАДАЧИ В случае, когда заданы условия на двух концах, ситуация существенно меняется. Рассмотрим уравнение второго порядка вида у" = л (х, у, у'), х, ( х ( хь (5.33) где решение подчинено граничным условиям у (х,) = си у (х,) = ся. Используя конечноразностные приближения и полагая у'(х) =(у (х+ Ь) — у(х)!/Ь, у" (х) = (у (х+ 25) — 2у (х+ Ь) +у (х)))Ь", (5.34) то формально процедурз в точности совпадает с приведенной выше.
Так как цифровые мзшины идезльно подходят для решения дифференциальных урзвнений с начальными условиями, то вполне можно мыслить себе решение систем вида (5.3!) с сотнями или даже тысячами уравнений. 245 огяхиичвния 9. ОГРАНИЧЕНИЯ Гораздо более серьезная со многих точек зрения трудность, чем трудность, связанная с чисто вычислительной стороной в случае двухточечных краевых задач, возникает от наличия ограничений на природу оптимизирующей функции.
Рассмотрим, например, задачу минимизации функционала ! (у) = ~ л(у, у', х) Ых а (5.35) при ограничении вида )у'~= еа (6.36) мы видим, что, хотя у (ха) задано, у нас нет явного способа определения у (х, †, 'Ь), поскольку не определено аначение у (ха). Обычный выход из этого тупика заключается в приблизительной оценке значения у'(х,), а затем в использовании для получения значения у (х,) методов, описанных в 9 7.
Затем первоначальная оценка для у'(х,) последовательно изменяется, пока не будет приемлемого согласия между предписанным значением в х, н значением, полученным при интегрировании. В случае нелинейного уравнения Эйлера метод корректировки первоначально выбранного значения у'(х,) совершенно произволен, и для него не имеется каких-либо определенных правил. Во многих случаях неустойчивость как аналиаического, так и вычислительного происхождения вызы. вает болыпие колебания в значении у (х,) при малых изменениях у'(ха). Не существует никакого практического способа предсказания численной неустойчивости для систем нелинейных дифференциальных уравнений, но опыт вариационного подхода к проблемам траекторий убедительно показывает, что неустойчивость представляет весьма реальную и часто непреололимую проблему.
В силу этого желательно иметь способ получения численного решения исходной вариационной залачи, который не зависел бы от решения лвухточечных краевых задач для нелинейных дифференциальных уравнений. '1гл ч ВАРНАЦНОННОЕ ИСЧИСЛЕНИЕ Поскольку суп!ествование уравнения Эйлера основано на предположении, чго вблизи от экстремали допускается свободное (двустороннее) варьирование, мы должны примириться с фактом, что здесь вообще может не быть никакого уравнения Эйлера! Решение может состоять из ингервалов, на которых у'=сь чередующихся с интервалами, где у'= — сн Или могут быть интервалы,где у'=с, или у'= — сь а также интервалы, где 1у'((сн Это означает, что уравнение Эйлера бУдет УдсвлетвоРЯтьса внУтРи тех интеРвалов, где 1У'( ( гь Решение тогда может иметь вид, изображенный на рис.
61. Рис. 61. Нетрудно построить примеры, в которых такие колебания могут встречаться сколь угодно чзсто. Лаже простые варианты траекторных процессов, процессов управления и процессов с «узкимн местами» могут иметь решения с тремя или четырьмя чередованиями. В результате такого усложнения задачи этого типа чрезвычайно трудны для решения.
Они требуют комбинирования аналитических методов и изобретательности, и в настоящее время не существует никаких единых методов для получения явных решений. Ниже будут даны ссылки на ряд решенных частных задач. Каковы бы ни были трудности при численном решении обычной вариационной задачи, они несравнимы с возникающими здесь трудностями.
Требуется не только угадать начальные значения, но во многих случаях также угадать начальные фазы решения и устойчивость этих фаз. указанную выше задачУ, где 1У') (св можно Решать с помощью множителей 247 ФОРИАльныЙ АппАРАТ Лзгранжа и приближенных значении для нзчальных условий. Задачу минимизации при ограничении вида 'у ,'а-.с, таким образом решить, по-видимому, нельая. Как мы увидим, метод диналлического программирования дает путь обхода этих трудностей; во многих случаях численное решение задач с ограничениями фактически даже облегчаегся Гла.одаря наличию ограничений Ф). 1ГА ЛИНЕЙНОСТЬ Исследовзние оптимального использования экономических комплексов, данное в главе лгП, приводит к аналитической задаче максимизации скалярного произведения ! (у) = (х ( Т), а), (6.37) где х и у связаны векторно-матричным уравнением — =Ах+Ву, х(0)=с, (5.38) и ограничением в виде неравенства Су ( 7)х.
(5.39) Линейность этой задачи делаег классический вариационный подход невозможным. Для этой задачи максимизации уравнения Эйлера просто не существует. !1, ФОРМАЛЬНЫЙ АППАРАТ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ Опишем теперь коротко подход к вариационным задачам с помошью динамического программирования. Как и ранее, действуем чисго формально. Рассмотрим задачу минимизации функционала л ! (у) = ) В (х, у, у') агх, а где функция у подчинена граничному условию у (а)= с. Минимальное значение будет функцией нзчального значения а, переменной х и граничного знзчения с функции у.
Здесь с Ф] См. обсуждение в ф 17 главы 1. 248 [гл. ч ВАРилциониов исчислвииз измеряет начальное состояние системы, а а определяет продолжительность процесса. Введем теперь функцию у(а, с)=пи'и/(у). (б.41) Итак, мы включили предложенную выше частную задачу, где а и с — постоянные, в семейство задач, возникающих, когда параметры а и с меняются в областях — оо(а(Ь и — со(с(оо. Начнем с вывода уравнения для функции г (а, с), а затем покажем, как это уравнение приводит к результатам, уже перечисленным в параграфах, посвященных вариационному исчислению, а также к некоторым дальнейшим результатам. В силу аддитивности интеграла ь а+а а 1=1т (б.42) а а а+А из принципа оптимальности немедленно получаем функциональное уравнение а+ а т(а, с)= пип ) ~ то(х, у, у')с(х+ л~а, а+А! с а +У (а + Ь, с (у))~, (5.43) где минимизация производится по всем функциям у, определенным на промежутке а(х(а+ 1 и удовлетворяющим условиям у(а) =с и с(у) =у(а+ Ь).
Мы используем это соотношение двояким образом: в аналитических рассуждениях — устремляя а к О, а при численных расчетах — взяв Ь малым, но отличным от нуля. Ниже эти подходы будут рассмотрены весьма подробно. Всюду в дальнейшем будет предполагаться, чго функция т'(а, с) имеет непрерывные первую и вторую производные. !2. ОСНОВНОЕ НЕЛИНЕЙНОЕ УРАВНЕНИЕ В ЧАСТНЫХ ПРОИЗВОДНЫХ Заметим, что выбор у (х) на интервале [а, а+ а) при ограничении у (а) = с можно трактовать как выбор у'(х) на интервале [а, а -1- Ь!. Если Ь мало, то выбор у'(х) на [а, а + Ь[ эквивалентен выбору у'(а) в предположении, 249 твяиивнив эйлввл непрерывности у'(х).
Таким образом, используя выражения я+я Р(х, у, у') Ых= Р(а, с, у'(а)) 5+о(5), (5.44) а с (у) = а +у' (а) д + о (5) и равенство в=у'(а), можно переписать (5.43) в следующем виде: 1(а, с)=шш]Р(а, с, ъ) 5+7 (а+5, с — ', ъ5)] — , 'о(5). (54о) Устремляя 5 к О, получим в пределе нелинейное уравнение в частных производных — — = пц' п ~ Р (а, с, в) + о — ~ . дт . ! дУ ! да дс ~' (5.46) Начальное условие состоит в том, что 7(Ь, с) =О для всех с; уравнение (5.46) остается в силе при а(Ь.
13. УРАВНЕНИЕ ЭЙЛЕРА Для того чтобы избежзть смещения результатов на постоянную, примем нижнюю границу а за х, а за у' — введенную выше величину о. Формзльное разложение (5.45) в степенной ряд приводит к уравнению г (х, у)=пни ~Р(х, у, у') 5+7 (х, у)+ У +дх 5+ д у а+ ...~. (5.47) При 5-ьО получим нелинейное уравнение в частных произ- водных О=ппп]Р(х, У, У)~дх+У д ! (5.48) дУ , д/ (уравнение (5.46)). Это уравнение эквивалентно двум уравнениям: ду (5.49) 250 !гл. ч влгиационнов исчисление которое получается взятием частной производной по у', и (5 50) дл ' ду которое спрзведливо для х, у и у', удовлетворяющих (5А9). Продифференцировав (5.49) по х, получим уравнение — Ру -!- — + —.У =О.
д'г" д-"г" дх м, дгду" ду. (5лб! ) Взяв частную производную от (о.50) по у, получим уравнение Р' — ' Гу — — !- — + —,, у' -~- — — — — О. (5.52) ду' д-"У д-"У,, дУ ду' ду ' дхду ду" ду ду ??ва последних уравнения вместе с уравнением (5.49) приводят к классическому уравнению Эйлера „" Р,„— Рх=О.
(5.53) Обычный вывод этого результата из (5.48) основан на теории характеристик. ?4. УСЛОВИЕ ЛЕЖАНДРА Мы использовали тот факт, что в точке минимума должна обращаться в нуль производная функции в (5.48). Добавочное требование о том, что в точке минимума должна быть положительной вторая производная по у', приводит к неравенству ~',у) О, (5.54) представляющему собой классическое условие Лежандра.
15. УСЛОВИЕ ВЕЙЕРШТРАССА Выполнение условия Лежандра не исключзет возможности того, что минимум является только относительным. Для существования абсолютного минимума для всех функций У" = У'(х, у) должно выполняться неравенство Р(х, У, У')+д +У'д (Р(х, У, !")+ — + ?' д (5.55) ду ду ду , ду ду или г' (х У, ? ) — т' (х, У, У') + ( У' — у ) д — ~ О, (5.56) 16) слгчай нвскольких зависимык пвввмвнных 251 Это и есть необходимое условие Вейерштрасса для абсолют- ного минимума.
16, СЛУЧАЙ НЕСКОЛЬКИХ ЗАВИСИМЫХ ПЕРЕМЕННЫХ Приведенный метод легко переносится на случай задачи минимизации функционала 1(у уа ." у.)= ь =~Р'(уь у,..., у„; у,', у.,',,„у„'; х,)бхь (5.58) х где у,(х)=уь у,(х)=ум ..., у„(х)=у„. (559) Если встречзются производные высшего порядка, то можно сделать замену переменных, сводящую задачу к предыдущей.