Беллман Р. Прикладные задачи динамического программирования (2013) (1246769), страница 52
Текст из файла (страница 52)
Уравнения, описывающие эту фазу процесса, таковы: ! (Ь) = сз х(Ь) = с,. и! — —, = — а,а! и'! (8.26) дх —,=а,а! — а„х с!г График функции х(!) при ! ) Ь имеет вид, показанный нз рис. 78. В этом случае нетрудно определить знзчение (, при котором досгигается максимум х для Ь. Обойдем, однако, на время эту задачу и гтс обозначим этот максимум через р(с,, сс). Ниже мы рассмотрим задачу определения р(с„с,) в более общем слу. чае, когда уравнения (8.26) являются нелинейными. Мы хотим определить сс(!)на интервале 0 =)(Ь, так чтобы минимизировать па~с„с,), причем на 1с наложено ограничение вида ~ лт сг! '~ (8.27) пРоцессы РегулиРоваш!я о оввдгной связью [гл, шн Это сложная неявная вариационная задача с обычными присущими ей трудностями. Вводя функцию т (с„см Ь) =ш!пр(са, са), (8.28) мы имеем рекуррентное соотношение Я(сн ся, Ь) = ш!п ]~[с, + б (а,гу (О) — ансг), (8.29) ся+ а(амо+аысг — (аз+ аггя)см Ь вЂ” 3] ]+о(б).
Это приводит к приемлемой вычислительной схеме при условии, если мы обладаем вычислительной машиной, способной справиться с функциями двух переменных. 11. МАКСИМАЛЬНОЕ ОТКЛОНЕНИЕ Обсудим теперь детзльнее задзчу определения функции р(с„сь). Рассмотрим рекуррентное соотношение Хл„=д,(ХО, ул), Х(0)=СР 1 (8.30) у„~г=ся(хгл ул), у(0)=ся ! и предположим, что мы хотим определить величину шах]х„]. л- О Эта величина, очевидно, является функцией начальных значений сн с,. Обозначим г (со са) =шах ) х„(, (8.3 1) л О Для того чтобы получигь рекуррентное соотношение для этой функции, проанализируем, что мы делали до сих пор, При изучении линейных операторов мы полагаем для Аг) ! и всех х, Е(хн х,,..., х )=х, +х +...+х, (832) и используем функциональное уравнение ~(хо хм ..., х,)=Ь(Е(х„х„..., х,), х ). (8.33) Заметим теперь, что оператор взятия максимума Л(хр хм ..., х )=шах[х» х„..., х ] (8.3Ф) 12'1 максимальная дальность удовлетворяет соотношению Я(хп хь .,., х,.)=Л((М(хн хп ..., х,),х,), (8.38) Это соображение позволяет нам решать многие задачи, включающие функционал максимизации с помощью, по существу, той же методики, которую мы использовали при изучении процессов с линейной фувсцией полезности.
Например, функция, определенная в (8.31), удовлетворяет уравнен гпо г(сн с ) = шах (ги у(8',(сп г„), дя(гп ся))). (8.38) для вычисления у(спс,) мы можем использовать метод последовательных приближений, основанный на введении времени, как в $ 13, или на каких-либо других приемах. !2. мдксимдльндя дА71ьнОсть Существуе~ немало интересных процессов, в которых может быль использован метод функциональных уравнений, дающий новый аналитический подход и экономичный вычислительный метод. Среди них много траекторных процессов, в которых внимание сосредоточено па определении максимальной дальности, минимального промаха и т. п. Рис. 79. Стандартный подход к таким задачам заключается в вычислении траектории в целом, а затем в определении желаемых специфических характеристик.
В качестве простого примера такой совершенной методики, основанной на использовании функциональных уравнений, методики, которая приводит к получению только желательной информации и не дает какой-либо другой, рассмотрим следующую аадачу. Снаряд выпускаезся вертикально вверх над плоской зем- лей и подвергается тормозящему действию силы тяжести и 328 пяописсы юпуливования с ов хтпой связью [гл. юп сил сопротивления. Мы хотим определить максимальную высоту, которой он достигает. Уравнение движения имеет вид —,, = — д — Л~ — ), х(0)=0, х'(0)=в, (8.37) где Л (т) — сила сопротивления, зависяпгая от скорости в. Пусть т(и) — максимальная высота, соответствующая начальной скорости ц (8.38) Рассматривая б как бесконечно малую величину, получим уравнение 1 (в) = о3 + У [о — (а + й (о) 3) [ Р о (3). (8.39) Разлагая в ряд и считая 3--О, приходим к дифференциальному уравнению 7 (о)= 7(0)=0 а-~ й 00' (8Л0) которое дает (8.41) мы можем тем же способом определить максимальную дальность и высоту.
Обсуждение этого вопроса может быть нзйдено в рзботах, перечисленных в конце глзвы. 13. МИНИМУМ МАКСИМАЛЬНОГО ОТКЛОНЕНИЯ Рассмотрим, наконец, задачу ре~улирования, включакмцуац минимизацию максимального отклонения. Предположим, что уравнение имеет вид и'и ~ ии —,= д~ —, и, о), п(0)=си и'(0)=ся (8.Щ «и = ',лг (см. рис. 79). Аналогичным образом, описываемое уравнениями гну ~ йх йут †. =- ивах, у, — , — ), лы = [ лг лг) рассматривая плоское движение, х (О) = си х' (О) = с,, (8.42) у(0)=са, у (0)=си З2З !41 понижвнив Размввиости и желательно выбрать в, на которое )н(~)~=--т; О==.Е( Т, так, чтобы ционал у(е)= шах (ц~. о=-мг Обозначим шш ./(в) =Т(с, с, наложено ограничение минимизировать функ- (8.44) Тогда приближенное функциональное урзвнение имеет вид Т (сь с„Т) = шах (сь пип (7 (с, + сяд), рмон м с, + д(си сь е (О) Ь, Т вЂ” Ь) Ц + о (Ь).
(84о) 14. ПОНИЖЕНИЕ РАЗМЕРНОСТИ Мы уже указывзли, что единственным препятствием для прямого численного решения широкого класса вариационных задач с помощью динамического программирования является размерность вектора состояний системы. Например, если х и у имеют размерность И, то процесс регулирования, направленный на минимизацию функционала вида У(у)=с [х(Т)]+). ~ й(у) сгг о (8,46) по всем у, подчиненным условию - — = гг (х,у), х (О) = с, (8.47) включает табулирование функций АГ переменных Г'(с, 7). Если Аг= 1, то это тривиально; если АГ= 2, то это доступно, но не тривизльпо; и если ЛГ=-- 3, то требуются изобретательность н аналитические усилия, при условии, что мы не используем очень грубую сетку или не ограничиваемся очень малой областью фазового пространства. Г!остараемся обосновать следующее важное соображение: если (8.47) является линейнмлг уравнением — — = А (Г)х+у, х(0) = с (8.48) Это соотношение позволяет нам получить численное решение вариационной задзчи.
ЗЗО пРОцвссы РвгулиРОВАния с ОБРАТНОИ связью (гл. нп! и д(х(Т)) в деиствительности является функцией только lг компонент х(Т), скажем х,(Т), х,(Т),..., ха(Т), то тогда вариационная задача может быть решена с помощью функциональных уравнениИ с рассмотрением только функций переменных. Основная идея состоит в том, чоо линейность (8.48) позволяет нам отделить влияние начальных условий от влияния внешних сил. Как известно, мы можем нанти из (848) х=Х(~)с+$х(~)Х '(а)у(а)йу, (849) где Х(Ь) — матрица, удовлетворяющая однородной системе — — =А(1)Х, х(0)=!'.
(8.ОО) Тогда х(Т) = Ь+ $ К(у)у (а) г(а, о (8.81) где Ь и К зависят от Т. Отсюда мы видим, что задача теперь сводится к минимизации функционала 8 [х! (Т),х, ( Т),..., хо (Т)) + ), ~ Ь (у) й = о тм =и '(Ь +(~ К,у~(а) тз,...,Ь +()~ К у! (а) г~о1+ от=! о т=! т +л~Ь(у)й (8Л2) тл д[Ьг+ ~ (~ К!,У, (У)!~Й,...,ЬА+~ х~~~ Ка,У,(а) Й~ + а /=! а/'=-! т +Л~Ь(у) и.
(8.88) а по всем у. Рассмотрим новую задачу о минимизации функ- ционала ЗЗ1 151 овсхждеппв Обозначим искомый минимУм чеРез 1(ЬьЬм...,Ьма). Тогда, используя принцип оптимальности, получим: ((Ьь Ья,..., Ьм а) = щ1п [18 (у(а)) б+) [Ь~+ м ~~~~~Кцу (а)~,...))~+о(Ь) (8.54) [ч1ю) ~=ч — функциональное уравнение, включающее функции только /г переменных. 1б.
ОБСУЖДЕНИЕ В дополнение к прямому приложению этой методики возможно получить и другие важные результаты. Во-первых, если функция критерия у[х(Т)[ является квадратичной, то вариационная задача приводится к линейному уравнению Эйлера, которое решается в явном виде. Однако явное аналитическое решение линейной системы большой размерности не является простым делом. Следовательно, даже в этом случае будет значительно более выгодно использовать подход с точки зрения функциональных уравнений.
Оказывается, что предельная форма уравнения (8.54) допускает явное решение, так как функция ~(ЬьЬн..„Ьма) является квадратичной форлсой относительно Ь; с коэффициентами, зависящими от а. Эти коэффициенты удовлетворяют системе квадратично нелинейных дифференциальных уравнений размерности А(А+ 1) 2 с начальными условиями. В то же время из вариационных уравнений получается линейная система размерности 2М с двухточечными краевыми условиями. Затем результаты предшествующего параграфа могут быть двумя путями использованы как исходный пункт для метода последовательных приближений. Во-первых, мы можем аппроксимировать общую функцию критерия функциен, зависящей только от Й из М компонент; во-вторых, мы можем аппроксимировать исходное нелинейное уравнение линейным.
Мы пе будем рассматривать эти приемы в дальнейшем, так как не имели опыта их использования. пго!гвсс!! Рвгхлпговхппя с огглтпой связью !Гл. чп! !6, СТОХАСТИЧЕСНИЕ ПРОЦЕССЫ РЕГУЛИРОВАНИЯ Предположим теперь, что физическая система, которую мы пытаемся регулировать, подвергается внутренним и внешним воздействиям, происхождение и в.чияние которых не полностью известно. Реальное положение дел, конечно, всегда таково. Однако во многих ситуациях неопределенность производит столь малый эффект, что ич можно пренебречь.