Беллман Р. Прикладные задачи динамического программирования (2013) (1246769), страница 45
Текст из файла (страница 45)
(. э~ими дополнениями рекуррентное соотношение прпобретаез в ад ~йе + 'И: ' .ул~~лХ ав а — ь «е Х Г Н+- --„-, д Е, О+ —, Д Е $ (6. 4) где ,—; = „~г — а'„ а'а 10' сгв 0 а'Е ИН К' яп0 ИЕ Р-- й (6,1о) 7'= Т(Е, Н), )7 = 17 (Е, Н, О, 0), (6.16) а ограничения по нагрузкам в уравнении (6.14) заданы в форме а=а(Е, Н,б), б=б(Е, Н,0).
(6.17) 10. ЗАДАЧА О ТРАЕКТОРИИ СПУТНИКА В последующих параграфах мы хотим изучить задачу о выведении спутника на орбиту. Так как вопрос является весьма сложным, изучим упрощенныи вариант. Проблема представляет интерес как с аналитической, так и с вычислительной точек зрения. Аналитически это вариациоиная задача типа Майера, в которой одна из переменных (горизонтальная скорость) должна Численное решение, как это часто отмечалось выше, включает последовательное вычисление ряда таблиц значенип функции двух переменных.
121 мхтвмхтическая Фоимглиговка бьы ь макснмизирована н момент полного иыгорания топлива, причем имеются некоторые ограничения. Если режим тяги обусловливается заранее или является постоянным, то для решения применима методикз предшествующей главы. Если величина аяги, которая входит в уравнение линейно, должна быть выбрана оптимальной при некоторых ограничениях, то аналитический подход затрудняется, но вычислительный алгоритм динамического программирования еще приложим. 11.
УПРОЩЕННАЯ ЗАДАЧА 11ашей целью является выбор закона (политики) управления тягой и расходования топлива, коэорый позволит вывесги спутник на орбиту с заданной высотой при максимальной горизонтальной компоненте скорости. Для того чтобы ограничить объем вычислений разумными пределами, мы воспользуемся существенными упрощениями, к которым приводят пренебрежение различными аэродинамическими силами и предположение о том, что земное поле тяготения является плоскопараллельным.
Определение траекторий, обеспечивающих минимум расхода топлива, максимум высоты и т. и., может быть проведено теми же приемами, которые были использованы в предшествующем рассмотрении. Аналогично при помощи тех же методов могу~ быть рассчитаны более реальные траектории при учете сферичности поля тяготения, — при этом придется привлекать функции двух или более переменных. !2 МАТЕМАТИЧЕСКАЯ ФОРМУЛИРОВКА Уравнения движения спутника, перемещзющегося над плоской землей, записываются в декартовой системе координат следующим образом: л'и вм — - =рсоа э, гГш — — =пз!пэ — л; ггг (6.18) лу лт — =Ю, вгХ Й - — '=й.
284 (гть ч» ОПТИМАЛЬНЫЕ ТРАЕКТОРИИ Здесь (см. рис. 73); л и у — как обычно, горизонтальная и вертикальная компоненты, и и тл — горизонтальная и вертикальная коипоненты скорости, р — аеличинз ускорения, создаааетю~о резктиаными силами, Т вЂ” угол наклона силы тнгн к горизонту. (а) (Ь) (6.19) (с) Если мы введем величину (г как скорость, достигаемую спутником в идеальном случае отсутствия гравитационных сил, то получим соотношение й)г Р.
о'г Переменнзя У будет монотонной липа. Так как аР и' где Р— тяга, и с Р= —— й функцией количествз топ- (6.21) (6.22) где М вЂ” 'вес и с — скорость вытекаюших гавов,,мы сможем Рис. 73. найти М как функцию «идеально достижимой» скорости М=М,е ', (6.23) где М, — вес пустой рзкеты. Уравнения движения (6.18) совместно с соотношениями (6.23), которые задают М как функцию К и (6.21), которое 2йб нвшвиив — т определяет ускорение через тягу и вес, позволяют определить о~ттиьтальный нзклон и оптимзльную велича<у тяги как функцию 1т.
13, АндлитическОе Решение Если р постоянно, то не~од предшествующей главы приводит к важному заключению, что оптимальная политика, сы характеризуется тем свойством, что — т16Р =) (6.24) где ),=сова(. 14. РЕШЕНИЕ С ПОМОЩЬЮ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ вЂ” ~ Рассмотрим теперь, как мы сможем использовать метод функциональных уравнений динамического программирования для получения численного решения. Переменными состояниями являются высота у, вертикальная компонентов скорости ш и идеальная доступная ско. рость 1т.
Следовательно, мы вводии функцию угтт, в, у), равную добавочной горизонтальной скорости, полученной при старте с высоты у с вертикальной компонентой скорости тв и идеальной (6, 26) достунной сноростью $т, при использовании оптимальной политики. Обращаясь к уравнениям движения, введенным в й 12, н используя принцип оптимальности, мы получим функциональное уравнение ,У(К ж', у) =и\ах [сов рД ь~+( )т Ы', жl — г- — д)т, у+ т, Р лу +П,бУЦ =шах~соз~рб1т+У( (т — оК и+ тг д где й )т рассматривается как малая величина. Считая 1т принимающим только конечный ряд значений О, м)т, 2л1т, ..., Ат1(т, 286 !гл.
ьч оптпмллъпыя тглгктогии мы видим, что вычисления сводятся к определению последовательности функций двух переменных у,(тв,у) =у 1Агд,ш, у) при использовании уравнения (6.26). !б. РЕШЕНИЕ С ПОМОЩЬЮ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ вЂ” !! Лля того чгобы упростить вычисления, используем метод множителей Лагранжа, позволяющий, как это было показано в $16 главы 11, привести задачу к определению последовзтельности функций одной переменной. Вместо минимизации окончательного значения и, ограниченного заданием высоты и тв в конце траектории, рассмотрим проблему максимизации суммы Π— ~ соа р гс ~'+ х ~ Д гт' )г 0 ~'о (6.
27) при выполнении уравнений движения, Здесь >,— множитель Лагранжа. Новое функциональное уравнение для максималыюй величины имеет вид где вторая алыернагнва внутри ~ ) предсгавляег решение на границах для малого временного интервала бт.
Параметр Х настраивается вплоть до выхода на ограничение по высоте. При использовании множителя Лагранжа мы разделяем задачу, первоначально включавшую последовательность функцин двух переменных, на ряд задач, включающих функции одной переменной. Время вычислений значительно уменьшзется. гтс г (!г, ш) = шах !шах ~ соз:яб ~'-~- "™е г б )г~ — ~~- р !. лр +~~ )г — б)г, те+(з!п<р — ' ~Ь1т) >твЫ+ -';У(К гг — дЫ)~, (6. 28) зт 16! вычислителю>ые РезультАты >6. ВЫЧИСЛИТЕЛЬНЫЕ РЕЗУЛЬТАТЫ Численное решение находится путем обратной итерзции рекуррентного соотношения (6.28) от известных окончательных величии.
Т(о начала вычислений заметим, что если выгорание топлива произойдет цри вертикальной компоне>пе скорос>и и>, >о приращение высопа будет равно свт12й и нрирщцение горизонтзльноИ скорости рвано нулю. Следовательно, Т(0, св)=йтвт>'2д. Таблица, содержащая г(0, св) для диапазона значений ш (мы еще не знаем, к кзкоИ величине ш в момент выгораиия приводит оптимальная политика), сохраняешься в оперативной памяти вычислительноИ машины. Эта табулированная функция теперь используется для определения новоИ функции у (1»К ш), равной полной добзвочной горизонтальноИ скорости пл>ос й, умноженное на высоту, которая может быгь достигнута, начиная с малой величины Ы' «располагаемой скорости», т.
е. Зоплива, и вертикальной компоненты скорости ш. Это вычисление производится с помощью уравнения (6.28). Мы оцениваем приращение, связанное с выбором различных з и Р, и сравниваем его с доходом от решения на ограничении. На этой основе мы выбираем оптимальное ре>некие. Резуль>а>ы э~ого решения, т. е. значения 1(д К тв) для ряда рассмотренных значений тв, хранятся в памяги машины.
Во второй таблице приводится оптимальное решение для 1(цК тв). В третьей. таблице 1(цК ш) записывается полная высота, получаемая при использовании оптимальной политики, начинающейся с точки (1» К ш). В этой таблице ведется запись величины, которая не испольауется при вычислениях, но зато сразу же по окончании итерации уравнения (6.28) дает значения полной высоты (а значит, и горизонтальной скорое~и У( К О) — Л 1( К, О)), получаемой цри следовании по оптимальной траектории, Удобство этой записи объясняется тем, что при полете мы стремимся максимизировать сумму горизонтальной скорости и высоты, умноженной на ).
После того как описанный выше метод для вычисления 1(>»К ш) с использованием таблиц значений 1 (О, ш) запрограммирован на быстродействующей вычислительной машине, вычисление значений 1 (21» К ц>) по 1 (ц К ш) и, наконец, 1 ( К и>) по 1()г — >а К ш) нетрудно осуществить с помощью той же 288 ~гл. чг оптимьльныг. тгтвктоеии самой программы.
Заметим, ч~о иа каждом этапе этих вычислений для построения следующей таблицы гребуе1ся аолько предшествующая таблица функций )', Как только таблица вычислена и использована для построения следующей, она может быть отпечатана выходным устройством вычислительной машины и изъята из памяти, Следовательно, требуемая емкость памяти машины определяется числом дискретных точек, выбранных для таблицы ш, и не зависит ог шага сетки по Ь К Полное время счета обраыю пропорционально величине шага д К При выполнении обратной изерации по уравнению (6.28) известны горизонтальная скорость и высо~а, получаемые при оптимальной политике для определенных начальных условий. Начальная политика для точки старта также определяегся природой вычислений У( К ш), Для того чтобы восстановиаь оптимальную ~раекторию во всей ее полноте, теперь определяется новое значение тв с помощью предписанного решения для первого интервзла й К При вычислении ~(К в Ь К ш) для этого значения ш определяется и записывается оптимальное решение (так как действительное и может не быть одной из точек сетки ш, ~о иногда оказывается необходимой интерполяция).