Беллман Р. Прикладные задачи динамического программирования (2013) (1246769), страница 46
Текст из файла (страница 46)
Это решение используется дзлее на и>первзле от К в Ь Г до К в 2Ь К Таким способом мы используем результаты вычислений в порядке, обратном тому, в котором они были получены. Приведенная выше операция может быть легко осущестиленз с помощью вычислительной мзшины как конечный этзп вычислений, если набор таблиц записан на магнитной ленте нли на перфокартах.
Еак только задача решена, проверяется значение конечной высоты для того, побы определить, достигнут ли требуемый уроиеиь. Затем вычисляется новое значение множителя Лагранжа ), на основании предшествующего значения и полученных результатов и все вычисления повторяются. Вычисления дают оптимальную траекторию, выраженную через горизонтальную скорость и ) (высоту) для широкого диапазона начальных значений вертикальной компоненты скорости. Это множество результатов представляет интерес в задачах, где начальное значение вертикальной скорости не обязательно задано и желательно получить ответы для некоторого диапазона значений, 171 числвпныя РГзхл!Таты Во-вторых, после ряда изменений х оказываются извест.
ньшн оптимальные траектории для различных высот, что дает интересную оценку компромиссного выбора между высотой и скоростью иа оптимальных траекториях. 17. ЧИСЛЕННЫЕ РЕЗУЛЬТАТЫ Прн всех вы шслениях мы рассматривали гипотетическую ракету со следующими характеристикаии: вес пустой ракеты Л4, = 6000 фунтов; скорость истечения г = 11 000 фут 'сек; максимальная тяга Р, =300000 фунтов, минимальная тяга при включенном двигателе Р,а = 50 000 фунтов, полная идеально возможная скорость 30 000 фуш:тек, Эти данные подразумеваюп что полный вес на старте равен 76 456 фун~ов. Значение ) =000142 приводит к окончательной высоте, равной приблизительно 4оО миль с горизонтальной скоростью на этой высоте, равной 26 300 фут/сек.
Были приняты следующие значения различных параметров н шагов сетки, требуемых для численного решения: 1) 5'и'=1000. Следовательно, рекуррентное соотношение итерировалось 30 раз. 2) 5 и = 50. Каждая таблица для У()г, те) содержала 281 число, так как диапазон изменения и был принят от 0 до 14000. 3) бе = 0,01 радиана. )сиапазон изменения углов тяги (О, я,'2) радиан, 4) Тяга могла принимать значения 300 000, 250 000, 200 000, 150 000, 100 000 или 50 000. Эти числа были определены экспериментально, Они обладают теи свойством, что дальнейшее изменение сетки оказывает малое илн вообще незаметнее влияние на вычисляемое решение. Сжатая сводка результатов решения, осуществленного на машине РАН)с Джонниак за 20 минут, дана в таблице 6.1. Необходимо отметить, что, хотя при таком упрощенном изучении обнаруживается, что ракета должна лететь на максимальной тяге вплоть до полного выгорания топлива, а направление тяги должно изменяться по простому закону, сама вычислительная схема не строилась в предположении этих результатов.
Она, следовательно, приложима и для более общих 10 Р, валллан, С. дрейфус 290 ОПТИМДЛЪНЫВ ТРЛГ!(ТОРИН ~гл. нг задач, решение которых недоступно для обычного матемаы)- ческого анализа. Таблица 6.1 'с а ссо» )флсл) сск) а Ч )ф.смн )раа) ссс) Всс )кунс) л )фусл) )снс, фея)ссс) о о одбо 1514 4279 0,523 3306 8 625 5259 13 020 7 330 17 436 9 464 21 871 11 6 ло 26 313 300 85,1 2 337 679 26 313 5 000 О 444,7 Интересно отмети)ь точность этих вычислений путем сравнения отклонений 1п л от выведенного выше оптииального линейного закона. С помощью метода наименьших квадратов мы приблизим зависимость 198н полученную выше, линейной 18!с(1)= = а+ рг, где а = О 623945 и р = — О 001336, и построил) таблицу 6.2, Таблица 62 мен) ) !)ае — )ае) л )о )хе и) 0,6269 0,5?95 0,6239 0,5795 0,0030 0,0029 0,0037 0,0000 0,0044 0,0058 0,0010 0 5513 0,5334 0,5220 0,5148 0,5103 18.
БЛОК-СХЕМА Программа вычислений покавана в виде диаграммы на рис. 74. 30 25 20 15 10 5 Выгорлние топлива Конец подъема 0 33,3 54,4 67,8 76,3 81,7 85,1 76 456 48 529 3О 8О3 19 552 12 410 7 877 5 000 0,560 0,523 0,503 0,490 0,480 0,480 0,472 0 16 045 57 720 106 344 152 954 192 848 224 920 0,5476 0,5334 0,5206 0,5206 0,5093 0,501 0,496 0,480 0,480 0,472 300 0 300 33,3 300 54,4 300 67,8 300 76,3 300 81,7 г99 [гл. чг оптимлльныв тялвктовии 19. НОВОЕ ПОНЯТИЕ УПРАВЛЕНИЯ Понятие парамегров состояния в динамическом программировании естественно приводит к новому подходу в пи.штнровании и в управлении с обратной связью вообще.
Г!ри старом варнационном подходе для любой данной задачи целью является определение уравнения наилучшеИ траектории, Естественно, что это приводит к идее пилотирования, основанной на предварительном вычислении желаемой траектории и настройке навигационного вычислительного устроИства на эту траекторию. Если снаряд отклонится от траектории под действием непредвиденных сил нли мелких неисправностеИ, мехзннзм обратной связи почувствует это огклонение и попытается вернуть снаряд на предписанный путь.
Использование тзкого устройства приводит к трудностям, связанным с обеспечением устойчивости, а иногда с действительной опасностью увеличения колебаний вследствие перерегулирования. Все эти трудности звтомзтически устрзняются введением параметров состояния. Как только ракета отклонилась, оптимальной будет уже не вычисленная ранее траектория, а новая, определяемая новым состоянием ракеты. Любая попытка вернуть ракету на прежнюю траекторию не только трудно выполнимз, но и в действительности, вообще говоря, неоптимальна. Истинная информация, необходимая для выполнения оптимальных действий, — оптимальное решение как функция всех возможных мыслимых состояний системы, — определяется при вычислениях по методу динамического программирования.
Введение этой информации в систему пилотирования позволит наИги легко осуществимые с летной точки зрения истинно оптимальные траектории. Проблема технической реализации этой идеи еще мало изучена. 20. МНОГОСТУПЕНЧАТЫЕ РАКЕТЫ Здесь мы будем рассматривать совершенно иной тип многошаговых задач, выдвинутых космическим веком.
Само наименование показывает, что к проблемам, касающимся опти. мального построения многоступенчатых ракет, удобно подойти с позиций динамического программирования. Лля того чтобы проиллюстрировать приложимость этой мегодики, выберем следующую задачу. 293 221 ФОРМУЛИРОВКА 21. ЗАДАЧА ОБ ОПТИМАЛЬНОМ РАЗДЕЛЕНИИ Рассмотрим задачу об определении надлежащего числа и размеров двигательных ступеней, возникающую при проектировании ракет. Как известно читзтелю любой нынешней ежедневной гззеты, современные ракеты-носители спутников и космические корабли строятся из нескольких секций с горючим.
После того как топливо, содержащееся в секции, изрзсходуется, корпус секции отделяе~ся, для того чтобы уменьшить общий вес. В идеале было бы желательно иметь бесконечно ступенчатую рэкету, вся излишняя часть оболочки которой непрерывно бы отпадала по мере расходования топлива. Однако это приводит к бесконечно болшпому количеству измерительной и управляющей аппаратуры, а следовательно, к весьма высокой вероятности неисправностей. Согласимся, что желательно использовать разумно малое число ступеней. Тогда встает вопрос о размещении топлива в них. Таков упрощенный вариант задачи, котору|о мы будем здесь рассматривать. Мы попытаемся определиаь количество топлива, которое должно быть помещено в каждую из ступеней л-ступенчатой ракеты, для того чтобы придать носовому конусу и полезной нагрузке заданную конечную скорость.
При этом распределение надо осуществить так, чтобы минимизировать полное количество топлива, т. е. начальный вес. Мы хотим решить эту задачу для Й-ступенчатой ракеты, где й принимает. значения 1, '2, 3, ..., Аг. Весь этот ряд задач может быть решен за один цикл вычислений при динамическом программировании. Выбор оптимального 1г может быть осуществлен на базе компромисса между весом и надежностью. 22. ФОРМУЛИРОВКА Мы желаем минимизировать вес, необходимый для достижения заданной скорости, в предположении, что траектория известна. Одной из переменных, необходимых для описания состояния ракеты в начале этапа, является достигнутая скорость или, что эквивалентно, оста~ошаяся доля скорости, которая должна быть достигнута с помощью последующих ступеней.
294 1гл, ш оптин».чьныв тгивктояии Необходимо также знать вес ракеты для того, чтобы рассчитать работу в течение данного этапа. Все другие данные, необходимые для вычисления функционирования в течение этапа, предполагаются заранее извеспаыми, независимыми ог вычисляемой конфигурации ракеты.
Так как критерием оптимизации является минимум веса, необходимого для достижения конечной скорости, а оптимальный вес ракеты при данной скорости есть именно тот, который необходим для достижения конечной скорости, то значение оптимизируемой функции (т. е. веса) на данном этапе и значение переменной состояния (т. е. скорости) определяют функционирование в течение этапа. Переходя к аналитической формулировке, определим у»(в) как минимальный вес »-ступенчатой ракеты, достигающей конечной скорости о. (6.29) Теперь, если и» есть еше не найденная скорость, которая добавится за время действия л-й ступени, а функция ш (и», у» ~(п — и»)) есть добавочный вес топлива и корпуса, необходимый для обеспечения этого прирагцения, то в силу принципа оптимальности имеет место рекуррентное соотношеш:е У» (и) = т 1п (ш (п»,У», (и — и»)) + У», (о — о»)). (6. 30) я» Природа функции ш является единственным выражением особешюстей этой задачи.
Нигде до этого момента мы не встречались с ситуацией, когда в одношаговой части рекуррентного соотношения появляется зависимость от оптимальной для (л — 1)-шагового процесса функции. То, что это не приводит к каким-либо дополнительным трудностям, может быть легко обосновано читателем при осушествлении вычислительного алгоритма, столь чзсто используемого в этой книге. Численные результаты, полученные таким путем, приведены в работах, указанных в конце главы.