Беллман Р. Прикладные задачи динамического программирования (2013) (1246769), страница 44
Текст из файла (страница 44)
+) (Н, (т)+ — (Т вЂ” 0 Рассмотрение этого уравнения приводит к трем случаям: (а) Если 1+ — ( Т вЂ” 0 ) д — О, необходимо выбирать мп 0 столь больюиль сколь возчожио. (Ь) Если 1+ — ' Т вЂ” 0 ! — ~ О, выбирать ', дУ и' 'л ) дь' Ми 0 =О. (с) Если 1 + — ( Т вЂ” 0 ) — — — О, тс, )дУ Ф'1 ) д)т д( 1 ь'д д)тЛ ! л дН( — (~ту — Мл = — — (,Тр — ~я'~. Уравнение для случая (с) мы выводим, исключая — „и — и дт дУ пользуясь тем, что уравнение (6. 5) остается справедливым.
(6.6) где о(ЬН) представляет собой слагаемое вьшшего порядка малости относительно ЬН. В силу того, что Т (Н, Г) в правой и левой часгях взаимно уничтожаются, мы получим, рааделив на ЛН и усгреиляя ЬН к нулю, равенство 275 вычислитвльная пяоцвдхва 1(злее составляются и приравниваются смешанные производные и †. , Полученное уравнение определяет тра- д»1 дд'-'1 дйд1/ дмдН' екторию в плоскости (Н, Гг). Теперь мы можем сделать заключение, что оптимзльнзя трзектория состоит из основной кривой, не ззвисящей от конечных точек, з также переходных участков, на которых совершается либо горизонтальный поле~, либо полег с наибольшим углом наклона траектории. Прямое решение уравнений типа (6.5) приводит ко многим грудностян. В настояцгее время только процедура проб и ошибок позволяет прийти к точной комбинации эйлеровых траекторий и переходных кривых, хотя в специальных случаях могут быть использованы н аналитические методы.
7. ВЫЧИСЛИТЕЛЬНАЯ ПРОЦЕДУРА Обратимся теперь к рассмотрению вычислительных аспектов задачи о наборе высоты, Предположим, что желательно пролететь от точки 1 до точки 2 (рис. 66) за минимальное время. Мы можем представлять себе плоскость (Н, 1г) как сетку из элементов произвольных размеров. Ограничимся только горизонтальными и вертикальными прирзщениями, сооаветствующимн шагу сетки, С физической точки зрения мы огрзничивземся движениями самолета с приращением высоты на азйглггл» постоянной скорости и Рис. 66. Сетка скорость — высота. ускорениями нз постоянной высоте. Линейность нашего «вырожденного» квазистационарного уравнения позволяет сделзть это.
Мы можем ~еперь попьпаться осуществить прямой подход к решению, т.е., нзчиная из точки 1, испытать все возможные пути и пай~и путь, требующий минимального времени, путем исключения. Этод «метод грубой силы» 276 оптимлльныв твлвктоР!ти 1гл. щ 8. ОБРАЗЕЦ РАСЧЕТА Лля того чтобы показагь численные резулыаты,получающиеся при применении динамического программирования к задаче о наборе высоты за минимальное время, был выбран гипотетический турбореактивный самолет-перехватчик с возможной высотой полета 60 000 футов и скоростью М = 2. Мы предполагаем, что читатель знаком с обычной терминологией авиационной техники я).
Предположение, что поляра является параболической, и использование уравнений движения приводят к следующим выражениям: Сп = Сдв + гс С! Ф!Тг Ст = —, ал ь'-' А!= соз 6+ — 6'в!п 6, К «)=148!6, М'=14816, ( — 1 . 5 ! Лля подъема с М = сопя! имеем: (6.7) (6.8) (6.9) (6.10) ") При переводе сохранены обозначения оригинала. Связь их с принятыми в СССР стандартными обозначениями ясна из текста. ()7рим.
ред.) обременителен по времени даже для вычислительной техники; например, сетка размером 10 к' 10 для испьпания всех возможных путей требует 876 000 отдельных просчетов. Вместо этого мы используем метод, описанный в 9 2. Построим вспомогательную матрицу со следующими свойствами: 1) оптимальный путь от любой точки до конечной точки 2 задаегся следованием по пути, указанному стрелками; 2) численные значения времени, затрачиваемого на оптимальный путь от любой точки, указывается числом в таблице. Для построения такой матрицы потребуется лишь малое число просчетов.
Например, для се~ки 10 )( 10 необходимо 180 вычислений по сравнению с 87о 000 для «метода грубой силыж 277 8] овялзвц Расчвта Для ускорения при Н= сопя( имеем: — ьр И" 8 Ы= (6.12) Здесь Сол и К вЂ” параметры уравнения поляры, связывающего коэффициенты лобового сопротивления Со и и 7,17 р ~тт Рис. 67. Зависимость коэффициента Со оо ат числа М. подьемной силы Ст, являются функциями числа М. Графики их даны на рис. 67 и 68. Доступная тяга как функция высоты и скорости, если установка регулятора фиксирована, показана на рис.
69. Мы произведем построение матрицы (Н,)7), для которой выберем ЬН= 1000 футов и ЬМ = 0,02. Начальная точка имеет координаты (Н= О, 7у 7Р РЛ 7Х ЗР М = 0,8), а конечная (Н вЂ” 60000 М вЂ” 20) Рис. 68. Зависимость коэффициента К что приводит к матри- от числа М. це размера 61 Х 61. (Вообще говоря, нет необходимости в том, чтобы матрица была квадратной.) Вторая таблица (сетка), аналогичная построенной 278 оптнмАльныБ ТРАБктоРии ~гл.
ш в предшествующем примере, была получена с помощью быстродействующей вычислительной машины и были определены 7У У.У Рб У~ йд Рпс. 69. График доступной тяги, н 477 ф ь Л' '- лсу т7о' с777 Ы Ул У4 Уб Усу Яст Рис. 70. График оптимального пути в координатах высота— скорость. оптимальные траектории для нескольких случаев. Результаты показаны на рнс, 70 — 72. ОБРАзял! РлсчБТА Рассматривая рис. 70, можно легко узнать обгцее решение описанного выше типа. Части граекгории сгН и У являются бб 477 ,Уй ь~ ес7 47 177 Л7 30 477 477 й7 7г7 дг7 Х 1е метгення миляд Рис. 70 График оптимального пути в координатах высота †горизон- тальная дальность. двумя ветвями эйлеровой траектории. Часть !нГг есть переход от сгартовой точки до дозвтковой зйлеровой траектории, Часть Н/ есть переход ме;кду дозвуковой и сверх- ~~ 4" звуковой ве1вями эйлеро- ф вой траектории.
Часть,7К ьь есть переход от сверхзву- „.ет7 конойветвизйлеровойтра- ~~ екгории к конечной гочке. ь В случае Л (рис. 70) принято, что вес самолета м Ггеее7 (влесте с топливом) ос- рис. 72. Зависимость минимального вре- Гвместе с тается постоянным и рав- вени набора высоты от начального веса. ным 40000 фунтов н что коэффициент перегрузки 7т7 равен единице. Время набора высоты по оптимальной траектории оказалось равным 277 секундам.
280 [гл. и оптимальные тялектояии В случае В эффект изменения веса вдоль траектории учитывался путем введения зависимости удельного расхода топлива от высоты и скорости. Так как при построении вгорой таблицы мы движемся в обратном направлении, то приходится начинать расче~ с некоторого предполагаемого значения веса в конце траекгории и вычислять его приращения при движении по таблице. Интересным побочным результатом расчетов являются, конечно, данные о зависимости времени набора высоты от начального веса. При начальном весе, равном 40000 фунтов, время подъема составляет 252 секунды, а затраты топлива 3450 фунтов. В случае С исследовался эффект влияния угла наклона траектории на лобовое сопротивление самолета.
Влиянием нормальных ускорений на лобовое сопротивление пренебрегзлось. Использованный метод расчета аналогичен игерационнолгу процессу, примененному при учете влияния изменении веса. Время набора высоа ы в случае С оказалось равным 2о1 секунде. Замечено, что изменение лобового сопротивления, вызванное пормальнычи ускорениями, является взжным, особенно в переходных точках, таких как выравнивание от первоначального угла наклона к горизонтальному ускорению.
Общее решение, учитывающее этот эффект, можно получить распространением описанного здесь метода (см. Ч 9). На рис. 71 показан профиль полета (траектория в координатах высота — горизонтальная дальность) для трех исследованных случаев, где приращение горизонтальной дальности для малых Ы вычислялось как произведение Ы на горизонтальную компоненту средней скорости. На рис. 72 приведен полезный график, который является побочным резульгатом вычислительной методики, использованной в случае В. Что касается практического приложения этих теоретических результатов, то было бы слишком оптимистичным ожидать, что человек или автопилот мог бы следовать такой сложной программе подъема по высоте и скорости, какая была здесь указана.
К счастью, можно найти более практическую траекторию, состоящую из двух участков под.ьема с постоянным числом М и одного участка разгона на постоянной высоте, которая, с точки зрения затрат времени, близка к сложной траектории, 9] овошцвннля задхчт о навоев высоты 201 найденной в примере. (.ледовательио, !еореаическое решение должно служить как бы проводником и критерием оценки нри нахождении практически приемлемых траекторий с минимальными затратами времени. 9. ОБОБЩЕННАЯ ЗАДАЧА О НАБОРЕ ВЫСОТЫ Задача о наборе высоты за минимальное время, рассмотренная в предшествующих параграфах, может быть ааписаца и форме, зиачителыю точнее отражающей действительное!ь, если учесть некоторые дополнительные факторы. В час!нос!и, кажется, что; 1) необходимо учесть зависимость лобового сопротивления от наклона траектории и нормального ускорения; 2) нормальные ускорения должны быгь ограничены допустимыми для пилота и прочности самолета нагрузками; 3) должны быть разрешены пикирование и «горки>; 4) должна быть задана предельная дальность полета.
Учет данных факторов не выходит за прелелы возможностей нынешней вычислительной техники. Однако он потребует значительных усилий при программировании и вычислениях. В идеале для инженеров-проектировщиков н эксплуа!ационников должны быть доступны как быстрый и легкип метод первого приближения, подобный описанному выше, так и более сложное решение, рассмотренное ниже, Влияние наклона траектории и нормальных ускорений на лобовое сопротивление отражаешься введением в формулу неременныт 0 и О. Это приводит к двумерной задаче.
Ограничения на ускорения определяют границы изменения 0. Программирование 0 эквивалентно программированию угла атаки. Лля того чтобы включить пикирование, т. е. увеличение скорости при потере высоты, и «горку», увеличение высоты с потерей скорости, необходимо ввести новую монотонно изменяющуюся промежуточную переменную. Эта переменная— энергетический уровень, определяемый как Р= И+,—' 2я (6.13) ,Юля всех разумных траекторий эта переменная будет увеличиваться при полете с включенным двигателем, хотя высота и скорость по отдельности могут колебаться.
Заметим, что 282 1гл. и ОПТИМАЛЬНЫЕ ТРАЕКТОРИИ прн этом не вводится никаких дополнительных переменных, так как знание Е и Н позволяет определять Р' с помощью соотношения (6.13). Наконец, предельная дальность полета Ь' может быть задана путем введения постоянного множителя Лагранжа, который экспериментально определяется прн пгерагнвном решении.