Беллман Р. Прикладные задачи динамического программирования (2013) (1246769), страница 43
Текст из файла (страница 43)
В. А. Т р о и цк и й, О варнзционных задачах оптимизации процессов управлении, Прикладная математика и механика, т. 26, в. 1, 1962. В. Ф. К рот он, Методы решения вариационных задач на основе достаточного условия абсолютного минимума, Автоматика и телсмсханика, № 12, 1962; № 5, !963. 1.. О. В с г с о ч11х, Ъ'аг1а!1опа1 Мейобз ш РгоЫсгпз о1 соптго1 апб ргобгаппп1пд, уонгп.
о1 Май. Апа1. апб АРР1., № 3, !961. См. также А. Я. Дубовицкий, А. А. Милютин, Задачи нз экстремум при наличии ограничений, Доклады АН СССР, т. 149, № 4, !963, стр. 759 — 762. глдвдтй ОПТИМАЛЬНЫЕ ТРАЕКТОРИИ 1, ВВЕДЕНИЕ Тор~ оные н военные применения авиации, научные зспекты соадания спутников н волшебные перспективы межплзнетных путешествий — все это вместе взятое привело к огромной концентрзпии внимания нз проблеме определения допустимых и оптимальных траекторий.
По мере совершенствования технических возможностей самолетов выбор траекторий, дающих минимальное время полета либо максимальнука дальность, на основе одной лишь интуиции становится все менее реальным. С другой стороны, вследствие все возрзстающего значения сокращения затрат времени в современном обществе и увеличивающейся стоимости топлива, задача определения эффективных режимов работы становится все более существенной. С появлением самолетов, способных совершать полет и вблизи поверхности земли и в стратосфере, и на дозвуковых и на сверхзвуковых скоростях, число возможных типов траекторий становится громадным.
Тем самым возрастает и сложность выбора из них оптимальной траектории (оптимальной политики). Трудности проблемы установления оптимальшах траекторий становятся ясными. если принять во внимание, что заманчивая область операций на сверхзвуковых скорое~ах отделена от дозвуковой области переходной границей, звуковым барьером, коаорый вызывает очень большое лобовое сопротивление. Невозможно ожидать того, чтобы какая-либо простая политика, основанная на одношаговом рассмотрении, позволила бы определить эффек~ивную траекторию полета, которая проникает сквозь этот барьер. Кроме того, явления изменения режима, 270 !гл. ш оптимлльшшг тглгктояии связанные с высокоэффективными дзига~елями, ясно указывают на желательность сверхзвукового полета. Обращаясь к ракетам и спутникам, напомним тот факт, что каждый фунт полезной нагрузки требует тысяч фунтов топлива.
Отсюда следует, что и здесь тщательный выбор траектории является существенным. Необходимо не только старательно рассчитать систему пилотирования и управления, но и соответственно выбрать сам способ управления, который должен быть осуществлен. Этот вопрос мы более детально рассмотрим ниже. На дальнейших страницах мы будем использовать для изучения множества проблем, возникающих в аэродиналгике н процессах управления, динамическое программирование (как стандартными, так и неожиданными способами). Хотя многие из этих проблем могуз быгь сформулированы и в терминах вариашюнного исчисления, мы по причинам, рассмотренным в предгцествукнцей главе, будем для получения численных результатов использовать метод функциональных уравнений. 2.
УПРОЩЕННАЯ ЗАДАЧА О 8ЫБОРЕ ТРАЕНТОРИИ Хотя вычислительный подход динамического программирования уже хорошо знаком читзтелю, мы чувствуем, что тем не менее стоит затратить д л время на формулировку и решение простой задачи о 7 4 а 7 выборе оптимального пути. 1!рименилщсть используемо- 4 го нами здесь меаода сганег л Ю сразу же очевидной, когда ,7 5 7 4 Д Д мы рассмотрим задачу о на- боре высоты самолетом за 4 Д .7 Д минимальное время.
1!редположим, что мы 7 г желзем нзйти тзкой путь,ко- торый минимизирует сумму Рис. 63. чисел, указанных на каждом из зненьен сетки, изображенной на рис. 63. Движение происходит оч точки А к точке В, причем всегда вправо. Рассматривая А как начало координат, 2! упяогктниля задач т о Вызове тизектоиии гт1 а г3 как точку с координагами (О, 6), мы построим рекуррентное сои~ношение х 1 н гГ(х,у; х —,' 1, у+ 1)"-'У(х+1, у+1)) г((х,у; х-~-1, у — 1)-,'— т (х — ', 1, у — 1)~ где гт(ху х — '1, у-~-1) предсгавляег собой число, указанное на звене между точками (х,у) и (х — ', 1, у+1), которое, Рис.
64. как предполагается, предсгавляег расстояние между точками (х,у) и (х+ 1,у+ 1). Решая задачу, мы прежде всего заметим, что г (6,1)= 4 и ~(б,— 1)=3. Используя зги значения для Х(б,у), определим т'(4,у). Так, Гб+41 /(4, 2) = 1 — , '4 = 5, ~(4, О) = ш1п ~,, ~ = 5 т'(4, — 2) = 6 -,'- 3 = 9.
Заметим также, что из г" (4, 0) оптимальный выбор заключается в движении по диагонали вниз. Аналогичным образом мы вычисляем т (З,у) У(2,у), у(1,у) и, наконеш г (0,0). Решение со стрелками, указываюшими оптимальные направления, сведено в габлнну, приведенную па рпс. 64. [гл. и ОПТИМАЛЬНЫЕ ТРАЕКТОРИИ 3. ДВОЙСТВЕННАЯ ЗАДАЧА В предшествующем параграфе мы определяли ) (х, у) как минимальную сумму расстояний от точки (х, у) до конечной точки.
Это приводит к итеративному методу, использующему движение обратно, ог конечнои точки. Однако мы могли бы точно так же 1З ввести иную функпию д(х,у), определяемую кзк ХУ минимальная сумма прп движении от начзльной 5 П 14 точки к (х, у). Это привело бы к итерации в пря- 7 1е" . Мом направлении, дающей еа решение, предстзвленное ,У д 11 нз рис,бо. Здесь стрелки должны быль ингерпретп- 7 П рованы как указатели направления, из которого осуществляется приход и точку.
Оба взрианта, кзк эго и должно бьгло бы~в, приводят к иденти шому результату по выбору наилучшего пути от А к В н по найденнои минимальной сумме. Эту двоиственность подходов необходимо иметь в виду при последующем рассмотрении. 4. ЗАДАЧА О НАБОРЕ ВЫСОТЫ ЗА МИНИМАЛЬНОЕ ВРЕМЯ Рассмотрим следующую задачу: какова траектория полета (в плоскости обобщенных координат высота — скоросгь), минимизирующая время, требуемое для подьема самолета с начальной высоты гт' при начальной скорости )1 до заданной конечной высогы етр и скорости 1'„. Ураинение движения *), ") Уравнения (6З) эквивалентны более очевидным соотношениям с%' д11 )Те — =д(Т вЂ” П) — И' яп0, — = Уяп0, дт дг Здесь %" — масса самолета.
При записи этих соотношений мы пренебрегли отличием между углом тангажа и углом наклона траектории. (Приль редд 273 вовмглиговкл задачи при предполо;кеииях квззисгациомарности, выведенное имеет вид ы ' ни 1р(1 (7' — — ь аш0, (6.1) 1 (.,-",~,- где тяга Т являегся функцией только высоты Н и скорости 1; гак как мы предполагаем, чго установка регулятора тяги фиксирована. Лля простоты в этом примере чы предположим, чго лобовое сопротивление г7 так ке является функцией Н и (г, пренебрегая тем самым изменением сопротивления, вызванным изменением наклона траектории и нормальным ускорением.
Ограничимся также только траекториями, пе включающими маневров типа «горок» и пикирования. Более точное репгеиие, при котором лобовое сопротивление рассма~риваегся как функция Н, (г, угла иаклонз траектории 0 и 0, и пе включаюгцее никаких искусственных ограничений на допустимые траектории, также возможно с помощью динамического программирования и будет дано в 9 9. Б.ФОРМУЛИРОВКА В ТЕРМИНАХ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ Основное уравнение динамического программирования для задачи о наборе высоты за минимальное время имеет вид т' (Н, У) = пни (( (Н, бН, Ъ; О) + +У(Н+бН; У+А(г[Н, бН, 1г, 0))). (6.2) В этом уравнении г'(Н, (г) представляет минимальное время г)эдъеьга ог начального положения Н, У до заданных конечных Н.
и 1г„. Выражение г(Н, цН, У, О) определяет время подьема до высоты Н вЂ ' лН с углом подъема 0. Урзвиеппе (6.2) устаканливаег тот очевидный факт, что полное время набора высоты предсгавляег собой сумму (а) времени подъема с углом 0 до некоторой близкой высоты, (Ь) минимального времени подьема иэ нового положения до конечной точки, минимизируемого по всем возможным углам. Это уравнение буде~ основным в нашем аналитическом и вычислительном рассмотрении. (гл.
лтт Л4 оитимальиые тРлектоРии б. АНАЛИТИЧЕСКОЕ РЕШЕНИЕ Подставляя выражение из (6.1) в (6.2), получим уравнение Т'(Н, Ъ')=ш)п ~„. О+у (Н+(л!т, 1' — ,' ! 00 — л1.тн)1. (6.'1) Разлагая выражение в правой части в степенной ряд вблизи точки (Н, (т), приходим к новому уравнению ) (Н, (л)=т)и .