Fedorenko-RP-Vvedenie-v-vychislitelnuyu-fiziku (810773), страница 96
Текст из файла (страница 96)
Эдесь индексами « — » и «+» отмечены предельные значения величин на у со стороны ш и й~ш соответственно. Вычитая, получаем соотношения для уравнения в вариациях: [ЬЯ'] = О, (и М'„] + (в 62'„] + [и2'„] = (и Ьй'„). (50) Используем тождество Лагранжа в форме (47). Дальнейшие преобразования носят стандартный характер, отличаясь от того, что было раиыпе, только другой формой уравнений в вариациях (49), (50). В силу (49) и (50) левая часть (47) приобретает вид — ] ] Ф йч (ч йгад 2') дх ду. Интеграл по Г в правой часги (47) с учетом краевого условия для 'Р и 62'[г= 0 превращается в ЬР.
Второе слагаемое интеграла по у обращается в нуль (в силу непрерывности Ьй' на у и условия [иЧ'„] = 0). Первое слагаемое этого интеграла преобразуется с учетом непрерывности Ф на 7 и уравнений (50) следующим образом: Рри 62 ]„= Чг [и 6« „]»» Ч/ИФ 62 ) + (чй' ) ) Ч/ (ей' ) Пренебрегая первым членом как малой более высокого порядка по сравнению со вторым, получаем Ьг [Ьи( )] — ] ] Ф йч (ч угад .й') дх ду+ ф Ч'(пй'„) дж пгнвлижвнныв мвтоды вычислительной физики 1ч, и й 28, Задачи оптимального управления Математическая теория оптимального управления начала бурно развиваться с начала шестидесятых годов.
Истоки этой дисциплины лежат в классическом вариационном исчислении, но процесс математизации разнообразных прикладных наук привел к постановке задач, вариационных по своей сути, но не укладывавшихся в старые рамки. Особую роль в становлении теории оптимального управления сыграли ракепктроение н теория автоматического регулирования (как источники новых типов задач) и работы математиков. под руководством Л.
С. Понтрягина, в которых была выделена общая постановка задачи и получен основной теоретический результат— принцип максимума. В настоящее время имеет смысл рассматривать задачи оптимального управления как задачи математического программирования в функциональном пространстве. И с этой точки зрения постановка задачи не отличается от рассмотренной в й 26. Требуется найти функцию и, обеспечивающую ш1п Я«1 (1) при условиях Г,]«] чО, 1= 1, 2, ..., т, и Е К (2) (Каждое условие может иметь и форму Р, = 0.) То обстоятельство, что и — это элемент функционального пространства, приводит к включению в форму (1), (2) различных задач, имеющих свои особенности. Начнем с конкретного примера.
Задача о подъеме ракеты. Движение ракеты описывается тремя функциями: т(г) — масса, И(г) — высота, «(г) — скоросп. Изменение этих величин определяется системой дифференциальных уравнений (О П ~ < Т) «(Г) И = т й = — й+ ]1"« — Це "(«)з]lт, (3) дополненных данными Коши т(0) = 1, И(0) = О, «(0) = О. Величины я, Р, Д, а, входящие в систему (3), — некоторые заданные-постоянные. Функция «(г) задает режим горения топлива.
Ее нужно найти, с тем чтобы наилучшим образом выполнить стоящую перед управляемой системой (ракегой) задачу. Ракета — управляемый объект, возможности управления которым ограничены выбором функции и(1). Естественно, возникают ограничения на возможности выбора. Обычно их обозначают общей формой «Е О. В данном случае эта абсграктная форма принимает вид 0 ч и(1) < и+, Ы 0 где и — техническое ограничение скорости расхода топлива. Цель управления — получить шах И(Т) прн усло- 8 281 злзлчн оптнмлльного гпглзлення вин т(т) = т„(Т, т„заданы). Итак, ставится задача достижения в момент Т наибольшей высоты прн заданном запасе топлива. Общая задача оптимального управления. Приведем обобщенную формулировку вариационных задач подобного типа. Имеется управляемая система, состояние которой в момент времени 1 описывается фазовым вектором х(г) (размерностн р).
Эволюция состояния системы ва времени описывается системой обыкновенных дифференциальных уравнений х = /(г, х(г), и(г)), 0 ч г ж т, х(0) = х, (5) в правую часть которой входит искомая вектор-функция и(1). Управление системой состоит в выборе функции и(г), ограниченной условиями и(г) яи, Угя(О,Т), (б) где У вЂ” заданная область в г-мерном пространстве. В болыпинстве приложений она замкнутая, ограниченная и не очень сложной.формы. Широко распространен простейший внд области У вЂ” прямоугольник: и~ и и,. ж и~+, 1 = 1, 2, ..., г (и,, и~ — заданные границы изменения и,).
Пусть задано управление и(.). Так обозначается точка функционального пространства, т.е. функция, взятая «целиком». Под и(«) мы теперь будем понимать значение этой функции в момент 1, а под и— просго точку из г-мерного пространства. В теории управления имеют дело со всеми тремя объектами одновременно и их нужно четко различать, используя разные обозначения. Тогда задача Коши (5) интегрируется (мы считаем, что все условия существования и единственность для этой задачи выполнены).
Таким образом, задание управления однозначно определяет состояние системы в любой момент времени. Пусть определены функционалы ат Р~(и( )) (1=0, 1, ..., т). Цель управления состоит в там, чтобы выполнить условия Р,[и(.)) ж О, 1= 1, 2, ..., т. Этой цели нужно добиться самым экономным способом, т.е. нужно при этом получить шш Я~( )1. Функционал Р,(и( )) — это абстрактное обозначение алгоритма, позволяющего, коль скоро задано управление и( ), вычислить число Рп Конкретные формулы вычисления г, могут быть самым разнообразными.
Бзь пРиБлиженные методы ВычислительнОЙ Физики 1ч. и Ограничимся пока несколькими наиболее часто встречающимися конструкциями функционалов: т г"[и( )) ш $ Ф[Г, х(Г), и(Г) [ ~й, (7) о (8) Р[и( ) [ ш Ф[х(г')[, где 'г* — ззданная точка из [О, т[. Функции Ф, входящие в (7), (8), — заданные гладкие функции своих аргументов. Эти две конструкции представляют широкой класс функционалов, дифференцируемых в смысле Фреше (вопрос о вычислении производных Фреше был обсужден достаточно подробно в 8 27). Заметим, что любая гладкая функция от функционалов типа (7), (8) также приводит к диффереицируемому по Фреше функционалу, который может быть использован при формулировке вариационной задачи.
Обозначение выражений в правой части (7), (8) через г [и(. ) ) оправдано тем, что именно и( ) является тем аргументом, задание которого позволяет (в принципе) вычислить значение г. Для того чтобы это фактически выполнить, следует при заданном и( ) проинтегрировать задачу Коши (5) (в общем случае только численно) и, получив х(Р), выполнить, например, интегрирование (тоже используя подходящий алгоритм приближенного вычисления квадратуры). Перейдем к следующим двум важным конструкциям: У[и( )[ ш шах Ф[0 х(1)[, (9) г"[и( )[ ш шах Ф[г,х(г), и(г)].
(10) Эти два функционала в общем случае не имеют производных Фреше, оин (прн сколь угодно гладких Ф) дифференцируемы лишь по направлениям в функциональном пространстве. Днфференцируемость функционала (9) зависит не от гладкости Ф, а от множества точек, на котором достигается максимум. Оно обозначается как аг8 шах Ф[0 х(г) [. Если это множество состоит из одной точки, функционал (9), как правило, дифференцируем по Фреше; если их хотя бы две, производной Фреше не существует.
Для (10) ситуация осложняется тем, что значения и(г) на множестве меры нуль несущественны. В терминах таких функционалов оформляются так называемые ограничения в фазовом пространстве. Пусть выбор управления и(Г) стеснен еще и требованием х(Г) Е С С йг, т'Г Е [О, Т[, где С вЂ” заданная область в йг.
Наиболее распространенным способом 457 8 281 ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ описания области С являются системы неравенств ФУ'(х) и 0 (У = 1, 2, ..., 4'). Каждое такое неравенство может быть оформлено как ограничение значения функционала типа (9). Функционалы типа (10) появляются таким же образом из требований (х(Г), и(Г)) Е б С ттл+', У Г м 10, Т1. Существуют причины, оправдывающие выделение (9) из более общей конструкции (1О). Мы их сейчас обсудим. «Измеримое» управление. Для того чтобы задача оптимального управления была поставлена достаточно четко, нужно указать то Функциональное пространство, в котором разрешается искать и( ).
При этом следуег учесть чисто теоретические аспекты с одной стороны (это пространство должно быть достаточно широким, чтобы в нем существовало решение задачи), и интересы практики — с другой (найденное оптимальное управление должно быть достаточно простой функцией, чтобы его можно было использовать при управлении данной технической системой, например ракетой). Удобным оказался класс измеримых функций. При этом не возникает трудностей при интегрировании системы (5).
Теория, как известно, требует От 7(Г, х, и(Г)) выполнения условия Липшипд по х и довольствуется произвольной, в сущности, зависимостью от к Конечно, класс измеримых (т.е. произвольных) функций слишком широк, техническая реализация такого управления кажется нереальной. К счастью, ситуация здесь оказалась достаточно благоприятной: при решении прикладных задач оптимальное управление, как привило, оказывается не очень сложно устроенной кусочно- гладкой функцией. Поэтому термин «измеримая функцияь практически означает, что никаких требований гладкости функции и(Г) мы не ставим. В большинстве случаев достаточным был бы класс функций, имеющих конечное число разрывов.
Между точками разрывов управление можно считать достаточно гладким. Правда, ни положения точек разрыва, ни их число заранее не известны. Приближенное решение. Алгоритмы приближенного решения задач оптимального управления формально мало отличаются от алгоритмов решения задач математического программирования. Но здесь есть своя специфика, и некоторые алгоритмы практически оказываются почти нереализуемыми. Первый специфический момент — это вычисление производных (Мы пока ограничимся задачами, в которых все функционалы дифференцируемы по Фреше). Основу алгоритмов составляет формула первого члена ряда Тейлора.
При малом изменении управления и( ) функцией би( ° ) происходит малое изменение функционала: г(и( ) + би( )) = г!и( )3 + био> ои( ПРИБЛИЖЕННЫЕ МЕТОДЫ ВЫЧИСЛИТЕЛЬНОЙ ФИЗИХИ 1ч. и 458 Эта абстрактная формула должна быть конкретизирована: т ЗР1В~ >1 Ьи(.) — $ (н(С) Ьи(С)) 1К В ( ) где х(г) — траектория, соответствующая и( ).
Функция У(Т) для данного функционала легко вычисляется. Например, для Р вида (7) имеем У(Т) = Ф„]б х(г), и(Т)]; . для р вида (8) У(г) = Ф.!х(Р)] Ь(~ — Р). Здесь Ь(Т вЂ” Р) — функция Дирака с полюсом в точке Р. После решения уравнения (12) функциональная производная вычисляется по формуле, полученной в з 27: и(Т) =/'„[О х(Т), и(Т)] чр(Ю)+Ф„]Ю, х(2), и(Р)]. (13) Реализация вычислительной схемы требует конечномерной аппроксимации всех объектов. Опишем возможный вариант. Сетка и управление. Введем на ]О, Т] сетку О = гв < г, < ...