И.М. Гельфанд, С.В. Фомин - Вариационное исчисление (1118004), страница 34
Текст из файла (страница 34)
Тогда в каждой точке направление кривой есчь направление распространения возбуждения в том смысле, как это было только что определено. Действительно, вдоль той кривой, направление которой в каждой точке есть направление распространения возбуждения от данной поверхности 5(х, 1) = О к близкой, возбуждение проходит быстрее, чем вдоль какой-либо другой кривой. Таким образом, фиксировав однопараметрическое семейство поверхностей 5 (х, 1) = 0 и точку хз, мы получим некоторую траекторию возбуждения. Выбирая точку хз произвольно, мы получим, что однопараметрическое семейство поверхностей 8(х, 1) = 0 определяет семейство траекторий возбуждения, зависящее от и — 1 параметров; при этом через каждую точку х пространства Х проходит одна и только одна траектория из этого семейства. Рассмотрим теперь полный интеграл уравнения Гамильтона— Якоби, т.
е. его рещение 8(х, 1, ап ..., а„), зависящее от п параметров. Этот полный интеграл определяет (и+ 1)-параметрическое "*) семейство поверхностей о'(х, 1, ан ..., а„)=0. Это семейство поверхностей определяет (2л — 1)-параметрическое семейство траекторий возбуждения. Так как траектории возбуждения — это экстремалн функционала (6), то полученный результат представляет собой геометрическую интерпретацию теоремы Якоби ") Физически зто означает следующее, Если поверхность (а) изменить лишь в малой окрестности точки х, то поверхность (б) прн атом изменится также лишь в некоторой малой области. **) Так как 5(х.
Г+ам аь ..., а„) = 0 при всяком Гя тоже представляет собой интегральную поверхность, то данное семейство действительно зависит от л + 1 параметров. РАспРостРАнение Возвуждения и кАнонические уРАвнения 2!7 о построении общего решения системы уравнений Эйлера по полному интегралу уравнения Гамильтона — Якоби "). 6. Уравнения траектс -ий возбуждения. Выведем теперь дифференциальные уравнен,'я траекторий распространения возбуждения. Примем за параметр вдоль каждой из таких траекторий время 1. Тогда из равенства И=У(х, дх) и однородности функции У по дх получаем: у (х, — „)=1, дх т.
е. Норма вектора — тождественно равна единице. Из соотношеш дх ния (14) следует, что в каждой точке х вектор — (касательный дг к траектории, вдоль которой Распространяется возбуждение) связан с ковариантным вектором р (определяющим гиперплоскость, касательную к фронту волны) соотношением дх' ~~~~~ рг — „= Н(х, р). 1-1 Лля любого другого вектора р, по определению нормы вектора в сопряженном пространстве, имеем: л Х с)х' р,— „1 ( Н(х, р).
1 1 Таким образом, выражение а Х т с1х' р! — „— Н(х, р), 1=1 рассматриваемое как функция от р, достигает максимума в том случае, когда р определяет гиперплоскость, касательную к фронту волны. Поэтому вдоль траектории распространения возбуждения выполнены условия л д )ж1 Лх1 — у р; — — Н(х, р) =О, 1 1 *) Мы рассматриваем параметрическую задачу; в этом случае между уравнениями Эйлера имеется зависимость (см. гл. 11, 5 8 и гл. ЧП, 8 ЗЗ), поэтому общее решение получающихся здесь 2л уравнений содержит только 2л — ! произвольных постоянных. 218 дополнвнив ~ т.
е. Их' дН(х, р) (17) дГ др; а значения рн ..., р„ в каждой точке траектории — это компод8 ненты —, вектора, определяющего гиперплоскость, касательную дх' к фронту волны. Поэтому вдоль каждой траектории имеем; д дх' следовательно, л др~ д дй д д8 С~ д'5 ихl дГ й дх' 'дГ дх' дхудх' дГ у-1 (18) Введем теперь следующие обозначения. Если функция Н(х, р) рассматривается при р = — как функция от х', ..., х и 1, то дЗ 1 и д .ю соответствующую частную производную ее по х' будем обозначать символом дН дх' ~ Если же Н(х, р) рассматривается как функция 2п переменных Р,, ..., Р„, х', ..., х", то соответствующую частную производную обозначим дН лх' я=сонм Мы получили систему и обыкновенных уравнений 1-го порядка. Так как в них входит 2п неизвестных функций х', ..., х" и рн ..., р„, то для полного описания траекторий нужно получить еще п уравнений.
Для получения недостающих уравнений воспользуемся тем, что поверхности, представляющие собой фронт волны в различные моменты времени, не произвольны, а удовлетворяют уравнению Гамильтона — Якоби яаспвоствхняннз воззтждения и канонические пвхвняния 219 Воспользовавшись уравнением Гамильтона — Якоби, мы можем равенство (18) переписать в виде др, дН \ ' д'5 с)ху + г, /=1 (19) Найдем связь между значениями производных дН дН и вдоль каждой траектории.
Имеем: дН дН др7 у 1 Ы-сопи "х' С=сопсС д5 дху дН Так как вдоль каждой траектории р) — — и = —,то из(19) дхз дГ др) получаем: дрс дН де дх' ~р.„„м Мы получили таким образом и уравнений, которые вместе с уравне- ниями (17) образуют систему дхс дН(х, р) дг др; др, дН(х, р) д) дх' (20) интегральными кривыми которой являются линии распространения возбуждения, т. е. зкстремали функционала (6). Система (20) представляет собой систему канонических уравнений для вариационной задачи (6). По отношению к уравнению Гамильтона — Якоби (16) система (20) является системой уравнений характеристик.
ДОПОЛНЕНИЕ П ВАРИАЦИОННЫЕ МЕТОДЫ В ЗАДАЧАХ ' ОВ ОПТИМАЛЬНОМ РЕГУЛИРОВАНИИ 1. Здесь мы кратко изложим некоторые результаты, относящиеся к так называемой теории оптимальных процессов. Эти результаты принадлежат Л. С. Понтрягину и его ученикам; они содержатся в монографии Л. С. Понтрягина, В. Г. Болтянского, Р. В. Гамкрелидзе и Е. Ф. Мищенко «Математическая теория оптимальных процессов» "). Рассмотрим связь этой теории с классическими вариационнымн задачами. Нахождение для некоторой системы режима работы, наивыгоднейшего с той или иной точки зрения, приводит к математической задаче, которую можно сформулировать так. Пусть закон изменения состояния некоторого объекта с течением времени дается системой дифференциальных уравнений йх' — =уч(х', ..., х"; ин ..., и»), или в векторной форме — =2 (х, и), йх (2) где х', ..., х" — функции времени Е а У'(х, и) — функции, определенные и непрерывные для всех х ~ Х н всех и = (и,, ия, ..., и„), принадлежащих некоторой фиксированной области й А-мерного пространства "*).
Задав функцию и = и(г) (со значениями из й), мы получим вместо системы (1) систему., = У'(х', .... х": и, (1), ..., и (1) ), (3) ') См. также Л. С. Понтрягин, Оптимальные процессы регулирования, Успехи матем. наук, 14, )Чь 1(85), 1959, стр. 3 — 20; В. Г. В ол танскийнй, Р. В. Гамкрелидзе н Л. С. Понтрягин, Теория оптимальных процессов. 1, Изв.
АН СССР, сер. матен., 24, 1960, стр. 3 — 42. '*) В указанных в предыдущей сноске работах рассматривается более общий случай произвольного топологнческого пространства ы. ВАРиац. методы В ВАЛАВАх ОБ ОптимАльном РЯГУлиРОВАнии 221 которая при заданном начальном значении х (Г,) = хе имеет некоторое определенное решение. Функции и,(1), ..., и»(Г) мы будем называть функциями управления. Задав эти функции на отрезке [Гв, 1,[ и начальное значеьие хе= х(ГВ), мы получим некоторую траекторию, т. е.
решение системы (1). Мы будем называть «управлением» совокупность функций и,(1) отрезка [гв, Г,[ и начальной точки х. В соответствии с зтим управление будет обозначаться символом и=(и(1), 1в, (п х,). Пусть далее гв(х', ..., х", и,, ..., и») — некоторая функция, определенная вместе со своими частными производными Ц вЂ” 1, 2,...,п) дхт при всех х~Х и всех и~ьа. Каждому управлению (.г поставим в соответствие число Ли[=Г в(х ) (4) Таким образом, л'[(г[ есть функционал, определенный на множестве управлений. управление сг =(и(Г), (в, Гн хв) назовем оптимальным, если, каково бы ни было управление с|*=(и*(г), гв, гм хв)„ переводящее данную точку хв в точку х, (т.
е. такое, что соответствующая' траектория х'(Г) удовлетворяет условию х'(Г,") = х,), имеет место неравенство у[и[ < у[и*[. (5) Траекторию, отвечающую оптимальному управлению, назовем оптимальной траекторией. Задача состоит в том, чтобы найти необходимые условия оптимальности управления (и соответствующей траектории). Подчеркнем следующее. Говоря об оптимальности того или иного управления, мы предполагаем, что заранее фиксирован некоторый класс управлений; мы будем называть зти управления допустимыми. Здесь мы будем предполагать, что класс допустимых управлений состоит из всех Кусочно-непрерывных ограниченных функций с разрывами первого рода, в каждый момент времени принимающих зна-. чения из обяасти Ь1.
222 дополнение и Важным частным случаем задач об оптимальном регулировании является тот случай, когда функционал (4) имеет вид Е, ~ и, т. е. предстзвляет собой время, за которое совершается переход из точки хв в точку хп Таким образом, здесь оптимальность означает переход из ха в х, за возможно более короткое время. 2. Задача об оптимальном управленим тесно связана с традиционными задачамн вариационного исчисления.
Действительно, интеграл / гв(х, и)си можно рассматривать как функционал, зависящий от и + ут функций х', ..., х"; ип ..., иа, т. е. как функционал, определенный на некотором классе кривых в (и + л + 1)-мерном пространстве. Функции х', ..., х", ип ..., и» связаны уравнениями (1). Таким образом, мы имеем здесь задачу на условный экстремум с неголономными связями (см. по этому поводу гл. П1, Э 1О). Граничные условия, состоящие в том, что искомая оптимальная траектория х (г) начинается в точке хв н кончается в точке хп означают, что в указавном (и+в+1)-мерном пространстве допустимыми являются те кривые, концы которых лежат на двух (Й+ 1)-мерных плоскостях, определяемых заданными значениями (х', ..., х,") и (х,', ..., х",) координат х', ..., х".
Мы видим, что задача об оптимальном регулировании представляет собой видоизменение задачи на условный экстремум. Особенность, характерная для задач об оптимальном регулировании, состоит в том, что заранее фиксируется определенный класс допустимых управлений, причем непрерывность функций управления, вообще говоря, не требуется, но предполагается, что они принимают значения, лежащие в некоторой фиксированной области. Покажем, что простейшая вариационная задача в и-мерном пространстве, в которой подынтегральное выражение не зависит явно от Ге), является частным случаем задачи об оптимальном регулировании. Пусть дан функционал (6) *) Это условие не является ограничением, так как к такому виду можно привести любой функционал, например, перейдя к параметрической форме задачи.