И.М. Гельфанд, С.В. Фомин - Вариационное исчисление, страница 35
Описание файла
DJVU-файл из архива "И.М. Гельфанд, С.В. Фомин - Вариационное исчисление", который расположен в категории "". Всё это находится в предмете "дифференциальные и интегральные уравнения и вариационное исчисление" из 4 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 35 - страница
влгилц. методы в задачах ов оптимальном гвгглиговлнии 223 требуется среди кривых, проходящих через точки (хо1, ..., х,") и (х,', ..., х,"), найти ту, на которой этот функционал достигает минимума. Для того чтобы представить эту задачу как задачу об оптимальном регулировании, достаточно функционал (6) переписать в виде ~ Р(х', ..., х", иц ..., и„)Ж, (7) а в качестве системы (1) взять уравнения лх' гг ="~ (8) 3.
Перейдем теперь к изложению условий, необходимых для того, чтобы данное управление (и отвечающая этому управлению траектория) было оптимальным. Для этой цели присоединим к системе уравнений лх' — =7,(х, и), 1=1, 2, ..., л, от еще одно уравнение охо — = 7о(х, и), лг где уо(х, и) — функция, опрелеляющая тот функционал (4), который мы должны минимизировать. Одновременно начальные условия х'('о) = хо (9) мы дополним условием хо(~о) = О. (10) отвечающее этому управлению и начальным условиям (9), (10), то У((71 ~ Уо(х л)г(~ хо(Г ) Итак, задача об оптимальном регулировании может быть сформулирована так: найти такое допустимое управление (7, при котором Ясно, что если У вЂ” некоторое допустимое управление и х=х(~)— решение системы лх — =Уч(х, и), 1=0, 1, ..., и, (11) 224 дополнение и решение х(г) системы (11), удовлетворяющее начальным условиям (9), (10), давало бы возможно меньшее значение хо(1,).
4. П р и н ц и п м а к с и м у м а. Для того чтобы сформулировать основное необходимое условие оптимальности, так называемый принцип максимума, будем, наряду с переменными хо, х', ..., х", рассматривать новые переменные ф, фы ..., фи, которые будем считать подчиненными следующей системе дифференциальных уравнений *): и иф~ Ст ду» — '=-г,— ф. дх' а О (12) Положим и П(ф, х, и) = ~, ф„г "(х, и). «-о Если управление У=(и(г), То, гм хо) оптимально, то существует такая непрерывная вектор-функция ф(т), что: 1) величины х(1), ф(г) и и(т) удовлетворяют системе ура- внений и 1=0,1,...,п; ттт ду» дх' а О 2) для всех 1, Уо ( Т ( ~ы величина и Б(ф(Т), х(г), и'1 = ~~р~ ф.
(г)г "(х (1), и) «О достигает максимума при и =и(1); ') Эта система имеет следующий смысл Рассмотрим в пространстве Х переменных х,,..., хи некоторую гиперплоскость 7а. проходящую через начальную точку (О, х', „х,",). Пусть эта гиперплоскость определяется вектором (ф~~~,..., фо). Тогда уравнения (12) описывают перенос этой гиперплоскости вдоль траекторий, являющихся решениями уравнений (11). (ее называют системой, сопряженной системе (!1).
Сформулируем основную теорему. Теорема (принцип максимума). Пусть У=(и(1), 1О, анхо)— такое допустимое управление, что отвечающая ему интегральная кривая х(т) системы (11), проходящая при 1=1О через точку (О, х', ..., х,",), удовлетворяет условиям хг(«) х1 хи(«) — хи влгилц. методы в злдлчлх ов оптичлльном гвгэлиговлнии 225 3) в момент г, выполнены соотношения л фв(г~) = О, ~2~ ф„(11) У" (х ((г), и ((1)) = О. л ,~~ ф„У (х, и) достигает максимума. Если этим требованием и определяется как однозначная функция от ф и х: и = и (ф, х), то, подставив ее вместо и в уравнения (11) и (12), мы получим замкнутую систему 2(и+ 1) уравнений с 2(п+ 1) неизвестными функциями.
Это и есть те уравнения, которым должна удовлетворять оптимальная траектория. 2'. С помощью функции л П(ф, х, и) = ~ ф„У" (х, и) а=я систему уравнений (11), (!2) можно зйааисать в виде Нх' дП иг дфг ' (11') дф, дП Ш дх'' (12') Эти уравнения по форме напоминают канонические уравнения Гамильтона. На самом деле они имеют иной смысл: уравнения Гамильтона образуют замкнутую систему, в которой число уравнений равно числу неизвестных, а уравнения (11), (!2) содержат кроме х и ф неизвестные величины и и превращаются в замкнутую систему лишь при определенном выборе этих последних. При этом, если ф(г), х((), и(г) удовлетворяют условиям 1) и и 2), то функции фв(1) и ~~'.~ ф„(г) ° э" (х(г), и(()) переменного г на -о самом де.ге от Ф не зависят и тогда в условии 3) точку С, можно заменить .любой другой, 5. Мы не будем приводить здесь доказательство принципа максимума (читатель найдет его в цитированных выше работах), а ограничимся лишь следующими замечаниями.
1'. Часто принцип максимума может быть использован как рецепт для построения оптимальной траектории, состоящий в следующем. Выберем для каждых фиксированных ф и х то значение и, при котором выражение 226 дополнвниа и Для того чтобы в задаче об оптимальном регулировании получить уравнения гамильтоновского типа, ик нужно писать не с помошью функции П(ф, х, и), а с помошью функции*) а'101= / Р(х! ..., х", ин ..., и„)г(х, функция П(ф, х, и) имеет вид о П(ф, х, и) =фауо(х, и)+ „л, ф,и,. а ! Система (!1'), (!2') при этом перепишется так: их о о о1х! — =У (х, и), =иг, дт 1=1,2,...,и, дф! дР(х, и) дфо О дх! а условие максимальности П(ф, х, и) дает: дП дто(х, и) =0 т.
е. дУо(х, и) ди; Отсюда получаем: Гдт о (х и) 1 дго (х, и) дт ~ ди, „дх! дхг — =- ип 1=1,2,..., и, но это и есть не что иное, как система уравнений Эйлера, в котооой ") Перекоп от П а Н прелставляет собой аналог преобразования Лежандра (о преобразовании Лежандра см. гл. 12, б 16). !! (ф, х) = апр П (ф, х, и). и 3'. В простейшей задаче вариационного исчисления система (11), (12) или эквивалентная ей система (11'), (12') вместе с условием максимальности функции П(ф, х, и) представляет собой обычную систему уравнений Эйлера. Действительно, для простейшей задачи, записанной в виде влгилц, методы в злдлчлх ов оптимальном гегглиговхнии 227 у= ~,уе(х!, ..., х", и, ..., и )!?г, (13) где (14) Для этого случая, как мы уже знаем, выражение а П (ф, х, и) = ~ ф„,? (х, и) а=я имеет вид П (ф, х, и) = ф 7~(х, и) + ~ ф и .
1-! С другой стороны, с помощью ураМйений (14) функционал (13) можно записать в виде (15) ~,г'е(х',..., х", х', ..., х"')с!!. Функция Вейерштрасса для такого функционала имеет вид (см. гл. Ч!) Е(х, х',.з) = ?ч(х, з) — уч(х, х') — ~ (л — л',) у~! (х, х ). (16) ! 1 ") См. по этому поводу гл.!Ч, стр. 6?. для приведения ее к системе уравнений 1-го порядка производная их' — =и, пр!инята за новую искомую функцию"). иг = 4'. Мы уже встречались (см. Дополнение !) с тем, что всякий процесс распространения можно описывать двояко: или с помощью траекторий, по которым происходит распространение («лучи» в оптике), или с помощью движения фронта волны.
Первый подход приводит к каноническим уравнениям Гамильтона или, как здесь, к уравнениям Эйлера, т. е. к системе обыкновенных дифференциальных уравнений, а второй — к уравнению Гамильтона — Якоби, представляющему собой уравнение с частными производными. Изложенный выше принцип максимума связан с рассмотрением траекторий, т.
е. в этом смысле аналогичен методу канонических уравнений. Подход к задачам оптимального регулирования, аналогичный рассмотрению «фронта волны», развивался в работах Беллмана (см., например, Р. Беллман «Динамическое программирование»).
6. Укажем в заключение связь между принципом максимума и вейерштрассовским необходимым условием экстремума (см. гл. Ч1, стр. 149). Рассмотрим сначала задачу о нахождении минимума функ- ционала 228 дополнения и Из формул (15) и (16) получаем: П(ф, х, г) — П(ф, х, х') — у (х, — хи) — П(ф, х, х') = ди, С=1 =фаге(х, х) — фзуз(х, х')+~~) ф,(х,— хи)— «~~(х; х )(ф у; +ф;) = фиг (х х) фз.г (х, х ) л — ~ (хг — х')ф,у,и=фа Е(х, х', х).
(17) г 1 Если функция П достигает максимума при значениях и =х', являющихся внутренними точками области й, то в этих точках д11 — = О. ди~ Так как, кроме того, фе — отрицательная константа, то в этом случае условие максимальности функции Н вдоль оптимальной траектории равносильно в силу равенства (17) условию Е(х, х', г))~ О, т.
е. известному условию Вейерштрасса. Если воспользоваться выражением функции Вейерштрасса для задач на условный экстремум (см., например, Блисс «Лекции по вариационному исчислению», стр. 264), то легко проверить, что соотношение фаŠ— П(ф, х, г) — П(ф, х, х ) — (хг — х' ) — П(ф, х, х ) д ди~ остается в силе и в случае условного экстремума, т. е., иначе говоря, для любой задачи об оптимальном управлении. Из сказанного ясно, что в тек" случаях, когда множество допустим ык значений управляющих функций открыто (т. е. все его точки — внутрен; ние), принцип максимуиа равносилен известному необходимому условию Вейерштрасса. Однако в тех случаях, когда оптимальное управление попадает на границу области (а, условие Вейерштрасса, вообще говоря, не выполняется, в то время как принцип максимума верен и в этом случае. Заметим, что принцип максимума содержит, в частности, иной, независимый от изложенного нами в гл.
Ч1, вывод условия Вейерштрасса. .