Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 42
Текст из файла (страница 42)
5 (почти для всех С, с« ~ С ( с,) выполнены соотношения; —,'„-,л«с«>,*«). ~. с«)= ь""",„" "«"+с<«-«. с=1, 2,..., и. Из зтих равенств следует, что с(с« ~ О, так как в противном случае мы имели бы с)сс (с) = О, с = О, 1,..., и. Следовательно, мы можем считать, что с)с = — 1, так как ф« = сопз1 =.0 (см. теорему 6), а величины фо, чсс, ... ..., ф„определены лишь с точностью до общего положительного множителя пропорциональности. Полагая в предыдущих равенствах с)св = — 1, мы получаем (почти всюду на отрезке С«( С ( С,) с)с (С) дс (с, х(с), (с)) с = 1 и (9) да С другой стороны, подставляя в уравнения (7) ф« = — 1 и интегрируя, мы находим с ~ д)(т, я(т), и (т)) с = 1,..., и, с«(с(сс, (10) Из (9) и (10) мы получаем уравнения Эйлера в инисееравьной форме (подставив вместо ис(С) производные— вес (с) ссс (см.
(4)): д! (с, *(с), () ) ( д! (т, (т), — ()) (=) )" — СР— — «„-,;~.> с'=1,..., и, где символ ( = ) означает, как и в главе 2, что равенства выполняются почти для всех С, Св ( С ( с . Дифференцирование по С (при условии, что функция ! и зкстре- ОСНОВНАЯ ЗАДАЧА в зз! маль х(1) дважды непрерывно дифференцируемы) дает уравнения Э "лера в обычном виде 1 = 1,..., И. Предположим теперь, что функция у (1, х, и) имеет в т о р ы е непрерывные частные производные по переменным и',..., и".
Тогда, если функция е еЯ (1)!(1), х(~), г, и) = ~(~, х(г), и)(- ~, '!Р (~) и'", и=! как функция переменного и, достигает в точке и = и, максимума, то квадратичная форма е ~" (Ф (1), х(1), 1, ие) 5"Р = ,з=! — О вз а 1(С, х(1), ие)Ц $ а,з 1 неположительна (при любых З1,..., $"). Следовательно, из условия максимума (8) вытекает, что почти для всех ~, ге =. 1 ( 1ы выполняется неравенство о„.о„з Это условие, необходимое для того, чтобы кривая х (~) была зкстремалью интеграла (3), называется условием Лежандра. Канонические переменные Пусть, как и выше, и (!), х (!), ~е ( ~ ( 11, — оптимальное управление и оптимальная траектория задачи (4), (5), а !р (Ф) = ( — 1, ф! (8),..., ~К, (с)) = ( — !, ф (8)) — соответствую!цее им ненулевое абсолютно непрерывное решение системы (7). ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ и'л. 5 268 Обозначим через Ф (1р, х, г) точную верхнюю грань значений функции аз (чр, х, Г, и) при фиксированных Ф=( — 1 1р) м(1р, х, 1) = зпраа" (я, х, 1, и) = айви п = ЗПР ( — Я, Х,и)+ У, 1уаиа).
ии Е„а=1 Предположим, что уравнение ай" (1р, Х, 1, и) = ей(1р, Х, Е) (11) имеет единственное решение (12) и=и(1(1, х, 1), определенное, непрерывное и непрерывно диффвренцируе- мов по своим аргументам при ~,==С~Г, !х1 — х'(Ю)~<б, ~ р1 — ~р,.(Г)~<б, 1=1,..., и, (13) Н Й, х, ~) = — 1(г, х, и (Ф х, с)) + Х Ф и (Ф, х, г) а=1 — функцией Гамильтона. Так как оптимальное управление и (г) почти всюду на отрезке 1а ~ г ( г1 удовлетворяет условию максимума (8) (напомним, что 1ра — — — 1) и так как и (1р, х„с)— е д и н с т в е н н о е решение уравнения (11) (при условиях (13)), то (почти всюду на отрезке ~, ( ~ ~ 11) и (г) = и (1р(1), х(1), 1) = (14) Можно даже утверждать, что равенство (14) выполняется в с ю д у на отрезке га == ~ ( гм В самом деле, так как где б — достаточно малое положительное число.
При этих условиях пвременныв (х',..., х") = х, (121,..., ф„) = 1р назовем каноническими переменными рассматриваемой оптимальной задачи, а функцию ОСНОВНАЯ ЗАДАЧА а 29) равенство (14) выполняется почти всюду, то х(с) = х(С,)+ ~ и(ф(т), х(т), т) сст. Но подынтегральная функция н е и р е ры в на по т (ибо решение (12) непрерывно по совокупности своих аргументов), и потому в к а ж д о й точке отрезка С, ( с ( с, производная интеграла равна подынтегральной функции. Иа равенства (11) следует, что частные производные функции а2('(ср, х, С, и) по ис, с = 1, ..., п, обращаются в нуль при и = и (ср, х, С) (если выполнены условия (13)): д)(с,х,и(1),х,с))+„р О, с= 1,..., л.
(15) диС 1 Следовательно, дН(1)1, х, С) д111 а и = — т — — — ' ' +пс(ф,х, С)+~ М— %1 дС диа (1)1, х, С); %1 диа(~К х,С) а=1 а 1 = ис(ф, х, с)+ т ~1(са — — „) — = и (ф, х, с); дс '1 диа а=1 дн(),, с) дхс и п д) у д) диа(~з, х, с) у диа(Ч>, х, с) а=с д) Ч,1 С' дс '1 диа дг(С,х, и(ф, х, С)) = — —;+ ~~, ~сра / — 1 —— а=1 Полученные соотношения, в силу (14), (7), приводят нас 270 ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ (гл. в к каноническим уравнениям Эйлера — Гамильтона: ах~ дН й дэч' 1=1,..., и, а'ф дН де дх~' которым удовлетворяют в каждой точке отрезка 8в =. 7 - с, координаты вектор-функций х (7) = (х' (7), ..., х"(С)) и ф(7) = (ф (7),, ф„й)). Предположим, наконец, функцию 7(~,х,и) д в а ж д ы непрерывно дифференцируемой по переменным и1,..., и" и пусть определитель ! д 7ду7(е, х(г), и(ф(К), х(е), с)) ! (16) отличен от нуля при ее ( е ( е,. В этом случае система уравнений — ~=0, ~=1,...,, Д7) однозначно разрешима относительно и',..., и", если х' и фе мало отличаются от х' (7) и ф, (8), и, в силу (15), решение этой системы совпадает с функцией (12).
Таким обраэом, данное нами выше определение канонических координат согласуется с обычным определением этих координат с помощью системы (17) при условии, что определитель (16) не обращается в нуль. 3 а м е ч а н и е. Если предположить, что функция 7 (7, х, и) определена не для всех вещественных значений переменных и',..., и", а только при и~: У ~ Е„, где У— некоторое открытое множество в Е„, то (после очевидных иэменений в определении экстремалей для интеграла (3)), все наложенное остается в силе.
Надо только в соответствующей оптимальной задаче (4), (5) в качестве области управления ваять не все пространство Е„, а его открытое подмножество У. Это замечание относится и к следующему параграфу. а за1 злдьчл лагэлнжа э 30. Задача Лагранжа Формулировка задачи Пусть заданы й функций ~'(Ц х', ..., х", э',..., э" ")=~'(Ц х, г), 1=1,..., Й, непрерывных и непрерывно дифференцируемых по всем аргументам при (г, х)~6 и при любых значениях вектора и = (э',..., э"), где г = п — й. Рассмотрим следующую систему й дифференциальных уравнений с и неизвестными функциями х' (1), ..., х" (г): Ых' ЫХг+' с7х" ~ сЬ~ 0хч ~ 1=1, ..., Й(я.
Абсолютно непрерывную кривую х (1), сг ( г ( т, целиком лежащую в области 6, будем называть допустимой, если она удовлетворяет краевым условиям (2), а ее координаты — системе (18). Далее, абсолютно непрерывную кривую х (г), гг ( г( с„мы будем называть экстремалью для функционала (3) при заданных краевых условиях (2) и заданной системе (18), если х (г) — допустимая кривая и существует такое з ) О, что Х (х) ( (Х(х) для любой допустимой кривой х(г), гг ( г ( т„лежащей в в-окрестности кривой х (1).
Задача Лагранжа (с закрепленными концами) при заданных краевых условиях (2) и ааданной системе (18) заключается в нахождении всех экстремалей для функционала вида (3). Покажем, что эта аадача сводится к некоторой оптимальной задаче. Для симметрии введем обозначение (о(с х э) = ~ (Ц х, /' (г, х, э),..., ~ь (г, х, э), э',..., э"), (19) гдв функция ~ (1, х, и',..., и") определена в предыдущем параграфе. ВАРИАЦИОННОВ ИСЧИСЛЕНИБ игл. з Рассмотрим систему и-го порядка —,=9(1, х, Р), 1=1,..., й, ЛхА" 1 -=Р, !=1,..., и — Й=г, (20) в которой через Р = (Рг,..., и") обозначен управляющий вектор.
Допустимыми будем считать любые измеримые ограниченные управления, т. е. областью управления служит все г-мерное пространство Е„переменных Р', ..., Р'. Требуется найти допустимое управление Р (~), которому соответствует траектория х (~) системы (20), удовлетворяющая краевым условиям (2) и минимизирующая интеграл Очевидно, что всякое решение этой оптимальной задачи (с закрепленным временем) является зкстремалью для рассмотренной задачи Лагранжа и, наоборот, произвольная зкстремаль х (е) = (хх (с),..., х" (е)), й, -= г ( к„задачи Лагранжа является оптимальной траекторией, соответствующей оптимальному управлению А )' Правило множителей Лагранжа ПУсть Р (~), 1, ( ~ -= ~м — оптимальное УпРавление, х (~) — соответствующая ему оптимальная траектория системы (20), удовлетворяющая краевым условиям (2). Пусть, далее, ф (г) = Ще (г),..., ~р„(~)) — соответствую- Легко видеть, что и, обратно, всякая оптимальная задача с закрепленным временем является задачей Лаграшка (с закрепленными концами), если класс допустимых управлений состоит из произвольных ограниченных измеримых управлений, а область управления совпадает со всем пространством В,.
з оо! ЗАДАЧА ЛАГРАНЖА 273 а=! Далее, мы имеем, в силу (19), дуо д! чо д! дуа диа дх! ' а=1 о дуо ду чо д! дуа а = 1 Следовательно, система уравнений для вспомогательных неизвестных ф! имеет вид (см. теорему 6) —,=0 дфо до (24) а А дио д; а=1 а=1 1=1,...,и. Из условия максимума (теорема 6) получаем почти всюду на отрезке уо ( ! ( у! (см. (23)) — '„ох<о!о.*!а! (о!1-)( —",,о ~ нфо.-~ а=! + ~~ !. ор +ор „.=О, у'=1, ..., и — й.