Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 41
Текст из файла (страница 41)
Иначе говоря, здесь при определении оптимальных управлений и траекторий мы будем срявппнят>, траекторию х(1) не со всем и другпмп траекториями х(1), а только с траекториями, расположенпымп в о окрестности кривой х(1). Всякая траектория, оптпмалышя в смысле гл. !, 2, является оптимальной и в смысле принятого здесь определения, но, вообпп говоря, нс наоборот. Таким образом, оптимальных управлений и траекторий в принятом здесь смысле б ол ьш с, чем оптимальных управлений н траекторий в смысчс глав (, 2.
Нетруд>го понять, однако, что принцип максимума, как н е о б х о д и м о с условие оптималщюсти, для оптимальных управлений и траекторий в принятом здсс> смысле сохрпняетсл в той яге сил|ой грг>р>грлг>рог>ке. В самом дслс, прп докязатс.|ьсп>е принципа максил|ума в главе 2 мьг сравнивали траектории> х(1) только с трз скториями вида х*(1) = х (1) + я йх (1) + о (в), где в — бесконечно малая величина. Прг> достаточно мя лом с траектория х*(1) лежит в г>-окрестности кривой х(1) (каково бы нн было зада|гное число 6), и поэтому все рассуждения главы 2 проходят б е з и з м е и е н и й для управлений и траекторий, оптимальных в рассматриваемом здссь смысле.
оснгюпаа задача 273 уй =фа)(1, х, и)+ ф,и'+ фзнз+ ... + ф„и", Х'Фг д((б х, а) . 1 1 тО ~ ) .1 и ) сЫ дх~ (6) (7) Условие максимума, указанное в теореме 6, дает (почти всюду па отрезке (ч ( (( (и ср. теорему 8). Так как область управления (7 совпадает со всем пространством Г„(для справедливости послсдующик рассуждений достаточно было бы потрсбовать, чтобы оиа была открытым множеством в Е„), то точка максимума и = и(1) функции 'В(з~.((), х(г), 1, и), рассматриваемой как функция переменного и ~ К является ее ста ционарной точкой. Следовательно, из (8) вытекает, что Сформулированная оптимальная задача (4), (5) является задачей с закрепленными коицамй н закрепленным временем (см, Э Я), Очевидно, что всякая оптимальная траектория задачи (1), (5) является экстремалью интеграла (3) и наоборот (достаточно, в силу (4), заменить в интеграле (5) величины и'(1) производИхым т ными '„), Поэтому принцип максимума, представляющий собой необкодимос условие оптимальности, является в то же время и необходимым условием для того, чтобы кривая х()) была экстремальк) интеграла (3).
Это простое соображение и иозволяег применять принцип максимума при решении вариационной задачи (3). В силу теоремы 6 для решения поставленной оптимальной задачи мы должны составить уравнения для вспомогательных неизвестных фм ~);и ..., Н „ и функцию К, которыс, в силу (4), принимают здесь вид яхгим»иониог исчислгниг сгл о (почти для всех 1, со (1(1,) выполнены соотношения: д тл(Р(с) х(с) с сс(с)) 1 д1(с, х(с), и(с)) 1 су (с) О с'=1,2, ..., п. Из этих равенств следует, что с)со ~ О, так как в противном случае мы имели бы фс(1) = О, с = О, 1, ..., и. Следовательно, мы можем считать, что фо = — 1, так как сро = сопз( ( О (см. теорему 6), а величины»)со, сгь - -.
Ф определены ли)пь с точностью до общего положительного множителя пропорциональности. Полагая в предыдущих равенствах фо = — 1, мы получаем (почти всюду на отрезке 1,(1(1,) ср (1)= ' ' 1=1 н (9) дис С другой стороны, подставляя в уравнение (7) сро = — 1 и интегрируя, мы находим )+ ~ д)(т, х(т), и(т)) дхс н (10) с = 1, ° ° ° > сс> (о ~~1 ~~ус ° Из (9) и (10) мы получаем уравнения Эйлера в интегральной Форме (подставив вместо и'(1) производные (см.
(4)): (=) ) с йт+ сгс (со)» с = 1, ..., и, где символ (=) означает, как и в главе 2, что равенства выполняются почти для всех 1, 1о (1~ тс. Дифференцирование по 1 (при условии, что функция 1 и экстремаль х(1) дважды непрерывно дифференцируемы) дает 275 ОГНОВНАЯ ЗАДАЧА уравнения Зилера в обычном виде д((1, к(!(, — ) (д ~б к(!1, — ) '! дк! д! ди! 1=1, ...,п. Предположим теперь, что функция 1(!, х, и) имеет вторые непрерывные частные производные по переменным и', ..., и". 'Тогда, если функция к Я(ф((), х(1), 1, и) =1(1, х(1), и)+~', ф (() и', а-! как функция переменного и, достигает в точке и = ие максимума, то квадратичная форма и ~(ф((), х((),(, .)$ 5"= е, Р-! и — ." а ~(1, х(1), ио) $'$' аз ! неположительна (прн любых $!, ..., $").
Следовательно, из условия максимума (8) вытекает, что почти для всех 1, 1е < 1< (ь выполняется неравенство и,а ! Это условие, необходимое для того, чтобы кривая х(1) была экстремалью интеграла (3), называется условием Лежандра. Канонические переменные Пусть, как и выше, и(1), х(1), (з(1~ (!,— оптимальное управление и оптимальная траектория задачи (4), (5), а !р (г) = ( — 1, ф! (1),..., ф, (1) ) = ( — 1, ф (1) )— соответствуюшее им ненулевое абсолютно непрерывное. решение системы (7). ялгилппоннс)г пг~игслГси!Р 276 ггл, г Обозначим через .Уу (гй, л, с) точную верхиюго грань значений функции,Ж(г)х х, с, и) при фиксированных гй = ( — 1, гр), х, й М (гр, х, 1) = апр Ж (г), х, С, и) =— «=е л « =-й ( — сск .сг-Ег:«).
««-Е «=! « Предположим, что уравнение Я(г1, х, 1, и) = «г'!гй, х, г) (1! ) имеет единственное решение и =- и (гр, х, 1), 112) определенное, непрерывное и непрерывно дифферепцп- руемо по своим аргументам прн 1, ==Л=-Ло ! х' — х'(1) ! < ! Р, — Рс (1) ! < б, с'=1,..., и, (! 3! где б — достаточно малое положительное число. Прп этих услопиях переменные (х', ..., х") = х, (фс, ..., ф«) = г)г назовем каноническими сгеременньслси рас- сматриваемой оптимальной задачи, а функцию « Г7(г)г, л., 1) = — ) (1, х, и (г), х, 1)) + ~ гр„сс«(г)г, х, 1) «=! — функцией Гама.гьтони.
Так как оптимальное управление и(!) почти всюду на отрезке 1« ( С "' 1! удовлетворяет условию максимума (8) (напомнилг, что г!гл = — 1) и так как и(ф, х, 1) = с д и н с т в е н н о е решение уравнения (11) (при услови- ях (!3) ), то (почтп всюду на отрезке г, (1 ( 1!) и(1) =и(ф(1), х(!), !) = (14) Иожпо даже утвсрждать, что равенство (14) выпол- няется в с со д у на отрезке 1, < 1 ( 6!. В самом деле, так как равенство (!4) выполняется почти вподу, то х(1) =х(1«)+ ~ и(гй(т), х(т), т)с(т, с, Основ««хя зхлк'«л 217 Но подыпте«ральная функция и е п р е р ы в н а по (ибо реп«ение (12) нспрерыппо по совокупности своих аргументов), и потому в к а «идой точке отрезка („( ~ ( ="!«производная интеграла равна подынтегральной функции.
!1з равенства (!!) следует, что частные произво (- пые функции М(ф, х, (, и) по и', ! = 1, , п, обраща«отея в нуль при и =- и(ф х, () (если выполнены условия (!3)): ди« Следовательно, дН («!«, х, () дф« х — — + и«(ф, х, () + а« а' ««их щ х «) « ~ дич(ф х «« дхч д«)«« дчн а « а=« =и«(ф, х, !)+ ~(«! — —,1' =и«(ф, х, (); д««~у дф, а-« дН(4ь х, Ц дх' д ~' д«ди~(«!«, х,() ~ ди'(4ь х, «) дх( " до~ дх' ~ дх' фи и ь — « и дх« ~ «, х- « д«ди" д«Р, х, и(4«, х, «Н дичх дх« дх« Цх' дн М д«г« ' д«(«« д! дг( ' Полученные соотношения, в силу (14), (7), приводят нас к каноническим ураене««ия««Эйлера — Гамильтона: пл. г ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ 278 которым удовлетворяю1 в каждои гочке отрезка 1о ( (1 = 1~ координаты вектор-функций х(1) = (х'(!), ...
..., х" (1)) и ф(1) = (ф (1), ..., ф„(1)). Предположим, наконец, фупкциго 1(Е х, и) з н а ж д ы непрерывно дифферепцируемой по переменным и', ... ..., и" и пусть определитель ! д' 1(1, хий, и !ф(г'), х(1), 1))~ ди' диг отличен от нуля прп 1Р ( т =' тг. В этом случае системз уравнений чч — ' ".") =О, -=1,. „11 ди' однозначно разрешима относительно и', ..., и", если х' и ~; мало отличаются от хе(1) и ф(1), и, в силу (15), решение этой системы совпадает с функцией (12). Таким образом, данное нами выше определение канонических координат согласуется с обычным определением этих координат с помощью системы (17) при условии, что определитель (!6) не обращается в нуль.
3 а м е ч а н и е. Если предположить, что функция 7(Е х, и) определена не для всех вещественных значений переменных и', ..., и", а только при цен(/сЕ„, где (7 — некоторое открытое множество в Е„, то (после очевидных изменений в определении экстремалей для интеграла (3)) все нзлогкецпое остаегся в силе. Надо только в соответствующей оптимальной задаче (4), (5) в качестве области управления взять не все пространство Е„, а его открытое подмножество ~l. Это замечание относится и к следующему параграфу.
$ 30. Задача Лагранжа Формулировка задачи Пусть заданы й функций )ч(1, х', ..., х", о', ..., си' «) ~'(1, х, и), 1 1, ..., й, непрерывных и непрерывно дифференцируемых по всем аргументам при (1, х) е= б и прн любых значениях век- ЗАДАЧА ЛАГРАНЖА тора о = (о'...,, о"), где г = п — й. Рассмотрим сле- дующую систему й дифференциальных уравнений с а неизвестными функциями х'(1), ..., х" (1): (18) ~" =1'(1, х, о), У 1, ..., й, Их+~ г (20) в которой через о = (о',, о') обозначен управляющий всктор.
Допустимыми будем считать любые изме- Абсолютно непрерывну|о кривую х(1), Уо ( У ( Уь целиком лсжащую в области 6, будем называть допустщяой, если она удовлетворяет краевым условиям (2), а ее координаты — системе (18). Далее, абсолютно непрерывную кривую х(1), Уо < У ( Уь мы будем называть экегремалью для функционала (3) при заданных краевых условиях (2) и заданной системе (18), если х(У) — допустимая кривая и существует такое г ) О, что У(х) (У(х) для любой допустимой кривой х(1), Уа ( У ~ Уь лежащей в з-окрестности кривой х(1).
Задача Лагранжа (с закрепленными концами) прн заданных краевых условиях (2) и заданной системе (!8) заключается в нахождении всех экстремалей для функционала вида (3) . Покажем, что эта задача сводится к некоторой оптимальной задаче. Для симметрии введем обозначение 10(У, х, о) = =У(У, х, У'(Х, х, о), ..., У~((„х, о), о', ..., о'), (19) где функция У(1, х, и', ..., и") определена в предыдущем параграфе.
Рассмотрим систему п-го порядка [гл. а 280 ВлгиА!1ионног исчислвниг римые ограниченные управления, т. е. областью управления служит всс г-мерное пространство Е, переменных и',, о'. Требуется найти допустимое управление о(1), которому соответствует траектория х(() системы (20), удовлетворяющая краевым условиям (2) и минимизирующая интеграл у ( ) ~ гг (( (() и (()) (( Очевидно, что вся кое решение этой оптпм альпой задачи ( с закрепленным временем ) является экстрем алью для р а осмотренной задачи Л а гр а н >ка и, па оборот, произвольная экстремаль х(1) = (х'(1), ..., х" (!)), 1„( задачи Лагранжа является оптимальной траекторией. соот|и тствующей оптимальному управлению (2() Легко видеть, что и, обратно, всякая оптимальная задача с закрепленным временем является задачей Лагранжа (с закрепленными концами), если класс допустимых управлений состоит из произвольных ограни.
чениык измеримых управлений, а область управлении совпадает со всем пространством Е,. Правило множителей Лагранжа Пусть и((), 1о ( 1 ( гь — оптимальное управление, х(() — соответствующая сму оптимальная траектория системы (20), удовлетворяющая краевым условиям (2). Пусть, далее, ф(У) = (фч(У),, ф„(()) — соответствующая функциям х(~), и(() ненулевая абсолютно непрерывная всктор-функция.