Ф.П. Васильев - Численные методы решения экстремальных задач (1125247), страница 101
Текст из файла (страница 101)
Для того, чтобы фазовые координаты объекта (процесса, системы) (7) были определены в виде функций времени х=х(1) на некотором отрезке 1«<1< Т, необходимо в начальный момент времени 8о задать начальное условно х(го)=хо и параметры управления и =(и', и', ..., и') как функции времени и = и(1) при ~ оп [1«, Т~. Тогда фазовые координаты х = х(~). будут определяться как решение следующей задачи Коши: х(1)=[(х(1), и(1), 1), г,<1< Т, х(С,) = х,. Нетрудно видеть, что функции и = и(1), называемые управлениями, должны удовлетворять определенным требованиям непрерывности, гладкости, так как, с одной стороны, при слишком «плохих» (слишком «разрывных») и (1) задача (8), (9) не будет иметь смысла, с другой стороны, слишком «п11охая» функция и(~) не будет иметь физического смысла управления. В большинстве прикладных задач в качестве управлений и = и(1) могут быть взяты кусочно-непрерывные функции.
Напоминаем, что функция и(1) называется кусочно-непрерь1внои на отреаке [«„Т1 если и(т) непрерывна во всех точках «н [~,, Т1 за исключением, быть может, лишь конечного числа точек т„..., т»~ [1«, Т1, в которых функция и(1) может терпеть разрывы типа скачка, т. е. существуют конечные пределы [пп и(~) = и(то — О), [по и(1) = и(т«+ О), 1 Ч-о 1 1+О но, вообще говоря, и(т,— 0)Фи(т;+О) (1=1, ..., р). В тех прикладных задачах, в которых разрывные управления технически нереализуемы, рассматриваются лишь непрерывные управления и(~). Встречаются также задачи, в которых, кроме непрерывности, от и(1) требуется существование кусочно-непрерывной производной и(1) — такие управления называют кусочно-гладкими.
В теоретических исследованиях упомянутые классы кусочпонепрерывных, кусочно-гладких управлений часто бывают слишком узкими, и вместо них прпходится рассматривать более широкие классы управлений, такие, как, например, пространство Щ [8о, Т) при некотором р (1 < р < ) [1791. Через Тр [1«, Т[ при 1 < р< будем обозначать пространство измеримых вектор-функций и(1) =(и'(1), ..., и" (Е) ) (1, < Ю < Т), для которых функция [и(с) [" суммируема на [~„Т1 в смысле Лебега, и, ПРИНЦИП МАКСИМУМА ПОНРРЯГИНА [гл. 6 следовательно, имеет смысл норма ~т ~пр (и1ь„= ~ ~ ! и (1) (р г)г), 1 ( р <" о Если р= с, то под Ь" (гр, Т) понпмается пространство ограниченных иамеримых вектор-функций и(г) = (и' (г), ..., и'(1) ) (1,(1~ Т), с нормой '1и)ь = езз зпр (и(1)) = ш1 зпр )о(1)), с,~г~т р(п е,<ыт ))и)ф .= ~(и(г)/" й(Е~, В = сопз1)0, (11) при некотором р (1 ( р( ).
Таким образом, постановка задачи оптимального управления прежде всего предполагает, что выбран некоторый класс функций — управлений (например, кусочно-непрерывные, кусочно- гладкие или функции из Ьр (1ю Т) (1( (р <~ сс)) и указаны налагаемые на них ограничения (например, ограничения вида (10) или (11)). Заметим, что в учебной литературе символом з(1) = =(з'(Г), ..., з" (~)) часто обозначают как значение функции в точке г, так и саму функцию, которая представляет собой отобраркение области определения функции в пространстве Е", ставящее в соответствие каждой точке ~ из области определения некоторую точку из Е". Отдаван дань традициям, мы будем продолжать пользоваться этим не вполне определенным символом где п(1) пробегает множество всех измеримых функций, совпадающих с и(Ю) почти всюду на отрезке 11„Т).
Если читатель недостаточно знаком с интегралом Леоега и пространствами Ер[1ю Т) (179], то всюду в этой главе он может считать, что все рассматриваемые управления и(8) суть кусочно-непрерывные функции. Далее, как видно из примеров 1, 2, значения управлений не могут быть совершенно произвольными и подчиняются некоторым ограничениям.
Такие ограничения можно описать условием и(г)ж $'(Ц, 1, (1< Т, (10) где р(8) — заданное множество из Е' при каждом 1ж ~й,„Т1 Например, в случае ограничений (3) р'(Г)=(и: ижЕ', !и! <7) при всех г. Для кусочно-непрерывных управлений выполнение условий (10) требуется для всех 1ж1г,, Т) а для измеримых управлений — почти всюду на )г„Т1. Кроме ограничений (10), возможны также и ограничения вида з 1) ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 427 в тех случаях, когда из контекста нетрудно понять, идет ли речь о функции в целом или о ее значении в конкретной точке. В тех случаях, когда обозначение г(С) может привести к недоразумениям, за значением функции в точке С будем сохранять обозначение з(С), а саму функцию будем обозначать через з( ) или просто з.
В свете этих обозначений подчеркнем, что ограничения (10) являются ограничениями на значения функции, и поэтому было бы бессмысленно вместо(10)писать и( )ьн Ст(С). Ограничение (11), наоборот, накладывается на всю функцию и(.) в целом и не является ограничением на значения функции — функция и( ), удовлетворяющая этому ограпиченлю, В отдельных точках илп промежутках малой длины может принимать произвольные значения. Поэтому (11) можно заппсать в виде [и( )[ь„((Л, а обозначеняе [и(С)[ь„(Л, иногда встречающееся в литературе, не вполне удачное. 3.
Итак, пусть заданы точка х, ж Л" и некоторое кусочно-непрерывное управление и = и( ) = и(С) (С, ~ С ( Т), илп управление и ( ) я Т"„(Сс, Т) при некотором р > 1. Рассмотрим задачу Копти (8), (9), Сразу же возникает вопрос: что понимать под решением этой задачи7 Если функции и(С), С(х, и, С) непрерывны, то, как обычно принято в учебниках по дифференциальным уравнениям [172, 251, 2951, под решением задачи (8), (9) можно понимать функцию х = х( ) = х(С), С, ( С = Т, которая непрерывно дифференцируема на отрезке [С„Т) и удовлетворяет условиям (8), (9). Однако для случая кусочнопепрерывных или измеримых управлений, как видно из (8), требовать существование непрерывно дифференцируемого решения задачи (8), (9), вообще говоря, не имеет смысла. Поэтому мы будем пользоваться следующим более общим определением решения задачи (8), (9).
О и р е д е л е н и е 1. Непрерывную функцию х = х( ) = х(С), С, ~ С < Т, удовлетворяющую равенству ь х(С) = [ У(х(т), и(т), т)ССТ+ хе, Се~ (С( Т, (12) ьо будем называть решением нли траекторией задами (8), (9), соответствующей начальному условию х, и управлению и = и( ), и будем обозначать через х=х(., и, х,)=х(, и( ), х,) плп х =х(С, и, х,) (Сь ~ С ~ Т). Начальную точку х(Сь, и, х,) будем называть левым ноньСом траектории х(, и, х,), С, — начальчыМ моментом, х(Т, и, х,) — правым ноньСоэь траектории, Т вЂ” нонвьным моментом. В тех случаях, когда ясно, какому именно управлению и( ) или начальному условию х, соответствует траектория, в обозначении х(, и, х,) букву и или х, будем опускать и просто писать х(, и) или х(, х,) илп х = х(.) = х(С) (С, ( С ( Т).
ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА !гл. в Классические теоремы существования и единственности решения задачи Коши х=д(х, 1), х(Ц)=х„ в учебниках по дифференциальным уравнениям обычно доказываются при требовании непрерывности у(х, 1) и д„(х, 1) по совокупности переменных в некоторой области, содержащей точку (х„ 1,) (условие непрерывности д„(х, г) часто заменяется условием Липшица д(х, 1) по переменной х) [172, 251, 295]. Однако если и(1) ен Ьр [1з, Т) (р ~~1), то непрерывности д(х, 1) — 7(х, и(1), 1) по переменной 1 ожидать не приходится и классические теоремы существования н единственности решения здесь становятся недостаточными.
Тем не менее, используя ту же технику доказательства упомянутых классических теорем, можно получить существование и единственность решения задачи (8), (9) и для кусочно-непрерывнык управлений и(с) или и (з) ен Ьр [г„Т[ (р > 1). Мы здесь ограничимся доказательством следующей теоремы. Теорема 1. Пусть функция Дх, и, 1) определена и непрерывна по совокупности переменных при всех (х, и, 1)зн Е" Х ХЕ" Х [Е„Т) и пусть [1(х, и, 1) — з (у, и, 1) [ < Т (1) [х — у[ (13) при всех (х, и, г), (у, и, г)жЕ" ХЕ" Х[Е„Т1 где Т,(Ю) — неотрицательная функция, принадлежащая А,(Г„Т1.
Тогда для любого ограниченного измеримого управления и(г) (т. е. и (г) ен ен Л" [гз, Т]) и начального условия х, задача (8), (9) имеет, и притом единственное, решение х = х(1), определенное на всем отрезке [г„Т[. Это решение имеет производную х(г) почти всюду на [Ц, Т1, х(1)енЬ [Г„Т[ и удовлетворяет уравнению (8) при почти всех г ж [[„Т1. Д о к а з а т е л ь с т в о. Пространство непрерывных вскторфункций х (1) = (х' (С),, х" (С) ) (Го < 1 < Т) с нормой [!х[с= шах [х(Ю)[ г, .ыт обозначим через С" [г„Т1 Как известно [179[, С" [~„Т) — полное нормированное пространство. Зафиксируем какие-либо точки х, и ограниченное измеримое управление и = и(с),т, < г -- Т. Можно показать [21, что тогда для любой функции х(С) ж шС" [1„Т) функция 1'(х(1), и(Г), 1) будет ограниченной измеримой функцией переменной С на отрезке [1„Т).
Определим отображение А: з(1) = Ах = ~ т'(х(т), и (т), т) с[т + х„сз (1( Т, (14) о Фп ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 429 действующее из С" (с„Т) в С" 11„Т1. Значение функции г( ).= =Ах( ) в точке 8 будем обозначать через Ах(.) (1). Покажем, что отображение А" — т-я степень отображения А — при достаточно болыпом т будет сжимающим [179]. Для этого с помощью индукции докажем, что для любых х( ), у( )~ С" )'с„Т) т» )А х( ° )(1) — А у( )(~)~( — псах )х(т) — у(т)! ) Ь(т)сст м)с ктлс а со (15) при всех 1, ~, < ~ ~ Т (т = 1, 2, ...).