Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 8
Текст из файла (страница 8)
ЯД 91ОФ1йзйз ... и на дуге ... ЯД(«1О о'(х', х') = — 1 ПраВЕЕ ЛИНИИ ... (Щ.!«11Ой11»1»й1» ° ° ° и на дуге . - ° »1зй1зй11О' + 1 ниже линии .. ° РзР»Р1О1(41М»мз - ° ° и на дуге „.. Мзй(„1)41О. оз(х', хз)= — 1 выше линии .. ° РзРзР1О11(11»1111!з ° ° ° и на дуге . ° ° РзР»Р1О. попадания на эту линию значения уппавляющих параметров переключаются и становятся равными и' = — 1, из = +!. Под действием этого управления фазовая точка движется в «квадранте» !Ч и достигает линии ОЯАз! 1з, причем в момент попадания на эту линию управляющие параметры принимают значения и1= +1, из = +1 и т. д. 1»се эти факты собраны в следующей таблице: ПРИМЕРЫ. ЗАДАЧА СИНТЕЗА Тогда вдоль каждой оптимальной траектории х(1) = = (х'(1), х'(1) ) соответствующее оптимальное управление и(1) = (и'(1), и'Я) имеет вид и' (1) = о' (х' (1), х' (1)), и' (1) = в- '(х' (1), хз(1)).
Это означает, что, заменив в системе (39) величины и', и' функциями о'(х',х'), о2(х',х'), мы получим спстсму ах' — =х'+ о' (х', х'), (42) — = — х'+ ве(х1, х'), Ж решение которой (прн произвольном начальном состоянии хч) дает оитимальнУю фазовУю гРаектоРи1о, ведУ- щую в начало координат.
Иначе говоря, система (42) представляет собой систему дифференциальных уравнений (с разрывными правыми частями) для нахождения оптимальных траекторий, ведущих в начало координат. Задача синтеза оптимальных управлений Рассмотренные выше примеры показыва1от, что решение задачи об оптимальных управлениях естественно ожидать в следующей форме. Будем решать оптимальную задачу в общей постановке (см. (9)), рассматривая всевозможные начальные состояния х, и каждый раз предписывая в качсстве конечного состояния начало координат О пространства Х Тогда (насколько можно судить по разобранным выше примерам) существует такая 4ункиия о(х), заданная в 1разовом пространс1ве Х и принимающая значения в области управления (/, что уравнение ,11 =1(х, о(х)) (43) (ср.
(5)) определяет все оптимальные траекгории, ведущие в начало координат. Иначе говоря, оптимальное управление оказывается естественным искать не в форме и = и(1), а в форме и = о(х), т. е. искомое оптимальное управление в каждый момент зависит лишь от того, пгигп!ип млкснмумк ггл. ! в какой точке пространства находится в данный момент фазовая точка. Это н понятно: ведь если мы уже попали в фазовую точку х, то н дальнейшее движение (из точки х в 0) должно быть оптимальным (ибо часть оптимальной траектории сама является оптимальной траекторией, см. стр. 22).
Поэтому значение оптимального управления и(!) в момент прохождения фазовой точкой положения х зависит только от х, а не от того, в какой точке начиналось дан!кение и сколько времени фазовая точка уже двигалась, прежде чем попала в положение х.
Фор. мулы (27), (38), (42) как раз н дают решение разбиравшихся оптимальных задач в форме днфференциалыюго уравнения (43) с разрывной правой частью. (Если область управления У является множеством г-мерного пространства переменных и', и', ..., и", то задание одной векторной функции о(х) равносильно заданию г скалярных функций и' = о'(х), ..., и' = о'(х); ср. формулы (42).) Функцию о(х), дающую уравнение оптимальных траекторий в форме (43), мы будем называть синтезирую- и(ей функцией, а задачу нахождения синтезирующей функции (если таковая существует хотя бы в достаточно малой окрестности начала координат) будем называть зпдачей синтеза оптимальных управлений. В разобранных вьппе примерах синтезирующие функции были кусочно-непрерывными.
Знание синтезирующей функции позволяет считать задачу оптимального попадания в начало координат м а т е м а т и ч е с к и решенной до конца. В самом деле, если рассматриваемый технический объект будет снабжен измерительным прибором, замеряющим фазовые состояния, и исполнительным механизмом, ставящим рули в положение и = о(х), где о(х) — синтезирующая функция (предполагаемая известной), то интересующий нас объект будет двигаться оптимально. Если функция о(х) имеет сложный вид, то для нахождения нужного положения рулей и = о(х), по-видимому, целесообразно применять (универсальные или специализированные) быстродействующие вычислительные устройства.
Читателя, интересующегося этим вопросом, мы отсылаем к обширной монографии А. А. Фельдбаума «Вычислн- задача с полн1юуп11мн концами тельные устройства в антомати ~еских снстемах», Физмаггиз, Москва, !959 (см. гл. )(! П). В общем случае задача синтеза (т. е. вопрос о сушествовании синтезирующей функции и ее отыскании) не решена. В частном случае линейных систем н оптимальности, понимаемой в смысле быстродействия, эта задача будет обсуждаться ниже в третьей главе.
й 6. Задача с подвижными концами н условия трансверсальности Для формулировки и решения дальнейших задач об отыскании оптимальных управлений нам будут необходимы некоторые геометрические понятия. Для удобства читателя мы напомним здесь определения этих понятий. Пусть )(х) = ! (х', ха,..., х") — некоторая действительная скалярная функция, заданная в какой-либо области 6 евклидова *) пространства Х с ортогональнымн координатами х', ..., х". Если функция ! имеет в области 6 первые частные производные по переменным х', ... ..., х", то в каждой точке х области 6 определен вектор называемый градиентом функции )(х) и обозначаемый символом угас) ~(х). Множество 5 всех точек х = (х', ..., х"), удовлетворяющих соотношению )(х', ха, ..., х") =О, (44) мы будем называть г перповерхностью пространства Х, а соотношение (44) — уравнением этой гнперповерхности.
Будем теперь считать, что левая часть уравнения (44) имеет непрерывные частные производные по переменным х', ха, ..., х". Точка хе:-5, удовлетворяющая соотношениям д! (х) д)(х) д7(х) О дх' дха ' ' дх" *) Можно не предполагать пространство Х еанлндоаым, но тогда пподнмыа ниже вектор нгад ((х) следует считать коаари. онтным.
гп иннин максим>мл »гл > 54 (т. е. точка, в которой вектор дгаб»>(х) обращается в нуль), называется особой точкой гиперповерхности 5. Прочие точки, принадлежащие гнпсрповерхности 5 (т.е. точки, в которых дга»!) (х) ~ 0), называются ее неособыли точками. Гиперповерхность, опредсляемая уравнением (44) с непрерывно днффсренцнруемой левой частью я не содержащая особых точек, назынасгся гладкой гипсрповерхностью. Все гиперповсрхностн, рассматриваемые в дальнейшем, предполагаются гладкимн. Прн и = 2 уравнение (44) принимает внд 1(х>, х')=О, и понятие гладкой гиперповерхности сводится в этом случае к понятию гладкой линии (на плоскости переменных х', хз). Прн и = 3 уравнение (44) принимает вид ( (х>, хз хз) = О, н понятие гладкой гиперповерхности сводится в этом случае к понятию гладкой поверхности (в пространстве переменных х', х', хг). Если уравнение (44) линейно, т.
е. имеет вид а,х'+ агхл+ ... + а„х" + Ь = О, (45) то отсутствие особых точек означает, что хотя бы один нз коэффициентов а» отличен от нуля. В этом случае гиперповерхность, определяемая уравнением (45), называется гиперплоскостью. При и = 2 гиперплоскость представляет собой прямую линию (на плоскости), а при и = 3 — плоскость (в трехмерном пространстве).
Пусть хь — произвольная точка гладкой гиперповерхности 5, определяемой уравнением (44). Вектор ага»11" (хь) (или любой коллинеарный ему вектор), называется нормальным вектором (или просто нормалью) гинерповерхности 5 в точке хь. В случае гипе р плоскости (см. (45)) нормальные векторы во всех точках одинаковы, т. е. имеется один единственный нормальный вектор (ан»»м ..., а„). ЗАДАЧА С ПОДВИЖНЫМИ КОНЦАМИ ч в1 Всякая гиперплоскость однозначно определяется заданием нормального вектора и одной точки, принадлежащей этой гиперплоскости. Если 5 — гладкая гнпсрповерхность с уравнением (44) н хь — некоторая сс точка, то гиперплоскость, проходящая через точку хь и имеющая вектор афтаб Дх,) своей нормалью, называется касательной гиперплоскостью гиперповсрхности 5 в точке хе.
Каждый вектор, начинающийся в точке хь н лежащий в касательной гиперплоскости, называется касательным вектором гиперповерхности 5 в точке хь. Иначе говоря, вектор, начинающийся в точке хь, тогда и только тогда являегся касательным вектором гиперповерхности 5, когда он ортогонален вектору нгаб 7(хь).
Пусть теперь 5! 5з . ~ 5А — гладкие гиперповсрхности, заданные в пространстве Х соответственно уравнениями 7,(х', хз, ..., х")=О, ~,(х', хз, ..., х") =О, (46) )А(х', х', ..., х") =О. Пересечение М всех этих гиперповерхностей (т. е. множество всех точек х ~ Х, удовлетворяющих одновременно всем уравнениям (46)) называется (и — й)-мер« ным (гладким) многообразием в Х, если выполнено следующее условие: в каждой точке х ~ М векторы игаб),(х), пгаб~,(х), ..., ~габ)А(х) (47) линейно независимы.
Таким образом, по определению, г-мерное многообразие в Х задается системой и — г уравнений. В частности, (и — !)-Мерное многообразие задается од н им уравнением. Таким образом, (и — !)- мерные многообразия пространства Х совпада|от с гиперповерхностями.
Одномерные многообразия называются также линиями. Заметим еще, что условие независимости векторов (47) равносильно требованию, чтобы пг>ипц>>п макса>мама (гл. ! ранг функциональной матрицы д/! (х) д<! (х) д/! (х) дх' Дх» ' ' ' Дх» Д/, (х) Д/, (х) д/, (х) Дх' Дх» ° Дхь (48) д/ (х) д/, (х) Д/,(х) Дх' дх» дл" был максимальным (т. е. был равен й). Если уравнения (46), определяюпше (и — /г) -мерное многообразие М, линейны, то многообразие М называется (и — /()-»>ерпой плоскостью пространства Х.
11паче говоря, (и — /с) мерная плоскость представляет собой пересечение /: гпперплоскостей, нормальные векторы которых линейно независимы. Одномерные плоскости называются также прял<ыми лилиями. Пусть М вЂ” гладкое (и — й) -мерное многообразие, определенное в пространстве Х уравнениями (46), и х— некоторая его точка. Обозначим через /.! касательную гнпсрплоскость к гнперповерхности /<(х>, хх, ..., х") = 0 в точке х (! = 1, 2,...,/»).