Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание), страница 8
Описание файла
DJVU-файл из архива "Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание)", который расположен в категории "". Всё это находится в предмете "оптимальное управление" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "оптимальное управление" в общих файлах.
Просмотр DJVU-файла онлайн
Распознанный текст из DJVU-файла, 8 - страница
.. МЗМ,М,О, 3 3 1ОМ1МЗМЗ ' РЗР3( 1О ° и на дуге — 1 выше линии У3(х1, х') =- и на дуге Тогда вдоль каждой оптимальной траектории х (1):-- = (х' (1), х3 (1)) соответствующее оптимальное управление и (Е) = (и1 (1), и3 (1)) имеет вид И' (С) = 31(Х'(Х), Х'(Е)) и3(1) = 33 (Х' (С), хз (Е)). Это означает, что, заменив в системе (39) величины и1, иа функциями о1 (х', х'), о' (х', х'), мы получим систему Ы31 11 — — = — х1+ а3(х1, х'), (42) решение которой (при произвольном начальном состоянии ха) дает оптимальную фазовую траекторию, ведущую в начало координат. Иначе говоря, система (42) представляет собой систему дифференциальных уравнений (с разрывными правыми частями) для нахождения оптимальных траекторий, ведущих в начало координат. пРимеРы.
3АдАчА синтезА от оа ача синтеза оптимальных управлений рассмотренные выше примеры показывают, что решезадачи об оптимальных управлениях естественно оижидать в следующей форме. Будем решать оптимальную задачу в общей постановке (см. (9)), рассматривая всевозможные начальные состояния х, и каждый раз предписывая в качестве конечного состояния начало координат О пространства Х. Тогда (насколько можно судить по разобранным выше примерам) существует такая функуия Р (х), заданная в фазовом пространстве Х и принимающая значения в области управления У, что уравнение ' — „;=~(х, .(.)) (43) (ср.
(5)) определяет все оптимальные траектории, ведущие в начало координат. Иначе говоря, оптимальное управление оказывается естественным искать не в форме и = и (1), а в форме и = о (х), т. е. искомое оптимальное управление в каждый момент зависит лишь от того, в какой точке пространства находится в данный момент фазовая точка. Это и понятно: ведь если мы уже попали в фазовую точку х~ то и дальнейшее движение (из точки х в 0) должно быть оптимальным (ибо часть оптимальной траектории сама являетсн оптимальной траекторией, см.
стр. 22). Поэтому значение оптимального управления и (1) в момент прохождения фазовой точкой положения х зависит только от х, а не от того, в какой точке начиналось движение и сколько времени фазовая точка уже двигалась, прежде чем попала в положение х. Формулы (27), (38), (42) как раз и дают решение разбиравшихся оптимальных задач в форме дифференциального уравнения (43) с раарывной правой частью. (Если область управления У является множеством г-мерного пространства переменных и', и', ..., и", то задание одной векторной функции и (х) равносильно заданию г скалярных функций и' = о' (х), ..., и' = о' (х); ср.
формулы (42).) Функцию Р (х), дазощую уравнение оптимальных траекторий в форме (43), мы будем называть синтезирующей функиией, а задачу нахождения синтезирующей функции ПРИНЦИП МАКСИМУМА (если таковая существует хотя бы в достаточно малой окрестности начала координат) будем называть задачей синтеза оптимальных управлений. В разобранных выше примерах синтезирующие функции были кусочнонепрериеными.
Знание синтезирующей функции позволяет считать задачу оптимального попадания в начало координат и а т е м а т и ч е с к и решенной до конца. В самом деле, если рассматриваемый технический объект будет снабжен ивмерительным прибором, замеряющим фазовые состояния, и исполнительным механизмом, ставящим рули в положение и = в (х), где и (х) — синтезирующая функция (предполагаемая известной), то интересующий нас объект будет двигаться оптимально. Если функция п (х) имеет сложный вид, то для нахождения нужного положения рулей и = и (х), по-видимому, целесообразно применять (универсальные или специализированные) быстродействующие вычислительные устройства.
Читателя, интересующегося этим вопросом, мы отсылаем к обширной монографии А. А. Фельдбаума «Вычислительные устройства в автоматических системах», Физматгиз, Москва, 1959 (см. гл. Х111). В общем случае задача синтеза (т. е. вопрос о существовании синтевирующей функции и ее отыскании) не решена. В частном случае линейных систем и оптимальности, понимаемой в смысле быстродействия, эта задача будет обсуждаться ниже в третьей главе. 3 6. Задача с подвижными концами и условия трансверсальности Для формулировки и решения дальнейших задач об отыскании оптимальных управлений нам будут необходимы некоторые геометрические понятия. Для удобства читателя мы напомним здесь определения этих понятий.
Пусть 1 (х) = 1 (х', х', ..., х") — некоторая действительная скалярная функция, ваданная в какой-либо области г' евклидова е) пространства Х с ортогональными *) Можно не предполагать пространство Х евклидовнм, но тогда вводимый ниже вектор йтаа 1(х) следует считать во«ариалтнмл. з в1 ЗАДАЧА С ПОДВИЖНЫМИ КОНЦАМИ 53 координатами х~, ..., х". Если функция у имеет в области 6 первые частные производные по переменным х', ..., х", то в каждой точке х области С определен вектор называемый градиентом функции ) (х) и обозначаемый кимвалом йтай У (х). Множество 8 всех точек х =~ (х~, ..., х"), удовлетворяющих соотношению ~ (х', х',..., х") = О, (44) мы будем называть гиперповерхностью пространства Х, а соотношение (44) — уравнением этой гиперповерхности. Будем теперь считать, что левая часть уравнения (44) имеет непрерывные частные производные по переменным х', х', ..., х".
Точка х~д, удовлетворяющая соотношениям д) (х) д)(х) д) (х) дх| дхг ' ' ' дхх (т. е. точка, в которой вектор огай ~ (х) обращается в нуль), называется особой точкой гиперповерхности Я. Прочие точки, принадлежащие гиперповерхности Я (т. е. точки, в которых дгаб )' (х) х О), называются ее неособими точками. Гиперповерхность, определяемая уравнением (44) с непрерывно дифференцируемой левой частыми н е с о д е р ж а щ а я особых точек, называется гладкой гиперповерхностью.
Все гиперповерхности, рассматриваемые в дальнейшем, предполагаются гладкими. При и = 2 уравнение (44) принимает вид ~(х', х') =О, и понятие гладкой гиперповерхности сводится в этом случае к понятию гладкой линии (на плоскости переменных х', хг). При и = 3 уравнение (44) принимает вид ~ (х', х', х') = О, 54 ПРИНЦИП МАКСИМУМА !гл, ! и понятие гладкой гнперповерхности сводится в этом случае к понятию гладкой поверхности (в пространстве переменных х', х', х').
Если уравнение (44) л и н е й н о, т. е. имеет вид а,х' + а,х'+... + а,х" + Ь = О, то отсутствие особых точек означает, что хотя бы один из коэффициентов а! отличен от нуля. В этом случае гиперповерхность, определяемая уравнением (45), называется гиперплоспостью. При и = 2 гиперплоскость представляет собой прямую линию (на плоскости), а при и = 3 — плоскость (в трехмерном пространстве).
Пусть хг — произвольная точка гладкой гиперповерхности 8, определяемой уравнением (44). Вектор ягай ~(хг) (или любой коллинеарный ему вектор), называется нормальным вектором (или просто нормалью) гиперповерхности Я в точке х,. В случае г и и е р и л о ск о с т и (см. (45)) нормальные векторы во всех точках одинаковы, т. е. имеется один единстве нный нормальный вектор (ад, а»,..., а„). Всякая гиперплоскость однозначно определяется заданием нормального вектора и одной точки, принадлежащей этой гиперплоскости.
Если 8 — гладкая гиперповерхность с уравнением (44) и хг — некоторая ее точка, то гиперплоскость, проходящая через точку хг и имеющая вектор дга!) Дхг) своей нормалью, нааывается касательной гиперплосностью гиперповерхности Я в точке хг. Каждый вектор, начинающийся в точке х, и лежащий в касательной гиперплоскости, называетсл насательн м вектором гиперповерхности Я в точке хг. Иначе говоря, вектор, начинающийся в точке хг, тогда и только тогда является касательным вектором гиперповерхности Я, когда он ортогонален вектору дга!) !(х»). Пусть теперь Я»,Ю», ...,Ю» — гладкие гиперповерхности, ааданные в пространстве Х злдлчл с подвижными концами бо соответственно уравнениями ~, (х', х',..., х") = О, ~,(х',х~,...,х") =О, (46) ~з (х', х',..., х") = О. 77гресгчгниг М всех этих гиперповерхностей (т.
е. множество всех точек х~Х, удовлетворяющих одновременно всем уравнениям (46)) называется (и — й)-мерным (гладким) многообразием в Х, если выполнено следующее условие: в каждой точке х~М векторы ягай ~„(х), огай ~, (х),..., атад ~„(х) (47) линейно независимы. Таким образом, по определению, г-мерное многообразие в Х задается системой и — г уравнений. В частности, (и — 1)-мерное многообразие задается о д н и м уравнением.
Таким образом, (и — 1)-мерные многообрааия пространства Х совпадают с гиперповерхностями. Одномерные многообрааия называются также линиями. Заметим еще, что условие независимости векторов (47) равносильно требованию, чтобы ранг функциональной матрицы дй (х) д), ( ) д1,( ) да' дхг ' " дх" д(г(г) д~~ (х) д(г (х) дх' дггг ' " дх" (48) д/а (х) д)з (х) д)з (х) дх1 дог ''' дх" был максимальным (т. е. был равен )с).
Коли уравнения (46), определяющие (и — й)-мерное многообразие М, линейны, то многообразие М называется (и — й)-мерной плоскостью пространства Х. Иначе говоря, (и — к)-мерная плоскость представляет собой пересечение Й гиперплоскостей, нормальные векторы которых линейно независимы. Одномерные плоскости называются также прямыми линиями. Пусть М вЂ” гладкое (и — й)-мерное многообразие, определенное в пространстве Х уравнениями (46), и х— 56 пРинцип максимума некоторая его точка.