Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 27
Текст из файла (страница 27)
Прямые 7, и 1, расположены в одних и тех же квадрантах — например в первом и третьем. $75 ПРИМВРЫ 5 2П Произведем нумерацию углов а; (определяемых прямыми 7, и 7,) так, как указано на рис. 53; соответствующая нумерация вершин параллелограмма К показана на Рис. 53. рис. 54.
Вспоминая характер изменения величин ~р и ~р„ мы приходим к следующему выводу относительно оптимальных управлений. Если начальное значение фс вектора ф = (фю $,) расположено внутри четвертого квадранта Рис. 54. (или на его сторонах), то при дальнейшем своем изменении вектор ф не выйдет иэ этого квадранта, т. е. будет все время находиться внутри угла ам Следовательно, мы будем все время иметь и = е, (без переключений). Этому управлению соответствует траектория системы (56)„ оканчивающаяся в начале координат (рис'. 55). Аналогично, если начальное значение ~рс вектора ф находится $76 ЛИНЕЙНЫЕ ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ (ГЛ, з уг ф =се — ц(, фз=се — Аи (где сг ) О и с, ) О, так как вектор ф расположен в первом квадранте), то момент переключения т, из вершины внутри или на сторонах второго квадранта, то мы будем иметь Р = е, в течение всего движения, т. е. получим траекторию системы (56)„оканчивающуюся в начале координат (рис.
56). Все остальу ные оптимальные траектории соответствуют случаям, когда вектор ф, расположен внутри первого или третьего квадрантов. Мы рассмотрим случай, когда ф лес„' жит внутри первого квадранта (случай третьего квадранта полуу' чается при помощи симметрии относительно начала координат). Р, е' Итак, пусть вектор ф, расположен внутри первого координатного угла, но одновременно Рис. 55. лежит в угле а,. С течением вре- мени вектор ф монотонно поворачивается против часовой стрелки, приближаясь к оси ординат. Следовательно, оптимальное управление имеетдва переключения: сначала и = е„аатем, после первого переключения, ут Р = е, и, наконец, после второго переключения, и = ез.
Мы сейчас е,' покажем,что при наличии указанных двух переключений промежуток времени, в течение которого управляющий параметр Р Р принимает значение ею имеет вполне определенную д л и н у (неаависимо от выбора начальных условий). В самом деле, обозначим угловые козффициенты прямых 7, и (з соответ- Рис. 56 ственно через йг, й, (где к, ( ез, см.
рис. 53). Так как изменение вектора ф описывается формулами ПРИМВРЫ 177 з 211 е, в вершину е, (т. е. момент перехода вектора ф через прямую 71) определяется из соотношения с е ~*с' 3 = 7с1. се 1 Аналогично, момент переключения т, из вершины е, в веРшинУ ее (т. е. момент пеРехоДа вектоРа 1Р чеРез пРЯ- мУю 11) опРеДелЯетсЯ из соотношениЯ се е = !се.
се 1 Таким обрааом, Л вЂ” 711 с ' 1 зе 71 и потому отрезок времени [т1, т,), в течение которого управляющий параметр Р принимает значение е„имеет длину Х1 — Хе 1 се Число, стоящее в правой части соотношения (58), не зависит от с, и се (т.
е. от начального значения фе вектора ер), и мы обозначим его через Т. Итак, при изменении вектора 1р в первом квадранте оптимальные управления имеют следующий вид. Управляющий параметр Р в течение некоторого времени принимает значение и = е1, аатем в течение времени Тпараметр Р принимает значение Р = е„после чего вплоть до окончания движения он принимает аначение Р = е,. разумеется, число переключений может окаааться и меньшим, чем два. Например, мы могли бы начать рассмотрение движения в момент, когда управляющий параметр и уже принял аначение е,.
Тогда мы получили бы, что параметр Р в течение времени, н е п р е в о с х о д я щ е г о Т, находится в вершине е„ после чего переключается в вершину е . Точно так же могло бы окаааться, например, что движение закончилось (попаданием в начало координат) до момента переключения из вершины е, в вершину ее. Иначе говоря, если управляющий параметр и совершает меньше двух переключений, то время пребывания его 178 линейные Оптимальные БыстРОдейСтВия ~гл, з в вершине е, не превосходит Т (причем переключение может происходить либо нз вершины е, в вершину ез, либо из еа в ес).
Теперь уже нетрудно построить на плоскости и «линии переключения», определяющие синтез оптимальных управлений. Наметим сначала г траектории, соответствующие д в у м переключениям. Заключительный этап движения на таких траекториях соответствует значению пау' раметра Р=е„т. е. движение происходит по дуге АО траектории системы (56)„ оканчивающейся в начале координат (рис.
56). Перед попаданием на линию АО движение происходило в силу системы (56),. Таким образом, АО есть линия переключения из вершины е, в вершину е,. Пусть Х вЂ” некоторая точка линии АО. Тогда предшествующий точке Х участок УХ оптимальной траекРис. 57. торин представляет собой дугу траектории системы (56)„ соответствующую отреаку времени Т (рис. 57).
Так как решения системы (57) имеют вид у' = с,ех', уз = сзех", то в реаультате движения точки по траектории этой системы в течение времени Т ее абсцисса умножается на ех т, а ордината — на сыт. Система же (56)с отличается от системы (57) только сдвигом положения равновесия.
Таким образом, точки Х получаются иэ соответствующих точек У (рис. 57) с помощью аффинного преобразования В, которое в системе координат с началом в точке ез (см. (55)) и осями, параллельными осям уг, у', заключается в умножении абсциссы на ахт, а ординаты — на е"*т. Следовательно, геометрическое место точек У представляет собой линию СВ, переходящую в линию АО при аффинном преобразовании В (рис. 58). Наметив еще линию ВО, пвнмегь1 179 » 20 Ряс. 58 представляющую собой дугу траектории системы (56)„ оканчивающуюся в начале координат и соответствующую отрезку времени Т, мы найдем, что вся «полоса» АОВС эаполнена кусками траекторий системы (56)», начинающимися на ливии СВ, кончающимися на линии АО и соответствую- у« щими отрезку времени Т.
Итак, геометрическим местом точек У, в которых '.з происходит переключение из вершины е» в вершину е„ У' служит линия СВ. До точки У движение совершалось по траектории системы (56),. В реэультате мы получаем В траектории, соответствующие д в у м переключениям (рис. 59). «Крайняя» траектория ЮВО на рис.
59 соответствует о д н о м у переключениго — фаэовая точка попадает в начало коордипат как раз в тот момент, когда » должно было бы проиэойти второе переключение (из вершины е, в вершину е»). Рассмотрим теперь траектории, соответствующие одному переключению иэ вершины е, в вершину е,. Заключительный этап движения происходит в этом случае по траектории системы (56), в течение времени, не превосходящего Т, и оканчивается в начале координат, т. е. происходит по некоторой части ЯО линии ВО (рис.
60). До точки Я движение происходило в силу системы (56),. Когда точка Я пробегает всю дугу ВО, траектории укаэанного вида ааполняют «полосу» ОВОА' (рис. 61), где А'Π— траектория системы (56)1, оканчивающаяся в начале координат. Объединяя все полученные оптимальные траектории, мы находим, что вся часть плоскости слева от линии АОА' эаполняется нми (рис.
59, 61). Очевидно, что линия А 'О симметрична линии АО относительно начала координат. $30 ЛИНЕННЫЕ ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ ~РЛ, 3 Справа от линии АОА' поведение траекторий симметрично, а переключения происходят иа вершины еа в вершину е, а аатем в е,. В ревультате синтее оптимальных Ряс. 59. у/ Ряс. 60. управлений осуществляется во всей плоскости (рис. 62).
Вид оптимальных траекторий покааан на рис. 63. При переходе от переменных р', у' к переменным хт, я' картина оптимальных траекторий аффинно искажается. ПРИМЕРЫ зги Пример 3 (Случай, когда многогранник У является одномерным, а собственные значения матрицы (а,') действительны.) Рес. 62. Ряс. 61. Предположим, что в системе (1) г = т, т, е. управляющий параметр и является действительным числом; предположим, кроме того, что зто число может изменяться в пределах — 1 = и ( т.
Таким образом, многогранник У представляет собой в рассматриваемом линеЙные ОптимАльные БыстРОдеЙстВия [гл, 3 случае отрезок ( — 1, 1) числовой оси, а система (1) принимает вид — = ~ а'е~+Ь[и, [и)(1, ю'=1, 2, ..., п. (59) т [ Предположим, наконец, что собственные значения матрицы У' Ркс. 63. (а,') действительны. Тогда, согласно теореме 10, оптимальное управление содержит не более п интервалов постоянства, причем на этих интервалах поочередно и = + 1 ни= — 1. ПРИМЕРЫ !вз з 2!! Иначе говоря, на кая!дом интервале постоянства движение происходит в силу одной из двух следующих систем: — —,= ~ а!х +Ь!, !=4, 2,..., и, (60)„ ч 1 — ~! а'х' — Ь!, !=1, 2,..., и.
(60) т=! Обозначим через М'„траекторию системы (60), оканчявагощуюся в начале координат, а через ̄— траекторию системы (60), оканчивающу!ося в начале координат. Рис. 64. Вместе М+ и М„составляют проходящую через начало координат ливию, которую мы обозначим через М„ Рис. 66. (рис. 64). В силу сказанного выше о характере оптимальных управлений ясно, что ааключительный этап оптимального движения (завершающийся попаданием в начало координат) представляет собой движение по линии М„' или М„.