Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 27
Текст из файла (страница 27)
44). Это позволяег последовательно вычерчивать части линий ОА;В;С;..., зная первые куски ОАь ОАь ОА», ОА4 этих линий (определение этих кусков было приведено выше). Остается замегить, что значение ьч управляющий параметр о принимает внутри «угла» между линиями ОА+1В+1С+, ... и ОА В С; ... и на дуге А;О. Это и дает синтез оптимальных управлений (рис. 45). Вид оптимальных траекторий показан на рис. 46. Напомним, что рисунки 37 — 46, рассмотренные выше, относились к случаю, когда ), ( О, т. е. когда собственные значения матрицы (а') имеют отрицательные дей.
ствительные части. В этом случае размеры дуг ОЛь А;Вь В;Сь ... увеличивались, а синтез оптимальных управлений осуществляется во всей плоскости и. При Л = 0 размеры дуг не меняются (т. е. ОА; = В;С; =..., А~В; = С;О; = ...); синтез оптимальных управлений попрежиему осуществляется во всей плоскости н (см. пример 3 в $ 5). Наконец, при Х ) 0 размеры дуг ОАь В;Сь ..., а также дуг А;Вь СьОь ... уменьшаются в геометрической прогрессии; синтез оптимальных управлений осуществляется лишь в ограниченном куске плоскости и (рис. 47). Все сказанное относится к синтезу оптимальных управлений в плоскости н переменных у', у». Переход в плоскости Х исходных переменных х«, х' осуществляется по формулам (47).
Картина синтеза оптимальных управлений при этом аффинно искажается. Пример 2 (Система второго порядка с двумя управляющими параметрами и отрицательными собственными значениями.) Рассмотрим систему (45) в предположении, что собственные значения матрицы (а') действительны, отрицательны и различны. Мы по-прежнему будем предполагать, что область управления У определяется неравенствами (46) и что определитель матрицы (Ь'.) отли/ чен от пуля.
Обозначим собственные значения матрицы 175 пгимегы $2П плп, иначе, к виду Ну' — =Х,(/+о, й (см. (49)). Как и в первом примере, точка о =(о', оз) описывает в плоскости я переменных у', дз параллелограмм Ъ' (рис. 33). Система (5) принимает в случае управляемого процесса (54) следующий вид: (54) ес общее решение: $, =с,е м~, ~рз=с~е-хз'. Из этих Формул видно, что если одна из постояннных интегрирования сь сз равна нулю, то вектор $ = ($ь~ъ) сохраняет постоянное направление (параллельное одной из осей координат). Если же оба числа сь с2 отличны от нуля, то вектор ~р монотонно поворачивается (с возрастанием 1) от оси абсцисс к оси о дипат, оставаясь а, все время водном квадранте (ибо ~ ~' = ~ — '~е<"-м1'-~ -~ оо при возрастании (). Для системы (45) мы предполагаем выполненным условие общности положения; тогда для гпстсмы (54), получающейся из нее линейным преобразованием, это условие также выполнено.
Иначе говоря, нп одна пз сторон параллелограмма $' пе параллельна пн одной (а') через л~ и Хь причем Хз ( Х~ ( О. Линейным преобразованием переменных (см. (47) ) систему (45) можно принести к виду !та линаиныв оптимлльные высттодвиствия !гл.з из осей координат. Проведя нз на ~ала координат прямые 1ь 1м перпендикулярные сторонам параллелограмма У (рис. 34; эти прямые отличны от осей координат в силу сказанного вьппе), мы, как и прежде, найдем, что если вектор ф находится в угле аз (1 = 1, 2, 3, 4), то максимум функции Н при о еи У достигается в вершине о = е, (рис.
35). Обозначим теперь через е', точку (а,', а,') плоскости и с координатами а,' = — — о', (55) еу' — =Л,у 1 сН еу' — Ау д 2. (57) с помощью параллельного переноса; именно, положение равновесия системы (56); расположено не в начале координат (как у системы (57), рис. 48), а в точке е,'.. Дальнейшее исследование приведет к существенно различным результатам в зависимости от того, как расположены прямые 11 и (м перпендикулярные к сторонам параллелограмма У. Мы выделим следующие два случая.
Случай 1. Прямые 11 и (з расположены в различных квадрантах (т. е. одна в первом и третьем, а другая— где о',, о~ — координаты вершины е; параллелограмма У. Тогда мы получим четыре точки еи е', е', е', являю- щиеся вершинами некоторого параллелограмма У'. Из формул (54), (55) вытекает, что в то время, когда управляющий параметр о принимает значение е;, изме- нение координат у', у' описывается уравнениями — = Х, (у' — а,'), (при о=е,). ) (56), + 2 (у' — ат) «Фазовый портрет» системы (56)~ получается из «фазо- вого портрета» системы 1та линейные оптимАльные выстгодгистеия 1гл 3 во втором и четвертом квадрантах, рис. 49).
Произведем нумерацию углов а4 (определяемых прямымп 1, и 1,) так, как указано на рпс. 50. Эта нумерация соответствует тому, что через ес и е4 обозначены соответственно верхняя и нижняя всршппы параллелограмма г', а через е, и ЕА — правая и левая (рис. 49). Вспоминая сказанное выше о характере изменения величии 4р1 п 4рм мы приходим к следу1ощсму выводу относительно оптимальных управлений.
1(аждое оптимальное управление либо совсем пе содержит переклю- Рис. 50. Рвс. 51. чсиий (т. с. в течение всего движения параметр о сохраняет постоянное значение, совпадающее с одной из вершин параллелограмма и'), либо содержит только одно переключение, и тогда до перекл4очения параметр о совпадает с одной из вершин ен е,, а после переключения — с одной пз всрппш ем е4.
Теперь нетрудно построить иа плоскости 44 «липин переключения», определяющие синтез оптимальных управлений. Обозначим через АО траекторию системы (бб)м оканчивающуюся в начале координат (рис. 51), а через ВΠ— аналогичную траекторшо системы (56)4. Линии АО и ВО симметричны относительно точки О. Если опти. мальное движение содержит переключение (только одно в силу сказанного выше), то заключнтсчьный этап движения, завершающийся попаданием в начало координаг, 179 ЛРИМЕРЫ $ хи происходит в силу системы (56)х или (56)е т.
е. вдоль линии АО илн ВО. До этого (т. е. до попадания на линию ВОА) точка движется в силу системы (56)1 или (56)м Таким образом, ВОА есть линия переключений, а ух Рис. 52. тве области, на которые плоскость разбивается этой литией, заполнены траекториями систем (56)~ и (56)з— ~равая область заполнена траекториями системы (56)м ~ левая — траекториями системы (56) ь Это и дает синтез оптимальных управлений (рис. 52), При переходе от переменных у', у' к исходным переиенным х', х' фазовая картина оптимальных траекторий ~ффинно искажается.
180 липгнныв оптимллы1ыа выстгодаигтиия 1гл. з Случай П. Прямые 1~ и 1с расположены в одних и тех же квадрантах — например, в первом и третьем. Произведем нумерацию углов сс~ (определяемых прямыми Рис. 53. 11 и (с) так, как указано на рис. 63; соответствующая нумерация вершин параллелограмма Г показана на рис. 54. Вспоминая характер изменения величин ~р~ и ~рь тр Рис. 54. мы приходим к следующему выводу относительно оптимальных управлений. Если начальное значение ~рс вектора ~р = ($ь $а) расположено внутри четвертого квадранта (или иа его сторонах), то при дальнейшем своем изменении вектор $ не выйдет из этого квадранта, т.
е. будет все время находиться внутри угла аь Следовательно, мы будем все время иметь о = е, (без переключений). Этому управлению соответствует траектория си- 181 ПРИМЕРЫ з и! стемы (56)ь оканчивающаяся в начале координат (рис. 55). Аналогично, если начальное значение ф, вектора 18 находится внутри нлп на сторонах второго квадранта, то мы будем иметь о = е, в течение всего движения, т.
е. получим траекторию системы (55)м оканчивающуюся в начале координат (рнс. 5б). Все остальные оптимальные траектории соответствуют случаям, когда вектор ~р, расположен внутри первого илн третьего квадрантов. Мы рассмотрим случай, когда ~ра лежит внутри у/ у/ Рис, бб. первого квадранта (случай третьего квадранта получается при помощи симметрии относительно начала координат). Итак, пусть вектор фа расположен внутри первого координатного угла, но одновременно лежит в угле пь С течением времени вектор ~Р монотонно поворачивается против часовой стрелки, приближаясь к оси ординат.
Следовательно, оптимальное управление имеет два переключения: сначала о = еь затем, после первого переключения, о = ез и, наконец, после второго переключения, о = ез. Мы сейчас покажем, что при наличии указанных двух переключений промежуток времени, в течение которого управляющий параметр о принимает значение еь имеет вполне определе ни ую длину (независимо от выбора начальных условий). В самом деле, обозначим угловые коэффициенты прямых (~ и Ц соответственно через йь лз (где й~ ~ йм см.
рис. 53), Так !ЗЗ ЛИНЕЙНЫЕ ОПТИМАЛЪНЫЕ БЫСТРОДЕЙСТВИЯ [ГЛ. 3 как изменение вектора ф описывается формулами ф, = с,е — х', ф, = с,е — хн (где с1 ) О и се ~ О, так как вектор ф расположен в первом квадранте), то момент переключения т1 нз вершины е~ в вершину ее (т. е. момент перехода вектора ф через прямую 11) определяется из соотношения с,е хеч — = й,. с~с — МЙ Аналогично, момент переключения тх из вершины ее в вершину ее (т. е.
момент перехода вектора ф через пря. мую 1е) определяется из соотношения ссе с1е — ~т Таким образом, ! ес1 1п —, Л1 — Ле се 'ге 1 вес~ 1п —, Л~ — Ле се Число, стоящее в правой части соотношения (58), не зависит от с1 и сх (т. е. от начального значения фс вектора ф), и мы обозначим его через Т. Итак, при изменении вектора ф в первом квадранте оптимальные управления имеют следующий вид. Управляющий параметр о в течение некоторого времени принимает значение о = е,, затем в течение времени Т параметр и принимает значение о = ех, после чего вплоть до окончания движения он принимает значение о = езразумеется, число переключений может оказаться и меньшим, чем два.