Пупков К.В. Методы классической и современной теории автоматического управления. Том 2 (2000) (1095389), страница 90
Текст из файла (страница 90)
Но тогда найдутся точки х" и х', лежащие соответственно на многообразиях ее и л! (рис. 2.15). Ясно, что управление и(!) и траектория х(!) являются оптимальными и в смысле рассмотренной в з2.1 двухточечной задачи оптимального управления, т.е. управление ц(!) и траектория х(г) должны удовлетворять принципу максимума (теореме 2.1). Таким образом, принцип максимума (теоремы 2.1 и 2.2) остается в силе и для задачи с подвижными концами. Однако в этом случае необходимо иметь некоторые дополнительные условия, которые позволили бы определить положение точек хл и х' на многообразиях ле и л!. Для получения указанных дополнительных условий обратимся к параграфу 1.5, в котором приводятся необходимые условия оптимальности, полученные методами классического вариационного исчисления.
Дополнительные условия задаются соотношениями (1.79). Выпишем эти условия, используя обозначения, принятые в принципе максимума: Методы тео ин оптимального п авления. Часть П! 486 Ч, (,!) 1х = х(г!) (2.57) здесь р, и р,', 1=!,р, ч=),к — некоторые числа. Во избежание недоразумений отметим, что имеющееся в (1.79) дополнительное условие вида Ч'о (го) = Ро (2.58) Ч'(го) =~Р!нЧ!с(х) !...(ь) ' ! ! Чг(г!) = ~р',У!3„(х) ~, „(,1.
ю ! (2. 59) (2.60) Известно, что вектор ~!( )!х = х(гл ) (2.61) в равенстве (2.56) опушено, т.к. ре — произвольное число, и, следовательно, соотношение (2.58) не несет какой-либо новой информации. Будем говорить, что на левом конце траектории х(Г) (в момент гь) выполнено условие трансверсальности, если найдутся такие числа р, (! =1,р), что имеют место соотношения (2.56). Аналогично, говорят, что на правом конце траектории х(г) выполнены условия трансверсальности, если найдутся такие числа р„ '(ч = 1,п), при которых выполняются равенства (2.57).
В смешанном случае, т.е. когда один конец траектории закреплен, а второй подвижен, условия трансверсальности следует относить к подвижному концу траектории. Сформулируем окончательный результат. Необходимые условия оптимальности в задаче с подвижными концами заключаются в следующем: 1) оптимальное управление и(г) и траектория х(г) должны удовлетворять принципу л!аксимума (теореме 2.1 или 2.2); 2) на подвижных концах траектории должны выполнюпься условии трансверсальности.
Условия трансверсальности являются теми дополнительными условиями, которые позволяют, в конечном счете, определить начальную н конечную точки, лежащие на многообразиях зе и з,.Действительно,координаты неизвестныхточек х и х вмео сте с р+/с неопределенными множителями Лагранжа р,,р„', 1= 1,р, ч = 1,п, приводят к 2п+ р+ !! неизвестным числам. Для определения указанных чисел необходимо воспользоваться 2п условиями трансверсальности (2.56), (2.57) и р+ к уравнениями (2.53), (2.54), т.е.
число неизвестных совпадает с числом уравнений. Формально условиями трансверсальности можно пользоваться и в том случае, когда в уравнениях (2.53) и (2.54) р = !1 = и. Уравнения (2.53) и (2.54) в этом случае задают соответственно начальную х 'и конечную х точки, т.е. имеет место двухтоо. чечная задача оптимального управления. Использовать условия трансверсальности в двухточечной задаче оптимального управления вряд ли целесообразно, т.к. это может только усложнить решение задачи.
Выясним геометрический смысл соотношений (2.56) и (2.57). Для этого запишем их в векторной форме: 487 Глава 2. П инцип максим ма Пон ягина ортогонален к поверхности грг(х) =0 (2.62) в точке 'х = х(го) . Многообразие зо образовано пересечением р поверхностей (2.53). Поэтому вектор (2.6!), являясь ортогональным к поверхности (2.62), ортогонален и к многообразию ло, которое принадлежит поверхности (2.62). Таким образом, правая часть равенства (2.59) является линейной комбинацией векторов, каждый из которых ортогонален многообразию ло. Поскольку векторы (2.55) линейно независимы, то вектор (2.59) является ортогональным к многообразию зо в точке х(!О) вектором общего положения.
Аналогичным образом можно показать, что вектор, стоящий в правой части равенства (2.60), является ортогональным к многообразию я, в точке х(г,) вектором общего положения. Вектор Х называется ортогональным к многообразию ло в точке х(го), если он ортогонален к плоскости, которая касается многообразия зс в точке х(го) . Касательная к многообразию ло плоскость образуется пересечением р плоскостей, каждая из которых касается в точке х(го) одной из поверхностей гр,(х)=0, 1=),р. Обозначим То плоскость, касательную к многообразию зо, а Т, — плоскость, касательную к многообразию зн Условия трансверсальности можно сформулировать в следующем виде.
Говорят, что на правом конце траектории х(1) выполнено условие трансверсальности, если вектор гр(г,) =(гр,(г,),гр,(г,),...,гр„(1,)) ортогонален плоскости 7;. Аналогичным образом формулируется условие трансверсальности и для левого конца траектории х(!). Пример 23. Внесем некоторые изменения в пример 2.2 Я2,1). По-прежнему пояагается, что движение объекта управления задается уравнениями (2 19) при ограничении на параметр управления (2.26), и в качестве критерия оптимизации рассматривается функционал (2.27) Однако вместо заданной конечной точки (в примере 2 — это начало координат) будем рассматривать перевод фаювой точки на многообразие, каторое зааается уравнением х! — — О. К условиям оптимальности, задаваемым теоремой 2.1, необходимо добавить условия трансверсатьности на правом конце траектории, которые имеют вид п(г)=р, ч,(т)=о.
(2.63) так как р является произвольным вещественным числом, то первое равенство (2 63) не накладывает никаких условий на функцию Чг!(г) . Далее, в соответствии с (2 37) Чг,(г) — линейная функция, которая может обращатьсв в нуль только один раз Поэтому в интервале 0 я г я Т функция Чг,(Г) НЕ МОжЕт НЗМЕ- нять свой знак Как следует из (2.63) и (2 32). на заключительном участке фазовая точка движется под воздействием управления и (г) .= 0 по траектории семейства (2 41). На начальном участке в зависимости ст знака чг,(0) движение происходит либо под воздействием управления н =1, либо — л = -1.
Возможен также вариант ( чг,(0) = 0 ), ко~ да на всей траекгории движения в (г) = 0 На рнс 2! 6 изображены управление л (г) и соответствующая ему траектория х(г) при Чз(0) >! Найдем на фазовой плоскости совокупность ючек, в которых происходит переключение управления с л (г) = 1 на и'(с) .= 0 Запишем равенство ' Вектор (2 61) называется ортогональным к поверхности (2 62) в точке х = х(г,), если он ортогонален плоскости, которая касается поверхности (2 62) в точке х(г,) .
488 Методы тео ии оптимального п авленид. Часть |П Н(хг(Т) х(Т),и (Т))=-4 — ~и (Т)(ьгу(Т) х,(Т) ьчгг(Т) и (Т) = — -/г.~-л/$(Т).«г(Т) =О, из которого следует, что /с «,(г,) = ж,(Т) = — . «!(Т) (2 64) Рис. 2.!6. Графики управления и фазовой траектории В иншрвале г, хг<Т чгг(т) = — чг1(71) (т — г~)+ чгг(г~) В соотвектвии с(2 32) чгг(гг) =1 и, очевидно, 1 Т-г, =— Чгг(гг) таК КаК Чг,(г,) =гл,(Т), тО ИЗ (2.64) СЛЕдуЕт «г (Т) Т-г =— ! )г (2 65) В интервале г, <г<т я (г) =О, и потому «,(Т) = «,(г,) (Т- г,)+ «,(г,) . Принимая во внимание (2 65) и равенство а(Т) = О, найдем 1 «,(г,)= —.«г(г!) «г(Т) чим у' линию на фюовой плоскости, определяемую соотношениями х, = — хг, «г > 0 Именно в точках линии у' происхолит переключение управления и (г) с'-1 на 0 Если рассмотреть управление и (г), вид которого представлен на рис.
2 17, и соответствуюшую ему фазовую траекюрию, то укюаиным выше способом легко установить, что переключение управления и (г) с -1 на 0 происходит на линни у, которая зады«<я соотношениями г «/ = — хг, «г <О А Обозначим у объединениелиний у' и у у=у'()у Для каждойфазовойтраекториих(г)переключение управления к (г) происходит на линии у. На рис 2 16 изображены линия <переключения> и вид Нот.к х,(Т) =.т,(г,), то окончательно получим «$(гг) = — «г(г,) г (г (2 66) Равенство (2.66) задает на фазовой плоскости параболу. Однако, как следует из рис. 2.16, переключение управления с и (г)=1 на и (г)=0 возможно только при х,(г,)>0 (в противном случае прямая х, =0 не может быть достигнуш), т.е.
уравнение (2,66) необходимо дополнить неравенством «,(г,) > 0 . Обозна- Глава 2. П инцип максим ма Пон ягина 489 выделенных необходимыми условиями оптимальности фазовых траекторий. Только изображенные на рис 2 18 траектории могут быть оптимальными траекториями Рне. 2.17. График управления и (г) Необходимые условия оптимальности непосредственно не могут гарантировать оптимальность выделенных с их помощью управлений и траекторий.
С другой стороны, оптимальная траектория и оптимальное управление должны удовлетворять необходимым условиям Изображенные на рис 2 18 траектории, несомненно, валяются оптимальными, т к. каждой начальной точке соответствует единственная траектория, а по условиям задачи существование оптимальных траекторий и управлений представляется вполне очевидным На рис 2 18 видно, что каждая оптимальная траектория великом лежит либо в левой, либо в правой полуплоскости Рис. 2Л8. Графики оптимальных фазовых траекторий Обозначим х~ —— гр(хз ) уравнение линии у Оптимальное управление задается равенством 1, если «р-ф(х,)<0 и «,<О, — 1, если х, — гр(хз)<0 и «, >О, и= О, если х,-е(хз)>0 и х,<0, или х,-и(хз)<0 и х,>0 2.2.3.
НеАВтОнОмный слУчАЙ В отличие от 82.1 будем теперь считать, что движение объекта управления опи- сывается неавтономными уравнениями вида г(х, — ' = у (х), ..., х, и), ..., и, 1), г =!,и, а вместо функционала (2.2) будем рассматривать функционал г) .г' = ) А(хы ..., х„, иг, ..., и, г)ггг, (2.68) 490 Методы тео ии оптимального п авления. Часть Ш Будем полагать, что момент времени со задан, а момент времени с, не задан и вместе с управлением ц(с) выбирается из условия минимизации функционала (2.68). Ограничимся рассмотрением двухточечной задачи о переводе фазовой точки х = (хп,,,, х„) из заданного начального положения х в заданное конечное положение х . Введем еще одну переменную х„„, которая определяется уравнением о!хи„ вЂ” = 1,хим (со) = со .