Принцип максимума Понтрягина (1264232), страница 3
Текст из файла (страница 3)
1.5, вкотором приводятся необходимые условия оптимальности, полученныеметодами классического вариационного исчисления. Дополнительныеусловия задаются соотношениями (1.79). Выпишем эти условия, используяобозначения, принятые в принципе максимума:pl ( x), i 1, n;(3.42)i t0lxi x x tl 10kit11( x)xi x, i1, n;(3.43)x t1здесь l и l , l 1, p,1, k , — некоторые числа.
Во избежаниенедоразумений отметим, что имеющееся в (1.79) дополнительное условиевида0t0(3.44)0в равенстве (3.42) опущено, так как 0 — произвольное число, и,следовательно, соотношение (3.44) не несет какой-либо новой информации.Будем говорить, что на левом конце траектории x(t ) (в момент t0 )выполнено условие трансверсальности, если найдутся такие числаl 1, p , что имеют место соотношения (3.42). Аналогично, говорят, чтоlна правом конце траектории x(t ) выполнены условия трансверсальности,если найдутся такие числа1, n , при которых выполняютсяравенства (3.43).
В смешанном случае, т.е. когда один конец траекториизакреплен, а второй подвижен, условия трансверсальности следует относитьк подвижному концу траектории.Сформулируем окончательный результат. Необходимые условияоптимальности в задаче с подвижными концами заключаются в следующем:1) оптимальное управление u(t ) и траектория x(t ) должныудовлетворять теореме принципа максимума;2) на подвижных концах траектории должны выполняться условиятрансверсальности.Условия трансверсальности являются теми дополнительными условиями,которые позволяют, в конечном счете, определить начальную и конечнуюточки, лежащие на многообразиях s0 и s1 . Действительно, координатынеизвестных точек x 0 и x1 вместе с pk неопределенными множителями, l 1, p,1, n, приводят к 2n p k неизвестнымЛагранжа l ,числам.
Для определения указанных чисел необходимо воспользоваться 2nусловиями трансверсальности (3.42), (3.43) и p k уравнениями (3.39),(3.40), т.е. число неизвестных совпадает с числом уравнений.Формально условиями трансверсальности можно пользоваться и в томслучае, когда в уравнениях (3.39) и (3.40) p k n. Уравнения (3.39) и (3.40)в этом случае задают соответственно начальную x 0 и конечную x1 точки, т.е.имеет место двухточечная задача оптимального управления.
Использоватьусловия трансверсальности в двухточечной задаче оптимального управлениявряд ли целесообразно, так как это может только усложнить решение задачи.Выясним геометрический смысл соотношений (3.42) и (3.43). Для этогозапишем их в векторной форме:pψ t0ll 1l ( x);(3.45).(3.46)x x t0kψ t1vv 1Известно, что векторv ( x)x x t1(3.47)l ( x) x x t0ортогонален к поверхности*0(3.48)в точке x x t0 . Многообразие s0 образовано пересечением p поверхностей(3.39).
Поэтому вектор (3.47), являясь ортогональным к поверхности (3.48),ортогонален и к многообразию s0 , которое принадлежит поверхности (3.48).Таким образом, правая часть равенства (3.45) является линейнойкомбинацией векторов, каждый из которых ортогонален многообразию s0 .Поскольку векторы (3.41) линейно независимы, то вектор (3.45) являетсяортогональным к многообразию s0 в точке x t0 вектором общегоположения.
Аналогичным образом можно показать, что вектор, стоящий вправой части равенства (3.46), является ортогональным к многообразию s1 вточке x t1 вектором общего положения.Вектор Y называется ортогональным к многообразию s0 в точке x t0 ,если он ортогонален к плоскости, которая касается многообразия s0 в точкеx t0 . Касательная к многообразию s0 плоскость образуется пересечением pплоскостей, каждая из которых касается в точке x t0 одной из поверхностейl ( x)l ( x)0, l 1, p.Обозначим T0 плоскость, касательную к многообразию s0 , а T1 —плоскость, касательную к многообразию s1.Условия трансверсальности можно сформулировать в следующем виде.Говорят, что на правом конце траектории x(t ) выполнено условиетрансверсальности, если вектор ψ t1ортогонален1 t1 , 2 t1 , , n t1T1.плоскостиАналогичнымобразомформулируетсяусловиетрансверсальности и для левого конца траектории x(t ).Пример 2.3.
Внесем некоторые изменения в пример 2.2 (п. 2.1). Попрежнему полагается, что движение объекта управления задаетсяуравнениями (3.6) при ограничении на параметр управления (3.13), и вкачестве критерия оптимизации рассматривается функционал (3.14). Однаковместо заданной конечной точки (в примере 2 — это начало координат)будем рассматривать перевод фазовой точки на многообразие, котороезадается уравнениемx1 0.К условиям оптимальности, задаваемым теоремой 2.1, необходимо добавитьусловия трансверсальности на правом конце траектории, которые имеют вид(3.49), 2 (T ) 0.1 (T )Вектор (3.47) называется ортогональным к поверхности (3.48) в точкеортогонален плоскости, которая касается поверхности (3.48) в точке x ( t0 ).*x = x ( t0 ) ,если онТак какявляется произвольным вещественным числом, то первоеравенство (3.49) не накладывает никаких условий на функцию 1 (t ).
Далее, всоответствии с (3.24) 2 (t ) — линейная функция, которая может обращатьсяв нуль только один раз. Поэтому в интервале 0 t T функция 2 (t ) неможет изменять свой знак.Как следует из (3.49) и (3.19), на заключительном участке фазовая точкадвижется под воздействием управления u* (t ) 0 по траектории семейства(3.28). На начальном участке в зависимости от знака 2 (0) движение1.происходит либо под воздействием управления u* 1, либо — u*Возможен также вариант0 , когда на всей траектории движения2 (0)u* (t )0.На рис. 3.15 изображены управление u* (t ) и соответствующая емутраектория x(t ) при 2 (0) 1.Найдем на фазовой плоскости совокупность точек, в которых происходитпереключение управления с u* (t ) 1 на u* (t ) 0.Запишем равенство*H ψ (T ), x(T ), u* (T )k u* (T )1 (T ) x2 (T )2 (T ) u (T )k1 (T )x2 (T )0,из которого следует, чтоx1 t11 (T )k.x2 (T )(3.50)u*x2u* = 0x1t1Tu* = 1tx(0)бaРис.
3.15. Графики управления (а) и фазовой траектории (б)В интервале t1tT2 (T )В соответствии с (3.19)Так как1 t11 (T ),2 t11 t1Tt11 и, очевидно,1T t1.1 t1то из (3.50) следует2 t1.x2 (T )(3.51).kВ интервале t1 t T u* (t ) 0, и потомуx1 (T ) x2 t1 T t1 x1 t1 .Принимая во внимание (3.51) и равенство x1 (T ) 0, найдем1x1 t1x2 t1 x2 (T ).kНо так как x2 (T ) x2 t1 , то окончательно получим1 2(3.52)x1 t1x2 t1 .kРавенство (3.52) задает на фазовой плоскости параболу. Однако, какследует из рис. 3.15, переключение управления с u* (t ) 1 на u* (t ) 0возможно только при x2 t1 0 (в противном случае прямая x1 0 не можетбыть достигнута), т.е. уравнение (3.52) необходимо дополнить неравенствомлинию на фазовой плоскости, определяемуюx2 t1 0.
Обозначимсоотношениями1 2x1x2 , x2 0.kИменно в точках линиипроисходит переключение управления с +1 на 0.Если рассмотреть управление u* (t ), вид которого представлен на рис. 3.16,и соответствующую ему фазовую траекторию, то указанным выше способомлегко установить, что переключение управления u* (t ) с –1 на 0 происходитTна линииt1, которая задается соотношениями1 2x1x2 , x2 0.kОбозначимобъединение линийи:. Для каждойфазовой траектории x(t) переключение управления u* (t ) происходит на линии. На рис. 3.17 изображены линия переключения и вид выделенныхнеобходимыми условиями оптимальности фазовых траекторий. Толькоизображенные на рис. 3.17 траектории могут быть оптимальнымитраекториями.u*Tt1t−1Рис.
3.16. График управления u* (t )Необходимые условия оптимальности непосредственно не могутгарантировать оптимальность выделенных с их помощью управлений итраекторий. С другой стороны, оптимальная траектория и оптимальноеуправление должны удовлетворять необходимым условиям. Изображенные нарис. 3.17 траектории, несомненно, являются оптимальными, так как каждойначальной точке соответствует единственная траектория, а по условиям задачисуществование оптимальных траекторий и управлений представляется вполнеочевидным.На рис.
3.17 видно, что каждая оптимальная траектория целиком лежитлибо в левой, либо в правой полуплоскости.+x2u* = 0x (0)u* = −1u* = 1u* = −1x1u* = 1x(0)u* = 0−Рис. 3.17. Графики оптимальных фазовых траекторийОбозначимx1x2уравнение линии . Оптимальное управление задается равенствомu1, еcли x1x20 и x10,1, если x1x20 и x10,0, если x1x20 и x10,или x1x20 и x10..