Принцип максимума Понтрягина (1264232), страница 2
Текст из файла (страница 2)
Число k является весовым коэффициентом, с помощьюкоторого устанавливается компромисс между двумя этими критериями.Требуется найти управление и траекторию, переводящие фазовую точку иззаданного начального состояния в начало координат и минимизирующиефункционал (3.14). В качестве начальных предполагается рассмотреть всеточки фазовой плоскости.В соответствии с теоремой 2.1 функция Гамильтона(3.15)H (ψ, x, u )u0 k1x22u.Вектор ψ (t ) определяется уравнениямиd 0d 1d 2(3.16)0,0,1.dtdtdtВыше уже отмечалось, что теоремой 2.1 вектор ψ (t ) определяется сточностью до постоянного положительного множителя.
Далее, поскольку1. Тогда функция (3.15) примет видconst 0, положим 0 (t )0 (t )(3.17)H (ψ, x, u )k u1x22u.Для определения оптимального управления необходимо максимизироватьфункцию Гамильтона как функцию управления, и, в соответствии с (3.17),максимизация функции Гамильтона выливается в максимизацию функцииHu2u.Представим H в виде0,2 1 u при u(3.18)H1uприu0.2Из условия максимума функции (3.18), принимая во внимание ограничение(3.13), найдем1, если 2 (t ) 1,1, еслиu* (t )0, если2 (t )2 (t )[0,1], если[ 1,0], если1,1,2 (t )2 (t )(3.19)1,1,здесь символом u* (t ) обозначено управление, максимизирующее функциюГамильтона.Введем в рассмотрение функцию «зоны нечувствительности» y dez( x),которая определяется соотношениями0, если xy1,sign x, если x1,[0,1], если x 1,[ 1,0], если x1.На рис.
3.6 приведен график функции y dez( x).Равенство (3.19) можно записать в видеu* (t ) dez 2 (t ) .(3.20)В конечный момент времени T x(T ) 0, так как конечной цельюуправления является перевод фазовой точки в начало координат. Покажем,что(3.21)1.2 (T )y1−11x−1Рис. 3.6. График функции dez( x)Запишем равенствоH ψ (T ), x(T ), u* (T )Если2 (T )ku * (T )1 (T )1, то, в соответствии с (3.20), u (T )H ψ (T ), x(T ), u* (T )kx2 (T )2 (T )u * (T ).(3.22)0 и из (3.22) следует0.(3.23)Соотношение (3.23) противоречит четвертому условию теоремы принципа0,1 , а примаксимума Понтрягина. При12 (T ) 1 u (T )2 (T )u (T )1,0 . Равенство (3.21) в этом случае также приводит к соотношению(3.23).Из неравенства (3.21) следует, что в начало координат фазовая точка1.может попасть либо с управлением u (t ) 1, либо с управлением u (t )Проинтегрируем уравнения (3.16):(3.24)1 (t )1 (0),2 (t )1 (0)t2 (0).Строго говоря, уравнения (3.16) допускают решение(3.25)0, 2 (t )1.1 (t )В этом случае соотношение (3.20) не определяет управление u* (t )однозначным образом.
Однако решение (3.23), как легко убедиться,противоречит условиюH ψ (t ), x(t ), u* (t ) 0и поэтому его следует исключить из дальнейшего рассмотрения.В соответствии с (3.24) график функции 2 (t ) является прямой линией.Вид этой прямой определяется начальными условиями 1 (0) и 2 (0). Далее,если2 (t )2 (0),то в соответствии с неравенствами (3.21) 2 (0) 1.Рассмотрим оптимальное управление и оптимальную траекторию,соответствующие функции 2 (t ), представленной на рис. 3.7.Управление u* (t ) в этом случае имеет вид, изображенный на рис.
3.8.Как следует из (3.11) и (3.12), при u 1 фазовая точка движется попараболе семейства1 2x1x2 s* ,(3.26)21 — по параболе семействаа при u1 2x1x2 s** ,(3.27)2здесь s* и s** — произвольные константы. При u (t ) 0x2 (t ) x2 (0),x1 (t ) x2 (0)t x1(0),т.е. при u 0 фазовая точка движется по прямой линииx2 (t ) x2 (0).(3.28)21t2Tt1t−1Рис.
3.7. График функции2 (t )u*1t2Tt1t−1Рис. 3.8. График оптимального управленияНа рис. 3.9 изображено семейство прямых (3.28).x2x1Рис. 3.9. Графики прямых, определяемых уравнением (3.28)Таким образом, траектория, соответствующая изображенному на рис. 3.8управлению u* (t ), состоит из парабол соответственно семейств (3.26) и(3.27), соединенных между собой отрезком прямой (3.28) (рис. 3.10).На заключительном участке фазовая точка движется по параболесемейства (3.27), причем по той из парабол семейства (3.27), котораяпроходит через начало координат. Эта парабола задается уравнением1 2x1x2 ,2а участок параболы, по которому фазовая точка переводится в началокоординат, — уравнением1 2x1x2 , x2 0.(3.29)2x2u=0u = −1u =1x1Рис. 3.10. График оптимальной траектории1 происходит именно вПереключение управления с u* (t ) 0 на u* (t )точках участка параболы (3.29).
Таким образом, можно записать1 2x1 t2x2 t2 .2Линию, которая задается уравнением (3.29), обозначим 1 .Найдем линию, в точках которой происходит переключение управления сu* (t ) 1 на u* (t ) 0.Воспользуемся равенством M ψ (t ), x(t ) 0. Для момента времени t2имеем(3.30)k u t2 00 0.1 t2 x2 t22 t2 u t2В соответствии с рис. 3.7, 2.9u t2 0Из (3.30) следуетt21Найдем1,2 t11,t221.k.x2 t21время движения с управлением1, то из равенства2 t22t21t2t1t12,(3.31)u* (t )0.Таккак2 t1следуетt21или, принимая во внимание (3.31),2 x2 t2.(3.32)kфазовая точка движется под воздействиемt2В интервалеуправления u* (t )t1tt20. Поэтомуt1x1 t2x2 t1 t2t1x1 t1 ,или2 x2 t2x1 t1 .kПоскольку x2 t1x2 t2 , то можно записать2 2x1 t2x2 t2x1 t1 .kТочка x t2 лежит на линии 1 и, следовательно,1 2x1 t2x2 t2 .2Подставив (3.34) в (3.33), получим1 2 2x1 t1x2 t2 .2 kДалее, учитывая, что x2 t2x2 t1 , можно записатьx1 t2x2 t112x1 t1(3.33)(3.34)2 2x2 t1 .kИтак, переключение управления с u* (t ) 1 на u* (t )кривой1 2 2x1x2 , x2 0.2 kЛинию, задаваемую уравнением (3.35), обозначим0 происходит в точках(3.35)2.*Рассмотрев управление u (t ), представленное на рис.
3.11, аналогичнымобразом можно показать, что переключение управления с u* (t )u* (t )1 на0 происходит на линииx1122 2x2 , x2k0,(3.36)а переключение управления с u* (t ) 0 на u* (t ) 1 происходит на линии1 2x1x2 , x2 0.(3.37)2Линии, задаваемые уравнениями (3.36) и (3.37), обозначим соответственно11 , а 222.2 и 2 . Пусть, далее, 1u*1t1tTt2−1Рис. 3.11.
График управления u* (t )Таким образом, на фазовой плоскости существуют две линии переключения*1, ниже1 и2 (см. рис. 3.12). Выше линии1 и2 управление u (t )линии1и2управление u* (t )1. В промежутке между линиями1и2*u0. На рис. 3.12 жирными линиями выделены две фазовые траектории,которые удовлетворяют теореме 2.1. Только управления и траектории,задаваемые рис. 3.12, могут быть оптимальными.x21− +2u=0x0u = −1x1u =1x0u=0 −21+Рис.
3.12. Графики фазовых траекторийДалее, поскольку для каждой начальной точки существует только однатраектория, удовлетворяющая необходимым условиям оптимальности(условиям теоремы 2.1), а по физическим соображениям существованиеоптимальных траекторий представляется вполне очевидным фактом, то этопозволяет заключить, что полученные выше управления и траекторииявляются оптимальными.Пустьx1 f1 x2— уравнение линии 1, аx1 f 2 x2— уравнение линии 2 . Тогда оптимальное управление можно задатьравенством1, если x1 f1 x2 0 и x1 f 2 x2 0,1, если x1uf1 x20, если signx10 и x1f1 x2f 2 x2sign x10,(3.38)f 2 x2 .Строго говоря, равенство (3.38) не задает значение оптимального управленияна линии 1, хотя линия 1 образована двумя оптимальными фазовымитраекториями системы (3.6).
Как будет показано ниже, задание управленияна линии переключения не требуется.На рис. 3.13 изображена структурная схема оптимальной системы.−111u−11− x1 + f1 ( x2 )f1 ( x2 )− x1 + f 2 ( x2 )f 2 ( x2 )1sx21sx1−11−1Рис. 3.13. Структурная схема оптимальной системыЕсли функции x1 f1 x2 и x1 f 2 x2 имеют разные знаки, то (t ) 0 иуправление u (t ) 0. Если указанные функции имеют одинаковые знаки, то(t )2sign x1f1 x2и сигнал управления u (t )sign x1f1 x2 .3.2. ЗАДАЧА С ПОДВИЖНЫМИ КОНЦАМИВ п. 3.1 предполагалось, что начальное и конечное состояния системыстрого определены, т.е.
в фазовом пространстве заданы начальная x 0 иконечная x1 точки, которые следует соединить оптимальной траекторией.Рассмотрим более общий случай. Предположим, что вместо начальной иконечной точек заданы начальное s0 и конечное s1 многообразия. Пустьмногообразие s0 задается уравнениямиx1, x2 , , xnа многообразие s1 — уравнениямиl0, l1, p, p(3.39)n,x1, x2 , , xn0,1, k , k n.(3.40)Если n 3, а p k 1, то многообразия s0 и s1 представляют собойповерхности в трехмерном фазовом пространстве. При n 3, p 2, k 1многообразие s0 задается как множество, образованное пересечением двухповерхностей (рис. 3.14), т.е. является линией в трехмерном фазовомпространстве, а многообразие s1 по-прежнему представляет собойповерхность.s1s0x0x1Рис.
3.14. Начальное s0 и конечное s1 многообразияx1, x2 , , xn , l 1, p,1, k , будем0 иФункцииl x1, x2 , , xnполагать непрерывно дифференцируемыми по всем своим аргументам.Введем вектор(x)(x)(x)x1, , x2,, ,,x1x2xnназываемый градиентом функции x .Многообразие s0 называется гладким, если в каждой точке x1 (x),2 ( x), ,p ( x)s0 векторы(3.41)линейно независимы. Условие линейной независимости векторов (3.41)эквивалентно требованию, чтобы ранг матрицы111x1x2xn222x1x2xnpppx1x2xnбыл равен p.
Аналогичным образом определяется гладкость многообразия s1.В дальнейшем многообразия s0 и s1 полагаются гладкими.Рассмотрим следующую задачу: требуется среди допустимыхуправлений u(t ), переводящих фазовую точку x с многообразия s0 намногообразие s1, найти такое, которое доставляет минимум функционалу(3.2). Так как в поставленной задаче концы траектории x(t ) могутскользить по многообразиям s0 и s1, соответствующую задачуоптимального управления будем называть задачей с подвижными концами.Пусть u(t ) и x(t ), t0 t t1, — управление и траектория, решающиепоставленную выше задачу оптимального управления с подвижными концами.Но тогда найдутся точки x 0 и x1, лежащие соответственно на многообразияхs0 и s1 (рис. 3.14).
Ясно, что управление u(t ) и траектория x(t ) являютсяоптимальными и в смысле рассмотренной в п. 2.1 двухточечной задачиоптимального управления, т.е. управление u(t ) и траектория x(t ) должныудовлетворять принципу максимума (теореме 2.1).Таким образом, принцип максимума (теоремы 2.1 и 2.2) остается в силе идля задачи с подвижными концами. Однако в этом случае необходимо иметьнекоторые дополнительные условия, которые позволили бы определитьположение точек x 0 и x1 на многообразиях s0 и s1.Для получения указанных дополнительных условий обратимся к п.