Принцип максимума Понтрягина. Пример (1264231), страница 2
Текст из файла (страница 2)
Остаётся только определитьвыражение сопряженной функции n (t ) , при котором решение системыуравнений (13) удовлетворяет граничным условиям (14, 15).Функцияn (t ) определяется из решения системы сопряженныхуравнений, в соответствии со вторым условием теоремы Принципамаксимума (8).Из математического выражения полученного закона управления (20)следует, что закон управления u (t ) носит кусочно-непрерывный характер, тоесть управляющее воздействие u (t ) принимает только свои граничныеU max , а моменты смены знака управляющегозначенияU max иливоздействия u (t ) совпадают с моментами времени i перехода функции i (t )через нуль.Эти моменты времени i заранее неизвестны, и более того, количествоих в системе n - порядка также пока не определено.
Как определитьколичество нулей функции i (t ) ? Ответ на этот вопрос дает теорема об n интервалах.Теорема об n – интервалах была доказана в 1955 году.Точками разрыва u (t ) являются нули функции n (t ) . На рис. 2 показанпроизвольный график изменения сопряженнойсоответствующее ему программное управление u (t ) .функцииn (t )и9u , n n (t )u (t )+ U max0123 t− U maxРис. 2. Графики сопряженной функции n (t ) и соответствующее ейпрограммное управление u (t ) .На графиках моменты времени, в которые спряженная функцияпересекает ось t , обозначены i .Теорема об n – интервалахЕсли корни характеристического полинома объекта управлениядействительны, то число переключений управляющего воздействия u (t ) непревышает (n 1) раза, где n - порядок характеристического полинома.Замечание 1.Объектыуправления,вкоторыхкорнихарактеристическогополиномаявляютсяA( p) det( Ep A) 0действительными, называются неосциллирующими ОУ.Замечание 2.Если объект управления осциллирующий, то естькорни характеристического полинома комплексно-сопряженные pij ,тогда условия теоремы Фельдбаума не выполняются, и число переключенийu (t ) зависит от начальных условий.Пример решения задачи быстродействияПредположим, что исходная физическая постановка задачиформализована, и математическая модель объекта управления представлена вформе Коши.Дано: математическая модель ОУx1 x1,x2 u ,граничные условия известны и имеют видx1 (0) 0,x1 (T ) 1,и.x2 (0) 0,x2 (T ) 0.Критерий качества также определён как критерийбыстродействияTJ1 dtmin , ограничения на управляющее воздействие представлены в0виде u (t )Um1.10Требуетсяопределить:законоптимальногопрограммногоуправляющего воздействия u (t ) , переводящий объект управления изначального состояния 0;0 в конечное состояние 1;0 за минимальное время,с учетом ограничений, налагаемых на управляющее воздействие.
Также впроцессе конструирования системы оптимального программного управлениянеобходимо определить длительность нахождения объект управления подвоздействием управляющего воздействия Tmin , количество k - переключенийи моменты i - смен знака управляющего воздействия.Решение:1.
Для того чтобы определить количество интервалов знакопостоянствауправляющеговоздействиянеобходимо определить корниu (t )характеристического полинома объекта управления0 1A( p) det( Ep A) detp2 0 .0 0Корни этого полиномаp1,2 0 , следовательно, объект являетсянеосциллирующим, и, согласно теореме Фельдбаума, число k - смен знакауправляющего воздействия равно 1.2. Составим функцию ГамильтонаH ( x, , u )011 (t ) x22 (t )u )max ,иопределимпроизводнуюГамильтонианапоуправляющемуHвоздействию0 . Следовательно, максимум гамильтониана2 (t )uH max ( x, , u ) достигаться на границах допустимого интервала управленияU max ; U max , а знак управляющего воздействия u (t ) определяется знакомсопряженной функции 2 (t ) . Таким образом, общий вид искомого законауправления можно определить такu (t )U max sign2 (t ) .3.
Выражение 2 (t ) определяется из решения системы сопряженныхуравнений с учетом полученного Гамильтониана110Hx00,1Hx10,2Hx21.Решение этой системы имеет видC001 (t )1,A1,2 (t )A1t A2 .4. С учетом конкретизации 2 (t ) , закон управления принимает видu (t )U max sign( A1tA2 ) .Остается только определить постоянные интегрирования A1, A2 .5.Обыкновеннопостоянныеинтегрированияврешениидифференциальных уравнений определяются из начальных условий, ноначальные условия для сопряженных функций 1 (t ) и 2 (t ) неизвестны.Поэтому, постоянные интегрирования можно будет определить только послетого, как мы узнаем Tmin - время функционирования объекта под действиемуправляющего воздействия.Время функционирование объекта под действием управляющеговоздействия Tmin и- момент смены знака управляющего воздействияопределяются с помощью метода «стыкования решений».5.1.
Рассмотрим начальный момент времени функционированияобъекта под действием управляющего воздействия, то есть t 0 . Начальноесостояние ОУ известно x1 (0) 0; x2 (0) 0 . А знак управляющегоUm1. Тогда динамическоевоздействия назначим произвольно u (0)движение объекта будет описываться следующим образомx1 x1,x21,x1I (t )0,5t 2C2Itx2I (t )tрешение имеет видC1I ,C2I ,так какC1I0,C2I0,тогда решение конкретизируется12x1I (t )0,5t 2 ,x2I (t ) t.5.2. Рассмотрим конечный момент времени функционирования объектапод действием управляющего воздействия t T . Конечное состояние ОУтакже известно x1 (T ) 1; x2 (T ) 0 . И если на первом этапе движение ОУU m , то, следовательно, окончаниеосуществлялось под воздействиемдвижения ОУ должно происходить под воздействием u (T )Um1.В этом случае динамическое движение объекта описывается такимобразомx1 x1,x21,решение имеет видx1II (t )0.5t 2C2IItC1II ,x2II (t ) t C2II ,так как постоянные интегрирования равныC1II 1 0,5T 2 ,C2II T ,то решение конкретизируется к видуx1II (t )0,5t 2 Tt0,5T 21,x2II (t )t T.Но длительность T функционирования объекта под действиемуправляющего воздействия пока не известна, также остается неизвестным- момент смены знака управляющего воздействия.
Определим их.5.3. T иопределяются из условия неразрывности решения вмомент смены знака управляющего воздействия. Приравняем решения в этотмомент времени xiI ( ) xiII ( ), i 1,2 и из полученной системыалгебраических уравнений определим искомые T и .0,5 20,5 2 T0,5T 2 1,t T.Откуда T и определяются единственным образомT 10,5.6. Руководствуясь четвертым условием теоремы Принципа максимума,определяются постоянные интегрирования A1 и A2 из уравнения функцииГамильтона в начальный и конечный моменты времени (0 и T ) следующимобразом13Ht1A1x2 (0)A2u (0)Ht1A1x2 (T )( A1T0u1x1 (0) 0x2 (0) 0Tu1x1 (T ) 1x2 (T ) 01A2A2 )u (T )0,1( A1TA2 )0.A1 и A2 определяются однозначно: A1 1 и A2 1.
Если подставитьзначения A1 и A2 в выражение сопряженной функции 2 (t )A1t A2 , тополучим2(t )t1.7. Искомый закон управления приобретет видu (t ) 1 sign( t 1) .8.Промоделируемполученную системуоптимального побыстродействию программного управления.Результаты моделирования представлены на временной диаграмме ифазовой плоскости на рис. 3.H0t0tx2u0− U max+ U maxtx100,501,0x1tx200,51,0tРис. 3. Временная диаграмма и фазовый портрет работы системыоптимального программного управленияИз анализа качества процесса управления ясно, что управляющеевоздействие носит кусочно-непрерывный характер, характер переходногопроцесса – апериодический.
Время перехода ОУ из начального состояния вконечное состояние – минимально, следовательно, и энергетические затратына процесс управления также будут минимальны.1415.