Принцип максимума Понтрягина. Пример (Лекции)
Описание файла
PDF-файл из архива "Лекции", который расположен в категории "". Всё это находится в предмете "методы оптимизации" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст из PDF
Принцип максимума Понтрягина. ПримерИспользование приёмов классического вариационного исчисления дляпостроения оптимальных систем управления при наличии жесткихограничений на управляющее воздействиевызываетu (t ) U maxопределенные трудности, поскольку в процедуре синтеза учесть этиограничения невозможно.Несостоятельность классической постановки задачи вариационногоисчисления выяснилась, в частности, при попытке решения задач, связанныхс запуском ракет.
Так как в этом случае присутствуют жесткие ограниченияна положения рулей управления и расход топлива.В связи с этим, в 50 – 60 годах прошлого века, Львом СемёновичемПонтрягиным в институте АиТ АН СССР (ИПУ), была предложена новаятеория, получившая название Принципа максимума [2].Рассмотрим постановку задачи.Дано: математическая модель объекта управления в форме Кошиxi fi (x, u), i 1, n .(1)Ограничения на управляющее воздействиеuk (t ) U k max , k 1, m .(2)Начальное состояние объекта управления в момент времени t0(3)xi (t0 ) xi 0 .И конечное состояние объекта управления в момент времени tк(4)xi (tk ) xik .Функционал качества видаtkJF (x, u)dtmin .(5)t0Замечание: функционал (5) не является функцией времени в явном виде.Требуется определить: u o (t ) - оптимальное программное управление,переводящее объект управления (1) из начального состояния (3) в конечноесостояние (4) по оптимальной траектории xio (t ), i 1, k , с учетомналагаемых на управляющее воздействие ограничений (2).Для рассмотрения теоремы Принципа максимума необходимо ввести врассмотрение функцию Гамильтона H (x, ψ, u) , являющуюся функциейкоординат состояния объект управления, управляющего воздействия u (t ) итак называемой сопряженной функцией i (t ) .nH (x, ψ, u)i (t ) f i ( x, u)max .(6)i 0Координаты состоянияи сопряженная функциясобой через Гамильтониан следующим образом:iсвязаны между2Hxi, i(7)0, n ,iH(8), i 0, n .xiСистема (8) называется системой сопряженных уравнений.Оптимальное управляющее воздействие определяется из условиямаксимума функции Гамильтона (6).
Согласно теореме Ферма для гладкихнепрерывных функций достаточно определить производную функцииГамильтона по искомому управляющему воздействию и приравнять её нулю.H(9)0.ukИз полученного выражения определяется оптимальное управляющеевоздействие uk o (t ) , k 1, m . Но при попадании uk o (t ) на границы областидопустимых значений (2), соотношение (9) нарушается, а оптимальноеуправление в этом случае, удовлетворяет Принципу максимума, доказанномув форме теоремы.iТеорема Принципа максимума.Пусть uk o (t ) - оптимальное программное управление, и xio (t ) соответствующие ему оптимальные программные траектории в задаче (1-5)определены.Тогдасуществуют:непрерывнаявектор-функцияψ o (t )1.o1 (t ),o2 (t ),,Ton (t )и число00 , такие, чтовектор-функция ψ o (t ) на интервале управления tнулю ψ o (t )t0 , tk не равна0;(t ) является решением системы сопряженных2.
вектор-функцияуравнений (8);3. функция Гамильтона (3.6) достигает максимума при u (t )оптимальном управленииH xo (t ), ψ o (t ), u o (t ) max H xo (t ), ψ o (t ), u(t ) ;(10)u U4.На интервале управления tt0 , tk выполняется тождествоH xo (t ), ψ o (t ), u o (t )0.(11)В теореме Принципа максимума условие 3, условие максимумафункции Гамильтона на интервале управления t t0 , tk , является основнымусловием (отсюда и получила название теорема).3Условие 4 служит для определения времени функционированияобъекта управления под действием управляющего воздействия - tk в задачахс нефиксированным временем.Теорема Принципа максимума, в общей простановке задачи (1-5), даетнеобходимое условие оптимальности, а в частном случае, для линейныхзадач оптимального быстродействия, Принцип максимума являетсянеобходимым и достаточным условием оптимальности.Замечание: внутри области допустимых значений управляющегоHвоздействия (2), условие (9)0 выполняется, и из него определяетсяukаналитическое выражение оптимального управляющего воздействия u (t ) .
АHна границах области допустимых значений условие0 нарушается иukуправляющее воздействие принимает свои граничные значенияu (t )U max .Рассмотрим пример применения теоремы для определенияоптимального управляющего воздействия.ПримерДано: математическая модель динамического движения объектауправления представлена в виде системы уравненийx1 x2x2 u.Граничные условия, то есть состояние ОУ в начальный t0 0 иконечный tk 1с моменты времени имеют вид:x1 (0) 5,x (1) 0,и 1x2 (0) 0,x2 (1) 0.Функционал качества определен в виде1(4 x12J5 x22u 2 )dtmin .0Известнывоздействие: uтакже ограничения,U max , U max 20 .налагаемыенауправляющееТребуется определить u o (t ) — оптимальное программное управление,с учетом налагаемых на него ограничений u U max , переводящее объект изTTначального состояния X (0) 5 0 в конечное состояние X (1) 0 0 заинтервал времени равный t 0; 1 c по оптимальной траекторииxio (t ) , i 1,2 .Решение:4Для того чтобы составить функцию Гамильтона, необходиморасширить фазовое пространство объекта управления посредством вводакоординаты x0 .
Производная по времени этой координаты x0 равнаинтегранту F (x, u ) функционала качества (5). Тогда размерность системадифференциальных уравнений, описывающих динамическое поведениеобъекта управления, повысится на единицу и примет видx0 4 x12 5 x22 u 2 ,x1 x2 ,x2 u.ФункциюГамильтонасоставляютвсилу«расширенной»математической модели объекта управления2Н5 x22 u 2 )max .0 (4 x11 (t ) x22 (t )uУправляющее воздействие определяется из условия максимумафункции Гамильтона (10) на оптимальной траектории. Найдем частнуюпроизводную Гамильтониана по управляющему воздействию, и из равенстванулю этой производной определим выражение для управления как функциювремени.H2 0u0,2 (t )u1 2 (t )u, u U max .2 0Общий вид управляющего воздействия определён, остается тольконайти аналитическое выражение сопряженной функции 2 (t ) и число 0 ,определяемые из системы сопряженных уравнений вида (8)H0,0x01Hx180 x1 ,H10 0 x21 (t ).x2Из решения первого уравнения системы определяется 0 const .Согласно теореме Принципа максимума число 0 является постоянной1 .
Следовательно,неположительнойвеличиной, например0120 . Тогда законуправляющее воздействие примет вид: u2 (t ), u2управления можно записать так2512u (t )2 (t ),если122 (t )U max , если122 (t )U max ;U max ;1U max .2 (t )2Далее следует определить функцию 2 (t ) . Для этого второе и третьеуравнения из системы сопряженных уравнений преобразуем с учетом1 к виду0H8 x1,1x1U max , еслиH10 x21 (t ).x2Для решения полученной системы сопряженных уравнений, дополнимих уравнениями связи, то есть уравнениями математической модели ОУ сучетом ранее определенных выражений для числа 0 и управляющеговоздействия ux1 x2 ,2x2112 (t ),28 x1,10 x21 (t ).Дальнейший ход решения аналогичен рассмотренному ранее прирешении примера в разделе 1.1.9.Таким образом, получим аналитические выражения оптимальныхпрограммных траекторий xio (t ), i 1,22x1o (t )25,0984et7,3028et14,4981e2t1,7025e 2t ,x2o (t )25,0984e t 7,3028et 28.9962C3e 2t 3.405e 2t .и искомого программного управления (уравнение регулятора)1125,098e t 7,302et 57,99e 2t 6,81e 2t ,2 (t )2 (t )22u o (t )12U max ,U max ,122 (t )2 (t )20;20;20.6▪ Произведем моделирование полученной оптимальной системыпрограммного управления.
Результаты моделирования приведены навременной диаграмме рис. 1.12200,51,0t0,51,0t0,51,0t0,51,0tu+ 200− 20x150x20Рис. 1. Временная диаграмма процесса управленияТаким образом, перевод объекта управления из начального состоянияTTX (0) 5 0 в конечное состояние X (1) 0 0 произошел за интервалвремени равный 1сек.С помощью теоремы Принципа максимума можно решатьоптимизационные задачи с нефиксированным временем tк в функционалекачества (5).
Такие задачи называются задачами быстродействия. В этомслучае выражение функционала упрощается, а время функционирования ОУпод действием управляющего воздействия определяется в самой процедуресинтеза.Математическая постановка задачи быстродействия.Дано:Математическая модель объекта управления в видеx Ax Bu .(12)Размерность матрицы A равна dim A (n n) , управляющеевоздействие является скалярным, размерность вектора B равнаdim B (n 1) . Матричное представление системы дифференциальных7уравнений (12) можно представить,использования, в форме Кошиxiai1x1ai 2 x2дляain xn , iудобствадальнейшего1,(n 1),(13)xnan1x1an 2 x2ann xnku.Граничные условияxi (0)xi 0 , i(14)1, n ,xi (T ) xiT , i 1, n .Функционалом качества является критерий быстродействия(15)TJ1dt(16)min .0Обязательными являются ограничения, налагаемые на управляющеевоздействие(17)uk (t ) U k max .Требуется определить: Оптимальное программное управляющеевоздействие u(t ) , переводящее ОУ из начального состояния xi 0 , i 1, n (14)в конечное состояние xiT , i 1, n (15), за минимальное время.Решение: поскольку необходимым и достаточным условиемоптимальности при решении задач быстродействия является Принципмаксимума, то для решения поставленной задачи необходимо составитьфункцию Гамильтонаn 1H (x, ψ, u)01i (t )( ai1x1ai 2 x2ain xn )i 1n (t )( an1x1an 2 x2ann xnku )(18)max.Искомое управление u(t ) определяется из условия достижениямаксимума функции Гамильтона (18) при налагаемых на управляющеевоздействие ограничениях (17).Как известно из теоремы Ферма, необходимым условием экстремумавсякой гладкой функции в открытой области изменения аргумента являетсяравенство нулю её производной.
Но если функция задана в замкнутойобласти, то её экстремум может достигаться как внутри, так и на границахэтой области.В рассматриваемом случае функция Гамильтона H (x, ψ, u) являетсялинейной относительно управления u (t ) , а её производная всюду наинтервале управления не равна нулю8H(19)k n (t ) 0uи от u (t ) не зависит. Поэтому функция Гамильтона H ( x, , u ) достигаетсвоего максимального значения на границах интервала ограничений (17)управляющего воздействия U max , U max .Возникает вопрос, при каком же все-таки управлении u (t ) функцияГамильтона H (x, ψ, u) достигнет своего максимума, или, другими словамипри каком значении управляющего воздействия u (t ) выполнится третьеусловие теоремы Принципа максимума? Ответ очевиден. Из выражения (19)следует, что максимум Гамильтониана будет достигаться на концахинтервала UU max , U max , то есть зависит только от знака производнойHфункции Гамильтонаk n (t ) .uСледовательно, оптимальное по быстродействию управляющеевоздействие u (t ) будет менять свой знак в соответствии со знакомпроизводной функции ГамильтонаH(20)u (t ) U max signsignk n (t ).uПолученный закон управления справедлив в каждый момент времени,принадлежащий интервалу управления t 0, T .