Принцип максимума Понтрягина. Пример (1264231)

Файл №1264231 Принцип максимума Понтрягина. Пример (Лекции)Принцип максимума Понтрягина. Пример (1264231)2021-07-292021-07-29СтудИзба

Лекции

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла

Принцип максимума Понтрягина. ПримерИспользование приёмов классического вариационного исчисления дляпостроения оптимальных систем управления при наличии жесткихограничений на управляющее воздействиевызываетu (t ) U maxопределенные трудности, поскольку в процедуре синтеза учесть этиограничения невозможно.Несостоятельность классической постановки задачи вариационногоисчисления выяснилась, в частности, при попытке решения задач, связанныхс запуском ракет.

Так как в этом случае присутствуют жесткие ограниченияна положения рулей управления и расход топлива.В связи с этим, в 50 – 60 годах прошлого века, Львом СемёновичемПонтрягиным в институте АиТ АН СССР (ИПУ), была предложена новаятеория, получившая название Принципа максимума [2].Рассмотрим постановку задачи.Дано: математическая модель объекта управления в форме Кошиxi fi (x, u), i 1, n .(1)Ограничения на управляющее воздействиеuk (t ) U k max , k 1, m .(2)Начальное состояние объекта управления в момент времени t0(3)xi (t0 ) xi 0 .И конечное состояние объекта управления в момент времени tк(4)xi (tk ) xik .Функционал качества видаtkJF (x, u)dtmin .(5)t0Замечание: функционал (5) не является функцией времени в явном виде.Требуется определить: u o (t ) - оптимальное программное управление,переводящее объект управления (1) из начального состояния (3) в конечноесостояние (4) по оптимальной траектории xio (t ), i 1, k , с учетомналагаемых на управляющее воздействие ограничений (2).Для рассмотрения теоремы Принципа максимума необходимо ввести врассмотрение функцию Гамильтона H (x, ψ, u) , являющуюся функциейкоординат состояния объект управления, управляющего воздействия u (t ) итак называемой сопряженной функцией i (t ) .nH (x, ψ, u)i (t ) f i ( x, u)max .(6)i 0Координаты состоянияи сопряженная функциясобой через Гамильтониан следующим образом:iсвязаны между2Hxi, i(7)0, n ,iH(8), i 0, n .xiСистема (8) называется системой сопряженных уравнений.Оптимальное управляющее воздействие определяется из условиямаксимума функции Гамильтона (6).

Согласно теореме Ферма для гладкихнепрерывных функций достаточно определить производную функцииГамильтона по искомому управляющему воздействию и приравнять её нулю.H(9)0.ukИз полученного выражения определяется оптимальное управляющеевоздействие uk o (t ) , k 1, m . Но при попадании uk o (t ) на границы областидопустимых значений (2), соотношение (9) нарушается, а оптимальноеуправление в этом случае, удовлетворяет Принципу максимума, доказанномув форме теоремы.iТеорема Принципа максимума.Пусть uk o (t ) - оптимальное программное управление, и xio (t ) соответствующие ему оптимальные программные траектории в задаче (1-5)определены.Тогдасуществуют:непрерывнаявектор-функцияψ o (t )1.o1 (t ),o2 (t ),,Ton (t )и число00 , такие, чтовектор-функция ψ o (t ) на интервале управления tнулю ψ o (t )t0 , tk не равна0;(t ) является решением системы сопряженных2.

вектор-функцияуравнений (8);3. функция Гамильтона (3.6) достигает максимума при u (t )оптимальном управленииH xo (t ), ψ o (t ), u o (t ) max H xo (t ), ψ o (t ), u(t ) ;(10)u U4.На интервале управления tt0 , tk выполняется тождествоH xo (t ), ψ o (t ), u o (t )0.(11)В теореме Принципа максимума условие 3, условие максимумафункции Гамильтона на интервале управления t t0 , tk , является основнымусловием (отсюда и получила название теорема).3Условие 4 служит для определения времени функционированияобъекта управления под действием управляющего воздействия - tk в задачахс нефиксированным временем.Теорема Принципа максимума, в общей простановке задачи (1-5), даетнеобходимое условие оптимальности, а в частном случае, для линейныхзадач оптимального быстродействия, Принцип максимума являетсянеобходимым и достаточным условием оптимальности.Замечание: внутри области допустимых значений управляющегоHвоздействия (2), условие (9)0 выполняется, и из него определяетсяukаналитическое выражение оптимального управляющего воздействия u (t ) .

АHна границах области допустимых значений условие0 нарушается иukуправляющее воздействие принимает свои граничные значенияu (t )U max .Рассмотрим пример применения теоремы для определенияоптимального управляющего воздействия.ПримерДано: математическая модель динамического движения объектауправления представлена в виде системы уравненийx1 x2x2 u.Граничные условия, то есть состояние ОУ в начальный t0 0 иконечный tk 1с моменты времени имеют вид:x1 (0) 5,x (1) 0,и 1x2 (0) 0,x2 (1) 0.Функционал качества определен в виде1(4 x12J5 x22u 2 )dtmin .0Известнывоздействие: uтакже ограничения,U max , U max 20 .налагаемыенауправляющееТребуется определить u o (t ) — оптимальное программное управление,с учетом налагаемых на него ограничений u U max , переводящее объект изTTначального состояния X (0) 5 0 в конечное состояние X (1) 0 0 заинтервал времени равный t 0; 1 c по оптимальной траекторииxio (t ) , i 1,2 .Решение:4Для того чтобы составить функцию Гамильтона, необходиморасширить фазовое пространство объекта управления посредством вводакоординаты x0 .

Производная по времени этой координаты x0 равнаинтегранту F (x, u ) функционала качества (5). Тогда размерность системадифференциальных уравнений, описывающих динамическое поведениеобъекта управления, повысится на единицу и примет видx0 4 x12 5 x22 u 2 ,x1 x2 ,x2 u.ФункциюГамильтонасоставляютвсилу«расширенной»математической модели объекта управления2Н5 x22 u 2 )max .0 (4 x11 (t ) x22 (t )uУправляющее воздействие определяется из условия максимумафункции Гамильтона (10) на оптимальной траектории. Найдем частнуюпроизводную Гамильтониана по управляющему воздействию, и из равенстванулю этой производной определим выражение для управления как функциювремени.H2 0u0,2 (t )u1 2 (t )u, u U max .2 0Общий вид управляющего воздействия определён, остается тольконайти аналитическое выражение сопряженной функции 2 (t ) и число 0 ,определяемые из системы сопряженных уравнений вида (8)H0,0x01Hx180 x1 ,H10 0 x21 (t ).x2Из решения первого уравнения системы определяется 0 const .Согласно теореме Принципа максимума число 0 является постоянной1 .

Следовательно,неположительнойвеличиной, например0120 . Тогда законуправляющее воздействие примет вид: u2 (t ), u2управления можно записать так2512u (t )2 (t ),если122 (t )U max , если122 (t )U max ;U max ;1U max .2 (t )2Далее следует определить функцию 2 (t ) . Для этого второе и третьеуравнения из системы сопряженных уравнений преобразуем с учетом1 к виду0H8 x1,1x1U max , еслиH10 x21 (t ).x2Для решения полученной системы сопряженных уравнений, дополнимих уравнениями связи, то есть уравнениями математической модели ОУ сучетом ранее определенных выражений для числа 0 и управляющеговоздействия ux1 x2 ,2x2112 (t ),28 x1,10 x21 (t ).Дальнейший ход решения аналогичен рассмотренному ранее прирешении примера в разделе 1.1.9.Таким образом, получим аналитические выражения оптимальныхпрограммных траекторий xio (t ), i 1,22x1o (t )25,0984et7,3028et14,4981e2t1,7025e 2t ,x2o (t )25,0984e t 7,3028et 28.9962C3e 2t 3.405e 2t .и искомого программного управления (уравнение регулятора)1125,098e t 7,302et 57,99e 2t 6,81e 2t ,2 (t )2 (t )22u o (t )12U max ,U max ,122 (t )2 (t )20;20;20.6▪ Произведем моделирование полученной оптимальной системыпрограммного управления.

Результаты моделирования приведены навременной диаграмме рис. 1.12200,51,0t0,51,0t0,51,0t0,51,0tu+ 200− 20x150x20Рис. 1. Временная диаграмма процесса управленияТаким образом, перевод объекта управления из начального состоянияTTX (0) 5 0 в конечное состояние X (1) 0 0 произошел за интервалвремени равный 1сек.С помощью теоремы Принципа максимума можно решатьоптимизационные задачи с нефиксированным временем tк в функционалекачества (5).

Такие задачи называются задачами быстродействия. В этомслучае выражение функционала упрощается, а время функционирования ОУпод действием управляющего воздействия определяется в самой процедуресинтеза.Математическая постановка задачи быстродействия.Дано:Математическая модель объекта управления в видеx Ax Bu .(12)Размерность матрицы A равна dim A (n n) , управляющеевоздействие является скалярным, размерность вектора B равнаdim B (n 1) . Матричное представление системы дифференциальных7уравнений (12) можно представить,использования, в форме Кошиxiai1x1ai 2 x2дляain xn , iудобствадальнейшего1,(n 1),(13)xnan1x1an 2 x2ann xnku.Граничные условияxi (0)xi 0 , i(14)1, n ,xi (T ) xiT , i 1, n .Функционалом качества является критерий быстродействия(15)TJ1dt(16)min .0Обязательными являются ограничения, налагаемые на управляющеевоздействие(17)uk (t ) U k max .Требуется определить: Оптимальное программное управляющеевоздействие u(t ) , переводящее ОУ из начального состояния xi 0 , i 1, n (14)в конечное состояние xiT , i 1, n (15), за минимальное время.Решение: поскольку необходимым и достаточным условиемоптимальности при решении задач быстродействия является Принципмаксимума, то для решения поставленной задачи необходимо составитьфункцию Гамильтонаn 1H (x, ψ, u)01i (t )( ai1x1ai 2 x2ain xn )i 1n (t )( an1x1an 2 x2ann xnku )(18)max.Искомое управление u(t ) определяется из условия достижениямаксимума функции Гамильтона (18) при налагаемых на управляющеевоздействие ограничениях (17).Как известно из теоремы Ферма, необходимым условием экстремумавсякой гладкой функции в открытой области изменения аргумента являетсяравенство нулю её производной.

Но если функция задана в замкнутойобласти, то её экстремум может достигаться как внутри, так и на границахэтой области.В рассматриваемом случае функция Гамильтона H (x, ψ, u) являетсялинейной относительно управления u (t ) , а её производная всюду наинтервале управления не равна нулю8H(19)k n (t ) 0uи от u (t ) не зависит. Поэтому функция Гамильтона H ( x, , u ) достигаетсвоего максимального значения на границах интервала ограничений (17)управляющего воздействия U max , U max .Возникает вопрос, при каком же все-таки управлении u (t ) функцияГамильтона H (x, ψ, u) достигнет своего максимума, или, другими словамипри каком значении управляющего воздействия u (t ) выполнится третьеусловие теоремы Принципа максимума? Ответ очевиден. Из выражения (19)следует, что максимум Гамильтониана будет достигаться на концахинтервала UU max , U max , то есть зависит только от знака производнойHфункции Гамильтонаk n (t ) .uСледовательно, оптимальное по быстродействию управляющеевоздействие u (t ) будет менять свой знак в соответствии со знакомпроизводной функции ГамильтонаH(20)u (t ) U max signsignk n (t ).uПолученный закон управления справедлив в каждый момент времени,принадлежащий интервалу управления t 0, T .

Характеристики

Тип файла

PDF-файл

Размер

692,84 Kb

Материал

Лекции

Тип материала

Лекции

Предмет

Методы оптимизации

Высшее учебное заведение

МГТУ им. Н.Э.Баумана

Тип файла PDF

PDF-формат наиболее широко используется для просмотра любого типа файлов на любом устройстве. В него можно сохранить документ, таблицы, презентацию, текст, чертежи, вычисления, графики и всё остальное, что можно показать на экране любого устройства. Именно его лучше всего использовать для печати.

Например, если Вам нужно распечатать чертёж из автокада, Вы сохраните чертёж на флешку, но будет ли автокад в пункте печати? А если будет, то нужная версия с нужными библиотеками? Именно для этого и нужен формат PDF - в нём точно будет показано верно вне зависимости от того, в какой программе создали PDF-файл и есть ли нужная программа для его просмотра.

Список файлов лекций

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.