Деменков Н.П. - Вычислительные методы решения задач оптимального управления на основе принципа максимума Понтрягина - 2015 (842911), страница 8
Текст из файла (страница 8)
Чтобы найтир2, используем уравнения Эйлера-Лагранжа_dp1 _ ан.- - - - - - - 0'dtах1анdp2dt--=---=-р1,ах2интегрируя которые, получимр1 = С; р2 = С2где С1 , С2 -- C1t,постоянные интегрирования.Подставим найденныеPiв гамильтониан, тогда имеемМаксимум функции Н с учетом ограничения на управляющийсигнал и обеспечивает оптимальность системы по быстродействию.Очевидно, что при наложенных ограничениях максимум Н существует, если управляющий сигнал и формируется исходя из алгоритма:и= 1· sign( С2 - C1t).Управляющий сигнал и должен изменять знак при выходе изображающей точки на линию переключения:+l приu(v) =_1при(dv)dv <dtdt(dv)dv >dtdtппи прии при(dv)dv =dtdtdvdt=(dv)dtпп< О;> О.Уравнение линии переключения имеет видVп = (dvJ = -fiьsignv.dt п(2.13)63Подставив числовые значения в уравнение(2.13), получимVп =(dv) = -✓0,045vsignv.dt пПоскольку Vп> vo ,и= + 1.Определим точку пересечения траектории спутника до началапереключения и линии переключения.Уравнение параболы до переключения имеет видх2_22Из уравнения= kx1 + с.(2.14)(2.14) найдем постояннуюх2C=_.1_-kx12'подставив в него начальные условия:(-0 698) 2С= х -kx ='-О 0225 · 5 236 = О 1258.2102'''220Чтобы определить точку пересечения траектории спутника и линии переключения, приравняем уравнения:-kх1пгде Х1п= х1,= kx1 + С,отсюдаХlп=-сk.2Подставив найденные значения в уравнение(2.13)линии переключения, получимV!п =-✓Csign (- ~) = -./0,1258 = 0,3547.Посколькуdv = kudt, (vi - vo) = kuЛt.Найдем время движения до переключения,лt1 _- t1п-to_ v1 -vo _ о, 3547 + о, 698 _- - - - - - - - - - - - 46 786 СkО 0225'''64и после переключения, учитывая, чтоЛt2vk = О :Vk -Vk О- 0, 3547=t2 -tп = - - - = - - - - = 1 5, 764с.-k-О 0225'Общее время перехода спутника в стационарное состояниеЛt = Лt1На рис.ходаи2.202.21+ Лt2 = 62, 5324 с.показаны фазовый портрет и процесс переспутника во времени из заданного положения в нулевое .-О'7-5 -4 -3Рис.2.20.-2 -1О12345Фазовый портрет перехода спутника изз аданного положения в нулевое54\32I\\\о-1-2Х2/\.\-3-4\.'\.-510Рис./2.21.' ---20__,30/40/,Vл" XJ5060Временные диаграммы перехода спутника из заданного положения в нулевое65Алгоритм работы системы управления спутника приведен ниже:1.
Вычисление скорости переключения при данномх1.2. Определение значения управления и по следующему правилу:u(v)={+1 при v < Vп и при v = Vп < О;при v-1> Vпи приv = Vп > О.3. Расчет новых значений х1 и х2 :х2 i'= х2 ' i-1 + kudt,·х1 i =х1 i-1 +х2 idt.'''4.Проверка равенства переменных х 1 и х2 нулю. Если подтверждается, то работа алгоритма управления завершена, иначе выполняется возвращение к п.1.2.6. Задача синтеза управления,оптимального по расходу топливаРассмотрим задачу определения оптимального по расходу топлива управления для объекта, описываемого системой уравненийdx1-=х2 ·dt'dx2(2.15)-=-х1 +и.dtУправлениеu(t) полагаем ограниченным : lu(t)l< l .
Минимизируемый функционал имеет видfkJ(х,и) = flи(t)ldt.toНачальное состояние объекта х 1 (О) = х 10 , х2 (0) = х20 , конечноесостояние x 1(tk)=О, х2(1)=О.Функция Гамильтона Н для рассматриваемой задачи при р 0Н(х, и,р)= -lиl+ р1 х266+р2 (-х1 +и) .= - 1:Управление и*, доставляющее максимум функции Гамильтона, определяется следующим равенством:IP2I < 1;О,и*-1,-1'Система уравнений дляР2> 1;Р2<-1.вспомогательных переменных р 1 и р2выглядит так:Ее решение запишем следующим образом:р1= -Acos(t + а); р2 = Asin(t + а), приИсходная система уравненийА> О и О< а<(2.15)при и=2n.О принимает видdx1--х·dt -2'(2.16)dx2-=-х1 .dtРешение системыпри условии(2.16)х1 =-Rcos(t + Р),О, О<R>рх2 =< 2n зависитRsin(t + Р)от постоянныхRи р.Фазовые траектории системы представляют собой семействоконцентрических(рис.окружностейсцентромвтакжебудут концентрическими окружностями, центр которых при и=+ 1расположен в точкев точке(1,О); при и+ 1иикоординат-12.22).Фазовые траектории системы при и =начале== - 1 центр окружностей находится(-1, О).Пусть некоторым оптимальным управлением и* начальноесостояние (х 10 , х20 ) переводится в начало координат.
Тогда на последнем участке оптимальной траектории управление и* равнолибо + 1, либо-1 .67Рис.2.22. Фазовые траекториисистемы при и= О, и = + 1 и и = -1Допустим, что некоторому начальному состоянию соответствует оптимальное управление (рис.Р2И*2.23).Р21о11tkаt-1Рис.2.23. Вид оптимального управленияТогда последний участок траектории представляет собой дугуокружности с центральным углом (рис.управление на отрезке времени [tk - п,2.24). Ввиду того чтоtk -11] равно нулю, соответствующий участок оптимальной фазовой траектории представляет собой дугу окружности АВ с центром в начале координат ицентральным углом пуправления с и*- 11 ·В точке А происходит переключение= О на и*= 1.со значения и*= -1 на и*= О.В точке В управление переключаетсяСледует отметить, что управление, удовлетворяющее принципумаксимума, не является единственным.
Начальная точка М можетбыть переведена в начало координат как по траектории ММ1 О, так ипо траектории ММ1М2МзМ4О(см. рис.этим траекториям68-2.24),а время движения поразличное. Поэтому для решения задачи син-иРис.= -12.24. Траектории движения системытеза ресурсосберегающих систем используют критерий оптимизации по расходу топлива и смешанный критерийоптимизации,учитывающий не только расход топлива, но и требования по быстродействию систем.2.7.
Задача оперевернутом маятникеРассмотрим перевернутый математический маятник, установленный на тележку, которая может перемещаться с ускорениемпогоризонтальной(рис.2.25).Уравнениеa(t)направляющейдвижениямаятникаимеет видmgт/ ip = mgl sin <р - mla cos <р,2гдеl-длина маятника,ускорение силы тяжести ;<рg-ауголотклонения маятника от вертикали.Управлением будем считать функциюа(t)u(t)=--.lРис.2.25. Перевернутыйматематический маятник69Линеаризуем уравнение движение в окрестности положенияравновесияq>=Ои введем фазовые переменные:= ~q>;{Х2 = q>,XIгде ro=Jf.Тогда уравнение движения маятника сводится к системе уравнений относительно фазовых переменных:{х1= rox2;х2 = rox1 + и.(2.17)Теперь можно сформулировать решаемую задачу в соответствииспринципоммаксимума.Требуетсяопределитькусочно-непре-рьmное управление, удовлетворяющее ограничению lи(t)I :s;; 1 , переводящее систему из начального положения х1 (О)= а1, х2 (О)= а2 вначало координат на фазовой плоскости (неустойчивое вертикальноеположение равновесия) х1 (t1)= О,x2(t1) = О за минимальное времяJ=t1 ➔ min.Составим гамильтониан:Н= ro [pi (t)x2 (t) + р2 (t)x1 (t)] + р2 (t)u(t).Оптимальное управление, максимизирующее гамильтониан:и* (t)= sign[p2 (t)].Получим решение сопряженной системы уравнений= -rop2;{ Р2 = -rop1~1в видеp1(t) = c1erot + c2e-ro1 ;{ p2(t) = -c1erot + c2e- rot,70гдес1, с2-постоянные интегрирования.Следовательно,Функция[-с1 е 001 +с2 e-rot] имеет не более одного корня, а оптимальное управлениене более одной точки переключения.
Воз-можны следующие четыре оптимальные управляющие последовательности:{+ 1} , {-1} , {+ 1, -1} , {-1, + 1}.Приu(t) = +1решение уравнений движения маятника(2.17)с начальными условиями а 1 и а2 будет таким:х1 (t ) = -1 ( ai + а2 + -1со2Исключая отсюда время2х2 -(х1Jе rot1 ( а1 +2+ -1соJе -rot- -1 ;соt, получим уравнения фазовых траекторий1 2+-)11+-),О)О)=-(а1 +а2 +-)(а1 -а2О)которые являются гиперболами (рис.2.26,а).баРис.а22.26.Фазовые траектории71u(t) = -1 решение уравненийными условиями ( а1 и а2) имеет видПридвижения(2.17)с началь1) е-rot +-;1+-1 ( а1-а2 -2(О(Ох2 (t) = ~ ( а1 + а2 -~ ( а1 - а2 -Исключив отсюда время~)~)е"" -e-rott, получим уравнения фазовых траекторийxi-(x1- ~у =-(ai+a2- ~)(ai-a2-~),которые являются гиперболами (рис .Вконечноеположениеуправлением, равным+12.26,б) .(начало координат)или-1 ,спостояннымможно попасть только подвум из этих фазовых траекторий, показанным на рис .2.27и обозначенным Г + и Г _ .XzРис.722.27.Линия переключенияКриваяявляется геометрическим местом точек, которые могут быть переu(t) = +1.ведены в начало координат с помощью управленияКриваягеометрическое место точек, которые могут быть переведены вначало координат с помощью управленияu(t) = -1.КриваяГ=Г+ UГ_является линией переключения и делит открытую полосу (полосубез границ)П={(х1,х2):х1 - ~ <х2 <xi + ~}на фазовой плоскости на две области П+ и п_ (см.
рис.2.27).Если начальное положение системы (а1, а2) находится в областип_, тотолько оптимальная управляющая последовательность {-1,+1} может перевести систему в начало координат. Этойуправляющейпоследовательностисоответствуетединственнаятраектория, которая проходит через начало координат и являетсяоптимальной. Оптимальное управление и* (t)= -1 ,вой плоскости система находится в области П_.пока на фазоПри выходе накривую Г + оптимальное управление изменяет свое значение (переключается) и в дальнейшем система движется по кривой Г + .Если начальное положение системысти П+,(щ, а2)находится в облато только оптимальная управляющая последовательность73{+ 1,-1} может перевести систему в начало координат.Этой управляющей последовательности соответствует единственная траектория,которая проходит черезначалокоординатиявляетсяопти-мальной.
Оптимальное управление и* (t) = + 1 , пока на фазовойплоскости система находится в области П+ . При выходе на кривуюг_ оптимальное управление изменяет свое значение (переключается) и в дальнейшем система движется по кривой Г _ .Если начальное положение системывой Г +,( а1, а2)находится на кри-то управление и* (t) = +1 является оптимальным по быстродействию. Если начальное положение системы( ai, а2)находится на кривой Г _ , то управление и* (t) = -1 является оптимальнымпо быстродействию.Если начальное положение системылосы( а1, а2)находится вне по-П, то не существует управление, удовлетворяющее ограничениям lиU)I ~ 1 и переводящее систему в начало координат.Таким образом, оптимальное управление однозначно определяется текущим начальным положением системы на фазовой плоскости, если оно (начальное положение) находится внутри полосыи задается следующим оптимальным законом управленияП(оптимальным регулятором):и* ={+1 при (х1,х2) ЕП+ UГ +;-1 при (х1,х2) Е п_ U Г -·Соответствующие оптимальные фазовые траектории движения при различных начальных условиях показаны на рис.2.28.В этой главе были рассмотрены самые простые случаи оптимального управления объектом(системой),поскольку ограничения накладывались только на вектор управленияu(t).Очень частонеобходимо решать задачи, когда ограничения наложены и на фазовые переменные системы.