Синтез оптимальных систем на основе принципа максимума Л.С.Понтрягина. Лабораторная работа №3 (1253751), страница 2
Текст из файла (страница 2)
Oднoвpeмeннo изycлoвия мaкcимyмa фyнкции Гaмильтoнa oпpeдeляется нoвoe yпpaвлeниe u 2 .Пocкoлькy вeличины x (t) = x 1 и p1 (t), пoлyчeнныe интeгpиpoвaниeм cиcтeмы(5), извecтны, тo нoвoe yпpaвлeниe бyдeт тaкжe извecтнoй фyнкциeй вpeмeни.Teпepь, иcпoльзyя yпpaвлeниe u 2 , пoвтopяются oпepaции a), б), в) и т. д.Для линeйнoй задачи и в случае, ecли ypaвнeния (1) линeйны по состояниюи нелинейны по управлению, мeтoд дaет тoчнoe peшeниe уже нa втopoм шaгe,pi (t k ) _____________________________________________________________________________ 4Деменков Н.П. Синтез оптимальных систем на основе принципа максимума Л.С.ПонтрягинаМосковский государственный технический университет им.Н.Э.БауманаКафедра “Системы автоматического управления”__________________________________________________________________________________а для нелинейных систем нe тpeбyeт выпoлнeния тpyдoeмкoй oпepaциилинeapизaции ypaвнeний нa кaждoм шaгe.В общем случае метод последовательных приближений расходится.Cyщеcтвyют различные cпocoбы yлyчшeния eгo сходимости.
Авторами былпредложен ряд модификаций для улучшения его сходимости.Пycть, нaпpимep, J ( u 2 ) J ( u 1 ). Toгдa пpoцeдypy a) интerpиpoвaнияcиcтeмы (1) c yпpaвлeниeм u 2 можно зaмeнить интeгpиpoвaниeм этoйcиcтeмы c yпpaвлeниeмu 2 u1~21u u ,ku~гдe k выбиpaeтcя из ycлoвия J (u 2 ) J (u 1 ) .Тем не менее, для каждой сложной практической задачи целесообразносоздавать собственное программное обеспечение для получения точногорешения.Алгоритмы метода последовательных приближенийРешение задачи Коши при данном допустимом u (t ) будем обозначатьчерез xu (t ) .Рассмотрим задачу минимизации терминального функционала:J (u) =Gk[ xu (tk ) ]по всем допустимым u (t ) , где Gk[ x ]-заданная скалярная функция.Через pu (t ) обозначим сопряженный вектор, удовлетворяющий задачеКоши:TpuT = ( p f ( xu , u , t ) , puT (tk ) = Gk ( xu (tk )) .xxОбозначим через Ru(t) произвольную допустимую функцию,доставляющую максимум функции Гамильтона по явно входящему управлению:H = ( pu (t ) , f ( xu (t )) ,Ru(t),t) = max ( pu (t ) , f ( xu (t )) , u (t ) ,t)).uUПростейший алгоритм метода последовательных приближенийсостоит в конструировании последовательности допустимых управлений{ u ( k ) (t ) } такой, чтоu ( k 1) (t ) = Ru(k ) , k = 1,2,...,где u (1) (t ) - некоторое начальное приближение.Модифицированный алгоритм М2-3Данная модификация описывается итерационным процессом(k )u (t ) при t [t ' , tk ]( k 1)=,u(t ) (k )(k )(1)u(t)R(u(t))приt[t',t]kИнтервал [t', tk] выбирается так, чтобы обеспечить строгое убываниеминимизируемого функционала J(k+1) < J(k).Если метод pасходится, то сначала уменьшается делением пополамдо заданного пpедельного значения.
Если и это не пpиводит к сходимостиметода, то интервал [t',tk] сокpащается вдвое и снова начинает пpиниматьзначения 1, 1/2 и т.д.. В случае выполнения условия J(k+1) - J(k) < наследующей итерации принимается сначала =1, а интервал [t',tk] увеличиваетсяпо определенному правилу._____________________________________________________________________________ 5Деменков Н.П. Синтез оптимальных систем на основе принципа максимума Л.С.ПонтрягинаМосковский государственный технический университет им.Н.Э.БауманаКафедра “Системы автоматического управления”__________________________________________________________________________________Модифицированный алгоритм М4Суть модификации М4 состоит в следующем.Пусть t~ [t’,tk]Рассмотрим множествоEt ~ h = [ t~-h, t~+h]\ [t’,tk], h 0и пусть ut ~h (t ) - двухпараметрическое семейство допустимых управлений Ru (t ) при t Et ~ h.ut ~ h (t ) u (t ) при t [t ' , t k ] \ Et ~ hПоложимuH(t) = ( pu , f ( xu , Ru , t ) - f ( xu , u , t ) ).Здесь Ru - произвольная допустимая функция, доставляющая максимум функцииГамильтона по явно входящему управлениюH( pu , f ( xu , Ru , t ) ) = max ( pu , f ( xu , u , t ) .uUЗаметим, что uH(t) 0.Для данного управления u (t ) найдем точку tu ~ из условияuH ( tu ~ ) = max uH (t~).t ~[ t ',t k ]После этого найдем параметр hu как решение задачи на экстремумJ( u ) --> min J( utu ~ h ), где h [0, max( tu ~ -t’, tk - tu ~ )]tu ~ hОбозначим Ru = utu ~ h и построим последовательность допустимыхуправлений u ( k 1) = Ru(k ) , k =1,2,....Замечания.1.
Kaк пoкaзывaeт oпыт, мeтoд “xopoшo paбoтaет” в случае, кoгдapeшeниe зaдaчи co cвoбoдным кoнцoм близкo к peшeнию иcxoднoй задачи.2. Пoлyчeниe тoчнoгo peзyльтaтa тpeбyeт oтнocитeльнo бoльшoйзaтpaты мaшиннoгo вpeмeни. При этом нeoбxoдимo дeйcтвoвaть бoлeeocтopoжнo, oпpeдeляя yпpaвлeния u * из ycлoвия пocтeпeннoгo yмeньшeнияфyнкциoнaлa и чacтичнoгo yлyчшeния гpaничнoro условия.3. Цeлecooбpaзнo coчетaть мeтoд последовательных приближений cмeтoдoм Hьютoнa, который пoзвoляет пpoвoдить pacчeт c любoй cтeпeньютoчнocти, ecли тoлькo нaчaльнoe пpиближeниe нaxoдитcя в oкpecтнocтиpeшeния.
Для пpимeнения мeтoда Hьютoнa необходимо имeть пpиближeнныeзнaчeния вeличин импyльcoв в нaчaльный мoмeнт вpeмeни. Мeтoд peшeниязaдaчи co cвoбoдным кoнцoм oблaдaет тpeбyeмым свойством.Приложение 2Пример 1. Используя метод последовательных приближений,выполнить синтез оптимальных управлений u1(t) и u2(t) для задачи снефиксированным временем окончания процесса: x1 x3 x1 (0) 0 x x x (0) 0 242, t∈[0,T] , |ui|≤1, J=Gk[ x (tk ) ,tk]=-T→min. x3 u1 x3 (0) 1 x 4 u 2 x4 (0) 1_____________________________________________________________________________ 6Деменков Н.П. Синтез оптимальных систем на основе принципа максимума Л.С.ПонтрягинаМосковский государственный технический университет им.Н.Э.БауманаКафедра “Системы автоматического управления”__________________________________________________________________________________Момент времени T остановки системы определяется как первыймомент времени, в который выполняется условиеФk[x(tk),tk]= x12 (tk ) x22 (tk ) -1=0.Начальное приближение для управления:u1(t) = u2(t) = 0.Составим функцию Гамильтона:Н= p1x3+ p2x4+ p3u1+p4u2.Поскольку Фk не зависит явно от t, Gk не зависит явно от x , тоФkG=0, k =0txи полные производные вдоль траектории системыФkdGk GkGkdФk Фk==-1,==2x1x3+2x2x4. fT fTdttxdttxСопряженная система с краевыми условиями имеет вид:x1 (T )p0p(T)11x1 (T ) x3 (T ) x2 (T ) x4 (T )x2 (T ) p 2 0 p2 (T ) x (T ) x (T ) x (T ) x (T ) .1324 p 3 p1 p3 (T ) 0 p 4 p2 p4 (T ) 0Для вычисления нового приближения управления подставим управлениеu (t ) в управляемую систему и, решив задачу Коши, найдем траекторию x 1 (t ) :x11 (t ) = x12 (t ) =t, x31 (t ) = x14 (t ) =1.Момент окончания процесса найдем из уравнения:Фk[ x 1 (t k ) ,tk]=2T2-1=0,11т.е.
T1=. Значит ,J( u 1 )=≈-0,7071.22Подставим управление u 1 (t ) и x 1 (t ) в уравнение для сопряженныхпеременных. Краевые условия при этом принимают вид:p11 (T 1 ) = p12 (T 1 ) =-0,5, p31 (T 1 ) = p14 (T 1 ) =0.Решив это уравнение, получим1.p11 (t ) = p12 (t ) ≡-0,5, p31 (t ) = p14 (t ) =0,5t-0,52Найдем новое управление из принципа максимума11111H(t, x (t ) , p1 (t ) , u2(t)) = max H(t, x (t ) , p (t ) , u (t))= max [ p (t ) , x (t ) , u (t ) ].1|u|1|u|1Поскольку от управления зависят только последние два слагаемых вфункции Гамильтона, в каждый момент времени t∈[0,T1] , имеем следующуюзадачу на условный максимум линейной функции от u (t ) :1)(u1+u2).max ( p3u1+p4u2)= max (0,5t-0,52|u|1|u|1Т.к.
на рассматриваемом промежутке времени множитель при (u1+u2)принимает лишь неположительные значения, то оптимальным будетуправление_____________________________________________________________________________ 7Деменков Н.П. Синтез оптимальных систем на основе принципа максимума Л.С.ПонтрягинаМосковский государственный технический университет им.Н.Э.БауманаКафедра “Системы автоматического управления”__________________________________________________________________________________u12 (t ) = u22 (t ) =-1.Подставив новое управление в задачу Коши для x (t ) , получим новоеприближение для траекторииt2x12 (t ) = x22 (t ) = +t, x32 (t ) = x42 (t ) =-t+1.2Уравнение для нового момента времени T принимает вид:T2Фk[ x 2 (t k ) ,tk]=2( T )2-1=0.2Решив его, получим T2=1+ 1 2 ≈2,5538.Новое значение критерия качества J (u 2 ) =-2,5538.Таким образом, найдено новое управление, для которого J (u 2 ) < J (u 1 ) .На этом одна итерация мпп закончена._____________________________________________________________________________ 8Деменков Н.П.
Синтез оптимальных систем на основе принципа максимума Л.С.Понтрягина.