Осмоловский Н.П. - Лекции по вариационному исчислению и оптимальному управлению (1156142), страница 16
Текст из файла (страница 16)
Posledn odnoznaqno opredelets indeksom θ . Kakuжe otmeqalosь, v-zamenu vpervye ispolьzovali Dubovicki i Miltin dldokazatelьstva principa maksimuma. v-zamena pozvolet v ishodno zadaqepoluqitь variacii malye po x, no ne malye po upravleni. Po harakteru зtivariacii blizki k igolьqatym variacim, kotorye ispolьzoval ewe Veerxtrasspri poluqenii uslovi silьnogo minimuma v variacionnom isqislenii, a zatem120ispolьzovali Pontrgin i ego sotrudniki: Boltnski, Gamkrelidze i Miwenko pri poluqenii principa maksimuma v optimalьnom upravlenii.Poprobute samostotelьno prosleditь za harakterom teh variaci, kotoryeporoжdaet v zadaqe B L∞-maloe varьirovanie funkcii v θ (·) v prisoedinennozadaqe B θ , kotoru my opredelim niжe.Opredelim dl indeksa θ funkciθu (τ ) =(û(tθ (τ )), τ ∈ M+ ,ui, τ ∈ ∆i , i = 1, .
. . , N.uθ (τ ) ograniqena i izmerima na kaжdom intervale ∆i ,i = 1, . . . , N i na kaжdom iz intervalov, sostavlwih mnoжestvo M+ . Sledovatelьno,uθ (τ ) ograniqena i izmerima na [τ0 , τ1 ].Prisoedinenna zadaqa B θ na fiksirovannom otrezke [τ0 , τ1 ] s upravleniemv(τ ) i fazovymi peremennymi x(τ ) i t(τ ) imeet vid:FunkciJ = æ0 (p) → min,æi (p)≤0, i = 1, . . . , k,K(p) = 0, p ∈ P,gde(29)p = (t0 , x0 , t1 , x1 ) = (t(τ0 ), x(τ0 ), t(τ1 ), x(τ1 )),dx(τ )= v(τ )f (t(τ ), x(τ ), uθ (τ )),dτdt(τ )= v(τ ),dτ−v(τ )≤0,(t(τ ), x(τ ), uθ (τ )) ∈ Q.(30)(31)(32)(33)Itak, v prisoedinenno zadaqe B θ na fiksirovannom otrezke [τ0 , τ1 ] trebuetsnati absoltno nepreryvnye funkcii x(τ ) : [τ0 , τ1 ] → Rn , t(τ ) : [τ0 , τ1 ] → R1i ograniqennu izmerimu funkci v(τ ) : [τ0 , τ1 ] → R1 , udovletvorwieograniqenim zadaqi i dostavlwie minimum funkcionalu J . Ograniqenie(33) dl dopustimo troki (t(·), x(·), v(·)) ponimaets tak: suwestvuet kompakt C ∈ Q, zaviswi ot troki, tako, qto(t(τ ), x(τ ), uθ (τ )) ∈ C p.v.
na [τ0 , τ1 ].121xθ (τ ) = x̂(tθ (τ )). sno, qto xθ (·)– lipxiceva funkci.. Esli (x̂(t), û(t) | t ∈ [t̂0 , t̂1 ]) dostavlet minimum v zadaqe B , to dl lbogoindeksa θ troka(tθ (τ ), xθ (τ ), v θ (τ ) | τ ∈ [τ0 , τ1 ])Poloжimdostavlet minimum v prisoedinenno zadaqeBθ.: Pustь traektoriγ̂ = (x̂(t), û(t) | t ∈ [t̂0 , t̂1 ])dostavlet minimum v zadaqe B i, sledovatelьno, ona dopustima v зto zadaqe.Pokaжem, qto traektoriγ̂ ′ = (tθ (τ ), xθ (τ ), uθ (τ ), v θ (τ ) | τ ∈ [τ0 , τ1 ])dopustima v zadaqeB ′ i vlets proobrazom traektorii γ̂ . Poskolьkutθ (τ0 ) = t̂0 , tθ (τ1 ) = t̂1 ,xθ (τ0 ) = x̂(tθ (τ0 )) = x̂(t0 ),xθ (τ1 ) = x̂(tθ (τ1 )) = x̂(t1 ),to vse koncevye uslovi v zadaqe B ′ vypolneny.Pokaжem, qto dl traektorii γ̂ ′ vypolnena differencialьna svzь v zadaqe′B .
Preжde vsego, otmetim, qto p.v. na [τ0 , τ1 ] imeet mesto ravenstvodxθ (τ )dx̂(tθ (τ )) dtθ (τ )=·.dτdtdτ(34)Destvitelьno, зto ravenstvo imeet mesto p.v. na M0 , t.k. na kaжdom intervalemnoжestva M0 funkci tθ (τ ) = const, a znaqit ixθ (τ ) = x̂(tθ (τ )) = const, i togda leva i prava qasti v (34) ravny nul.
Nakaжdom intervale mnoжestva M+ imeem: tθ (τ ) = τ + const, i, sledovatelьno,ravenstvo (34) vypolneno p.v. na зtom intervale. Znaqit, ono imeet mesto p.v.na M+ . A togda (34) vypolneno p.v. na [τ0 , τ1 ].Dalee,dx̂(t)= f (t, x̂(t), û(t))dtp.v. na[t0 , t1 ]. Sledovatelьno,dx̂(tθ (τ ))= f (tθ (τ ), x̂(tθ (τ )), û(tθ (τ ))) = f (tθ (τ ), xθ (τ ), uθ (τ ))dt122(35)p.v. na kaжdom intervale mnoжestva M+ , ibo na зtom intepvaletθ (τ ) = τ + const. Sledovatelьno, (35) imeet mesto p.v. na M+ , a togdadxθ (τ )dtθ (τ ) θ=f (t (τ ), xθ (τ ), uθ (τ ))dτdτp.v. na[τ0 , τ1 ]. Ostaets zametitь, qtodtθ (τ )= v θ (τ ) p.v. na [τ0 , τ1 ].dτZnaqit, p.v. naB′:[τ0 , τ1 ] dl γ̂ ′ vypolneny obe differencialьnye svzi v zadaqedxdt= vf (t, x, u),= v.dτdτIz uslovi û(t) ∈ U p.v.
na [t̂0 , t̂1 ] i opredeleni funkcii uθ (τ ) vytekaet,qto uθ ∈ U p.v. na [τ0 , τ1 ]. Зto takжe otdelьno ustanavlivaets dl intervaloviz mnoжestva M+ i mnoжestva M0 . Зto жe kasaets i uslovi (tθ (τ ), xθ (τ ), uθ (τ )) ∈Q.Nakonec, uslovie −v θ (τ )≤0 na [τ0 , τ1 ] vytekaet iz opredeleni funkciiv θ (τ ).Itak, γ̂ ′ , dopustima v zadaqe B ′ .Pustь teperь τ θ (t)– prava obratna k tθ (τ ).
Togdaxθ (τ θ (t)) = x̂(tθ (τ θ (t))) = x̂(t) ∀t ∈ [t̂0 , t̂1 ],uθ (τ θ (t)) = û(tθ (τ θ (t))) = û(t) ∀t ∈ tθ (M+ ),t.e. p.v. na[t̂0 , t̂1 ].Sledovatelьno, γ̂ ′ – proobraz optimalьno traektorii γ̂ . Po teoreme ob зkvivalentnosti traektori γ̂ ′ optimalьna v zadaqe B ′ . Togdaγ θ = (tθ (τ ), xθ (τ ), v θ (τ ) | τ ∈ [τ0 , τ1 ])– optimalьna traektori prisoedinenno zadaqi B θ , ibo zadaqa B θ otliqaetsot zadaqi B ′ tem, qto upravlenie uθ v ne ne varьiruets.Teorema dokazana. ✷: Dl kaжdogo indeksaθ traektoriγ θ = (tθ (τ ), xθ (τ ), v θ (τ ) | τ ∈ [τ0 , τ1 ])stacionarna v prisoedinenno zadaqeBθ.123My poluqim princip maksimuma dl traektorii γ̂ v osnovno zadaqe B kaksledstvie iz poslednego utverжdeni.Vypixem uslovi stacionarnosti v toqke γ θ v prisoedinenno zadaqe B θ .Poloжiml=kXαi æi + βK;H = ψx vf (t, x, u) + ψt v,H̄ = H + µv.0Uslovi stacionarnosti sostot v sleduwem:suwestvut qisla α0 , .
. . , αk , vektor β ∈ Rs , absoltno nepreryvnye funkciiψx (τ ) : [τ0 , τ1 ] → Rn , ψt (τ ) : [τ0 , τ1 ] → R1 i ograniqenna izmerimafunkci µ(τ ) : [τ0 , τ1 ] → R1 takie, qtoαi ≥0, . . . , αk ≥0;αi æθi = 0,kX0αi + |β| > 0;i = 1, . . . , k; µ≥0; µv θ = 0;dψx−= v θ ψx fxθ ,dτdψt−= v θ ψx ftθ ,dτψx (τ0 ) = lxθ 0 , −ψx (τ1 ) = lxθ 1 ,ψt (τ0 ) = ltθ0 ,−ψt (τ1 ) = ltθ1 ,ψx fuθ + ψt + µ = 0 ( t.e.
H̄v = 0).Iz poslednego uslovi i usloviµ≥0,µv θ = 0 vytekaet, qtoψx fuθ + ψt ≤0 p.v. na [τ0 , τ1 ],ψx fuθ + ψt = 0 p.v. na M+ .Vse proizvodnye vyqislts vdolь traektorii γ θ .K soжaleni, my ne moжem poka vospolьzovatьs vypisannymi uslovimistacionarnosti, tak kak formalьno lokalьny princip maksimuma dl prisoedinennozadaqi B θ ne byl poluqen. Delo v tom, qto zavisimostь funkcii f (t, x, uθ (τ )) =f θ (t, x, τ ) po τ ne vlets, voobwe govor, nepreryvno, poskolьku razryvnafunkci uθ (τ ). Odnako vse dokazatelьstva lokalьnogo principa maksimuma,poluqennye dl zadaqi A, mogut bytь povtoreny, daжe s nekotorymi uprowenimi,i dl zadaqi B θ . (My ne rassmotreli srazu bolee obwi klass zadaq, vklqawiprisoedinennu zadaqu B θ , qtoby izbeжatь sloжnyh predpoloжeni o povedenii f po t.) Nam pridets vkratce povtoritь vesь putь dl zadaqi B θ .1246.
Uslovie stacionarnosti v prisoedinenno zadaqe B θ . Privedem,radi polnoty izloжeni, vyvod uslovi stacionarnosti (lokalьnogo principamaksimuma) v zadaqe B θ v toqke (tθ , xθ , v θ ).Dokazatelьstvo sostoit iz sleduwih punktov.(i) Formalizaci prisoedinenno zadaqi B θ . Privedem zadaqu B θ k vidu, sootvetstvuwemuabstraktno zadaqe ZA . Proizvolьnu troku funkci (t(·), x(·), v(·)), zaviswih ot τ ∈ ∆θ = [τ0 , τ1 ], v zadaqe B θ budem oboznaqatь qerez ω θ .
Onaestь зlement prostranstvaΩθ = W11 (∆θ , R) × W11 (∆θ , Rn ) × L∞ (∆θ , R).Zadaqav vide:B θ , rassmatrivaema v prostranstve Ωθ , moжet bytь predstavlenaJ = F0 (ω) = æ0 (p) → min;Fi (ω) = æi (p)≤0,i = 1, . . . , k,gdep = (t0 , x0 , t1 , x1 ) = (t(τ0 ), x(τ0 ), t(τ1 ), x(τ1 ));G(ω) =!dxdt− vf (t, x, uθ (τ )) ;− v ; K(p) = (0; 0; 0),dτdτgdeG(·) : Ωθ 7→ Y,Y = L1 (∆θ , Rn ) × L1 (∆θ , R) × Rs ;F (ω) = vraimax(−v)≤0;θ∆(t, x, v) ∈ U.Po opredeleni mnoжestvo U sostoit iz naborov ω = (t, x, v) ∈ Ωθ takih,qto p ∈ P i suwestvuet kompakt C ⊂ Q (zaviswi ot w ) tako, qto(t(τ ), x(τ ), uθ (τ )) ∈ C p.v.
na ∆θ .Poloжim ω θ = (tθ , xθ , v θ ).Spravedlivy sleduwie utverжdeni.1. Funkcionaly Fi (ω) nepreryvno differenciruemy po Frexe v toqke ω θ , i =0, . . . , k ; ih proizvodnye Frexe v toqke ω θ imet vid: æip (pθ )p̄, i = 0, . . . , k .2. FunkcionalF (ω) = vraimax(−v)θ∆125– sublineny. Napomnim, qtoθv (τ ) =gde(τ ∈ M0θ ,τ ∈ M+θ ,0,1,M0θ– koneqny nabor otrezkov na ∆θ = [τ0 , τ1 ], a M+θ = ∆θ \M0θ .
PoзtomuMδθ = {t ∈ ∆θ | − v θ (τ )≥ − δ} = M0θpri vseh δ ∈ (0, 1). Sledovatelьno, proizvodna po napravleniω̄ = (t̄, x̄, v̄) v toqke ω θ funkcionala F estь sublineny funkcionalΦθ : w̄ 7→ vraimax(−v̄(τ )).θτ ∈M0Rassmotrim sublineny funkcionalΨθ0 : v̄ ∈ L∞ (∆θ ) 7→ vraimaxv̄θM0Ego mnoжestvo opornyh ∂Ψθ0 sostoit iz linenyh funkcionalov λ ∈ L∗∞ (∆θ )takih, qto λ≥0; λ sosredotoqen na M0θ ; λ(I) = 1. Sledovatelьno, proizvolьnylineny funkcional, oporny k Φθ imeet vid: l(w̄) = λ(−v̄), gde λ ∈ ∂Ψθ0 .3. Operator G nepreryvno differenciruem po Frexe v toqke ω θ .
Ego proizvodnaFrexe v зto toqke estь lineny operator G′ (ω θ ):θω̄ = (t̄, x̄, v̄) ∈ Ω 7→!dx̄dt̄− v θ fxθ x̄ − v θ ftθ t̄ − v̄f θ ,− v̄ , Kpθ p̄ ∈ Y.dτdτZdesьfxθ = fx′ (tθ (τ ), xθ (τ ), uθ (τ )) i t.d.;Kpθ = Kp′ (tθ (τ0 ), xθ (τ0 ), tθ (τ1 ), xθ (τ1 )).Зtot operator imeet zamknuty obraz veratorov:Y , poskolьku opredelets paro op-dx̄ω̄ 7→ dτ− v θ fxθ x̄ − v θ ftθ t̄ − v̄f θ ,ω̄ 7→ Kpθ p̄.dt̄dτ− v̄ ;Pervy iz nih srъektiven, a vtoro koneqnomeren, otkuda i vytekaet zamknutostьobraza operatora G′ (ω θ ).126Dl proizvolьnogo linenogo funkcionala y ∗soprжennomu prostranstvu= (ψx , ψt , β), prinadleжawegoY ∗ = L∞ (∆θ , Rn ) × L∞ (∆θ , R) × Rs ,lineny funkcionalZy ∗ G′ (ω θ ) imeet vid:!dx̄− v θ fxθ x̄ − v θ ftθ t̄ − v̄f θ dτ +dτψx∆θZψt∆θ!dt̄− v̄ dτ + βKpθ p̄.dτ(ii) Uravnenie Зlera-Lagranжa.Soglasno neobhodimomu uslovi minimuma (uslovi stacionarnosti) vzadaqe ZA , suwestvutα0 , .