Осмоловский Н.П. - Лекции по вариационному исчислению и оптимальному управлению (1156142), страница 13
Текст из файла (страница 13)
Togda (s toqnostь do1зkvivalentnosti) ψ(·) ∈ W∞(∆, Rn ), t.e. ψ – lipxiceva funkci, i pri зtomdl ψ vypolneny uravnenie−ψ̇ = ψA − b(20)ψ(t0 ) = k0 , ψ(t1 ) = −k1 ,(21)i graniqnye uslovigdek0 ∈ Rn , k1 ∈ Rn , (k0 , k1 ) = k. (Zdesь k, k0 , k1 , ψ i b – vektor-stroki.): Pustьψ̃ – absoltno nepreryvna funkci, udovletvorwa uslovim:˙−ψ̃ = ψ̃A − b; ψ̃(t0 ) = k0 .(22)Зto – zadaqa Koxi dl lineno neodnorodno sistemy. Ee rexenie suwestvueti edinstvenno, i predstavlet sobo absoltno nepreryvnu funkci. Poskolьkuiz uravneni sleduet, qto˙−ψ̃ = ψ̃A − b ∈ L∞ (∆, Rn ),to ψ̃ – lipxiceva funkci.imeem:Zt1ψ̃ x̄˙ dt =t0ψ̃x̄|tt10−Zt1t0x̄(·) ∈ W11 (∆, Rn )Sledovatelьno, dl lbo˙ψ̃x̄dt= ψ̃(t1 )x̄(t1 ) − k0 x̄(t0 ) +Zt1t0(ψ̃A − b)x̄dt(sm. (22)).
Takim obrazom,k0 x̄(t0 ) − ψ̃(t1 )x̄(t1 ) +dl lboZ∆ψ̃(x̄˙ − Ax̄)dt +Zbx̄dt = 0∆x̄(·) ∈ W11 (∆, Rn ). Vyqita зto ravenstvo iz (19) , poluqaem(k1 + ψ̃(t1 ))x̄(t1 ) +Z(ψ − ψ̃)(x̄˙ − Ax̄)dt = 0 ∀x̄ ∈ W11 (∆, Rn )¯ ∈ L1 (∆, Rn ) – proizvolьna funkci, i pustьPustь f(·)estь rexenie zadaqi Koxi¯ x̄(t1 ) = 0.x̄˙ = Ax̄ + f,97(23)x̄(·) ∈ W11 (∆, Rn )Togda iz (23) sleduet, qtoZ∆(ψ − ψ̃)f˜dt = 0.Зto uslovie vypolneno dl lbo funkciif˜ ∈ L1 (∆, Rn ). Sledovatelьno,ψ − ψ̃ = 0 p.v.,t.e.ψ = ψ̃ p.v.Togda iz uslovi (23) sleduet, qto(k1 + ψ̃(t1 ))x̄1 = 0 ∀x̄1 ∈ Rn .Otsda poluqaem:ψ̃(t1 ) = −k1 . ✷Iz зto lemmy i uslovi (18) vytekaet: Funkci ψ(t) (v uslovih (1)-(5)) vlets lipxicevo nanee vypolneny soprжennoe uravnenie∆, i pri зtom dl−ψ̇ = ψfx − µϕx (ili − ψ̇ = H̄x )i uslovi transversalьnostiψ(t0 ) = lx0 , ψ(t1 ) = −lx1 ,fx = fx (t, w 0 ), ϕx = ϕx (t, w 0 ), lx0 = lx0 (p0 , α, β), lx1 = lx1 (p0 , α, β),α = (αi ), i ∈ I¯, p0 = (x0 (t0 ), x0 (t1 )).gdePodvedem itog.
My predpoloжili, qto vse ograniqeni tipa neravenstvaaktivny v toqke w 0 i poluqili sleduwi rezulьtat: esli w 0 – toqka slabogominimuma, to suwestvutα0 ≥0, α1 ≥0, ..., αk ≥0, β ∈ Rs ,(24)1ψ(·) ∈ W∞(∆, Rn ), µ(·) ∈ L∞ (∆, R1 ),(25)µ≥0, µϕ0 = 0,(26)98takie, qtokX0αi + |β| +−ψ̇ = ψfx − µϕx ,Zµdt > 0,(27)∆ψ(t0 ) = lx0 , ψ(t1 ) = −lx1 ,ψfu − µϕu = 0,gdel=X(28)(29)αi æi + βK.(30)Napomnim, qto v uslovii netrivialьnosti my zameniliRµdt, poзtomu зto uslovie priobrelo vid (27).α na αϕ λ(I) = λ̃(I) =µ(t)ϕ(t, w 0 (t)) = 0 p.v.
na ∆.(31)∆Uslovieµϕ0 = 0 oznaqaet:Зto – uslovie dopolnwe neжestkosti. Ono pozvolet vklqitь v rassmotreniesluqaF (w 0 ) = vraimax ϕ(t, w 0 (t)) < 0,t.e. sluqa, kogda ograniqenie F ≤0 aktivnym v toqke w 0 ne vlets. (Takoeograniqenie v uslovih lokalьnogo minimuma uqityvatь ne nuжno.)My moжem poloжitь v зtom sluqae v uslovih stacionarnosti µ = 0.Uslovie (31) зto nam obespeqivaet: esli F (w 0 ) < 0, to ϕ(t, w 0 (t)) < 0 p.v.na ∆, i togda iz (31) sleduet, qto µ(t) = 0 p.v. na ∆.Analogiqno, esli æi (p0 ) < 0 dl nekotorogo i ∈ {1, ..., k}, to my moжem(formalьno) vklqitь i зto ograniqenie v uslovi stacionarnosti, poloжivαi = 0. Uslovie dopolnwe neжestkostiαi æi (p0 ) = 0, i = 1, ..., k(32)зto ravenstvo avtomatiqeski obespeqit.Dl aktivnyh ograniqeni, t.e. dl i ∈ I зto ravenstvo takжe vypolneno.
Itak, obwi sluqa, kogda ne vse ograniqeni tipa neravenstva vltsaktivnymi, uqityvaets s pomowь uslovi dopolnwe neжestkosti (31),(32).Nam ostaets pokazatь, qto v uslovii netrivialьnosti (27) nabora mnoжiteleRLagranжa integral µdt moжno ubratь, i my poluqim зkvivalentnoe uslovie.99: EslikXi=0αi + |β| = 0,to iz uslovi (24)-(26),(28)-(31) sleduet, qtoµ = 0.: Iz (33) sleduet, qto lx0 = 0. Umnoжa (29) na ϕTu =ψfu ϕTu = µϕu ϕTu .Poskolьku µϕ0 = 0 i |ϕu |≥const > 0 na M0 , toµ=(33)(ϕ0u )T sprava, poluqaemψfu ϕTuχM0 .ϕu ϕTu(34)Podstavl зto vyraжenie v uravnenie−ψ̇ = ψfx − µϕx ,poluqaem linenoe odorodnoe uravnenie na−ψ̇ = ψfx − ψfu ϕTu ·ψ s nulevym naqalьnym usloviem:1χM0 ϕx ,ϕu ϕTuψ(t0 ) = lx0 = 0.Otsda vytekaet, qto ψ = 0, a togda v silu (34) µ = 0.
✷PItak,αi + |β| > 0 – зkvivalentnoe uslovie netrivialьnosti.My dokazali sleduwi rezulьtat.(uslovie stacionarnosti.) Pustь w 0 dostavlet slaby minimum v kanoniqesko zadaqe A. Togda suwestvut mnoжiteli Lagranжa1αi ∈ R1 , i = 0, ..., k, β ∈ Rs , ψ(·) ∈ W∞(∆, Rn ), µ(·) ∈ L∞ (∆, R1 )(35)takie, qto vypolneny(i) uslovi neotricatelьnosti:αi ≥0, i = 0, ..., k; µ(t)≥0 p.v.(36)(ii) uslovi dopolnwe neжestkosti:αi æi (p0 ) = 0, i = 1, ..., k(37)µ(t)ϕ(t, w 0 (t)) = 0 p.v.(38)100(iii) uslovie netrivialьnosti:kXi=0αi + |β| > 0,(39)(iv) soprжennoe uravnenie:−ψ̇(t) = H̄x (t, w 0 (t), ψ(t), µ(t)),(40)gdeH̄(t, w, ψ, µ) = ψf (t, w) − µϕ(t, w) = H(t, w, ψ) − µϕ(t, w);(v) uslovi transversalьnosti:gdeα = (α0 , ..., αk ),ψ(t0 ) = lx0 (p0 , α, β),(41)−ψ(t1 ) = lx1 (p0 , α, β),(42)l(p, α, β) =kXαi æi (p) + βK(p);0(vi) uslovie stacionarnosti funkcii H̄ po u (ili ”lokalьny princip maksimuma”):H̄u (t, w 0 (t), ψ(t), µ(t)) = 0.(43)Uslovi (35)-(43) nazyvat takжe uravneniem Зlera- Lagranжa..
Pustь v zadaqe imeets ne odno, a neskolьko smexannyh neravenstvϕi (t, x, u)≤0,i = 1, ..., s.Зto – smexannye ograniqeni tipa neravenstva na fazu x i upravlenie u.Pustь v kaжdo toqke (t, x, u) ∈ Q gradienty po u ϕiu (t, x, u) aktivnyh v зtotoqke (t.e. takih, qto ϕi (t, x, u) = 0) ograniqeni lineno nezavisimy. V зtomsluqae formulirovka i dokazatelьstvo uslovi stacionarnosti analogiqnyformulirovke i dokazatelьstvu dl sluqa odnogo ograniqeni (dopolnitelьnyesloжnosti nesuwestvenny).101Rezulьtat sohranets i v sluqae, kogda gradienty po upravleni aktivnyhsmexannyh ograniqeni lixь pozitivno nezavisimy (t.e.
”nezavisimy” s neotricatelьnymikoзfficientami; зto oznaqaet, qto konus, natnuty na зti gradienty vletsostrym, t.e. ne soderжit nenulevogo podprostranstva).Esli otkazatьs i ot зtogo uslovi, to sloжnosti suwestvenno vozrastutkak v dokazatelьstvah, tak i v formulirovkah. Зto – teori zadaq s neregulrnymismexannymi ograniqenimi. Princip maksimuma i lokalьny princip maksimumabyli poluqeny dl takih zadaq Dubovickim A.. i Miltinym A.A.Sloжnosti voznikat daжe v sluqae odnogo ograniqeni, kogda uslovieϕu 6= 0 na poverhnosti ϕ = 0 naruxeno.
Naprimer, dl ograniqeni ϕu = 0 vu2 + x2 ≤1toqkah x = 1, u = 0 i x = −1, u = 0. Takie toqki nazyvats ”fazovymi”(dl ograniqeni Φ(x)≤0 – ”qisto” fazovogo, kaжda toqka na poverhnostiΦ(x) = 0 vlets tako). Pri prohoжdenii qerez takie toqki soprжennaperemenna moжet imetь skaqki.
Harakter otveta usloжnets.Qisto fazovye ograniqeni – bolee prosto sluqa, qem neregulrnyesmexannye ograniqeni, no i zdesь u soprжenno peremenno ψ vozmoжnyskaqki pri vyhode na granicu fazovogo ograniqeni.Itak, my poluqili neobhodimoe uslovie slabogo minimuma v kanoniqeskozadaqe A, kotoroe imeet po krane mere tri nazvani: uslovie stacionarnosti(ili slabo stacionarnosti), lokalьny princip maksimuma, ili uravnenie ЗleraLagranжa.
Pri зtom byl ispolьzovan vesь nabor abstraktnyh ponti, lemm iteorem (otnoswis k zadaqe ZA ), kotory byl nami nakoplen i podgotovlendo togo, kak my zanlisь zadaqe optimalьnogo upravleni – zadaqe A.Odnako my ewe ne dostigli celi. Celь sostoit v poluqenii principamaksimuma – obobweni uslovi Veerxtrassa. A rezulьtat, kotory mypoluqili, estь analog uravneni Зlera.102V optimalьnom upravlenii lokalьny princip maksimuma, kak i svzannys nim tip minimuma – slaby minimum, igrat znaqitelьno bolee skromnurolь, qem princip maksimuma i tip minimuma, dl kotorogo princip maksimumavlets neobhodimym usloviem (s зtim tipom minimuma my poznakomimspozdnee). Situaci zdesь suwestvenno otliqaets ot variacionnogo isqisleni,gde, naoborot, uravnenie Зlera i slaby minimum zanimat glavenstvuweepoloжenie, a uslovi Veerxtrassa otvodits bolee skromna rolь.My perehodim k poluqeni osnovnogo neobhodimogo uslovi v optimalьnomupravlenii – principa maksimuma.
Estь raznye puti poluqeni principamaksimuma. My izberem putь zameny vremeni (ili v -zameny) t = t(τ ), predloжenny Dubovickim i Miltinym. Pri зtom lokalьny princip maksimumabudem ispolьzovatь kak apparat.103Lekci 12.Princip maksimuma Pontrgina.∆1. Kanoniqeska zadaqa B . V зto zadaqe my ne sqitaem otrezok vremeni= [t0 , t1 ] fiksirovannym. On podleжit vyboru vmeste s funkcimix(t) : [t0 , t1 ] → Rn i u(t) : [t0 , t1 ] → Rm .My polagaem dl kratkostix0 = x(t0 ), x1 = x(t1 ),p = (t0 , x0 , t1 , x1 ) = (t0 , x(t0 ), t1 , x(t1 )).Trebuets minimizirovatьJ = æ0 (p) → min(1)pri ograniqenihæi (p)≤0,i = 1, ..., k,(2)K(p) = 0,(3)ẋ = f (t, x, u),(4)u ∈ U,(5)(t, x, u) ∈ Q,p ∈ P.(6)Zadaqu (1)-(6) budem nazyvatь kanoniqesko zadaqe B . Ona vlets osnovnov dannom kurse.Zdesь U ⊂ Rm – soverxenno proizvolьnoe (naprimer, dvuhtoqeqnoe) mnoжestvo,Q ⊂ R1+n+m – otkrytoe mnoжestvo, P ⊂ R2+2n – otkrytoe mnoжestvo,æi (p) : P → R1 ,K(p) : P → Rs104i = 0, 1, ..., k,– funkcii, nepreryvno differenciruemye na P (po vsem peremennym t0 ,a funkcif (t, x, u) : Q → Rnx0 , t1 , x1 ),nepreryvna na Q po vsem peremennym i nepreryvno differenciruema na Q poperemennym t i x (differenciruemostь po u ne trebuets).Qerez (w(t) | t ∈ [t0 , t1 ]) oboznaqaem traektori w(t) = (x(t), u(t))na otrezke ∆ = [t0 , t1 ] , gde u(t) : [t0 , t1 ] → Rn – ograniqenna izmerima funkci, a x(t) : [t0 , t1 ] → Rn – absoltno nepreryvna funkci.Traektori (w(t) | t ∈ [t0 , t1 ]) vlets dopustimo, esli ona udovletvoretvsem ograniqenim (2)-(6) zadaqi B , i pri зtom suwestvuet kompakt C ∈ Qtako, qto(t, x(t), u(t)) ∈ C p.v.
na [t0 , t1 ].(7)C zavisit ot traektorii).Tak my ponimaem uslovie (6). (Kompakt2.v -zamena. Nardu s kanoniqesko zadaqe B :J = æ0 (t0 , x0 , t1 , x1 ) → min,æi (t0 , x0 , t1 , x1 )≤0,i = 1, ..., k,(t0 , x0 , t1 , x1 ) ∈ P,K(t0 , x0 , t1 , x1 ) = 0,dxdt= f (t, x, u),rassmotrim sleduwu zadaquu ∈ U,(t, x, u) ∈ Q,B′:J = æ0 (t0 , x0 , t1 , x1 ) → min,æi (t0 , x0 , t1 , x1 )≤0,i = 1, ..., k,(t0 , x0 , t1 , x1 ) ∈ P,K(t0 , x0 , t1 , x1 ) = 0,dxdτ= v f (t, x, u),v≥0 (v ∈ R1 ),dtdτ= v,u ∈ U,(t, x, u) ∈ Q.Zdesь τ ∈ [τ0 , τ1 ] – nova nezavisima peremenna, otrezok [τ0 , τ1 ] fiksirovan,fazovymi peremennymi vlts t(τ ), x(τ ), a upravleniem u(τ ), v(τ ).105Po opredelenit0 = t(τ0 ), x0 = x(τ0 ), t1 = t(τ1 ), x1 = x(τ1 );u(·), v(·) – ograniqennye izmerimye funkcii, t(·), x(·) – absoltno nepreryvnye i, sledovatelьno, lipxicevy.Sledu Dubovickomu i Miltinu, budem nazyvatь v -zameno perehod otzadaqi B k zadaqe B ′ .