Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 53
Текст из файла (страница 53)
Часть IIКонечные условия формируются с учетом условий трансверсальности[2, 158]:∂J∂F∂FΨ X (T ) =Ψ X (t ) =−+ C1 1 + C2 2 =−2 ⋅ X (T ) + C1 =C X ; (7.98)∂X∂X∂X∂J∂F1∂F2YY (T ) =YY (t ) =−+ C2+ C2=−2 ⋅ Y (T ) + C2 ( −C ) =CY ; (7.99)∂Y∂Y∂Y∂J∂F∂F(7.100)Ψ Z (T ) =Ψ Z (t ) =−+ C3 1 + C3 2 =C3 =CZ ;∂Z∂Z∂Z(7.101)Ψ Θ (T ) =0 , так как Θ(T ) =var ;Ψ ψ (T ) =0 , так как Ψ (T ) =var .(7.102)Последнее уравнение системы (7.97) перепишем с учетом (7.78), (7.98),(7.99): = C ⋅ Z + C ⋅ X .(7.103)ΨΨXZВ соответствии с принципом максимума рассмотрим max H , тогда опuтимальное значение перегрузки в каждый момент времени t определяетсявыражением Ψ g cos g Ψ Ψ g sin g ,(7.104)−n0 =n ′ ⋅ sign ΘVV cos Θ за исключением тех моментов времени, когда выражение в скобках формулы (7.104) равно нулю, а функция n 0 не определена и может приниматьлюбое допустимое значение.
Далее будет показано, что выражение в скобках может быть равным нулю на некотором интервале времени только в0случае особого nособ= 0 управления [80, 339]. Поэтому будем рассматривать условия максимизации Гамильтониана на всем интервале времени, заисключением конечного числа точек, где n 0 не определена.Для того чтобы достигался максимум Гамильтониана по переменной γ ,необходимо [124]∂H(7.105)=0∂γ γ0и достаточно [124]∂2 H∂γ 2<0.(7.106)γ0Рассмотрим первое условие (7.105):∂H Ψ g sin g Ψ Ψ g cos g = n ⋅ − Θ− = 0.∂g gVV cos Θ g00(7.107)Глава 7. Программно-корректируемое позиционное управление277Если=0 , то H= const ≠ f ( γ ) и экстремум H по γ достигаn 0 n=особется при любом допустимом γ .
Поэтому на особом участке управления nможно выбрать γ , совпадающее со значением, например, на предыдущемучастке движения.Если=n const ≠ 0 , то условие (7.107) принимает видΨ Ψ g cos g 0 Ψ Θ g sin g 0+=0.V cos ΘVТак как ( g / V ) ≠ 0 , сократив на них, получимили(7.108)ΨΨ= − tgg 0 ⋅ Ψ Θcos Θ(7.109)ΨΨ.Ψ Θ cos Θ(7.110)Ψ g cos g 0 Ψ Ψ g sin g 0=+n( − Θ)<0VV cos Θ(7.111)tgg 0 =−Рассмотрим условие (7.106)∂2 H∂g 2g0илиΨ Θ g cos g 0 Ψ Ψ g sin g 0(7.112)−)>0.VV cos ΘПри условии, что перегрузка n принимает оптимальное значение в соответствии с (7.104), условие (7.112) принимает видn(n ′sign Ψ Θ g cos g 0 / V − Ψ Ψ g sin g 0 /(V cos Θ) ××( Ψ Θ g cos g 0 / V − Ψ Ψ g sin g 0 /(V cos Θ)) > 0(7.113)илиn ′ Ψ Θ g cos g 0 / V − Ψ Ψ g sin g 0 /(V cos Θ) > 0 .(7.114)Поскольку n ′ > 0 , то достаточное условие (7.106) в виде (7.113) справедливо всегда, если выполняется условие (7.104).
Поэтому формулы(7.104) и (7.110) определяют оптимальные значения параметров управления n 0 и γ 0 всегда, кроме отдельных моментов времени, оговоренныхвыше и называемых в дальнейшем моментами переключения, когда n 0терпит разрыв первого рода. В случае, если такой момент времени является началом участка особого управления (далее будет показано, что0nособ= 0 ), то γ может быть любым допустимым в соответствии с форму-лой (7.107).278Задачи управления двухкоалиционными ММС.
Часть IIОптимальное значение параметра γ 0 в явном виде не зависит от параметра n 0 , а n 0 явно зависит от текущего значения крена, поэтому сначалаопределим, какой вид конкретно имеет оптимальная программа измененияугла крена γ .Предположим, что осуществляется «плоское» движение с креном(7.115)γ = γ (t ) = 0.Тогда Ψ (t ) =0 иΨ (t ) =Ψ (t0 ) =Ψ (T ) =0.Это ведет к тому, что Z (t ) = 0 и(7.116)=Z (t ) Z=(t0 ) Z=(T ) 0 .(7.117)При этом удовлетворено одно из конечных условий (7.94).При условии (7.117) соотношение (7.103) приобретает вид = C ⋅ X .Ψ(7.118)ΨZДалее следует ответить на вопрос, может ли быть осуществлено плоское движение (7.115) в классе экстремалей Понтрягина, определяемыхуравнением (7.110). Очевидно, если обеспечитьΨ Ψ (t0 ) =Ψ Ψ (t ) =0,(7.119)то ответ на вопрос будет положительным.Для момента времени t = T справедлива формула (7.102). Поэтому ясно, что для того, чтобы выполнилось соотношение (7.119), необходимо идостаточно (t ) =(7.120)Ψ0,Ψчто вполне можно обеспечить, если принять(7.121)Ψ Z (T ) =Ψ Z (t ) =Ψ Z (t0 ) ==CZ 0 .Кроме того, если выполняется (7.115), то формула (7.104) приобретаетвидΨ g n0 =⋅n′ sign Θ =⋅n′ sign [ Ψ Θ ] . V Таким образом, движение с параметрами управления g 0 (t ) =0;(7.122) 0n ′ sign [ Ψ Θ ] n =⋅является экстремалью Понтрягина.В соответствии с (7.85) экстремальное управление в исходной системе(7.78) будет иметь вид n ′sign [ Y Θ ] n0 n0 0 (7.123)u= = + =nZ .00arctgg g C g n nY 278Задачи управления двухкоалиционными ММС.
Часть IIДля системы (7.78) всегда существует множество направлений ν , длякаждого из которых условия F1 , F2 (7.94), накладываемые на правый конец траектории, могут быть удовлетворены только при помощи единственного управления ± n′ u0 = n ,arctg Z nY являющегося частным случаем управления (7.123). Примерами такогомножества являются направления, составляющие угол ϕ =n ′gT 2V с осьюO0 X 0 . Для каждого из множества таких направлений плоское движение(7.123) является единственной экстремалью.
Из единственности экстремали (7.123) следует ее оптимальность. Эти рассуждения свидетельствуютоб оптимальности движения в плоскости (7.122).Теперь необходимо определить оптимальное управление перегрузкой0 в плоскости ( X νOYν ) с учетом краеn 0 при движении с креном γ 0 (t ) =вых условий (7.93), (7.94), (7.98) – (7.102).С учетом формул (7.115) – (7.117), исходная система принимает вид d Θ ng dt = V ; dX= V cos Θ; dt dYV sin Θ.= dt(7.124)Вектор управления превращается в скаляр с ограничением (7.90).Критерий минимизации имеет вид (7.92). Начальные условия системы(7.124 ):X = Y = Θ = t0 = 0 .(7.125)Конечные условия системы (7.124):tk= T= const,=) 0,FX (T ) − C ⋅ Y (T=1(7.126)Θ(T ) =var .Гамильтониан системы (7.124) принимает видH = Y X ⋅V cos Θ + YY ⋅V sin Θ + Y Θ ⋅где сопряженная системаng,V(7.127)Глава 7. Программно-корректируемое позиционное управление∂H =0;Y−=X∂X =− ∂H =0;YY∂Y∂ = − H = Y ⋅V sin Θ + Y ⋅V cos Θ.YXYΘ∂ΘКраевые условия сопряженной системы (7.128) имеют видY X (T ) =Y X (t0 ) =CX ;YY (T ) =YY (t0 ) =CY ;279(7.128)(7.129)0,Y Θ (T ) =тогда = C ⋅V sin Θ − C ⋅V cos Θ .YΘXYОптимальное управление удовлетворяет условиюn0 =⋅n′ sign [ Ψ Θ ] .(7.130)(7.131)Введем в рассмотрение угол ϕ , задаваемый параметрами C X и CYследующим образом:CX =C X2 + CY2 ⋅ cos ϕ; CY =C X2 + CY2 ⋅ sin ϕ; A= V ⋅ C X2 + CY2 > 0 .Тогда (7.127) с учетом (7.131) приобретает видn ′gC X2 + CY2 ⋅ cos ϕ ⋅V cos Θ + C X2 + CY2 ⋅ sin ϕ ⋅V sin Θ + Y Θ ⋅=V(7.132)n ′gn ′g= A ⋅ {cos ϕ cos Θ + sin ϕ sin Θ} + Y Θ ⋅ = A ⋅ cos( Θ − ϕ) + Y Θ ⋅.VVСоотношение (7.130) принимает вид=ΨA sin( Θ − ϕ) .(7.133)ΘВведем в рассмотрение угол ξ = Θ − ϕ , где=Hξ(t0 ) = Θ(t0 ) − ϕ;ξ(T ) = Θ(T ) − ϕи обозначимf ( ξ) = A ⋅ cos ξ .Тогда (7.132) и (7.133) принимают видn ′g,H= f ( ξ) + Ψ Θ ⋅V = A ⋅ sin ξ .ΨΘ(7.134)(7.135)f ( ξ) и Ψ Θ ( ξ) , изображенные наРассмотрим графики функцийрис.
7.16.Отметим, что функция Гамильтониана (7.134) состоит из двух слагаемых, второе из которых неотрицательно.280Задачи управления двухкоалиционными ММС. Часть IIΨ θ ⋅ n′g VfH(t) = H(T)A0 ξ (T )ξ0ξ∗ξf (ξ )Ψθξ0-AΨ θ+0 ξ (T )ξ0ξ∗ξξ∗ξ2 AVn′g2 AVn′gΨ θ0 ξ (T )Ψθ0 ξ (T )ξ0Ψ θ ( t0 )ξ0ξ∗ξРис. 7.16. Диаграммы изменения функций (T ) =0 , поэтому второе слагаемое равноВ момент времени t = T : ΨΘнулю.В соответствии с принципом максимума [158](7.136)=H (t ) H=(T ) const ,(7.137)H (T ) =A ⋅ cos ξ(T ) .Глава 7. Программно-корректируемое позиционное управление281Рассмотрим моменты переключения управлений в соответствии с(7.93).
Предположим в момент t = t* происходит переключение, т.е. функ0 илиция Ψ Θ (t* ) =ξ* A cos ξ(T ) .H (=t* ) A cos=Поэтому(7.138)ξ* =ξ(T ) ± 2πb , b = 0,1, 2,... ,илиξ* = −ξ(T ) ± 2πb b = 0,1, 2,... .В соответствии с принципом максимума функция f ( ξ) не может бытьбольше значения H (T=) f ( ξ(T )) , поэтому (рис. 7.16) моменты переключения могут быть определены только как(7.139)ξ* =ξ(T ) ,или(7.140)ξ* = −ξ(T ) ± 2π .Причем знак в выражении (7.140) определен однозначно: либо «плюс»,либо «минус», что ясно из рис. 7.16. Таким образом, функция Ψ Θ можетбыть нулем только в моменты времени, когда(7.141)ξ (t ) =ξ∗ .Возникает вопрос, сколько раз функция ξ(t ) будет достигать значенияξ* , начиная свое движение с некоторой величины ξ(t0 ) ?Здесь возможно несколько вариантов:• ξ достигает значения ξ* =ξ(T ) только один раз в момент времениt =T ;• ξ достигает значения ξ* два раза: в последний момент времениt =T ( ξ* =ξ(T )); в некоторый момент времени t = t* ( ξ* = −ξ(T ) ± 2π) ,при этом ясно, что длительность участка[t* , T ]не меньше, чемдлительность первого участка [t0 , t* ] .
То есть последний интервалпостоянства управления не меньше, чем (T − t0 ) / 2 . Как частныйслучай длительность первого участка может быть равна нулю;• ξ достигает значения ξ* три и более раз. При этом все участкизнакопостоянства Ψ Θ имеют равную длительность, за исключениемпервого, который может быть короче, и, как частный случай,длительность первого участка может быть равна нулю.Линейная зависимость функции Гамильтониана от управления свидетельствует о возможности существования особого управления.Особое управление возможно, когда [80, 264]282Задачи управления двухкоалиционными ММС.
Часть IIΨ Θ ( τ) =0 , t ∈ [t* , T ] ; ( τ) =0 , t ∈ [t , T ] ;ΨΘ* ( τ) =0 , t ∈ [t , T ] .ΨΘ*Из соотношения (7.144) определим вид особого управленияA cos ξ ⋅ ξ .=ΨΘ , следовательноТак как ξ = Θ = 0 , t ∈ [t , T ] .Ψ⋅ΘA cos ξ=Θ ( τ)*Из соотношения (7.143) следует, что =ΨA sin=ξ 0 , t ∈ [t* , T ] ;Θ ( τ)(7.142)(7.143)(7.144)(7.145)(7.146)(7.147)ξ* = ±π ⋅ b , b = 0,1, 2... .Это свидетельствует о том, чтоξ = ξ* = const ,(7.148)(7.149)cos ξ* ≠ 0 .Поэтому из соотношения (7.146) следует, что ( τ) n 0=(7.150)=Θg / V 0 , t ∈ [t* , T ]и особое управление, претендующее на оптимальность, имеет вид(7.151)n 0 ( τ) =0 , t ∈ [t* , T ] .Соотношение (7.142) свидетельствует о том, что начало участка особого управления возможно только в момент t* , когда выполняется соотношение (7.141).Таким образом,ξ* = ξ(T ) = ±π ⋅ b , b = 0,1, 2,...
.Исследуем особое управление (7.151) на оптимальность, используякритерий Келли [80, 264, 339]:∂ d 2 ∂H (7.152) ≥ 0 ,∂n dt 2 ∂n g∂H Ψ Θ g d 2 ∂H d ; 2==ξ ⋅ ng 2 A cos ξ / V 2 ,= A sinV∂nVdt ∂n dt ∂(7.153)ng 2 A cos ξ / V 2 = ( g / V )2 ⋅ A cos ξ .∂nСоотношение (7.152) должно выполняться вдоль особого управления,(т.е.гда)(7.154)cos ξ* ≥ 0 .Таким образом, особое управление оптимально только в момент t* , коξ* = 0 ± 2πb , b = 0,1, 2... .(7.155)Глава 7.
Программно-корректируемое позиционное управлениеГрафики функций n 0 , f ( ξ) , на участке [t , T ]ξ , ΨΘ и ΨΘ0имеют вид, показанный нарис. 7.17. Таким образом, анализособого управления позволяетсделать вывод о существованиичетвертого варианта поведенияфункции ξ на интервале [t0 , T ] :•fТаким образом, выявлены четыреструктурыэкстремалейПонтрягина, среди которых есть иструктура оптимального управления величиной n по критерию(7.92). Заметим, что вопрос удовлетворения траектории краевомуусловию F1 (7.126) пока не рассматривался.t*Ttt*Tt0t*Tt0t*Ttt*Tt0ξ0Ψθξ достигает значения ξ(T ) =0в момент t = t* и остаетсянулевой на оставшемся интервале времени t ∈ [t* , T ] .283Ψθn00-n'Рис.