Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 65
Текст из файла (страница 65)
449].Итак,П(8.73)K ( tk , t1 ) =ρG −1 ( t1 ) C ( tk , t1 ) .Подстановка этого выражения в преобразованное с помощью прямыхпроизведений выражение (8.64) дает искомое выражение для оптимальнойматрицы ИПФ K *∆ ( t2 , t1 ) как функции ε д* ( tk ) :t2 , t1 ) K ∆П ( t2 , t1 ) − λ q Ω −1 ( t2 , t1 ) A T ( tk , t2 ) ⊗ N 2 ( t1 ) ×K *∆ (=×G −1 ( t1 ) C ( tk , t1 ) − ρ −1 Ω −1 ( t2 , t1 ) A T ( tk , t2 ) ⊗ y ∆ ( t1 ) ε д* ( tk ) .(8.74)ЗдесьK ∆П=( t2 , t1 )n∑ K ∆ПTi* ( t2 , t1 ).(8.75)i =1Исследование и решение уравнения (8.38).
Используя в (8.38) прямыепроизведения, получимε д* ( tk=)tkT*д∫ ( E ⊗ y ∆ ( t1 ) ) K ( tk , t1 ) d t1 + ε0 ( tk ) .(8.76)t0Подстановка сюда (8.73) с учетом (8.71) дает систему n алгебраическихуравнений для определения ε д* ( tk ) :D2 ( tk ) ε д* ( tk ) =ρI3 ( tk ) + ε 0д ( tk ) .Здесь n × 1 векторI 3 ( tk ) =(8.77)tkTn−1−2∫ ( E ⊗ y ∆ ( t1 ) )G ( t1 ) ( E ⊗ N ( t1 ) ) K ( tk , t1 ) d t1 ,(8.78)t0n × n матрица D2 (tk )= E + I 2 (tk ) ,I 2 ( tk ) =(8.79)tkT−1−2∫ ( E ⊗ y ∆ ( t1 ) )G ( t1 ) ( V ( t1 ) ⊗ N ( t1 ) ) ( E ⊗ y ∆ ( t1 ) ) d t1 .
(8.80)t0Необходимым и достаточным условием существования и единственности решения (8.77) для любых правых частей является невырожденностьматрицы D2 ( tk ) ; условием устойчивости решения является «хорошая»обусловленность этой матрицы [240].В [54, с. 450] показано, что матрица D2 ( tk ) невырождена и найденыдостаточные условия «хорошей» обусловленности этой матрицы.Глава 8. Стохастическая интегро-дифференц. модель конфликта353Таким образом, решение системы (8.77) для любой правой части существует, единственно и(8.81)ε д* ( tk=) D2−1 ( tk ) ρI3 ( tk ) + ε0д ( tk ) .Из (8.79), (8.80) следует, что достаточным условием «хорошей» обусловленности матрицы D2 ( tk ) является «хорошая» обусловленность матриц V ( ττ) , N −2 ( ) (см.
(8.69)).Поскольку приведенные результаты справедливы для любых τ1 ,t0 ≤ t1 < tk , то отсюда и из (8.74), (8.71), (8.81) следует явное выражениедля искомой оптимальной МИПФ*Пt2 , t1 ) K ∆ ( t2 , t1 ) − λ q Ω −1 ( t2 , t1 ) A T ( tk , t2 ) ⊗ N 2 ( t1 ) ×K ∆ (=()×G −1 ( t1 ) × E ⊗ N −2 ( t1 ) K({п( tk , t1 ) −−λ qρ −1 Ω −1 ( t2 , t1 ) A T ( tk , t2 ) ⊗ N −2 ( t1 ) ×)(8.82)}×G −1 ( t1 ) V ( t1 ) ⊗ N −2 ( t1 ) y ∆ ( t1 ) + λ −q 1 Ω−1 ( t2 , t1 ) A T ( tk , t2 ) ⊗ y ∆ ( t1 ) ××D2−1 ( tk ) ρI3 ( tk ) + ε 0д ( tk ) ,где t2 ∈ [t0 , tk ] , t0≤ t1 < tk .
Подобно тому, как это было сделано в пункте(2.1) для выражения (8.59), легко показать, что формула (8.82) определяетМИПФ K *∆ ( t2 , t1 ) и при t2 = tk , и при t=tk , t=21 tk .Таким образом, доказано следующее утверждение.Утверждение 8.2. Решение матричного интегрального уравнения (8.60)в условиях постановки пункта 1.3 существует и единственно в пространстве L n2×n [t0 , tk ] и задается выражением (8.82) для любого x q ( t ) ∈ X q ( t ) .Достаточным условием устойчивости решения (8.82) является «хорошая» обусловленность матриц (8.35), (8.47) для любого x q ( t ) ∈ X q ( t ) .В завершение пункта рассмотрим используемый в дальнейшем изложении частный случай. Пусть мультипликативная помеха представляет собой некоррелированный «белый» шум с одинаковым уровнем спектральной плоскости N 2 ( τ ) компонент. В этом случае(8.83)N 2 ( τ=) N 2 ( τ ) E(см.
(8.35)) и выражения для K * ( tk , t1 ) , ε д* ( tk ) и K *∆ ( t2 , t1 ) существенно упрощаются.Для K * ( tk , t1 ) из (8.69), (8.71), (8.73) здесь имеем354Задачи управления двухкоалиционными ММС. Часть IIK * ( tk , t1=) N −2 ( t1 ) G −1 ( t1 ) ρK П ( tk , t1 ) − V ( t1 ) ε д* ( tk ) y T∆ ( t1 ) , (8.84)где K П ( tk , t1 ) и V ( τ1 ) определяются соответственно выражениями(8.67), (8.47), аG ( τ1 ) = λ q V ( τ1 ) + ρN −2 ( τ1 ) E ,(8.85)K *∆ ( ρ, =t2 , t1 ) K n∆ ( t2 , t1 ) − ρ −1Ω −1 ( t2 , t1 ) A T ( tk , t2 ) ×(8.86)× λ q K * ( ρ, tk , t1 ) N 2 ( t1 ) + ε д* ( ρ, tk ) y T∆ ( t1 ) ,гдеI 2 ( tk ) =tkT−1−2∫ G ( t1 ) V ( t1 ) y ∆ ( t1 ) y ∆ ( t1 ) N ( t1 ) d t1 ,(8.87)t0 t2( 2 )*(2)E2 K *∆ ( r, t2 , t1 ) =E2 ( r ) =r −2 tr ∫ V ( t2 ) × t0(8.88)T× λ q K * (r, tk , t2 }N 2 ( t2 ) + ε д* (r, tk ) y T∆ ( t2 ) [ − // − ] dt2 .Подставляя (8.84) (с учетом (8.86)) и (8.86) в (8.64), получим явное выражение для оптимальной МИПФ()}K *∆ (=t2 , t1 ) K n∆ ( t2 , t1 ) − ρ −1Ω−1 ( t2 , t1 ) A T ( tk , t2 ) ×{}× λ qρG −1 ( t1 ) K n ( tk , t1 ) − λ q G −1 ( t1 ) V ( t1 ) − E ×(8.89)×∆2−1 ( tk ) ρI3 ( tk ) + ε 0д ( tk ) .Анализ результатов пункта 2.2.
Точное решение матричных интегральных уравнений для помех общего вида и задающих необходимые идостаточные условия оптимальности стратегии объекта Р не удается. Поэтому для получения точного решения в данном параграфе рассмотренпрактически важный случай, когда аддитивная и мультипликативная помехи аппроксимируются «белыми» шумами. Для полученных матричныхинтегральных уравнений (8.37), (8.60) в данном пункте доказана корректность по Адамару задач решения этих уравнений в пространствеL n2×n [t0 , tk ] и найдены явные выражения оптимальных МИПФ K *∆ ( t2 , t1 ) .Результаты пункта сформулированы в утверждениях 8.1, 8.2.В заключение п.
8.2 полезно сделать следующие замечания.1. Выражение для оптимальной МИПФ K *∆ ( t2 , t1 ) (8.71) является частным случаем решения матричного интегрального уравнения, задающего необходимое и достаточное условие «оптимальности» K *∆ ( t2 , t1 ) вГлава 8. Стохастическая интегро-дифференц. модель конфликта355случае функционала сложности, включающего в себя математическоеожидание вектора j p∆ ( t ) и его дисперсию [413].2. В случае помех общего вида возможно приближенное решение уравнений путем аппроксимации корреляционных матриц помех суммамивырожденных ядер – метод Шинброта 1.8.3. ОПРЕДЕЛЕНИЕ МНОЖИТЕЛЯ ЛАГРАНЖА ρ , ОБЕСПЕЧИВАЮЩЕГОЗАДАННЫЙ УРОВЕНЬ ОГРАНИЧЕНИЯ СЛОЖНОСТИ СТРАТЕГИЙ ОБЪЕКТА РВ данном параграфе рассматривается второй шаг этапа определенияоптимальной стратегии объекта Р – задача поиска множителя Лагранжа,обеспечивающего значение функционала сложности, не превышающегозаданное (8.38).(1)Функционал сложности E28.3.1.Выражение для рассматриваемого функционала сложности в случае,когда мультипликативная и аддитивная помехи аппроксимируются не коррелированными «белыми» шумами и K ∆ ( t2 , t1 =) K *∆ (ρ, t2 , t1 ) , имеет вид 2()(1)E2 K *∆ ( r, t2 , t1 ) = tk t2= tr ∫ ∫ Ω ( t2 ) K *∆ ( r, t2 , t1 ) N 2 ( t1 ) K ΔT ( r, t2 , t1 ) d t1dt2 , t0 t0(8.90)где N 2 ( τ1 ) определяется выражениями (8.35), (8.36).
Подставляя в (8.90)выражение (8.51) для K *∆ ( ρ, t2 , t1 ) (или (8.59)) и используя известныесвойства следа матрицы, получим tk (1)*(1)E2 K *∆ ( r, t2 , t1 ) = E2 ( r ) = −r −2 tr ∫ V( t2 ) × t0()× ∫ V1−1 ( r, t1 ) ε д* ( rrr, tk ) ε д*T ( , tk ) V1−1 ( , t1 ) z ( t1 ) d t1dt2 ,t0(8.91)t21См., например, Питерсон И.Л.
Статистический анализ и оптимизация систем управления. – М.: Сов.радио, 1964. – 248 с.2См. замечание 8.1.Задачи управления двухкоалиционными ММС. Часть IIгде матрицы V ( t2 ) , V1 ( ρ, t1 ) , ε д* ( ρ, tk ) и скаляр z ( τ1 ) определены в356пункте 8.2. Интегрирование по частям внешнего интеграла в (8.91) дает(1)*компактное выражение для E2 ( ρ ) :(1)*E2 ( r ) = t2 (8.92)tr ∫ V1−1 ( , t2 ) V ( t2 ) V1−1 ( , t2 ) z ( t2 ) dt2 ε д* ( , tk ) ε д*T ( r, tk ) .= −rrrr t0−2Задача определения множителя Лагранжа ρ = ρ* , обеспечивающего за1(1)*данное значение S ( ) ( tk ) функционала сложности E2 ( ρ ) , сводится, таким образом, к следующему нелинейному уравнению: t2*− 2 rrrrrtr ∫ V1−1 * , t2 V ( t2 ) V1−1 * , t2 z ( t2 ) dt2 ε д* * , tk ε д*T * , tk t0()(())() −(8.93)1− S ( ) ( tk ) =0.(1)невязка которого не должна превышать по модулю величины ε S (см.
п.8.1.3).Утверждение 8.3 [54]. При любом уровне ограничения сложности10 < S ( ) ( tk ) < ∞ и любом x q ( t ) ∈ X q ( t ) решение уравнения (8.93) существует.Аналитическое решение уравнения (8.93) не удается даже в простейшем случае. Поэтому принята ориентация на использование численныхметодов решения нелинейных уравнений.При численном решении для сокращения вычислительных затрат важным является получение оценок диапазона возможных значений искомыхвеличин.Предложение 8.1 [54, 64]. При любом уровне ограничения сложности1)1(S ( t ) , 0 ≤ S ( ) ( t ) < ∞ и при любом x ( t ) ∈ X ( t ) оценкой сверхуkkqqмножителя Лагранжа ρ* , обеспечивающего этот уровень сложности, является величинаρ*maxn εд0 ( tk )=1S ( ) ( tk )2tk∫t0y∆ ( t )2m (V ( t ) )dt .m N 2 (t )()Отметим, что из этой оценки легко могут быть получены более простые, но и более грубые оценки ρ* .Глава 8.
Стохастическая интегро-дифференц. модель конфликта8.3.2.357( 2)Функционал сложности E2Подстановка в выражение для рассматриваемого функционала (8.26)явного выражения для K *∆ ( ρ, t2 , t1 ) приводит к слишком громоздким результатам. Воспользуемся поэтому формулой (8.64), из которой следует,чтоK *∆ ( ρ,=t2 , t1 ) K ∆П ( t2 , t1 ) − ρ −1Ω −1 ( t2 , t1 ) A T ( tk , t2 ) ×× λ q K * ( ρ, tk , t1 ) N 2 ( t1 ) + ε д* ( ρ, tk ) y T∆ ( t1 ) ,(8.94)где матрица K * ( ρ, t2 , t1 ) получается из K ( ρ, t2 , t1 ) (8.73) с помощьюоперации, обратной прямому суммированию (8.70). Подставляя (8.94) в(8.26), аналогично (8.92) получим t2( 2 )*(2)E2 ( K *∆ ( r, t2 , t1 ) =E2 ( r ) =r −2 tr ∫ V ( t2 ) × t0(8.95)T× λ q K * ( r, tk , t2 } N 2 ( t2 ) + ε д* ( r, tk ) y T∆ ( t2 ) [ − // − ] dt2*}(см.
(8.47)). Задача определения множителя Лагранжа ρ = ρ* , обеспечива2( 2 )*ющего заданное значение S ( ) ( tk ) функционала сложности E2 ( ρ ) ,сводится, таким образом, к нелинейному уравнению t2Tr*−2 tr ∫ V ( t2 )[λ q K * r* , tk , t2 N 2 ( t2 ) + ε д* r* , tk y T∆ ( t2 )][ − // − ] dt2 − t0 (8.96)()()0,− S 2* ( tk ) =2невязка которого не должна превышать по модулю величины ε(S ) (см.8.1.3).Утверждение 8.4. При любом уровне ограничения сложности20 < S ( ) t < ∞ и любом x t ∈ X t решение уравнения (8.96) суще-( k)q()q()ствует.Аналитическое решение уравнения (8.96) не удается. Поэтому и здесьпринята ориентация на использование численных методов решения нелинейных уравнений.Получить оценку сверху для ρ* , как это сделано в предыдущем пункте,здесь в общем случае не удается.Предложение 8.2.