Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 80
Текст из файла (страница 80)
Без ограниченияобщности метода оптимизации на основе ПКЗУ специфика данной задачи (малое число тактов) предполагает наличие двух тактов целераспределения на отрезке [0,T] и, как следствие, двух тактов ПДК на первом ∆Ти одного на втором соответственно.Структурная схема точного последовательного четырехэтапного алгоритма ЦР-ПДК при выполнении дополнительных условий дана нарис. 10.12.Этап 1Алгоритм формализации конфигурацииθψна k-м такте (получение Pij)Этап 2Осреднение вероятностей по формулам (10.14)(получение Pij )Этап 3Алгоритм конфликтно-оптимального ПДК на k-м такте(или на k, k+1 тактах) на основе модели (10.8) с элементами СТЭК на доверительных интервалах (получениедолей ν ij (k) численностей Ni (k))Этап 4θψАлгоритм ЦР на k-м такте на основе матриц Pij и доθψлей ν ij (k) от Ni (k) (получение матриц назначения γ ij)Рис.
10.12. Последовательный алгоритм ЦР-ПДК на ∆Т438Исследование стабильности, эффект. и элементов СТЭК. Часть IVОбщая структурная схема итерации совместного алгоритма ЦР-ПДК наk-м такте конфликта дана на рис. 10.13. В данной структуре заложены дваварианта прогноза: только на одном, k-м, такте (∆Т), или на двух, k-м и(k+1)-м, тактах (2∆Т). Прогноз конфигурации на k+1 такт заключается в«сдвиге» на ∆Т ЛС СВН с учётом «прореживания» обоих ЛС после k-готакта. Итерационные процедуры заканчиваются, когда найденная νij ( k ) воднотактном прогнозе или вектор ( νij ( k ) , νij ( k + 1) ) в двухтактном прогнозе обеспечивают заложенный в качестве целевого вид СТЭК (например,СТЭК-7).Из общей структуры итерации исходного совместного алгоритма следует, что он является достаточно сложным, так как для его реализациинеобходимо реализовать оптимизационную процедуру ПДК на уровнеСТЭК с встроенным на итерации алгоритмом ЦР, получить прогноз конфигурации на двухтактном ПДК, совмещая целочисленные и нецелочисленные процедуры в процессе оптимизации и так далее.
Поэтому рассматриваются два варианта приближения исходного совместного алгоритма при однотактном и двухтактном прогнозе.Рис. 10.13. Общая структура итерации совместного алгоритма ЦР-ПДКна k-м такте конфликтаОсновная идея приближения алгоритма при однотактном прогнозе заключается в предварительном многократном решении задачи ЦР (10.9) –(10.11) (с поправкой ИТК) для сети значений νij удовлетворяющих ограничениям (10.4), и получении регрессионных зависимостей C j ( νij ) , гдеГлава 10.
Исследование конфликтной ситуации на основе СТЭК439C j – максимальное значение выражения (10.9) с учётом ИТК при фикси-рованном значении νij и заданных для данного такта N i ( k ) . Данные регрессионные зависимости заменяют слагаемые в скобках системы (10.12),которая принимает вид: x1 ( k + 1)= N1 ( k ) − [C1 ( ν41 ) + C1 ( ν51 )] ⋅ R( N1 ( k )) − λ( k ) ⋅ N1 ( k );+ 1) N 2 ( k ) − [C2 ( ν42 ) + C2 ( ν52 )] ⋅ R( N 2 ( k )) − λ( k ) ⋅ N 2 ( k ); x2 ( k=1) N 3 ( k ) − [C3 ( ν43 ) + C3 ( ν53 )] ⋅ R( N 3 ( k )); x3 ( k +=(10.15)+ 1) N 4 ( k ) − [C4 ( ν14 ) + C4 ( ν24 )] ⋅ R( N 4 ( k )) − λ( k ) ⋅ N 4 ( k ); x4 ( k=N 5 ( k ) − [C5 ( ν15 ) + C5 ( ν25 )] ⋅ R( N 5 ( k )) − λ( k ) ⋅ N 5 ( k ); x5 ( k + 1) = x6 ( k +=1) N 6 ( k ) − [C6 ( ν16 ) + C6 ( ν26 )] ⋅ R( N 6 ( k )).Этап 1Формализация конфигурациина k-м тактеЭтап 2Получение регрессионныхзависимостейc j vij на основе ЦР-ИТК( )Этап 3Получение модифицированноймодели (10.12), (10.16)Этап 4Алгоритм ПДК с элементами СТЭК(получение vijopt )Этап 5{ }Выбор матриц γ ijθψ из наборарешений ЦР-ИТК по vijoptРис.
10.14. Приближённый алгоритм ЦР-ПДК с однотактным прогнозом440Исследование стабильности, эффект. и элементов СТЭК. Часть IVТогда структурная схема приближённого последовательного пятиэтапного алгоритма ЦР-ПДК с однотактным прогнозом принимает вид(рис. 10.14). Очевидно, что степень приближения полученного алгоритма кисходному совместному определяется плотностью сети значений C j ( νij )на этапе 2.Шаг 1Формализация конфигурации на k-мтакте (получение Pijθψ )Шаг 2Определение вероятностей(получение Pij )Шаг 3Алгоритм ПДК с элементами СТЭКна k-м такте (получение vijopt )Шаг 4Задание vijtАлгоритм ЦРШаг 5Шаг 6Алгоритм ИТК(получение численности послеk-го такта)Шаг 7Алгоритм ПДК с элементамиСТЭК на (k + 1) тактеШаг 8Формирование (l + 1)– итерации vij наk-м такте для улучшения рез.
шага 7Рис. 10.15. Итерация приближённого алгоритм ЦР-ПДК с двухтактным прогнозомВариант приближения совместного алгоритма рис. 10.13 при двухтакном прогнозе, итерация которого представлена на рис. 10.15, заключа-Глава 10. Исследование конфликтной ситуации на основе СТЭК441ется в применении осреднения вероятностей Pijθψ для получения первогоприближения долей νij (10.10) алгоритма ЦР на основе алгоритма ПДК сэлементами СТЭК для k-го такта. Вторым элементом приближения является использование тех же осреднений для алгоритма ПДК с элементамиСТЭК для (k+1)-го такта (но при вновь полученных для начала (k+1)-готакта прогноза численностей объектов).
Главное удобство полученногоалгоритма (рис. 10.15) в отличие от исходного (рис. 10.13) заключается вполучении возможностей последовательно решать оптимизационные задачи и задачи моделирования на его итерации. Степень приближения зависит от разброса вероятностей Pijθψ от средних Pij , но, во-первых, как отмечалось, при достаточно больших расстояниях между конфликтующимисистемами малый разброс может иметь место; во-вторых, задачи ПДК иЦР – это разные распределительные задачи (в первой имеет место групповое распределение по типу; во второй – распределение объектов при фиксированных i, j по геометрии их расположения), и поэтому геометрическаянеточность Pij для задач первого типа может несущественно сказыватьсяна результатах; в-третьих, задача на шаге 3 даёт лишь здравую тенденциюпервого приближения (конфликтно-оптимальный ПДК k-го такта), котораяизменяется на итерациях для достижения наилучших результатов при прогнозе на (k+1)-м такте и, следовательно, повышения качества ЦР.Следует отметить, что полученный алгоритм ЦР-ПДК, представленныйна рис.
10.15, в отличие от алгоритма на рис. 10.12 обладает адаптивнымисвойствами, когда приближение от усреднения вероятностей при ПДК частично компенсируется дополнительной задачей улучшения качества ЦРПДК на основе перестройки νij . Поэтому последовательный алгоритм нарис. 10.12 является частным случаем алгоритма с подстройкой на риc.10.15, при этом шаг 1 – шаг 4 последнего превращаются в последовательные этапы 1-4 первого при отсутствии подстройки. Таким образом, алгоритмическая основа ЦР-ПДК сводится к применению двух приближённыхпоследовательных вариантов совместного алгоритма, структуры которыхданы на рис. 10.14, 10.15.Как следует из структуры данных алгоритма, в его состав входят стандартные алгоритмы ЦР, ИТК и алгоритм ПДК с элементами СТЭК.
Рассмотрим структурные свойства данных алгоритмов.Алгоритм ЦР. Задача ЦР (10.9) – (10.11) имеет одну структурную особенность. Для её решения необходимо либо задать не только доли νij ичисленности xi , но и местоположения (θ) объектов этой доли, либо задавать местоположения долей (θ) и, в общем случае, (ψ), что повышает эф-442Исследование стабильности, эффект. и элементов СТЭК. Часть IVфективность ЦР. В этом случае задача ЦР для каждой конфликтующей системы в рамках модели (10.12) приводится к виду:для ЛС ПВОx j x4x j x53 θψ θψ(10.16)∑ a4 ∑ ∑ P4θψj γ θψ4 j + a5 ∑ ∑ P5 j γ 5 j → maxψ = 1 θ= 1j= 1 ψ= 1 θ= 1при ограничениях α4 + α5 =1 ; 0 ≤ αi ≤ 1, i = 4,5;x j x43ψ = 1 θ= 1j=1ν 4 j x4 ; ∑ ν 4 j =1 ; 0 ≤ ν4 j∑ ∑ γ θψ4j =xjx531 ; 0 ≤ ν5 jν5 j x5 ; ∑ ν5 j =∑ ∑ γ 5θψj =ψ = 1 θ= 1≤ 1, j = 1,2,3;≤ 1, j = 1,2,3;j=1для ЛС СВНx j x2 x j x1 θψ θψ∑ a1 ∑ ∑ P1 j γ1 j + a2 ∑ ∑ P2θψj γ 2θψj → maxψ = 1 θ= 1j= 4 ψ= 1 θ= 16(10.17)при ограничениях α1 + α2 =1 ; 0 ≤ αi ≤ 1, i = 1,2;xjx161 ; 0 ≤ ν1 jν1 j x1 ; ∑ ν1 j =∑ ∑ γ1θψj =ψ = 1 θ= 1≤ 1, j = 4,5,6;j= 4x j x26ψ = 1 θ= 1j= 4ν 2 j x2 ; ∑ ν 2 j =1 ; 0 ≤ ν2 j∑ ∑ γ θψ2j =≤ 1, j = 4,5,6.Весовые коэффициенты αi характеризуют приоритеты распределенияАО разных типов исходной ЛС, которые, например, будут равноценнымипо целям, если αi =1/2.
Если в (10.16) и (10.17) ввести пристыкованныематрицы (см. рис. 10.16){P } = {P }{P } {P } ,θψiгде i = 4,5; = 1,2,3;θψi1θψi2θψi3(10.18){P } = {P }4{P }4{P } ,θψikгде i = 1,2 , k = 4,5,6;и далее,{P } =θψnθψi4{P }θψ4θψi5{ }θψi6{P }θψ1kθψ ; Pmk= ,{P }θψ5{P }θψ2k(10.19)442Исследование стабильности, эффект. и элементов СТЭК. Часть IVто полученные матрицы составляют полные матрицы вероятностей поражения противников с учётом типа и расположения объектов нападения изащиты. Условный вид такой пристыкованной матрицы для ЛС ПВО данна рис. 10.16.
В результате решения задач (10.16), (10.17) с вероятностными матрицами (10.18), (10.19) при наличие ограничений будут полученыискомые наборы матриц { γ ijθψ } и величины (10.9), обеспечивающие максимум взвешенной суммы средних численностей поражённых средств.x4 + x5 ≅ x1 + x2 + x3 .{ }Рис. 10.16. Матрица вероятностей ЛС ПВО Pnθψс учётом типаи расположения объектовМетоды решения задач ЦР детально изучены, например, в работах[203–205].
Для решения задачи ЦР применяется разработанный в указанных работах модифицированный алгоритм ЦР на основе метода минимального элемента, который является достаточно простым и быстрым вариантом ЦР. Блок схема алгоритма ЦР на примере ЛС ПВО дана нарис. 10.17.Принцип минимизации νij N i в данной последовательной оптимизациивносит свойство усреднения в получающиеся максимальные средние численности (10.9), (10.16), (10.17), имея тенденцию большего приближениямаксимального среднего к значению доли νij N i по мере уменьшения доли(т.е. чем меньше доля, тем большие значения вероятностей ей соответствуют).
Данный алгоритм качественно учитывает приоритет i-х типовобъектов ЦР, что позволяет усилить реализованную тенденцию ПДК в ЦР.Глава 10. Исследование конфликтной ситуации на основе СТЭКРис. 10.17. Блок-схема алгоритма ЦР443444Исследование стабильности, эффект. и элементов СТЭК. Часть IVАлгоритм ИТК и коррекция средних. Имитация конфликта заключается в стохастическом учёте [38] промаха h при оценке качества наведенияи «накачки» вероятностей Pijθψ , для которых в задачах ЦР были полученызначения элементов матриц назначений γ ijθψ равные единице, в зависимости от «потока» Pijпор . Оценка производится по формуле: Pijθψ an =hijθψ=1−1 − Pijθψ , где Pijθψ < Рijθψ an ≤ 1 , Pijθψ an – апостериорное значение,hk()hijθψнесёт смысл неэффективности наведения и удовлетворяет следуюhkщим условиям (Random):h≤ C;0 ≤hkhδ− равномерно распределена на [0; C ];=hk(10.20)σ2δ C 2 12;[δ] C 2 и= и при этом M=1 при Pijθψ ≤ Pij;пороговое=( Pijθψ ), где С 1 − PijθψС f=при Pijθψ > Pij пороговое .−P1ij пороговоеxis()Учёт коалиций заключается в замене Pijθψ на Pijθψ =1 − ∏ 1 − Pijθψ , гдеθ=1xis – число активных средств i-го типа в коалиции s, действующих противобъектов j в точке ψ, причём оцениваемое значение имеет смысл Pijsψ ап ,так как при xis ≥ 2 − 3 эффективность Pijsψ достаточно велика.
Блок-схемаалгоритма ИТК для ЛС ПВО дана на рис. 10.18.Средние численности x j ( k + 1) после залпа определяются из уравнений(10.12). Коррекция средних имеет смысл в получении истинных значенийN j ( k + 1) , которые, например, с вероятностью 0,96 находятся в интервале[38, 244]:−2σ j + x j ( k + 1) ≤ N j ( k + 1) ≤ x j ( k + 1) + 2σ j ,(10.21) x j ( k +1) 2где=σ2j x j ( k +1) 1 − .
Вид функции σ j представлен на рис. 10.19.()NkjГлава 10. Исследование конфликтной ситуации на основе СТЭК445{ }Набор матриц Pijθψ при γ ijθψ ( k + 1=) 1, N i (k ), N j (k );=i 4,5;=j 1, 2,3Фиксируем i,jФиксируем θ,ψPijθψ <PporogC=1 − Pijθψrd := Random1 − Pporogrd := Random(C )Pijθψ an =1 − rd (1 − Pijθψ )НетМатрица Pijθψ anполученаДаНет{Набор матриц Pijθψ an}i 4,5;j 1, 2,3==полученДаПолучение численностейx j ( k + 1), j =1, 2,3по формулам (10.12)Рис. 10.18. Блок-схема алгоритма ИТК (для ЛС ПВО)Как следует из рис. 10.19, дисперсия будет мала, если тактика ПДК-ЦРбудет ориентирована на усиленное подавление некоторых видов объектовпри ослабленном воздействии на другие, так как средние x j ( k + 1) первыхбудут близки к нулю, средние вторых – к N j ( k ) . Этот факт тем болеесправедлив в рассматриваемой тактической задаче, где её решение по уничтожению некоторых видов объектов противника должно быть обеспечено446Исследование стабильности, эффект.