Воронов Е. М. Методы оптимизации управления ММС на основе стабильно-эффективных игровых решений (2001) (1264203), страница 61
Текст из файла (страница 61)
В рассмотренных позиционно-программных играх с идеальной информацией указанным принципам оптимальности соответствуетпринцип максимина 1 [195]:sup()inf=E ( K ( t ) , u q ( t ) ) E=K x*(⋅) ( y ) , u*q ( t ) E ** .u q ( t )∈U q K ( t )∈U p(8.3)В постановке, близкой к принятой в главе, позиционно-программныестохастические неадаптивные игры (в «бесшумной» форме) впервые рассмотрены, вероятно, В.М. Александровым, А.Д.
Иргером, В.А. Скрипкиным, А.Д. Шараборовым под руководством А.М. Баткова (см., например,[3, 4, 13]). Обобщенная исходная постановка здесь такова. Игрок Q описывается системой линейных векторных дифференциальных уравнений:(8.4)x q ( t ) =A ( t ) x q ( t ) + B ( t ) u q ( t ) , x q ( t0 ) =x q0 , t ∈ [t0 , tk ] ,1Полагается, что игрок Р стремится минимизировать функционал выигрыша Е(K,uq), аигрок Q максимизировать его.Глава 8. Стохастическая интегро-дифференц.
модель конфликта331где x q (t ) − m × 1 вектор; u q (t ) − r × 1 вектор – стратегия игрока Q;A ( t ) , B ( t ) – известные матрицы. Игрок Р описывается системой линей-ных интегральных связейx p (=t)t∫ K ( t, t ) y ( t ) d t ,(8.5)t0где K ( t , t ) − m × p МИПФ – стратегия игрока Р;=y (t ) H (t ) xq (t ) + n (t ) ,(8.6)где H ( t ) − p × m матрица; n ( t ) − p -мерный векторный случайныйпроцесс типа «белого» шума, имеющий нулевое математическое ожиданиеи известную корреляционную матрицу N 2 ( t ) δ ( t − t ) . Это является основным вариантом, но не ограничивает рассматриваемый подход при «небелом» шуме, так как в этом случае может быть введен формирующийфильтр. В качестве критерия эффективности рассматривается среднийквадрат ошибки:(8.7)=ε ( tk ) χ T x p ( tk ) − x q ( tk ) ,()где χ – заданный n × 1 вектор.
Требуется найти стратегии u*q и K * такие,что()M ε2 u*q , K * = min max M ε2 ( u q , K ) ,Kuq(8.8)где2M ε=[ M ε]2 + σ2 ( ε ) .(8.9)С помощью сопряженной системы и расширения вектора состояния игры после осреднения (8.9) задача сводится к позиционно-программной«бесшумной» дифференциальной игре (8.2).Дальнейшее развитие теория позиционно-программных «бесшумных»игр с идеальной информацией получила, например, в работах [60, 62, 156,413].
Здесь рассмотрена многомерная задача с заданной частью и ограничением координат, получено аналитическое выражение для оптимальной()МИПФ K * ( x q ( ⋅) , τ, q ) и выражение для E u q , K * ( x q ( ⋅) ) . В соответствиис общей методикой задача определения u*q (t ) сведена к задаче оптимального управления.В данной главе метод, сформированный в работах [26, 60, 62, 64, 413],представлен в наиболее полном виде с обеспечением адекватности моделей игрока Р реальным системам (учтены кинематические связи, специфические для систем само- и теленаведения; выделены кинематические связиускорений объекта с его координатами центра масс; на основе принципаЗадачи управления двухкоалиционными ММС.
Часть II332ограниченной сложности [240] использованы конструктивные ограничения двух типов на МИПФ K *∆ ( x q ( ⋅) , τ, q ) ; в формализм задачи и АО введен опорный режим, относительно которого проведена линеаризация объекта), с учетом аддитивных и мультипликативных помех в каналах измерения объекта Р. Момент времени окончания игры здесь может быть нефиксирован.8.1.2.Формирование расчетной схемы позиционно-управляемогообъекта (Р), адекватной реальным системамтелесамонаведенияКак указывалось в 8.1.1, основным недостатком предшествующих работ является неадекватность используемых в них моделей игрока Р реальным объектам. В данном параграфе показана возможность сведения общихструктурных схем теле- и самонаводящегося объектов к единой структурной схеме, учитывающей специфику объектов и кинематические связи вних.
Данная схема используется в качестве расчетной схемы объекта Р.ОИКСЦельКЦКСКСКФИКО1ОИИКЦОИИКО2ЛСКФВПУКСОКОεКФРис. 8.1. Структурная схема системы теленаведенияРассматривается движение центров масс телеуправляемого и самонаводящегося объектов в системе координат OX ∂Y∂ Z ∂ или в связанной сэтой системой сферической системе координат rϕχ .В качестве компонент вектора ускорений объекта рассматриваютсяпроекции этого вектора на оси скоростной системы координат OX aYa Z a .Общую структурную схему системы теленаведения объекта можноизобразить в виде представленной на рис.
8.1 [63, 143, 251], где ОИ –ошибка измерения, КЦ – координаты цели, КО – координаты объекта,ИКЦ – координаты цели, измеренные на станции наведения, ИКС – координаты объекта, измеренные на станции наведения, ИКО – координатыобъекта, измеренные на самом объекте, ЛС – командная линия связи, ПУ –потребные ускорения, В – возмущения, КСО – кинематические связи ПУ сГлава 8. Стохастическая интегро-дифференц. модель конфликта333координатами объекта, КС – кинематические связи координат с измеренными координатами, КФ – корректирующие фильтры. Определяющими вэтой схеме являются ошибки измерения координат цели. Пренебрегаяошибками измерения в каналах измерения координат объекта на станциинаведения (на объекте) и возмущающими воздействиями, из схемы рис. 8.1легко получить схему на рис.
8.2. Обозначив часть системы, выделеннуюпунктиром, через ОЧС (оптимизируемая часть системы), получим отсюдасхему, представленную на рис. 8.3.Произведем линеаризацию оптимизируемой части этой схемы и кинематических связей объекта относительно некоторых КЦ 0 и им соответствующих ИКЦ 0 и ПУ 0 . Тогда из рис. 8.3 следует схема на рис. 8.4.ИКО1КФЦельКСОКСОИЛСКСКФК=1ПУКСОεИКЦИКО2КФКСОКСРис. 8.2. Упрощенная структурная схемаОИЦельКЦИКЦКСОЧСПУКСОКОРис.
8.3. Схема системы теленаведения с блоком ОЧСКЦ0ЦельКС0КЦИКЦ0ОИКС∆КСО0ОЧС0ИКЦ ∆ОЧС ∆ПУ∆КСО∆КО0КО∆КОКЦРис. 8.4. Линеаризованная системаОбщую структурную схему системы управления самонаводящегосяобъекта можно изобразить в виде представленной на рис. 8.5 [63, 143, 251],где ОК – относительные координаты объекта и цели, а остальные обозначения совпадают с введенными выше. При допущениях, аналогичных сде-Задачи управления двухкоалиционными ММС. Часть II334ланным для системы теленаведения, из рис. 8.5 следует схема на рис.
8.6.Обозначим часть системы, выделенную пунктиром, через ОЧС, линеаризуем ее и кинематические связи объекта относительно некоторых КЦ 0 иим соответствующих ПУ 0 . Тогда из рис. 8.6 следует схема на рис. 8.7, откуда, обозначив часть линеаризованной системы, выделенную пунктиромчерез ОЧС ∆ , получим схему, представленную на рис. 8.8.ОИКЦОКЦельИОККСОИОКВПУКФКСКОИОККФКСРис. 8.5. Структурная схема системы самонаведенияОИЦельОККЦИОКПУКФКС1КСОКОКСОКФИКОКСКСОРис.
8.6. Упрощенная структурная схемаКЦ00ОЧС0КСОКО0ОИЦельКЦ∆КСИКЦПУ∆КФ∆1КО∆КСОКСКСОКСОКФ∆ИКОКС∆Рис. 8.7. Схема системы самонаведения с выделением ОЧСКОГлава 8. Стохастическая интегро-дифференц. модель конфликта335Координаты цели – программно-управляемого объекта Q и объекта Р –обозначим n × 1 ( n ≤ 3) векторами x q ( t ) и x p ( t ) ; координаты объекта Q,измеряемые на станции наведения (при теленаведении), и относительныекоординаты объекта Q и объекта Р, измеряемые на объекте Р (при самонаведении), обозначим n × 1 вектором y ( t ) ; декартовы координаты объеквекторами x дq ( t ) и xдp ( t ) . Здесь и далее t – текущеетов обозначим n × 1время.КЦ0КЦ0ОИЦельКЦКЦ∆ОЧС0ИКЦ∆ОЧС∆КСЦ∆ПУ∆КСОПУ∆КСО∆КО∆КОРис. 8.8.
Линеаризованная системаx q0 ( t )H0K0j p0A0x p0П0n (t )u q0 ( t )uq ( t )y0QГ (t )-x q∆ ( t )xq ( t )H∆∑+K∆j p∆A∆x p∆x∂p∆П∆x∂p+-εx∂q ( t )Рис. 8.9. Единая расчетная схема системы телесамонаведенияПусть, кроме того, j p (t ) − n × 1 вектор компонент ускорений объекта Р;u q (t ) − m × 1 вектор управлений объекта Q; ε д (t ) − n × 1 вектор декартовыхкомпонент расстояния между объектами Р и Q; n(t ) − n × 1 вектор ошибокизмерения (помех). Тогда из рис. 8.4, рис.
8.8 следует схема, представленная на рис. 8.9, где введена мультипликативная помеха, определяемаяn × n диагональной матрицей Г ( t ) . На рис. 8.9 оператор Н 0 соответствует КС0 и при теленаведении нелинеен, а при самонаведении является линейным и единичным; оператор Н ∆ соответствует при теленаведенииКС∆ , а при самонаведении КСц∆ и является в обоих случаях линейным;336Задачи управления двухкоалиционными ММС. Часть IIнелинейный оператор ∑ соответствует кинематическим связям x q ( t ) иx дq ( t ) ; нелинейный оператор К 0 соответствует при теленаведении ОЧС0 ,а при самонаведении ОЧС0′ ; линейный оператор К ∆ соответствуетОЧС∆ ; нелинейный оператор A 0 и линейный оператор A ∆ соответству-ют КСО0 и КСО ∆ ; нелинейный оператор П 0 и линейный П ∆ соответствует кинематическим связям x p0 , x дp0 и x p∆ , x дp∆ .Линеаризация алгебраических кинематических связей x q (t ), y (t ) иx p (t ), x дp (t ) и дифференциальных кинематических связей j p (t ), x p (t )приведена в [64].