Лысенко Л.Н. Наведение и навигация баллистических ракет (2007) (1242426), страница 85
Текст из файла (страница 85)
Другими словами, будем считать, что располагаем абсолютно точно измеренными детерминированными (неслучайными) компонентами вектора состояния х(1). Известно [28, 40), что линейной оптимальной системе отвечает квадратичный критерий качества, функциональное выражение которого соответствует зависимости (13.! 0). Для определенности воспользуемся квадратичным критериеи смегианнаго тина: Из условия экстремума Н„по ц имеем — =В' р+гб); п=О, бн„ дц (13.41) откуда пс = — -ьсзВ эр. — г (13.42) Подставив полученный результат в исходное уравнение состояния, найдем г( 1 — х = Ах — — В(мзВ' эр; х(!а) = хо г(1 2 (13.43) В итоге получена система уравнений (13 40) и (! 3 43), позволяющая установить ли- нейное соотношение между вектором состояния ЛА х(1) и соответствующим век- тором сопряженных переменных эр(1) в форме эр(!) = 2Х(!)х(!), (13.44) где Х(!) — некоторое обобщенное матричное преобразование, а эр(!) н х(!)— векторные функции, удовлетворяющие уравнениям (13.40) и (13.43).
Множитель 2 введен в (13.44) для того, чтобы исключить появление дробей при последующей записи полученных соотношений. Продифференцировав по ! правую и левую части уравнений (13.44), найдем эр = 2Хх + 2Хх. (13.45) Подстановка (13.45) в (13.40) с учетом (13.43) дает после соответствующих пре- образований 2 (Х Ч- ХА 4 А'Х вЂ” ХВ(4зВ'Х 4 Я,) х = О.
(! 3.46) Х= ХА АХ Я +ХВС)зВ Х (!3.47) называемому мамричным уравнелисн Риккалги. Граничные условия для его решения однозначно вытекают из (13.43), (13.40) и (! 3.45). Учитывая, что эр((ь) = = 2(ськ(!ь), получим Х(!ь) = С)ь. Тогда, имея в виду (13.47), вследствие симметрии (4ь найдем, что матрица Х(!) симметрична при всех значениях й Данное обстоятельство приводит к следующему выражению для оптимального управления: цо = — С)зВ'Хх (! 3.48) или, обозначив матрицу коэффициентов усиления (4аВ'Х через К, запишем окончательно цс = — Кк. (13,49) 475 В силу того, что требуется найти преобразование Х(!), справедливое для любого х(!), условие (13.46) будет удовлетворено, если матрица коэффициентов при х то- ждественно равна нулю.
Это будет иметь место прн Х, удовлетворяющих диффе- ренциальному уравнению Так как ь» — положительно-определенная матрица, оптимальное управление является единственным из числа возможных. Теперь перейдем к обсуждению системы со стокастической обратной связью.
На первый взгляд представляется, что стохастическая модель может быть получена простым добавлением случайной составляющей к правой части детерминированного уравнения состояния системы (13.8). Однако это не так. Действительно, рассмотрим для общности детерминированную модель состояния системы П 3.50! где ю (!) представляет собой вектор детерминированных входных воздействий, а также чстохастическую» модель — х(!) = к'(йх(!), щ ) Ч- т!(х, !), г( а! (13.51) ох = е'(х, !) с(! + п(х, !) г) з).
(13.52) 476 где з)(х, Г) — случайный процесс с заданными свойствами. К числу таких свойств должны быть отнесены: независимость т((!) и з)( т) при ! ~ т, равенство нулю его математического ожидания М(з)(!)) = О, непрерывность и наличие конечной дисперсии. Почему выбраны аменно эти свойства? Условие конечной дисперсии вытекает из реальных свойств действующих на ЛА возмущений; непрерывность есть следствие выбора класса модели в виде системы дифференциальных уравнений.
Требование равенства нулю математического ожидания не является слишком строгим. Оно не ограничивает общности рассуждений и всегда может быть выполнено за счет выбора функции е( ° ). Наконец, требование независимости т!(!) и э) (г) диктуется тем, что в противном случае вероятностное распределение г(х/с(! будет зависеть не только от текущего состояния (что необходимо для данной модели), но и от его предыстории. При оговоренных условиях интеграл от з)( т) существует, а его математическое ожидание равно нулю, к е. М / т)( т)г( т = О. Существует и средний квадрат производной, который в силу ограниченности дисперсии и независимости т)(!) и т)( т) будет также равен нулю, М( г)~(!)) = О, на основании так называемого неравенства Шварца.
Следовательно, траектории движения, отвечающие моделям (13.50) и (13.51), полученным в результате интегрирования рассматриваемых уравнений, будут совпадать в среднем квалратическом. Таким образом, модель системы в форме (13.51) не будет удовлетворять стохастической модели состояния с желаемыми статистическими свойствами. Для получения корректной стохастической модели состояния системы с непрерывным временем следует использовать стокастическне дифференциальные уравнения. При этом ослабляется требование конечности дисперсии действующего возмущения. Это приводит к снижению уровня адекватности получаемой модели по отношению к реальному процессу, но позволяет упростить исследование. Поскольку э)(!) в стохастических моделях не имеет конечной дисперсии, то не будет ее и у производной ах?'а!.
Следовательно, ожидать существование процесса ах?'аг мы не можем. В связи с этим стохастические дифференциальные уравнения записываются в форме Векторную функцию Е(х, !) при этом называют векторам сноса (коэффициентом сноса для одномерного случая), а матрицу ц(х, !) — матрилей диффузии (коэффициентом диффузии). При этом среднее направление траекторий процесса х((), прошедших в момент т через соответствующую точку х( т), характеризует вектор сноса, а степень разброса случайных траекторий диффузионного процесса (размытость траекторий) определяет матрицу диффузии. Стохастическос дифференциальное уравнение будет называться линейнегм, если функция Р линейная по х и и не зависит от х.
В канонической векторной форме это уравнение, являющееся стохастическим эквивалентом модели (13.38), имеет вид г(х = (Ах+ Вц]й(+ Нт), (13.53) (! М(7] = М вЂ” 'С) х + (2 -~ — / (х'(()(4г(!)х(!) + и'(Г)С! '(!)ц(!)] гЫ)~ (!3.54) В отличие от детерминированного случая, для которого оптимальное управление ц" было определено в функции точно известного состояния х(г), в случае стокастической обратной связи цс(!) уже является функцией Уг = (у( т),(о < т < !). Причем условное распределение х(1) относительно з'г будем считать нормальным, харакгеризуемым средним значением х(!) и ковариационной матрицей Р(Г).
Покажем, что терминальный член (13.54) может быть записан при этом в виде хььеьхь = х'(Го)Х(го)х(!) Ч- / г((х'Хх). (13.55) со Данная форма записи вполне справедлива, учитывая, что Х(П) = ьеь, а хг.Хьхь = х'(Гс)Х((о)х(!) -1- / г!(х'Хх). м (13.56) 477 где т)(() — г-мерный винеровский процесс с нулевым средним значением и ковариацией приращения ПчЖ, причем В.„— симметричная и неотрицательноопределенная ковариационная матрица, элементы которой могут быть кусочно- непрерывными функциями времени. Решение (13.53) приведет к получению множества траекторий, исходящих из начальной фазы х((о).
Критерий (! 3 35) для рассматриваемого случая будет теперь также стохастической переменной, по которой непосредственно нельзя определить, что понимается под его минимальным значением. В этом смысле от критерия в форме (13.35) здесь целесообразно перейти к его математическому ожиданию, т. е. записать Так как х(1) представляет собой решение стохастического дифференциального уравнения (13.53), дифференциал под знаком интеграла не подчиняется правилам обычного исчисления. Значение его, полученное в ряде источников (см., например, (93, с.
313)), приведем здесь без вывода г((х'Хх) = ~ — ц'(ез 'ц — х'С),х+ (ц+ ьезВ"Хх)'х х С)з '(ц+ !езВ'Хх)~Ж -Ь 8РКХЖ Ч- г(ц'Хх+ х'ХИп, (13.57) где ц(Г) — вектор ошибок измерений (измерительный шум), а через бр обозначен след (шпур) соответствующей квадратной матрицы, под которым принимают сумму ее диагональных элементов, т е. бр К = 3 (пл)„. Подставив (1357) в (!355), получим '„!ч„", = '(',)Х(!.) (',) — / [ '!чЛ+ 'С),' ) ж+ ы м + /(ц+ ЦзВ'ХхЩ ' (ц+ !4 В'Хх) г(!+ м м м 1- / 8РКХп! <- / Нп'Хх+ / х'ХНп.
(13.58) Перенеся в левую часть равенства второй член, стояший в правой части, найдем окончательно хь()ьхь .ь / [х'Я,х -ь ц'Чз 'ц[ й = хоХ(го)хоч- м м + / (ц -ь сезВ'хх)'сез '(ц+ !мзВ'хх)г!1+ и 1ь м -1- / брКХ~Й+ / дп'Хх -1- / х'ХНц. (13.59] и ю Для детерминированной системы т)(1) = ц(1) =- 0 и в силу единственности оптимального управления це = — С)яВ'Хх получим, что прн реализации це критерий (13.35) примет минимальное значение гпш 7 = хьСЕьхь+ / [хь)эх+ цСЕз 'ц[ г)Г = хоХ(ео)хо~- и 478 ц Ь /(и~+ ь]зВ'Хх)'Сиз (по+(чзВ'Хх)о( = х~Х((а)хо (1360) и Для случая же неполной стокастической информации о состоянии системы мини- мальное значение квадратичной функции потерь М[2] будет равняться [93] ч ° ил=.ам[но,...)' во,".о;'.(а) = и = М [хоХ((а)хо] + БрХ((о)Во + [] (ЯрХК)И(Ч- зо -Ь [ (БрХВьегХР)г(К (13.61) В (13.61) первое слагаемое определяет вклад в ппп М[з"] начального состояния системы.