Лысенко Л.Н. Наведение и навигация баллистических ракет (2007) (1242426), страница 88
Текст из файла (страница 88)
(13.97) Возвращаясь к (13.94), запишем М [у'( т,)у( т,)] с1 тг+Н(Г,1)С(1)М [х(1)у'( гг)]— Г дН(1, тг) д1 ~-т 491 — А(1)М ]х(()у'( тг)] = ! ' М ]у'( тг)у( т1)] д тг+ !" дН(1, тг) д( г — т + М]х(1)у'( тг)] ]Н((,1)С(!) — А(1)] = О. (13.98) Преобразуем (13.82) при введенных обозначениях к виду ж(1) Н(1~ т2)У( т2) Ы т2, ~ — т (13.99) тогда М ]х(1)у ( тг)] = Н(1, тг)М [у ( тг)у( т1)] Нтг. (13.100) В результате подстановки (13.100) в (13.98) найдем — А(1)Н(1, тг) + ' + Н(1,1)С(1)Н(1, тг) х дН(1, тг) г-т х М (у ( тг)у( т!)] сУ тг = О. (13.101) Поскольку М [у'( тг)у( т|)] — произвольная величина, она должна быть отлична от нуля. Для выполнения равенства (13.! О! ) необходи- мо, чтобы нулю равнялось выражение в фигурных скобках: А(()Н(1, тг) — ' — Н(1,1)С(!)Н(1, тг) = О, (!3,!02) дН(1, тг) Продифференцировав (! 3.99), получим гс(т) = / у( тг)сХ тг + Н((, ()у(!).
(13,103) с~ . !' дН(1, тг) 492 дН((, тг) Теперь подставив выражение ' из (13.103) в (! 3.102) и введя д! обозначение Н(С, !) = К(1), найдем й1 ~-т — К(1)С(1)Н(1, тз)у( тг)~ й та+ К(1)у(т) = с + К(1)у(1) + [А(1) — К(1)С(1)[ Н(1, тз)у( тз) й тз. (13.104) г-т Вспомним, что Н(1, тз)у( тз)а тз = х(1), поэтому окончательно имеем — х(1) = А(1)х(1) + К(1) [у(т) — С(т)х(1)[; х(1о) = О. (13.105) а1 Полученное уравнение представляет собой векторно-матричное дифференциальное уравнение оптимального оценивания вектора состояния х(1) или уравнение оптимального линейного динамического фильтра (фильтра Калмана — Бьюси).
Исходя из структуры уравнения (13.105) определим, что оптимальный фильтр является системой с отрицательной обратной связью, обусловленной сомножителем, стоящим при матрице коэффициентов усиления К(1) (рис. 13.9). Указанная матрица пока не найдена. Для ее получения вновь воспользуемся уравнением Винера — Хопфа, записав его в функции ошибки оценки Ь (1) = х(1) — х(1).
(13. 1Об) Рнс.13.9. Схема оптимального непрерывного многомерного фильтра Калмаиа — Бьюси 493 Имея в виду (13.106), запишем Н(С, тз)М[у (тз)у(тд)]с(тз— д — т — М [х(С)у'( тз)] + М [Ь„(С)у'( тз)] = О. (13.!07) С учетом (13.99) получим, что М [х(С)у" ( тз)] — М [х(С)у'( тз)] + М [Ь„(С)у'( тз)] = О. (13.108) Тогда М [ Ь„(С)у ( тз)] = О, но М [Ь„(С)у'( тз)] = М [х(С)у'( 'ся)] — М [х(С)у'( тз)] = Н(С, тд)М [х ( тд)х'( тз)] дСтд+ д — т + Н(С, тай(тз) — М [х(С)х"„(тз)] = О. (! 3.109) Здесь через х.(С) обозначено произведение С(С)х(С).
Перейдем в выражении (13.!09) к пределу при т — д С. Данный предельный переход правомерен, поскольку все члены рассматриваемого соотношения непрерывны по тз при любом С. Сделав соответствующие преобразования и имея в виду зависимости (13.89) и (13.99), а также принятое обозначение К(С) = Н(С, С), найдем К(С)С3(С) = М [х(С)х'„(С)] — Н(С, тд)М [у( тд)х1(С)]дС тд+ д-т д + Н(С, тд)М [и( тд)х',(С)] дС тд. (13.110) д — т В силу некоррелированности п( тд) и х(С) последнее слагаемое в (13.100) равно нулю, а предпоследнее, учитывая (13.99), есть не что иное, как М [х(С)х',(С)], тогда К(С)ьс(С) = М [х(С)х',(С)] — М [х(С)х',(С)], (13.1!! ) 494 что эквивалентно, согласно выражению ошибки оценки Д„(1), ра- венству К(()С~(!) = — М [Дх(()х'(!)] С(!). (13.112) Подставляя в (13.112) х(1) = х'(1) — Д;(1), найдем К(!)Щ!) = — М [дх(!)х'(1)] С'(!)+ + М [ Д (() Д'„(()] С'(().
(13.113) Первое слагаемое в правой части (13.113) равно нулю, поскольку М [Д„(!)у'( тз)] = О, а у(1) связано с х(т) линейной зависимостью (! 3.86). Следовательно, К(!)(3(!) = М [Д И) Д'„И)] С' = В.И)С'(!), где В.(Е) = М [ Дх(!) Д'„(г)] представляет собой ковариационную матрицу ошибок оценивания; 63(!) — матрица, положительно-определенная и потому невырожденная. Невырожденность 6~(!) дает основание считать, что обратная матрица Я ' (1) существует, тогда К(!) = В(1)С'(!)Я (!). (! 3.115) Таким образом, матрица коэффициентов усиления ФК найдена.
Однако не ясен алгоритм вычислений ковариационной матрицы Й.((). Для его получения составим дифференциальное уравнение, основываясь на соотношении (13.105) при учете (13.86) и (13.89). Запишем — дх(1) = А(() дх(!) — К(!) [С(() дх(() — п(1)] + Ч((); тй (13.! 16) дх(га) = — хо Теперь возьмем производную от матрицы В(!) по т, имея в виду ее выражение, приведенное ранее, В(!) = М [Дх(!) Д (1)] + М [Дх(!) Д (()] (13.117) т Заменяя Дх(() и Дх(() их выражениями, найдем В(!) = А(!)В(1) — К(г)С(!)В(!) — К(!)М [и(!) д'„(!)]+ + М [з)(() Д'„(1)]+ В(()А'(() — В(()С'(()К'(1)- 495 — М[Л,,(1)п'(!)[К(!) + М[Ь„(1) з)'(!)[.
(!3.118) Можно показать (40], что М [ Ь„(~)п'(1)[ = — 0,5К(~)С3(~), М [Л„(1) Ч'(1)[ = 0,5С(1), (13.119) М [)Ч(й) Лт И)[ = — 0,ба(й)кт(К), М [з)(!) Ь'„(!)] = 0,5С(1). После подстановки получим В(!) = [А(!) — К(!)С(~)[ В(!) + В(1) [А(1) — К(~)С(1)['+ + К(~) С~(~) В'(!) + С(~). (13.120) Ранее было показано, что К(Е) = В(й)С'(~)че '(!), поэтому окон- чательно В(~) = А(!)В(~) + В(~)А'(~)- — В(1)С'(1)!4 ~(1)С(!)В(1) + С(1); (13.121) В(~о) = Во где Во — априори известная ковариационная матрица вектора состояния х(1), соответствующая начальному моменту времени ! = 1о. Уравнение (13.121) совпадает по форме с уравнением (13.47) и представляет собой нелинейное дифференциальное матричное уравнение Риккати. Решение (13.121) является единственным при всех 1 = !о, если Во — неотрицательно-определенная матрица.
В частном случае стационарной устойчивой системы и для значений возмущений и шумов, аппроксимируемых белыми шумами, при 1о — ь — оо уравнение (13.121) имеет предельное установившееся решение, определяемое из алгебраического матричного уравнения Риккати. Последнее получаем из (13.121) путем приравнивания В = 0: АВ'+ В.'А' — В'С'Я 'СВ'+ С = О. (13.122) Каждое решение стационарного уравнения Риккати при отличных от нуля значениях Во и !о -+ — оо будет равномерно стремиться к В*. Оптимальный фильтр в этом случае описывается, согласно зависимостям (13.105) и (13.115), стационарным уравнением — х(!) = [А — В'С'Я С[ х(1) + В'С'!4 'у(!). (13.123) 4 гц 496 Это уравнение определяет асимптотически устойчивый фильтр, совпадающий по свойствам со стационарным ВФ.
Полученные соотношения были найдены в предположении, что полезный сигнал, характеризующий значение вектора состояния х(г), порождается только белым шумом, и входное воздействие не содержит детерминированной составляющей в виде вектора управления ц(1) с матрицей управления В(!).
Данное обстоятельство не снижает общности рассуждений и выводов. В этом случае уравнение оптимального фильтра (13.105) должно быть скорректировано (105] введением в его правую часть слагаемого В(!) ц(!). В результате уравнение (! 3.105) примет вид — х(!) = А(1)х(г) + К(1) [у(1) — С(г)х(г)) + В(г) ц(г). (13.124) с(1 Уравнения (13.121) и (13.115) при этом останутся без изменения. Для того чтобы полностью завершить описание алгоритма непрерывной калмановской фильтрации, необходимо сделать несколько замечаний по заданию начальных условий для интегрирования (!3.105) или (13.124).
Начальное условие при (13.105) было записано в виде х((о) = О, что может вызвать недоумение. В общем случае при выборе значения х(1о) следует исходить из требования несмещенности оценки х(!) относительно полезного сигнала. Данное условие эквивалентно выполнению равенства М [х(1)[ = М [х(1)). Нетрудно показать, что это равенство будет иметь место, если х(!о) = М [хо], что даст М [Ь„(1)) = О. Таким образом, если не оговорено нулевое значение математического ожидания вектора х(го), что было сделано нами при выводе (13.105), в качестве х((о)должно быть принято М [хо) ф О. Использование в совокупности с алгоритмом фильтра Калмана переходной матрицы фазовых состояний либо матрицы влияния позволяет решить задачу упреждения (прогнозирования) оцениваемого фазового состояния.
Она сводится к нахождению оценки х(!1[!) в некоторый момент времени 1~ по данным наблюдений на интервале (!о, 1), причем (1 ) г. Соответствующая расчетная зависимость будет иметь вид (13. 125) х(!1 [!) = Ф(!1, й) х(1[!) . Матричная структурная схема непрерывного фильтра Калмана с про- гнозатором показана на рис. ! 3.10. 497 Рис. 13.10.
Схема непрерывного фильтра Калмана с прогнозатором При решении навигационных задач, как правило, приходится иметь дело с достаточно высокой размерностью вектора состояния х(т). Реализация соответствуюшего фильтра в виде непрерывной (аналоговой) системы при этом оказывается весьма сложной, к тому же не удается обеспечить и требуемой точности решения задачи из-за погрешностей работы элементов аналоговой вычислительной техники.
В связи с этим весьма важным становится переход от алгоритма непрерывной оптимальной фильтрации к дискретному алгоритму, имеющему вид рекуррентнык соотношений, весьма удобных с точки зрения их использования на БЦВМ. Многошаговые алгоритмы оптимальной фильтрации предполагают использование дискретной формы представления моделей. Возможность соответствующего перехода неразрывно связана с эквивалентностью дискретного представления непрерывных систем. Если для детерминированных систем достаточным условием эквивалентности является совпадение реакций систем на аналогичные воздействия, т.е. эквивалентность во временнбй области, то для стохастических дискретных систем, как и для непрерывных, эквивалентность должна рассматриваться и во временном, и в статистическом отношениях. Рассмотрим данное требование подробнее. В общем случае детерминированная г-мерная система с дискретным временем, отвечающая непрерывной модели типа (! 3.8), описывается разностным уравнением х(lс + 1) = Р (х()с),lс~, ! Е Т, (!3.!26) где !с — номер тахта, принимающего целочисленное значение О, 1, 2, ..., М.
Очевидно, что движение такой системы в будущем однозначно определяется значением х в момент времени 1, отвечающий !с-му такту и не зависит от предыстории х(к — 1). Если реакция детерминированной дискретной (! 3. ! 26) и непрерывной (! 3.8) систем на одно 498 и то же воздействие окажется идентичной, то преобразование можно считать эквивалентным. Теперь выясним, каким образом модель (13.126) может быть представлена в форме стохастической модели состояния.
Для этого предположим, что х(/с+ 1) не определяется однозначно х(й), а является случайной величиной, зависящей от х(/г) и Й. Тогда можем записать х(/с+ 1) = Р [х(/с), Ц+ т)(х(й), й). (13.127) В данном соотношении первое слагаемое представляет собой условное среднее от х(/г + 1) при заданном х(/с), а второе — случайную величину (возмущение) с нулевым математическим ожиданием. При этом необходимо потребовать, чтобы процесс (13.127) был марковским. В противном случае в вероятностном смысле процесс х(й + 1) будет зависеть не только от х(й), но и от предшествующих значений, т.
е, от х(/г — 1), х(/г — 2) и т. д. Если дополнительно предположить, что т)(/г) при заданном х(/с) подчиняется нормальному закону распределения, то случайная величина т1(/г) всегда может быть нормирована так, что т), = т),(х,/с) = а,(х,й)ю;(/с), (13.128) где о~(х,/с) — дисперсии г-х компонент независимых одинаково распределенных гауссовых случайных векторов с нулевым математическим ожиданием и ковариационной матрицей Ктк. В линейной постановке, т. е.