Радиолокационные измерители дальности и скорости by Саблин В. Н. (z-lib.org) (852905), страница 12
Текст из файла (страница 12)
Заметим, гипотеза заданного а- предполагает обработкутолько j-ro измерения и не может включать обработку других измерений.Матрица дисперсий плотности вероятности WiZj(k)|z^’ 1 , a j )определяется общим выражением° 4 аИ = 1[zi(k) - ziH >k)f w(zjw hir1’= оф)эХ)(а?,к)+DHj(k)][aJ8]T>=(1.8.22)где матрица Ва^ а ?,к | - вычисляется по (1.8.18) для заданной гипотезы a •.Определяянакаждомшагепараметрыплотностиw(zj(k)| z^”1, a®j в соответствии с (1.8.21Н 1.8.22), можно рекур-4 4 * 1 = p(fl^ h "1H zj(kK ’ 1,aj ) /(1.8.23)с начальным условием Pan= ( a j )•Уравнения (1.8.17)—(1.8.19) и (1.8.21)-(1*8.23) полностью определяют оптимальный алгоритм оценки координат всех объектов,с минимальной дисперсией ошибок фильтрации.
Данный алгоритмтребует значительных вычислений, т.к. в (1.8.17) входят условныеоценки по всем возможным состояниям (M=mN) матричной случайной величины а.Более простой квазиоптимальный алгоритм получается из следующих рассуждений. Представим апостериорную плотность вероятности w|^(k)| Zj j в видеw|?i(k)jzf) = £w|;>i(k),asjzfj =^w|A(k)|z{,asJp|as|zf).Если апостериорные вероятности p|as|zij уменьшаются достаточно быстро относительно максимальнойp|a(k)|zij,так, чтоможно полагать p|a|zi j » 5(a - a(k )), где a(k) - оценка неизвестного параметра а, соответствующая максимуму апостериорной вероятности, а условная плотность вероятности W ^ (k )| z i,a j, рассматриваемая как функция от а, меняется достаточно медленнопри его изменении, то приближённо можно полагать» wjx(k|z£,a(k)j.(1.8.24)При сделанных допущениях оценка координат может находиться, например, в форме?*(k) = max-1 w(x(k)jzj, ot(k)),или в форме оценки углового среднего^(k) = JX(k)w|x(k|zi, а(к))сЦк).(1.8.25)В рассматриваемой задаче обе оценки совпадают, так как условная апостериорная плотность вероятности W^A,(k)|zi,a(k)j гауссовская, и определяются уравнениями (1.8.18) при а 8 = d(k).В качестве оценки а(к) неизвестного матричного параметра аудобно взять оценку, для которой апостериорная вероятностьpfajzj1) максимальна, т.е.
а (к) =шах -1 p|a8|zj j . Учитывая свойство(1.8.19), максимальная вероятность p|aB|z^j достигается, если максимальные значения принимают вероятности P^ajjz^ (j = l,N ).Таким образом, сначала необходимо найти частные решенияaj(k) =max'1p|aj|z^|,j = 1 »N .(1.8.26)Так как число возможных значений вектора otj конечно и равно ш, то максимум находится путём простого перебора апостериорных вероятностей pfaJzn), которые, как показано выше, могутбыть вычислены рекуррентно по формуле (1.8.23)1 8 21 1 8 22).с учётом( . . ), ( . .После вычисления условных оценок (1.8.26) оценка обобщённогоматричногопараметрааопределяетсякакa(k) = |aj(k) 6с|(к)...
а^(к)|Данная оценка определяет ту гипотезу, для которой на каждом такте работы строится единственныйфильтр вида (1.8.18). Заметим, что на начальном этапе работыоценка a(k) может меняться, что соответствует изменению гипотезы, для которой строится фильтр (1.8.18). Таким образом получаем нестационарную структуру фильтров, в которой на каждомтакте работы может обрабатываться разное число измерений.
Вустановившемся режиме работы будет функционировать одна изструктур.1.0. ОСНОВЫ СТАТИСТИЧЕСКОЙ ТЕОРИИ ОПТИМАЛЬНОГОУПРАВЛЕНИЯ1.9.1. П остановказадачи синтеза оптимального управленияПри описании в §1.1 общих подходов к синтезу ДС в пространстве состояний было отмечено, что СТОУ используется приналичии ограничений на проектируемую систему. Поясним этоттезис более подробно. В теории оптимальной фильтрации, как показано в §1.3, полагается заданным описание информационногопроцесса в пространстве состояний вектором х и результатов наблюдения его компонент - вектором z.
При этом функция x(t)описывает фазовую траекторию, которую и необходимо восстановить (оценить) по результатам наблюдений вектора z. Никаких ограничений на синтезируемую систему, которая оптимальным образом будет формировать эту оценку, не накладывается. В теорииоптимального управления предполагается, что априорно задананекоторая часть системы, на вход которой подаются сигналыуправления u(t), а на выходе этой системы необходимо воспроизвести искомую траекторию x(t). Процесс на выходе системыуправления будем обозначать ху (управляемая траектория). Структура системы управления полагается заданной и описывается впространстве состояний соответствующим уравнением, напримерлинейнымxy(t) = Fy(t)xy(t) + By(t)u(t) + $y(t).(1.9.1)Здесь u(t) - г-мерный вектор сигналов управления (г<п), подаваемых на вход системы управления, с,у - вектор дополнительных(неконтролируемых) случайных возмущений, который обычноописывают белым гауссовским шумом с нулевым математическиможиданием и матрицей спектральных плотностей Gy.
В общемслучае размерность вектора ху отлична от размерности вектора х,т.е. система управления воспроизводит не все координаты искомойтраектории x(t), а только часть из них. В целях большей физической наглядности будем полагать сначала, что размерности указанных векторов совпадают.Так как в теории оптимального управления принято говоритьо траекториях в пространстве состояний, то процесс x(t) часто называют требуемой траекторией и обозначают xT(t). Поэтому здесьи далее также будем использовать это обозначение. Тогда соответствующее уравнение, описывающее требуемую траекторию в пространстве состояний, представим в виде*,(*) =+ $т(*) •(1-9*2)где ^ - белый гауссовский шум с нулевым математическим ожиданием и спектральной плотностью GT.Многовариантность описания процедур задачи оптимальногоуправления приводит к чрезвычайному разнообразию её постановок [43].
Ниже будет использована одна из самых несложных, позволяющая получить наиболее простые алгоритмы формированияуправляющих сигналов. Эта задача формулируется следующим образом: по результатам наблюдений z(t) (структуру которых мы определим позже) всех или некоторых компонент xT(t) и xy(t) выбором вектора управлений u(t) необходимо наилучшим (оптимальным) образом на выходе системы управления сформироватьуправляемую траекторию Xy(t).
Возможные критерии оптимальности описаны в §1.2. Рассмотрим, например, критерий типа(1.2.16), получивший название критерия Лётова-КалманаI(u) = Mj[xT(tk) - xy(tk)]TQ[xT(tk) - xy(tk)] ++ f[xT(t) - xy(t)fL[xT(t) - xy(t)]dt+ 'jv K u d tl00J(1.9.3)где - момент окончания управления. Первое слагаемое в (1.9.3),называемое терминальным членом, характеризует сумму взвешенных дисперсий ошибок в конце управления. Второе слагаемоепредставляет интегральную квадратичную оценку текущей точности управления, а третье, характеризующее экономичность, представляет затраты энергии на управление. Неотрицательно определенные матрицы Q и L штрафов за точность управления выбираются в соответствии с важностью парциальных ошибок Дх^х^-х^для системы в целом. Положительно определённая матрица К определяет штрафы за экономичность.Из физических соображений понятно, что, задав ограниченияна структуру выбираемого (синтезируемого) вектора ху, мы ограничиваем возможности выбора наилучшей системы, а, следовательно, характеристики выбранной системы будут «не лучше» (а вобщем случае хуже), чем у системы, которая выбирается (синтезируется) без ограничений.
Поэтому, задав структуру системыуправления (1.9.1) мы заведомо идем на ухудшение потенциальных показателей качества. Более того, если в системе управленияимеют место дополнительные возмущения (шумы £у), которые отсутствовали при решении задачи оптимальной фильтрации, то этоприведет к дополнительному ухудшению потенциальной точности.Необходимо, однако, подчеркнуть, что использование (1.9.1) даётвозможность ещё на стадии проектирования учесть ограниченияна динамические свойства исполнительных органов, которые заведомо войдут в состав системы.Кроме указанных в §1.2, в теории оптимального управлениямогут накладываться дополнительные ограничения на сигналыуправления в виде одного из трех условий:0 = ^<L9-4)M{uT(t)Ku(t)}<p„(t);(1.9.5)} М juT(t)Ku(t)jdt < ц .(1.9.6)Неравенство (1.9.4) означает, что мгновенные значения Uj каждого сигнала управления не должны превышать допустимогозначения и доп}.
Неравенство (1.9.6) ограничивает мощность сигналов управления с учетом важности отдельных его составляющих Ujдля системы в целом. Количественно степень важности различныхсигналов управления определяется коэффициентами kjj матрицыК . Условие (1.9.6) ограничивает "взвешенную” энергию, затрачиваемую сигналами управления за все время управления tK.
Этидополнительные ограничения приводят к ухудшению потенциальной точности слежения за требуемой фазовой траекторией.Вместе с тем следует отметить, что в ряде приложений реальная точность систем, синтезированных по алгоритмам СТОУ оказывается лучше, чем у аналогичных систем, синтезированных поалгоритмам оптимальной фильтрации. Обусловлено это тем, что впервых уже на стадии проектирования можно учесть реальные ограничения, которые часто имеют место в практике эксплуатации,и которые не учитываются теорией оптимальной фильтрации.Отмеченные выше положения справедливы и для более общегослучая, когда размерность векторов хт и х у не совпадают. Приэтом обобщенный показатель качества Лётова-Калмана можнопредставить в виде [34])JTI(u) = Mj[ATxT(tk) - Ayxy(tk Q[ATxT(tk) - Ayxy(tk)] ++ 1[Ал .(^ - AyXyft^llAjApft) - AyXy(t)]dt+ *1uTKudt|, (1.9.7)где матрицы Ат и Ay устанавливают соответствие между одноименными компонентами векторов хт и ху<Для сокращения записей, введем обобщенный векторx=[xJxy]T.
Тогда, с учетом (1.9.1)-(1.9.3), можно записатьx(t) = F(t)x(t) + B(t)u(t) + $x(t),(1.9.8)I(u) = м | xT(tk)Q1x(tk) + J|xT(t)L1x(t) + uTKuj dt 1. (1.9.9)Здесь:F = F0. Fy0 , в= 0 . *U =ВУGT 00 GyA^QAj,Qi=-A^QA,-A ^ Q A yAyQAy» L l“Y1ТA^LA,- A^LAj-A 'y L A ,AyLAy. (1.9.10)Для задачи линейного оптимального управления наблюденияполагаются линейными и описываются уравнениями(1.9.11)где £и - белый гауссовский шум с нулевым математическим ожиданием и матрицей спектральных плотностей G„. При нелинейныхнаблюдениях уравнение (1.9.11) представляется в видеz(t) = s(x,t) + SH(t).(1.9.12)Однако, также как и в задачах оптимальной фильтрации, прибольшом отношении сигнал/шум и высокой точности измеренийзадачу с нелинейными наблюдениями можно привести к эквивалентной задаче линейных наблюдений. Поэтому в дальнейшем будем рассматривать в основном линейные наблюдения (1.9.11).В общем случае задача синтеза ДС на основе математическогоаппарата СТОУ формулируется следующим образом: для системы сзаданной частью (1.9.1), предназначенной для отработки процесса(1.9.2), при наличии измерений (1.9.11) или (1.9.12), необходимонайти сигнал управления и, обеспечивающий минимум того илииного функционала качества (например (1.9.9)).Для задач с дискретным временем соответствующие уравненияимеют видх(к) = Ф(к, к- 1)х(к-1) +В(к- l)u(k-1) +£,х(к-1), (1.9.13)z(k) = Н(к)х(к) +^и(к),(1.9.14)а функционал качестваI(u) =M-|xI(k)Q1x(k) + Z|xT(i)L1x(i) +uT(i)Ku(i)j|, (1.9.15)смысл слагаемых в котором аналогичен функционалу (1.9.3).1.9.2.У правляемость и наблю даем ость в линейны х системахВ общей теории систем вводятся понятия наблюдаемости иуправляемости, с помощью которых можно до проведения синтезаоптимального управления оценить корректность поставленной задачи и возможность получения требуемого результата.Наблюдаемость системы характеризует принципиальную возможность для невозмущенной системы определить вектор ее начального состояния x(to) по результатам наблюдений z(t) на интервале времени [t0,t].