Радиолокационные измерители дальности и скорости by Саблин В. Н. (z-lib.org) (852905), страница 4
Текст из файла (страница 4)
Винвариантных системах показатели качества их работы не зависятот характеристик сигналов и помех. Однако платой за такую инвариантность является худшая эффективность функционирования.В наиболее эффективных - адаптивных ДС, априорная неопределённость статистических характеристик полезных и мешающих процессов преодолевается оцениванием неизвестных параметров систем и процессов в процессе работы и использованиемполученной информации для оптимизации системы. Во многихпрактических задачах априорная неопределенность носит параметрический характер и сводится к неопределенности некоторых параметров статистических распределений процессов, что эквивалентно неопределенности соответствующих параметров моделей(1.1.3Н1-1.6).
В этих условиях соответствующие модели можнопредставить в видеx(t) = f[x(t),u(t),oc,£x(t),t], z(t) = h[x(t),a,£„(t),t],(1.1.7)x(k+ l) = f[x(k),u(k)>a,5x(k),k], z(k) = h[x(k),a,£H(k),k], (1.1.8)где a - вектор неизвестных параметров, который может быть постоянным или меняющимся во времени. В процессе адаптации проводится оценка указанных параметров.Адаптация может также осуществляться непосредственнойподстройкой параметров синтезированной динамической системы,минуя прямую оценку неизвестных параметров информационныхпроцессов (1.1.7), (1.1.8).Достоинство адаптивных систем в том, что при успешнойадаптации априорная неопределенность преодолевается полностьюи показатели качества системы в всем диапазоне условий работыоказываются наилучшими.Также как и в случае полной априорной информации, в условиях параметрической априорной неопределенности более просто решаются задачи при отсутствии ограничений на структурусистемы и энергетические затраты.
Для решения таких задач используется теория адаптивной фильтрации [51].1.2. КРИТЕРИИ И ПОКАЗАТЕЛИ ЭФФЕКТИВНОСТИРАДИОЭЛЕКТРОННЫХ СИСТЕМПод эффективностью радиоэлектронной системы (устройства) понимают степень ее соответствия своему назначению [42, 76].Оценивается эффективность с помощью показателей и критериев.При этом показатели представляют количественную оценку эффективности, а критерии - правило, по которому определяетсястепень соответствия системы своему назначению.Синтез любой динамической системы предполагает заданиекритерия эффективности ее функционирования.
Математическойосновой выбора наилучшего (оптимального) решения являютсятеория игр и статистических решений [54] и теория динамического программирования. Приведем основные положения указанныхтеорий, которые понадобятся для решения задачи синтеза радиолокационных измерителей.Пусть информационный процесс в пространстве состоянийпредставляется вектором x(t) (1.1.3). Наблюдаемый процесс z(t)описывается уравнением (1.1.4). При этом X - множество возможных решений (оценок), а х е X - его элементы. Совокупностьразличных преобразований q>(z(t)) наблюдаемых данных z(t) воценки x(t) образуют множество возможных решающих правил алгоритмов обработки данных наблюдения z(t).
Каждый алгоритмобработки cp(z(t)) приводит к соответствующей оценке x(t). Длясравнения различных оценок вводится количественная мераg(x,x), получившая название «функции потерь» («функции штрафов»). Эта функция представляет собой априорную оценку последствий принятия решения x(t), в то время как реальный процессотображается вектором x(t). В большинстве практических задачпотери зависят не от абсолютных значений х и х , а от их разности, т.е. g (x ,i) = g(x - х). Наиболее часто используемые функциипотерь: квадратичнаяg(x-x) = (x -x )TQ (x-x),(1.2.1)где Q - весовая неотрицательно определенная матрица, и простаяg(x- х) = |х- х|.(1.2.2)Так как информационный процесс х и его оценка х описываются случайными функциями времени (в уравнения (1.1.3) и(1.1.4) входят случайные процессыи £и), то функция потерьg(x - х) также является случайной.
В связи с этим в теории статистических решений вводится понятие “риска” R, характеризующего потери в среднем, т.е.R = M[g(x ~ х)],(1 .2 .3 )где М[*] - операция математического усреднения. В зависимостиот полноты усреднения в (1.2.3) вводят несколько различных рисков, которым соответствуют разные принципы выбора оптимального решения.Прежде всего рассмотрим случай полной априорной информации о статистических характеристиках всех процессов и отсутствия ограничений на синтезируемую систему.
Выберем в качествевероятностной меры при усреднении в (1.2.3) совместную плотность распределения вероятностей W(x,z). Тогда имеем= | J g ( x - x ) w ( x , z)d x d z.(1 .2 .4 )-0 0 -0 0Риск, определяемый соотношением (1.2.4), называется средним. Используя формулу Байеса для плотности W(x,z), выражение(1.2.4) представим в видеЩ = | } g(x-x)w(x|z)w(z)dxdz = J R^fxjzjV^zjdz,(1.2.5)где Rpa(xjz) = |g(x - x)w(x|z)dx - апостериорный риск (т.е. после-0 0проведения наблюдений z(t)), a W(x|z) - апостериорная плотностьвероятности.Располагая функцией риска R (x ) можно очевидным образомсформулировать задачу нахождения оптимальной оценки: оптимальной называется оценка х 0, минимизирующая средний риск.Такая оптимальная оценка называется байесовской.Используя методы вариационного исчисления легко показать, что оптимальной байесовской оценкой при квадратичнойфункции потерь (1.2.1) является условное математическое ожидание( 1. 2.
6)а при простой функции потерь (1.2.2) - оценка х тах, доставляющая максимум апостериорной плотности W(x|z). В дальнейшем вкниге используются в основном оценки условного среднего (1.2.6),при записи которых будет опускаться индекс «О». Показатель качества (1.2.5) с функциями потерь (1.2.1), (1.2.2) широко используется в теории оптимальной фильтрации при полной априорнойинформации о статистических характеристиках исследуемых процессов.В условиях неполной априорной информации, когда неопределенность носит параметрический характер и описывается вектором а неизвестных параметров, средний риск (1.2.5) также становится функцией этих параметров Щ х,а ). В этом случае, следуяобщей методологии, введем усреднение по а^а шахооооЁ(х) = J \ \ g(x(a)-x)W(x,z,a)dxdzda =a min -со -ооa шах= IJ g(x(a) - x)w(x|z, a) dx w(z|a)dz W(a)da. (1.2.7)Критерий минимума риска Ё(х) используется в теории адаптивной фильтрации для нахождения оптимальных оценок в условиях параметрической априорной неопределенности.
Более подробно процедура минимизации Й(х) будет рассмотрена в соответствующих разделах книги.18Вернемся к задаче с полной априорной информацией, но приналичии дополнительных ограничений. Конкретизируем вид ограничений применительно к задачам синтеза радиолокационных измерителей. Это прежде всего ограничения на структуру системы,что может быть обусловлено заданной инерционной частью системы, цепями управления и т.д. Будем полагать, что заданная частьсистемы в пространстве состояний описывается Z-мерным векторомху, удовлетворяющим уравнениям:ху = fy(xy,u,Sy(t))(1.2.8)в непрерывном иx y(k+ Х) = fy (x y(k> u (k). М к))(1 .2 .9 )- в дискретном времени, в которых £y=Kyi £У2 ••• byilT - возмущения, U - [щu r]T - управляющие сигналы.В общем случае наблюдения (1.1.4), (1.1.6) также зависят отвектора х у:z(t) = h(x(t),xy(t),£„(t)),(1.2.10)z(k) = h(x(k), xy(k), £и(к)).(1.2.11)Второй тип возможных ограничений это ограничения на область возможных управлений:и , < и доп1,(1 .2 .1 2 )где Ufl0Ili - допустимая величина i-ro сигнала управления.Третий вид ограничений - это ограничения в затратах энергии управляющих сигналов.
Точнее сказать это не ограничения, ажелание проектировщика минимизировать энергию управляющихсигналов. Поэтому соответствующий (как правило квадратичныйuTKu) член вводится в функцию потерь. По аналогии с (1.2.3) введем обобщенный риск:Ry = M[g(x, ху, и, t)],(1.2.18)где g(x,xy,u,t) - обобщенная функция потерь.В теории статистического оптимального управления [34, 77]выбор функции потерь более тесно связан с существом решаемойзадачи, чем в статистической теории оценивания. Однако этомуфакту не всегда уделяется достаточно внимания. Прежде всего вСТОУ различают два варианта задания времени управления.В первом варианте используется фиксированный интервалвремени TK=[0,t,J, на котором формируется оптимальное управление, а соответствующая функция потерь представляется как интегральная функцияg1(x,xy,u,tk)= Jg(x,xy,u,t)dt.(1.2.14,а)оВо втором - время полагается текущим, а функцией потерь являетсяg2(x,Xy, u, t) = g(x, ху, u, t).(1.2.14,6)В первом случае критерий называется интегральным, так какуправление должно быть выбрано из условия экстремума функционала, заданного на интервале времени TK=[0,t,J.
При этомgl(x,xy,u, tK) является функционалом от u(t), te[0,tIC]. Во второмслучае критерий называется текущим (локальным), так как требуется обеспечить экстремум показателя качества в каждый текущий момент времени. При локальном критерии, строго говоря,вариационная задача, понимаемая как задача минимизациифункционала, вырождается, так как показатель g (x ,x y,u ,t) является скалярной функцией времени, а его минимум необходимообеспечить в любой текущий момент времени за счет выбора текущего значения u(t) вектора управления.
При синтезе оптимальных ДС возможно использование как интегрального, так и локального критериев.В СТОУ, входящую в (1.2.14) функцию потерь g (x ,x y,u ,t)часто задают в видеg(x, Ху, u, t) = g(x, ху, t) + uTKu,(1.2.15)где К - положительно определенная матрица, задающая вес мощности управляющих сигналов в общем показателе качества;g(x,xy, t ) - функция потерь, аналогичная (1.2.1).В случае интегрального критерия в показателе качества чаетевыделяют компоненту, соответствующую конечному времени tKт.е. записывают его в видеg ^ X y . u . t J = g (x,X y ,tk) + j(g(x,xy,t)+uT(t)Kn(t))dt(1.2.16)Для дискретных во времени процессов интегральный показатель качества записывается в видеgj(x, ху, u,kT) = g(x, ху, кт) +[g(x, Ху,i) + uT(i)Ku(i)].(1.2.17)Конкретизируя в (1.2.13) операцию математического усреднения,аналогично тому, как это было сделано в (1.2.4), (1.2.5), вводятсяпонятия среднего и апостериорного рисковR(u)= J J Jg(x,xy,u,t)w(x,xy,z)dxdxydz,(1.2.18)-с о -о о -о оR Ps ( u ) =J Jg(x,xy,u,t)w(x,xy|z)dxdxy,(1.2.19)—оо"COв процессе минимизации которых при ограничениях (1.2.8),(1.2.9), (1.2.12) находится оптимальное управление.1.3.
ОСНОВЫ ТЕОРИИ ОПТИМАЛЬНОЙ ФИЛЬТРАЦИИПусть на приемной стороне наблюдается реализация случайного процесса z(t), описываемого уравнением (1.1.4) и несущегоинформацию о полезном сообщении x(t). Под оптимальной фильтрацией сообщения x(t) понимают наилучшее (в том или иномсмысле) его воспроизведение из наблюдаемого процесса z(t). Воспроизведенное сообщение х часто называют оценкой.Рассмотрим задачу текущей фильтрации. Как отмечалось в§1.2, в теории фильтрации оптимальность, как правило, связывают с квадратичной (1.2.1) или простой (1.2.2) функциями потерь.В первом случае оптимальной оценкой сообщения является оценкаусловного среднего (1.2.6), а во втором случае - оценка, для которой апостериорная плотность вероятности принимает максимальное значение. Для нахождения обеих оценок необходимо располагать апостериорной плотностью вероятности.