Сосулин Ю.Г. Теоретические основы радиолокации и радионавигации (1992) (1151790), страница 6
Текст из файла (страница 6)
Обнаружитель по истечении некоторого времени выносит одно из двух взаимоисключающих решений: есть сигнал (есть цель) нли нет сигнала (нет цели). Эти решения, принимаемые в результате наблюдения случайного процесса у(1), носят статистический характер. Поэтому, чтобы создать (сннтезировать) алгоритм работы оптимального обнаружнтеля, который решал бы задачу обнаружения наилучшим образом, необходимо воспользоваться прежде всего результатами теории статистических решений. Последняя изучает статистические решения о наблюдаемых реализациях случайного процесса и дает методы построения оптимальных решающих правил.
Приведем основные сведения из теории статистических решений, которые затем будут использованы при синтезе оптимальных обнаружителей. Необходимо также отметить, что излагаемые далее положения теории решений явятся основой для оптимизации и других задач обработки сигналов, рассматриваемых в последующих главах. Краткие сведения из теории статистических решений. Основные понятия. Задача статистического решения возникает при наблюдении реализации у некоторого случайного процесса у(г). Обозначим через У пространство, на котором определены все возможные реализации процесса у(1).
Пусть Π— некоторый параметр, принадлежащий пространству 6. Предположим, что распределение вероятностей наблюдаемого процесса у(1) зависит от параметра О, истинное значение которого неизвестно. Наблюдение может протекать в непрерывном времени либо в дискретном. В последнем случае имеем конечную последовательность случайных величин (у(1;) =уь 1=1, 2, ..., п), которая полностью описывается п-мерной функцией распределения вероятностей ))У(у~О), зависящей от параметра О (здесь у=уь..., у — и-мерная величина).
Если наблюдаемая последовательность состоит из непрерывных случайных величин, то ее можно описать при помощи и-мерной плотности распределения вероятностей ш(у(О). Применительно к задаче обнаружения параметр О может принимать, например, два значения, которые соответствуют ситуациям наличия и отсутствия полезного сигнала в наблюдаемом процессе.
В задаче измерения О может принимать непрерывное и дискретное множество значений, которые соответствуют самому сяг- 26 (2.1) называемое функцией риска, зависит от значения параметра 8 н принятого решающего правила б. Раскрывая математическое ожидание с помощью плотности вероятностей ш(у(0), функцию риска можно представить в виде г (О, б) = (' с (О, б (у)) (у(0) ау. (2.2) налу (либо параметрам сигнала).
При этом наблюдаемый процесс у(4) представляет собой некоторую смесь сигнала и шума. Обозначим через а элемент множества решений с), которые можно вынести относительно параметра О по результатам наблюдения у(7), и пусть б — решающая функция (решающее правило), принадлежащая классу решающих функций Л и отображающая множество У в Р. Согласно этому решающему правилу каждой возможной реализации уеду ставится в соответствие определенное решение д=б(у), йе=с1. В результате принятия тех или иных решений возможны ошибки.
«Убыток», который несет при этом наблюдатель, можно охарактеризовать некоторой функцией с(0, й), выбираемой нз эвристических соображений и называемой функцией потерь. Эта функция определяет потери, возникающие вследствие принятия решения с( при условии, что истинное значение параметра равно О. Функцию потерь можно использовать для сравнения решающих правил и выбора из них более предпочтительного.
Поскольку решение с(=б(у) зависит от реализации случайного процесса, то значение функции потерь при й=б(у), т. е. с(0, б(у)), которое будем называть потерями, является случайным. Поэтому решающие правила естественно выбирать на основании сравнения статистических характеристик потерь. В теории решений используется математическое ожидание потерь (однако, вообще говоря, могут учитываться и другие характеристики). Математическое ожидание потерь г (О, б) = М (с (8, б (у)) ~ 0), Байесовские решения. Наиболее предпочтительным решающим правилом естественно считать то, которое минимизирует функцию риска для всех значений О. Однако такое правило существует лишь в редких случаях.
Обычно решающая функция, минимизирующая (1), зависит от О, при этом неясно, какую же решающую функцию считать наилучшей. Указанную зависимость мо. жно исключить, если использовать байесовский подход к задаче выбора решений. Суть этого подхода заключается в следующем. Предполагается, что: 1) параметр 0 можно рассматривать как случайную величину, Распределение вероятностей которой 1(7«(8) существует; 27 2) распределение $Гю(В), называемое априорнюсм (доопытным), известно наблюдателю. Тогда можно определить средний риск, взяв повторное математическое ожидание от функции риска (!), рассматриваемой как условное (относительно О) математическое ожидание потерь: т (йу„ 6) = 6464 (е (О, 6 (У))(01 = )' г (О, 6) йг, (О) (2.3) е (здесь используется интеграл Римана — Стильтьеса).
Учитывая формулу полного математического ожидания Мйй (~(п) = М$, (2.4) видим, что средний риск Р(чую, 6) представляет собой полное математическое ожидание потерь г ()(Рю 6) = М с (О, 6 (у)). (2.5) При этом он зависит от априорного распределения параметра 0 и от принятой решающей функции. Если 0 — непрерывная случайная величина, а нсю(9) — ее плотность вероятностей (априорная плотность), то согласно (3) и (2) средний риск можно записать в виде т (иссс, 6) = ( т (9, 6) иссс (0) й О = = (' )' с (9, 6 (У)) ис (У(0) ис (О) йУ й О. (2.6) ег Решающая функция, минимизирующая средний риск, т.
е. решающая функция 6*, для которой Р(ЯРю, 6*) (Р(ссую, 6) при всех 6, называется байесовским решением относительно априорного распределения Ягю(9). Величина Р(ЯГю, 6") называется байесовским риском для сстю. Итак, байесовское решение является наилучшим или оптимальным, если в качестве критерия оптимальности принят минимум среднего риска — критерий Байеса. Байесовские решения определяют синтез оптимальных байесовских систем обработки сигналов на фоне помех. Математический синтез байесовских систем сводится к нахождению байесовских решений в тех или иных задачах обработки сигналов (обнаружения и др.), к конкретизации получаемых решающих функций для заданных распределений сигналов и помех и представлению операций над наблюдаемым процессом в виде соответствующих алгоритмов.
Анализ байесовской системы обработки сигналов сводится к вычислению минимального значения среднего риска, т. е. байесовского риска г (И, 6*) = пйп т (иссс, 6), (2.7) ю 28 который является мерой качества работы оптимальной системы. Представим теперь средний риск (6) в иной форме записи. Используя свойство условных плотностей вероятностей — формулу Байеса, определяющую апостериорную (послеопытную) плотность вероятностей параметра О: в(у)0) в, (0) в(у(0) в, (О) [ в(у~О) во(0) оО в(у) перепишем (6) в виде г(гсо 6) = [ г, (у, 6) и (у) йу, У (2.8) — апостериорное математическое ожидание потерь, называемое апостериорньом риском.
Поскольку и(у))0, то из (9) следует, что минимум среднего риска г(шо, 6) достигается прн том же значении 6*, что н минимум функции г. (у, 6) (у фиксировано). Таким образом, байесовское решение можно находить путем минимизации апостериорного риска. Отметим, что данное утверждение справедливо и тогда, когда 0 — дискретная случайная величина. В этом также нетрудно убедиться исходя из (3), при этом интеграл в (10) заменится суммой, а апостериорная плотность ш(О~у)— апостериорной вероятностью Р(О=Оо[у) (Оь 1= 1,..., й, — возможные значения параметра О). Математическое ожидание минимального апостериорного риска г,(у, 6*) дает согласно (10) и (4) байесовский риск (7): М г, (у, 6') = ММ [с (О, 6* (у)) [у) = М с (О, 6* (у)) (2.11) и поэтому определяет качество работы байесовской системы. Таким образом, синтез и анализ байесовских систем можно проводить, оперируя апостериорным риском.
Последний определяется задаваемой функцией потерь и апостериорным распределением параметра О. Минимаксные решения. Рассмотренный байесовский подход связан с двумя ограничительными предположениями, из которых наиболее сильным обычно является второе. Если априорное распределение параметра О неизвестно, то байесовский метод в том виде, как он изложен, использовать нельзя. В этом случае прибегают к различным небайесовским методам выбора наиболее предпочтительной решающей функции, при которых допущения 1 и 2 предыдущего пункта ие делаются. Остановимся на одном из таких методов — минимакеном. где г (у, 6) = [' с (О, 6 (у)) и (0[у) б 0 = М [с (О, 6 (у)) ( у) (2.10) е Решающая функция б' называется минимакгным решением, если гпах г (О, б*) ( шах г (О.
б) в ' в для всех б. Величина гпахг(О, 6*) называется минимаксным рис- ком. Если каждое из множеств 9:-эО и А~б содержит лишь конеч- ное число элементов, то всегда существует минимаксное решение б*, для которого шах г(О, б*) =пни гпах г(О, б), в в е (2.12) для всех Ф"е. При этом минимаксный риск равняется байесовскому для йув .' пйп гпах г (О, б) = ппп г ()ггвя б). в е е Минимаксные решения и риски определяют синтез и анализ систем обработки сигналов, оптимальных по минимаксному критетерию.