Тихонов В.И., Харисов В.Н. Статистический анализ и синтез радиотехнических устройств и систем (2004) (1151791), страница 61
Текст из файла (страница 61)
(6.5.7) Первые два слагаемых в правой части (6) сеть постоянные неотрицательные величины, не зависящие от результатов наблюдений. При условии (7) каждый подынтегральпый член также неотрицателен. Поэтому минимальное значение среднего риска Л (минимум интеграла) будет достигнуто в том случае, когда подыптегральное выражение отрицательно, т. е. когда в подобласть Г включены все точки пространства наблюдений, для которых (го! г! !)Р» (Н!)Р(»о ! Н!) о-(гоо гоо)Р» (Но)Р (о!о ! Но) Точки, для которых выполняется обратное неравенство, нужно отнести к области Г,.
Такое заключение следует из очевидного факта: для любои области ГоеГо при г(х)<0 всегда выполняется неравенство ( 7'(х) о(х > ( 7"(х) о)х !' о го Поэтому интеграл в (6) достигает минимума тогда и только тогда, когда в область интегрирования включены все точки 321 11 — 2247 пространства наблюдения, для которых подынтегральная функция отрицательна. Таким образом, приходим к следующему байесовскому правилу принятия решений: (65.8) о Отношение функций правдоподобия в левой части называют опшошениел! правдоподобия /(Ц). Поскольку оно представляет собой отношение двух фушсцнй случайных величин, то и само является случайной величиной.
Величина /! в правой части (8) является порогом решения. Так как обе части неравенства (8) есть положительные величины и натуральный ло! арифм есть монотонная функция аргумента, то вместо (8) часто используется эквивалентное неравенство 1п /(с,о) <' 1п l!. Оо Если ввести апостериорные вероятности гипотез Р (Н) — Р(Н;!ть!)!==сопя!Р „(Н )Р(Д0! Н!), то критерий (8) можно записать иначе: (6.5.9) (6.5.10) 322 р(//!~1;) рн(Н,),(„зд, !,.-е.. (6.5.1 1) р(//о!ео) ре (Но) // со! — и!! о Итак, из критерия Байеса следует, что необходимо сравнивать с порогом апостериорные вероятности гипотез или, что то же самое, отношение правдоподобия. Из (8) и (9) видно, что вся процедура обработки наблюдения сводится к вычислению отношения правдоподобия /(1,"0); оно является достаточной статистикой для данной задачи.
Априорные вероятности и стоимости не оказывают влияния на отношение правдоподобия„ от них зависит только значение порога /!. Эта нпвариантпость процедуры обработки результатов наблюдения имеет большое практическое значение. Весьма часто априорные вероятности н ст.онмости являются просто квалифицированными предположениями на основании предыдущего опыта. Правило (8) дает алгоритм обработки, нс зависящий от априорных вероятностей и стоимостей. Прн этом Ь можно рассматривать как перемештый порог„учитывающий изменения в наших оценках априорных вероятностей и стоимостей.
Наиболее часто критерий Байеса используется с простой функцией стоимостей (6.3.14): со, — — с,о=!, соо — — с1, — — О. При таких стоимостях значимость ошибок первого и второго рода прннима- 1п/(ео) (~ /и (Рс (Но)/Рсн(Н1)з! Но р(Н К:)/р(Н. К') ='1 (6.5.13) Оо При этом минимальное значение среднего риска (5) равно / ее( 0) 3 Р(яо ~ НО)Е/яо+Рре(Н1) 1 Р(чо~ Н!)!/Сео. г о Оно совпадает с вероятностью полной ошибки (3).
Следовательно, при простой функции стоимостей критерий Байеса минимизирует вероятность полной ошибки (максимизирует полную вероятность правильного решения). Руководствуясь правилами (12) или (13), наблюдатель, обрабатывающий длинную последовательность повторных наблюдений, может быть уверен в том, что вред, причиняемый неверными заключениями, окажется минимальным. Правила решения (1 2) и (13) в литературе называют поразному: идеальный наблюдатель, идеальное решение или наблюдатель Котелыпекава — Зигерта. В том случае, когда обе гипотезы априорно равновероятны (р,„(Н,) =р„(Н,) = 0,5), что часто справедливо для цифровых систем связи, выражение (3) для вероятности полной ошибки (минимального среднего риска) принимает вид Ре 2 ~ ( Р ~До 1Н~) е/1о+ ) Р(""о ~ Н!) е/Ро~.
г, о Критерий Байеса применим для различения не только двух но и т гипотез, для которых известны априорные вероятности р „(Н!), !'=О, т — 1. Обозначим подобласть пространства наблюдений Г, в которой принимается решение о верности гипотезы Нз, через Г; (рис. 6.2). Выражение для среднего риска теперь примет вид ги — ! м — 1 С!/Рре(Н) ) Р(10 ~ Н!) Е/10. (6.5.16) (6.5.15) =о е=о Прастрниси/бн инйиюбсиий Г и! Рис. 6.2. Вероятностная модель при различении о! гипотез 323 ется одинаковой. В данном случае оптимальные решающие правила (9) и (11) принимают соответственно вид Р(,о ) Но) = ) Р (1о1Ио. 11)Ро(11) Фр г Р(6)1Н,)= ) Р(Ц ~ Н„~)Р, (~) Н..
(6.5. 18) г, После вычисления этих п.в. приходим к задаче различения двух простых гипотез, для которой оптимальный алгоритм основан 324 Оптимальность критерия Байеса состоит в минимизации среднего риска, что достигается определением подобластей Го при которых средний риск имеет минимум, Для простой функции строимостей (сн — — 1, 1Ф2, со=О, 1, 1=0, т — 1) этот критерий приводит к следующему правилу принятия решения: принимается ре1нение о верности той из гипотез Н1, для которой апосгериорная вероятность максимальна, т.
е. р„(Н))Р„(НЗ) при всех /~1'. (6.5.1 7) Вычислить вероятность полрюй ошибки теперь гораздо сложнее, чем для двух гипотеЗ. Рассмотрим случай двух сложных гипотез. Пусть функции правдоподобия при каждой из двух возможных несовместимых гипотез И и И, зависят от других параметров, т, е. имеют вид р(со(Но, 11) и р(со! Н,, р'), где р и Х вЂ” неизвестные параметры (в общем случае векторы, часть их компонент может совпадать), пРичем )геГрсГо, ХеГ„~Г„Г=Го+Г1--по-пРежн мУ пРостРанство наблюдений со. Отметим, что пространства параметров и гипотез должны быть согласованы.
При байесовском подходе считаются известными априорные вероятности гипотез рр„(Но) и Р„„(Н,), параметры ц и ) интерпретируются как случайные величины с известными априорными п.в. Ро(р) и Р,(р.). В том частном случае, когда эти параметры заранее точно известны и равны ро и ) о, плотности вероятности являются дельта- функциями: Ро(р)=8(р — 1го), Р1(Х)=8(р.— р.о). При наличии случайных параметров следует различать по крайней мере два вариан~а задачи: 1) все параметры р и р.
являются сопровождающими (неинформативными) и задача заключается только в оптимальном различении гипотез, т. е. в проверке сложной гипотезы против сложной альтернативы; 2) среди параметров 7. и р имеются представляющие (информативные) и требуется совместно принимать решение о гипотезах Но, Н, и оценивать представляющие параметры (совместное различение и оценивание). Первый вариан~ задачи сводится к ранее рассмотренной. Располагая указанными функциями правдоподобия и априорными п.в., по известным правилам находим функции правдоподобия гипотез: на сравнении с порогом апостериорных вероятностей (11) или отношения правдоподобия (8), которое теперь можно записать в виде 1(со)= ) Р(со~ Но А)Р1())лЧ1) Р(со~ Но р)Ро(р)р(ц (6 5.10) (6.5.20) У(Ро)= 1П1 РГ.
т (1о) Для получения явных выражений алгоритмов можно использовать оценку орной вероятности У.Ф) = РР(У~~о) 1 или по максимуму правдоподобия У(1о) = кцРР(1о ~ У). байесовских совместных по максимуму апостери- (6.5.21) (6.5.22) 325 г, г Такая методика исключения нсинформативных параметров справедлива при различении не только двух, но и большего числа гипотез.
При решении второй задачи — различении и оценивании-- полагаем все параметры представляющими (ннформативными). Если имеются сопровождающие компоненты, то их можно исключить из апостериорной п.в. путем осреднения ее с априорной п.в. этих компонен~, как это делается, например„в (18). Для краткости записей несколько изменим обозначения. Пусть требуется различать т гипотез и оценивать случайные параметры )1=Я~;, Хз„..., Хд) еЛ„сопровождающие каждую из гипотез И1, 1=0, т — 1, по наблюдению Ц н Г. Размерность и физический смысл отдельных компонент вектора Х, при разных гипотезах може~ быть различным. Отождествим совокупность рассма~риваемых гипотез Н, с дискретным параметром 9=(9о, 9,, ..., Э,„,) н0, где Э принимает значение 31, если имеет место гипотеза Йр Пару значений Э, и )ч можно рассматривать как одно значение 71 составного векторного параметра 7=(9, р.), одна из компонент которого 3 дискретна, а другая р.
непрерывна; компонента 3 принимает значения из дискретного множества О, а р. при 9=9,, из непрерывного множества Л1, 1=0, т — 1. При такой формулировке задача сводится к оценке дискретно-непрерывного параметра у. Для получения байесовской оценки должны быгь известны априорная п.в. оцениваемого параметра р„„(у) и условная п.в. наблюдения Р(со)у) при фиксированном значении оцениваемого параметра. Задавшись функцией стоимости с(у, у), можно записать выражение для среднего риска. Из условия минимума среднего риска находим оптимальную байесовскую оценку 1(~~) Р Во|И~) р(ц ~н,) о Согласно ранее введенной терминологии можно сказать, что данный критерий обладает максимальной мощностью из всех критериев с уровнем значимости, не превышающим ро, Оптимальный обнаружитель Неймана-- Пирсона (26) по наблюдению Ц должен формировать отношение правдоподобия 326 (6.5.26) Разумеется, что алгоритмы различения — оценивания не сво- дятся к простой комбинации тех алгоритмов, которые получаются при раздельном рассмотрении задач различения гипотез и оценки параметров; они оказываются более сложными.
Более трудоемким сгановится и вычисление вероятности полной ошибки. Критерий Неймана †Пирсо. Во многих задачах (в частности, радиолокационных) бывает затруднительно задать обоснованные стоимости и априорные вероятности гипотез Но и И,. В этом случае невозможно воспользоваться критерием Байеса и не- обходимо применять другие методы решения, базирующиеся лишь па условных вероятностях оф(Н„) и р(се~ Н,) и соот- ветственно на введенных ранее ошибках первого й второго рода п и (3.
В теории обнаружения сигналов ошибку первого рода и (усло- вную вероятность выбрать гипотезу Н,, когда верна гипотеза Н„) принято называть веролтностпыо ложной тревоги: Рг=-а=-12Я ~ Ио)= ) Р(~о~И,)а~",. (6.5.23) г, Вероятность правильного решения о гипотезе Н, равна Ро= — 1 — ()5 Р(Н1! Н1) =- 1 Р(со~ Н~) с!со (6,5.24) г, Будем рассматривать только такие решения (такие разбиения области Г на две час-ги Г и Г,).
для которых при заданном значении веРоатности ложной тРевоги Ре =Ре веРоЯтность пРа- вильного обнаружения ро максимальпас - - критерий Неймана —. Пи- Рсона. Решение этой задачи легко получить, используя метод множителей Лагранжа. Найдем условный максимум функции Я(Г~)5 ро !оре=) ~р(1о~Н1) 1ор(~о~НоЯс(1о= шах, (6525) г, г, где !о — множитель Лагранжа, определяемый условием рс=ро.
Чтобы максимизировать этот интеграл за счет выбора Г „ нужно отнести к Г, все значения Ц, для которых подынтегральная функция положительна. Значит должно приниматься решение о выборе гипотезы И, (Цн Г,), если р(со ~ Н,) — 1о!2(~о ~ И„) > О, и решение о выборе гипотезы Но, если имеет место проти- воположное неравенство. Правило решения принимает вид 1(Ц) и сравнивать его с порогом !а, что полностью совпадает с алгоритмом (8). Отличие состоит лишь в значении порога 1„. Если обозначить п.в, случайной величины !(Ц) при двух гипотезах через р(1~ Н„) и Р(1~ Н,), то ре = Р (1> ! ~ Н ) = ) р (! ( Н ) с!1, ~о р =Р(!>1„~ Н,3 = ) рЯН,)с(!.