Левин Б.Р. Теоретические основы статистической радиотехники (3-е издание, 1989) (1141996), страница 66
Текст из файла (страница 66)
13.7.5. Коэффициент асимптотической относительной эффективности алгоритма, использующего асимптотически нормальную статистику. Рассмотрим два состоятельных односторонних алгоритма проверки гипотезы Н против альтернативы К, удовлетворяющих условию (13.153). Решение 71 (отклоняется гипотеза Н) принимается, если (13. 154) (13.155) 359 уи!,) с1 (алгоритм 6'"„, ), у<'!„,(х))с, (алгоритм 6<",). Как уже отмечалось в п. 12.5.2, иногда не удается вычислить коэффициент относительной эффективности по формуле (13.150), и тогда для характеристики качества алгоритма принятия решения используют коэффициент асимптотической относительной эффективности 1см, (12.34а) ]. 13.7.4.
Синтез непараметрических алгоритмов. Непараметрический (по отношению к гипотезе Н) алгоритм 6*„* — оптимальный по критерию относительной эффективности (т. е. наиболее эффективный), если при заданных значениях вероятностей ошибок а и )! для любых других напараметрических алгоритмов б„выполняетсй неравенство р„,з (6, 6"„.) )1. Алгоритм 6*„* будет равномерно наиболее эффективным, если указанное неравенство при фиксированном значениь а выполняется .ля 1юбого значения р В отличие от синтеза оптимальных алгоритмов проверки простых гипотез и гипотез в условиях параметрической неопределенности регулярных общих методов синтеза наиболее эффективных непараметрических алгоритмов пока не существует.
Поэтому не- параметрические алгоритмы проверки гипотез синтезируются на эвристической основе. При фиксированном условии (13.148) устанавливается соответствие между критической областью Хк выборочного пространства Х" и некоторой статистикой (функцней выборочных значений) у„(х), которое может быть следующим: Предположим, что распределения статистик у<о „, (х) и у<»>„, (х) асимптотически нормальные '. Обозначим и>> [ у<о (х)]Н] =а«>„, и> (у<'> (хИК] = а<ох, рз [8«>(х)]Н) =- [о<'> ]' р [у<о(х)]К] =- [о<о ]т, <'= 1; 2.
Предположим также, что (13. 156в) л. о < < (13. 156а) (13.1566) Предельные при и< -оо рабочие характеристики алгоритмов 6<"„, и 6<'>„„связывающие предельное значение вероятности ошибки второго рода с заданной вероятностью <х ошибки первого рода, имеют следующий вид [ср. с (13.88а)]: х> — р= хм <(<~ (13. 157а) где <(< = Игп [а«>к — и<'> ]1о<'>и, л<.+ о Если (как это часто бывает) дисперсия статистики у<о <(к) растет пропорционально размеру выборки пь то для того, чтобы величина 4 была конечной и отличной от нуля, необходимо, чтобы разность а«> — а<'> возрастала как ]< по л>К л<Н Предположим далее, что при и; оо альтернатива К и гипотеза Н сближаются. Прн этом а<'> .
а<'>„. Введем малыйпараметр 6 и обозначим а<'> о а«>(д) а«> = а<'>(0). Тогда л;К л< л>н л,. а<'> — а<'>н — — а«> (6) — а<'> (0) = 6 [ а«> (0)]'+ о(д), (13.158) л> л< "< (13.1576) где [а<<>(0)] = — а<'>(д)(е о ~ О, Полагая 7<=6 ')г и<, получаем из (!3.1576) и (13.158) <1<и р<еь (13.159) (13.160) где з<= 11<и [а<о(0)]'4о<'>н)гп<], 1=1; 2.
л>-+ «< ' Во многих случаях асимптотическая нормальность статистики ро(х) следует из центральной предельной теоремы. Как известно, центральная предельная теорема формулируется относительно нормированных статистик (у (х) — т,Х Х>р„<х))]1[в ('р„(х)Ц ' '. Мы будем часто нспользовзть термин «асимптотичесчи нормальная статистика» для ненормированных статистик, имея при этом в виду, что распределение суммы случайных величин при большом числе слагаемых прн определенных ограничениях аппроксимируется нормальным распределением со средним и дисперсией, зависящими от числа слагаемых.
360 Величину еь определенную согласно (13.160), называют эффективностью алгоритма 6((>„. Из (13.157а) и (13.159) получаем линейное уравнение относительно уь которое имеет единственное решение: у, =-(х„— х, а)(е(, 1= 1„2. (13. 161) При фиксированных значениях а и 6 из (13.161) находим следующее выражение коэффициента асимптотической относительной эффективности (КАОЭ) алгоритма 6('>„по отношению к алгоритму 6('>„; (13.162) где е( и ез определяются согласно (13.160). Если первые г производных а((>„,(д) по д при 6=0 обращаются в нуль, то в (13.160) вместо первой производной следует подставить (г+1)-ю производную а(о„,.
(6) прн 0=0. Заметим, что из определения КАОЭ следует, что при фиксированных вероятностях а и (1 для трех алгоритмов 6(", 6(", 6">„имеет место следующее соотношение: р(би> 6(з>) р (6(н ба>) р (6(з> б(з>) 13.3. СТАТИСТИКИ, ИСПОЛЬЗУЕМЫЕ В НЕПАРАМЕТРИЧЕСКИХ АЛГОРИТМАХ ПРОВЕРКИ ГИПОТЕЗ (13.163) 13.8.1. Предварительные замечания. Если имеется независимая однородная выборка, то, используя некоторые статистики от нее, можно на эвристической основе получить непараметрические ал- горитмы проверки гипотез, для которых вероятность ошибки пер- вого рода остается постоянной при произвольных размерах вы- борки для любых распределений, характеризуемых плотностью и(х) е-=шя. Вероятность ошибки второго рода прн использовании таких алгоритмов будет, в общем больше минимально возмож- ной для данного распределения при альтернативе.
Рассмотрим следующие статистики, на основе которых могут быть получены непараметрическне алгоритмы: знаковые, поряд- ковые, ранговые и знаково-ранговые. 13.8.2. Знаковые статистики. Пусть х=(хь ..., х ) — наблюда- емая выборка. Введем знаковую функцию 1, х)0, 51ЯП х =— ')/(х( 1 — 1, х(0. Знаковым вектором выборки х назовем вектор зппх с компонен- тами здпх„..., зппх„. Пространство всех знаковых векторов вы- борки размером п содержит 2" точек. Произвольную функцию компонент знакового вектора назовем знаковой статистикой, а 361 алгоритм, использующий знаковую статистику — знаковым алгоритмом.
Пусть рассматривается задача сдвига (см. п. 13.7.1) и априори известно, что при гипотезе Н наблюдения характеризуются плотностью ш(х), которая принадлежит непараметрическому классу ип распределений, симметричных относительно нуля х0=х0 5=0. Если выборка х независимая, однородная, то число положительных и отрицательных знаков в выборке равновероятно для всех а(х) ешп, т. е. Р(х;)01Н)=1/2.
При альтернативе К: хо=ход) )О вероятность появления положительных знаков больше вероятности появления отрицательных для всех п>(х — О), О)О, т. е. Р(х;)0>К)=р)1>2. Это позволяет использовать знаковую статистику для принятия или отклонения гипотезы Н о симметрии относительно нуля плотности распределения, которому принадлежит наблюдаемая выборка. Для рассматриваемого симметричного распределения наблюдений, для которого плотность ш(х) =ю( — х), нетрудно записать распределение знакового вектора выборки х размером и: Р(зцпх=(зйпх);~Н)=(1/2)" 1=1,..., 2" (13.164а) >'»' Р(з|пх=(зЯпх )»К)=р (1 — р)", 1=1,,> 1, й=О, и, '"'(, ь /' (13.1646) где зппхь — вектор, содержащий Й единиц, р)1/2.
Заметим, что гипотеза Н о симметрви плотности щ(х) относительно нуля влечет утверждение, что медиана распределения равна ~нулю: хюл=О (как уже отмечалось). Однако обратное утверждение, вообще говоря, неверно, т. е. из х0л=О не следует обязательно симметрия распределения. Иногда вместо знаковой функции (13.163) используют фупкц~ию единичного скачка 1см. (2.7)1, которая однозначно связала со знаковой функцией, так как 2и(х) =зппх+1.
(13.165) Вектор п(х)=(и(х>), ..., и(х„)1 назовем положительным знаковым вектором выборки х. 13.8.3. Порядковые статистики. Перегруппируем элементы выборки х= (хь ..., х ), расставляя их в возрастающем порядке так, что х(ь>(хп>, если А(1. Тогда получим упорядоченную выборку хп>, ..., х~">, которую называют также вариационным рядом.
Вектор х( >, компонентами которого являются элементы упорядоченной выборки, называют вектором порядковых статистик, а компоненты этого вектора — порядковыми статистиками. Для выборок из распределения, имеющего непрерывную плотность, вероятность совпадения двух и более выборочных значений (а следовательно, и порядковых статистик) равна нулю. Для однородной независимой выборки размером п из распределения р>(х) нетрудно найти функцию распределения рп>(х) порядковой статистики хп>, Так как вероятность того, что в неЗб2 зависимой выборке х„..., хл имеется ровно й элементов, не пре- восходящих заданного порога х, равна (",)[Р,( И'[! — Р,( И"-', то глл !Уг Уг+!) г+г!Уг .
и! (Уг) 13.8.4. Ранговые статистики. Рангом )7! элемента х! выборки называется порядковый номер этого элемента в вариационном ря- 363 ( 13. 167в) л Р!о (х) = Р(хьп(х] = 2; Р[х1~1(х(х!4+!!) = »=! л = ~', (" ][Р,(х))'[1 — Р,(х)]л 4, !'=1, и, х'л+"=со, (13.166) »/ Из (13.166) дифференцированием по х правой части получим выражение для плотности вероятности порядковой статистики х!41: гв~!1(х) = !в! (х) ~ ( ] (й [Р! (х)]» — ' [1 — Р, (х))л — »в — (и — й) [Р, (х)]" [1 — Р, (х)]л — 4 — ') = л = ип!,(х) ~, '~" ] [Р,(х)]4 — ! [1 — Р,(х)]л — »в „,~4 1/ — Х (" '1[Р (х)]» [! — Р (х)] — -! = »=! ! л г' = и ( ] [Р, (х)]' — ' [1 — »(х)]л — 'пг»(х).
(13.167а) 'т! — 1 ) Совместная плотность вероятности г порядковых статистик у! =х'!', 1<з,«...з,<и, [42] и!„(у„..., уг) = и ! [(з! — 1)! (з, — з, — 1)! ... - (и — з,)'] 'Р"!' '(у!)[Р (у) —" (у)]'* " '-. (13. 167б) г=! Из (13.167а и б) следует, что совокупность порядковых статистик х!'1, ..., х!"! представляет простую марковскую последовательность, так как ы(у,+,]у„-,у,)= ""'"'-'"'"' = мг У! ... Уг) лл-г — ! ( — ) (у.+ ) лл-г („) Л а Я, = —',~ зяп(х, — хь)+ —, 1= 1, и 2 ~ 1 2 (13.168б) Из (13.168а и б) следует, что ранги являются знаковыми статистиками от разностей выборочных значений.