Левин Б.Р. Теоретические основы статистической радиотехники (3-е издание, 1989) (1141996), страница 68
Текст из файла (страница 68)
Как указывалось в п. 13.7.5, при неограниченном увеличении размера выборки и следует предположить, что гипотеза Н и альтернатива К сближаются. В рассматриваемом случае близость Н и К означает малость параметра а. Тогда для симметричной относительно среднего значения а плотности вероятности и(х),имеем р = Р (х > 0(а > 0) = ) ю (х — а) о(х = — -,.' о а ! + ) и! (х + а) о(х = — + ап! (0) + 0 (а) (13. 189а) о 2 4р(1 — р) =1 — 0(а). (13.1896) Подставляя (13.189а и б) в (13.181), получаем для линейного знакового алгоритма следующую асимптотическую характер~истику: х — х! 6=2аш(0) )~ и. (13.!89в) збя Из (13.162), (13.188) и (13.189в) находим КАОЭ линейного знакового алгоритма (13.176) по отношению к линейному (13.185): (13.190) р = 4о'в' (О) .
Если ш (х) — плотность нормального распределения, то ш (О) = = (2по') и' и из (13.190) следует, что р=2/пж0,64, т. е. при указанном условии эффективность знакового алгоритма почти в два раза меньше эффективности линейного, который оптимален при проверке гипотез о среднем значении нормального распределения.
Однако при симметричном распределении, которое отличается от нормального, положение меняется. Так, при распределении Лапласа с плотностью ш(х) = (Ъ/2)ехр( — Цх~), Х)0, имеем ш(0) =Ъ/2, о'=2/)Р и из (13.190) следует, что р=2, т. е. знаковый алгоритм асимптотически вдвое эффективнее линейного. Из (13.!90) для равномерного распределения ш(х) =1/2, (х(( (1, о'=1/3 следует, что р= 1/3, а для синусоиды со случайной равномерно распределенной фазой ш (х) =-,, ! х(( 1, о' = 1/2 и (1 — х~)'~~ р=2/п'-0,2.
В этих двух случаях линейный алгоритм существен~но эффективнее линейного знакового. Заметим, что для симметричного распределения, у которого ш(0) =О, КАОЭ знакового алгоритма (!3.176) по отношению к линейному (13.185) равен нулю, Примером указанного распределения является бимодальное распределение с плотностью ш(х) = = (1/2) ~х(е м1. Отметим также, что формула (13.190) представляет КАОЭ знакового алгоритма (13.176) по отношению к равномерно наиболее мощному алгоритму (13.104) для проверки гипотезы о среднем нормального распределения при неизвестной дисперсии. Это происходит потому, что статистика Стьюдента асимптотически нормальная, статистика в левой части (13.105) при в»1 и аз=0 близка к линейной в (13.185), а порог (13.105) близок к са (см.
(13.187)). !3.8.8. Двусторонний знаковый алгоритм. Если проверяется гипотеза Н о том, что независимая однородная выборка х= (хь ... ..., х ) принадлежит симметричному относительно нуля распределен~ию с плотностью ш(х) против альтернативы К, что эта выборка принадлежит тому же симметричному распределению, но с плотностью ш(х — д), причем сдвиг ЮФО и может быть любого знака, то следует использовать двусторонний знаковый алгоритм.
Решение у~ принимается, если 1см. (13.152)] (13. !91 и(х„)эс или 2; и(х„)(п — с. х=! й=! 370 Вероятность ошибки первого рода [ср. с (!3.177)] л ал=Р ~;» и хд)~[с +1 Н + «-! ! л +Р ~2; и(х)(п — [с]]Н =2 [1 — 1!!д(п — [с], [с]+1)], «-! (13.191б) а вероятность ошибки второго рода [ср. с (13.1?8)) л р=Р ~2, и(х„)([с]+1]К + д=! л +Р ~ ~', и(хд).-.п — [с]]К =!д р(п— д ! — [с], [с]+ 1)+1, р ([с)+1, п — [с]). (13,191 в) Нетрудно доказать несмещенность алгоритма (13.19!а). При п»1 аналогично (13.179а и б) находим а=2 ~1 — Р( ~ )1, (д,]/лр (! — р) ) (]/лр (! — р) ) Из (13.191г) при п»1 следует, что в алгоритме (13.191а) с = (х,„(д ]/п + п) !2.
(13.191е) Подставляя (13.194е) в (13.194д), находим к — 2р — 1) 1/л [ [ — к — (2р — !)1/л [) =Р р а! 2 1/р (! — р) ~ ~ 2 ]/р (! — р! (13. 191ж) Сравним теперь двусторонний знаковый алгоритм (13.191а) с алгоритмом (13.98) при ил=О, оптимальным для проверки гипотезы Н о том, что среднее значение а гауссовской случайной величины равно нулю, против сложной альтернативы К, что а~О.
Для независимой выборки х!, ..., х при заданной вероятности а ошибок первого рода алгоритм (13.98) в этом случае представляется в виде У~ 2; х, х„п о]/и, ! ! т~ где ок — известная дисперсия гауссовской случайной величины. Предположим, что двусторонний алгоритм (13.191з) используется для проверки гипотезы Н против альтернативы К при произвольном симметричном распределении дс(х). Так как сумма 37! ~ =Г (хыз — — Ф л — р' — х.м — — Уп 1 (13,191и) Из сравнения (13.191ж, и) с аналогичными формулами (13.188), (13.189в) непосредственно следует, что КАОЭ двустороннего знакового алгоритма (!3.191а) по отношению к двустороннему линейному алгоритму (13.191з) равен аналогичному коэффициенту для односторонних алгоритмов, т. е. определяется по формуле (13.190).
Из (13.110) следует, что при неизвестной дисперсии оптимальный (несмещенный РНМ) по критерию Неймана — Пирсона алгоритм проверки рассматриваемых гипотез о среднем значении гауссовской случайной величины при заданной вероятности а ошибок первого рода представляется в виде л г ! л / 1 п ~2! — на т, — х„~ х; — — 2, х„м Г ~, (13.191к) ~/л ь ~ " аа " =~ т. где („д — процентная точка распределения Стьюдента. Квадрат знаменателя в левой части (13.191к) — несмещенная оценка дисперсии о'.
Поэтому при и-э-со для однородной независимой выборки из произвольного распределения алгоритмы (13.191к и з) совпадают. Следовательно, формула (13.190) остается также справедливой и для КАОЭ двустороннего знакового алгоритма по отношению к алгоритму (13.191к). 13.8.9. Линейный знаково-раиговый алгоритм. Более эффективным, чем рассмотренный линейный знаковый алгоритм, в задаче проверки гипотезы о том, что независимая однородная выборка принадлежит симметричному относительно нуля распределению против альтернативы сдвига, является, как правило, знаково-ранговый непараметрический алгоритм. Рассмотрим (на эвристической основе) линейный знаково-ранговый алгоритм, использующий статистику (13,192) Я„(к)= 2; Р+=;Я В+и(х;), к~>0 которая представляет сумму тех компонент вектора положительных рангов, которые соответствуют положительным выборочным значениям х;)О.
Учитывая (!3.165), можно статистику (13.192) переписать в виде л л 5„(к) = —,3 )с+ зпп х; + —,~~~ Я+, ~=! 2 (13,192а) 372 л — ~ х; нри альтернативе К асимптотически нормальна с пап~/л~ ~ раметрами (а/а)1/и, то из (13Л91з) следует, что при и»! вероятность ошибки второго рода — ~ Н+= — ~ й= 1 л 1 в л(5+1) 2 ! о 4 г=! а-! (13. 192 б) Линейный знаково-ранговый алгоритм проверки гипотезы Н о симметрии плотности относительно нуля против альтернативы К сдвига предписывает сравнение статистики 5 (х) с порогом ' 5„(х)= — ~ Н+здпх,+ ' ~ с, о и (н+ 1) ! 4 (1ЗЗ 98) г=! Уч где у! — решение отклонить гипотезу Н, а ро — решение принять ее. Заметим, что для любой однородной независимой выборки, принадлежащей симметричному относительно нуля распределе- нию, векторы мь и здпх независимы (42).
13.8.10. Среднее и дисперсия линейной знаково-ранговой ста- тистики. Из (13.192а н б) с учетом независимости векторов кь и зипх прн гипотезе Н и, (5„(х))Н) = — 2; т, (Р~-[Н) х г=! х из(зйпх![Н)+ '"+"" = ("+"" так как тг(зпдх!)Н) =О, 1=1, п. Дисперсия статистики 5„(х) при гипотезе Н р,(5„(ХНН)=- — 'и, 1Х Х Н+г+х 1!=! 1=! и х здпхгзцпхз[Н = — 2, и, (Я+в)Н). 4 г=! Так как Р(А'ьг=)з)Н) = [г!и, 1, п=), п, то л т Р+ [Н)= ~ йвР(Н+= ь=! (13.!94) 1 " „а (и+ 1) (2л+ 1) л г,, 6 и, следовательно, при гипотезе Н 1!2(5в(х) [Н) =п(п+ 1) (2п+ 1)/24.
(13.195) ' Алгоритм (13.193) называют оиновыборочным ранговым алгоритмом Вилкоисона [42). Его можно записать более компактно: л и т. Яч(х) = У; 2; и(х!+х!) ~«с. (13. 193 а) г!г!т, 373 причем второе слагаемое в (13.192а) — постоянная величина, так как Так как при альтернативе К сдвига в(х~К) =в(х — а), а)0, то Р (х; ) О (К) =. ) в (г — а) Лг о и для независимой однородной выборки Р (х, + х; » 0(К) = 1 — ) Р, ( — г — а) в (г — а) о(г, М где Р~(у) — функция распределения выборочных значений. Из приведенных соотношений следует, что при альтернативе К т, (5„(х)(К) =- и )" в (г — а) о(г+ о и (и — 1) 2 Р ( — г — а) в (г — а) о(г.