Большев Л.Н., Смирнов Н.В, Таблицы математической статистики (1983) (1186204), страница 28
Текст из файла (страница 28)
Следует помнить, что Р„~ шах [ г'(т[ ) — т/п[ 1<1п<п пли шах [г" (т[ ) — (2тп — 1)/2п[(примеры не- 1<Ф <и точного или неоправданно упрощенного приме- нения критериев Колмогорова и Смирнова при сравнительно небольших значениях и можно, к сожалению, найти во многих распространен- ных руководствах по математической статис- тике (см.,например,[47), гл. тс1; [104[, гл. 1тс„ [83[, гл. 1У).
Если гипотеза Н, верна, то статистики Р„ и .Р„ распределены одинаково, поэтому з дальнейпсем мы будем рассматривать лишь критерий, основанный на статистике Р„. Как показано в работе [113[, я [Р„> х) = ~п(1 — хд Спх (х+ — ) (1 — х — — ) 1-о (О (х(1), где [у[ — целая часть числа у. Из предельных теорем и асимптотическнх формул, опубликованных в работах И7, 58, 113, 145, 146[, следует, что если и -х со и 0(з «(х =О(п'/*), то с (ы>"„+ ту 2хт — 4х — 1 С 1 = (1 — е-х) + е-' + О т1 =1, тзл л у л / =К(~/ — ) — — / ( — 1) е [Ро(х)+ + 2/с'х — /с'[+ О ( = [, ~л)сл ) где К(у) = ~ ( — 1) е-'"'о*; Н= — еа (3) К (у) — функция распределения Колмогорова, которое является предельным распределением случайной величины )/пР„при п — оо, и Р„(х) = = С /с' — ~ (1 — 2/с'х) + 2/с'х (/с'х — 3).
Иными словами, при больших значениях и статистика (бпР'„+1)о/(оп) приближенно распределена как )(о с двумя степенями свободы (см. таблицы раздела П), а статистика (бпР„+ + 1)1/(18п) приближенно распределена по закону с функцией распределения К ()/х/2) (см. таблицу 6.1). Оба эти приближения действуют практически удовлетворительно при и ~ 20. С ростом и погрешности убывают как 1/и. Пусть (/ — заданный уровень значимости, выраженный в процентах (О ( (~ «( 50осо), и пусть Р„(ч) и Р„(ч) — критические значения статистик Р„и Р„соответственно, определяемые как решения уравнений Р (Р„>Р'„(О)) = О,О[О, Р (Р„~ Р„(О)) = 0,01 О. Если в результате эксперимента окажется, что Р„~ Р„(ч), то согласно критерию Колмогорова с уровнем значимости т/ гипотеза Н, должна быть отвергнута (аналогичный вывод по критерию Смирнова делается при Р„х Р„(())).
Если у «(20%, то с болыпой точностью Р„Е) — Р„+ (0,5 ч). (4) (5) где у = — 1и (0,01ч), если вычисляется Р+„(ч), и у = — 1п (0,005 (с), если вычисляется Р„(Д). Для приближенного определения Р„(ч) при 20о4 ( Ч ~ Зоо4 и 10 ~ п <" 50 рекомендуется полагать у равным корню уравнения К (у' у/2) = 1 — 0,019 (см. таблицу 6.1) и Погрешность этого приближенного равенства при О = 20 и 10% не превышает соответственно 5.10 с и 5 10 о; с уменьшением (с погрешность быстро убывает. При п х 10 для определения Р„(с',)) на отрезке 1оо «(ч(20об и Р+„ф) при(с е 0,5о4 можно воспользоваться приближенным выражением — 81— применять более точную формулу (см. [17!): 0„(()) = — ьгт! (о!'! * тп ° ттп 1 — (а — — (тт — ат 11 ', за у+ ! ! 1 — — (6) бп ' При и )~ 100 указанные приближенные формулы позволяют нацеплено оценивать критические значения 0 (Я и О„(тт) на отрезке 0,01% ( ' ( 50% (оценки )7~ (()) оудут удовлетворктельнымв при всех 0 ) 0,01%).
Критерии Репьи Д ля проверке гипотезы На при конкурирующих глпотеаах Н, (ф (Р)), Нт (т!т (Р)) или Нт (ф (Р)) с весотюй функцией 1/Р(х), если Р(х)~)а, т(т(Р(х))= О, если Р(х) (а Лп(а, 1) = зпр Пхт>а пттп — Р(т! ) шах гш ~>а " (яхт) Р 1х) — Р(х) Р„(а, 1) = — !и! Пх1> Р (х) Р (тт ) — (тп — 1Рп шах па т>~ (Ч ) ! Р„(х) — Р (*) ! Л„(а, 1)= епр и з —, Р() = шах (В„(а, 1), В„(а, 1)). Если же весовая функция определяется равенством 1/(1 — Р (х)) ври Р (х) ( а, 0 при Р(х)) а, то статистики критериев задаются выражениями Р„(*) — Р( ) Л,",(О, )=' р цх,'~а — (ч~) тпах РШ тра 1 Р (т! ) Р„(х) — Р (х) Л„(0, а) = — (п1 их 1<а Р (3) ) (~ — 1)/и шах пч рма 1 — Р(ч ) (а — заранее заданное число, принадлежащее отрезку О ( а ( 1) применяются критерии Ренье (см. (100)).
Статистики этих критериев задаются формулами, в которых знаки + п —, а также отсутствие анака указывают на соответствующие конкурирующие гипотеаы: Р„(х) — Р' (х) Р (х) !Р„(х) — Р(х) ! Л„(0, а) = зпр г< 1 — Р (х) = шах (Вп (О, а), Л„(0, а)) . Так как случайные величины Л„(а, 1), В (а, 1), В„(0, 1 — а), Л„(0, 1 — а) расйределенй одинаково (аналогичное утверж- дение справедливо и для статйстик Л„(а, 1) я В„(0, 1 — а)), то для вычисйення критиче- ских значений соответствутощнх критериев до- статочно знать функции распределбйня случай- ных величин Л„(а, 1) и Л„(а, 1) при произ- вольных а на отрезке 0 ( а ( 1.
Как показал Репьи (см. (100!), при 0 ( а ( ( 1 имеют место предельные соотношения )!шр(~/ — "' Л„+(а, 1)(х~ = =2Ф(х) — 1 (х)0), (7) где Ф (х) — функция нормального распределе- ния с параметрами (0,1) (см: таблицу 1;1); Пшр()/ — В„(а, 1)<"х~=' Т1(х) (х: 0), где (см. таблицу 6.3) Следовательно, при больших аначеннях и 'т',)- процентные критические значения (О ( т) ( ( 50%) для статистик Л,+, (а, 1) и В„(а, 1) приближенно равны соответСтвенно )/: Ч" (1 — 0,005~), )/ — 'Е;г(1 — 0,01б)), где Ч' — функция, обратная Ф (х) (см.
табли- цу 1.3), и А ' — фуякция, обратная Х (х). Если ь) ~10%, то с большой точностью имеет место приблиткенное равенство Ч" (1 — 0,005 Я = Ь' 1 (1 — ' 0,02т.т), которое означает, что ()-процентные критиче- ские значения статистик Вп (а, 1) практически совпадают с 2()-процентными критическими зна- чениями статистик В„(а, 1). При малых значениях и для вычисления функции распределения статистик В„(а, 1) можно воспользоваться точной формулой (см.
(39, 114!) Р (Л„' (а, 1) ~ >х) = = +. ~з '-('+'.")" ('+'") гдех)0, Я=п — [па(1+х)! — 1 и [у!— целая часть числа у. Если а = О, то (х) 0). Р (Л» (О, 1) . - х) = 1 — ' Крйтерии в' Выше рассматривались конкурирующие гипотезы, в которых «расстояние» между гипотетическим и истинным распределениями выражалось в равномерной метрике (за «расстояние» принималось экстремааьное значение «взвешенной» разности МР„(х) — Р (х)).
Если воспользоваться квадратйчной метрикой„то конкурирующую гипотезу можно записать в виде неравенства: Нг (г[г [Г (х)!) ' 1 [МГ„(х) — Р(х)]'г[г[Р(Х)! ЫР(х)) О, где 2[г (г) — заданная на отрезке 0(1(1 неотрицательная функция (предполагается, что г(г(г), гг]г(г) и г»г]г(г) интегрируемы на отрезке О ( г ( 1; см. [3]). Для проверни гипотезы Но при указанной альтернативной гипотезе Н, (г[г (Р)) применяется критерий, статистика которого выражается формулой »И(Р)]= = ) [Р„(х) — Р(х)]2 2[2 [Г(х)] г]Р(х) = = =Е(У[~(Ц')! 2» /[~(г)4+ 2-1 1 + ~ (1 — !)'ф(!) «(г, о где / (() = ) ф (з) «1», у (г) = ~ ог[г (о) ого.
о о В частности, при г[г (!) =— 1 и г[г (!) = 1/! (1 — г), полагая для краткости во = во [1] и О~, = — ог,', [1/Р (1 — Р)], имеем пв„ = (2 + ~~~ з [ Р (тй) †' '2 ~ ; (9) 1 п()„"= — и — 2 ~, ~ ~ ]пР(г),)+ 1 + (1 — — ) ]п [1 — Р (г)г)]~ . (10) Как показано в работах [3! и [110], при и — оо существуют предельные распдеделе- ния статистик пв„и пО„: 2 2. 1гш Р (ггво ( х) = аг (х) = — »14' (41'+ 1) ~ ~ ~ (41 + 1) (41'+ «Р ~~ Пп(Р(гг»«2 (х) =по(х) = ф'2п ~.~; Г(г+1,2) «,Р ( 1) г(гг2)г(1+ 2) (4!+1) )( «=О Х ехр~ — ' ' ~~ ехр ( о — -'- — и — г-! «О, (22) где 1„(з) — модифицированная функция Бесселя (иногда ее называют функцией Бесселя от мнимого аргумента; см.
[30, 70, Т39]). Критерии однородности двух выборок Пусть, помимо выборки $„ $„ ..., $„,име- ются также взаимно независимые случайные ве- личины $„$„..., $, распределенные оди- наково и непрерывно, и пусть т)1 ( г)2 ~... ... ( «)' — те же величины эг, но располо- я«енные в порядке возрастания их значений (объемы выборок гп и п могут быть различными). Обозначим символом 6 (х) функцЫ эмпири- ческого распределения, соответствующуго вы- борке $,', $„. « ., $ .
Основ»]ая гипотезй Нв подлежащая проверке, заключается в предполо- г((ения; что обе вьгборки извлечены из одйой и той иге совокупности и, знайит, функции рас- пределения случайных величин $ и $' одина- ковы. Эту гипотезу можно выразить то»1«дест- вом: Н;. МР„(х) = М6 (х), где Р„(х) — функция эмпиричесйого распреде- ления, построенного по выборке $1, Э„ ..., $„. Возможные конкурирующие гипотезы запишем в виде неравенств: Н12 зпр М(6лз(х) — Ро(х))) Оо гхг<а гн( М (6„(х) — Р„(х)) (О, гхг<а Нгг эпр [М(6 (х):Р„(х))[ >О. гх)< В случае конкурирующих гипотез Н» и Н, для проверки гипотезы Н, можно воспользоваться критериями, основанными на прн больших и распределены приближенно, как Р, и Р соответственно, где т = тп/М (Р и Р, — указанные выше случайные величины, определенные при целых т формулами (2); нх функции распределения имеют смысл и при дробных т).
Более точно, если х — какое-либо + из возможных значений Рт э или Рю „, то прн Л' — > сс и х = 0 (1/~'т) Р(Рт, и (х) =!* (Рт(х — с (1 — 6Ь(гя, я)— — — '"))+О( — '). (17) Аналогичная формула для Р „ получается из формулы (17) после отбрасывания знаков +. Критические значения Р „(()) и Р „((3) статистик Р „и Р, „, соответствугощие уровню значимости Д (О ~ () ~( 5091), представляют собой решения неравенств Р (Р, „) Р, „а) ) с 0,01 В Р (Р „( Р;„„ф)) ) 1 — 0,01~ на множестве возможных значений указанных статистик (для Р „((/) неравенства записываются аналогично (18)). С помощью наименьшего общего кратного Ь = /г (т, п) этн решения можно выразить в виде отношений Р",„(Р)="'(О), Р„,„(Р)= (О), (19) где г+ и г — целые числа.