XVII Математическая статистика (1081432), страница 46
Текст из файла (страница 46)
Е Р41о(4) > 151 = 0 0207, Р4(Я(4) > 14) = 0,0577. (9.14) Отсюда следует, что уравнение Ра(Я(4) < а ) = 0,975 не имеет решений, т.е. квантили а1 1г —— ло,вта у статистики 5(4) нет. Тем не менее, согласно (9.14), гнпотеза НО отклоняется в пользу Нз на уровне значимости о= 2 0,0207= 0,0414 с 0,05. Для оценки неизвестного параметра о из вариационного ряда находим хВО) = 4+0,78 = 4,78, х01) = 4+ 0,86 = 4,86. Согласно (9.11), 1 1 д = — (х1ш) + х1мб) = — (4,78+ 4,86) = 4,82. 2 2 Гипотезу НО нужно отклонить на уровне значимости о в пользу НЗ~ ЕСЛИ а(ИО) ( Зо/2 ИЛИ а(ое) )~ Л1 о/З.
Выборочное значение статистики Я(де) = Я(4) совпадает с количеством положительных чисел в построенном вариационном ряде вида (9.4) и равно 15. В таблице квантнлей биномиального распределения для и = 20 и реа = ра = 0,5 находим 382 и непАРАметрические метОДы сГАтистики Из (9.14) следует, что доверительного интервала для параметра д уровня доверия 1 — 0,05 = 0,95 нет. Поэтому построим доверительный интервал уровня доверия 1 — о = 1 — 0,0414= = 0,9586. В соответствии с (9.14) в1 р = в1 е езет = вед7вз = 15, н+1 в1- уз=20+1 — 15=6.
Поэтому с вероятностью 0,9586 х1„< в < Хрв1. Из вариационного ряда находим х1в1 = 4+ 0,09 = 4,09, х1ж1 = 4+ 1 03 = 5 03. Отсюда следует, что доверительный интервал уровня доверия 0,9586 есть (4,09, 5,03). Ф Критерий знаковых рангов Вилкоксона. Определим подмножество IС, множества л.е, состоящее из всех функций распределения,Г, соответствующих случайным величинам, плотность которых симметрична относительно нуля, т.е. (9.15) что равносильно условию Г(1) = 1 — Г( — 1), 16 К. Отметим, что функция распределения нормальной случайной величины с нулевым математическим ожиданием принадлежит К,. Итак, /С = (.Р:;Г 6 я о, г'(г) = 1 — г'(-г)) . Рассмотрим случайную выборку Х„= (Хы ..., Х„).
Для произвольного т 6 И обозначим через Н; (Х„) случайную вели- 383 9.Ь Одиовыворочиаа эадача о сдвиге чину, представляющую собой ранг элемента ~Хт — г) случайной выборки ~Хт — т~, ..., ~Մ— т). (9.16) Определим статистику Т(т) в соответствии с формулой а Т(г) = ~~~ И; (Х„)т1(Х; — г). ю=1 (9.17) Заметим, что значения 1(г) статистики Т(т) — целые числа, наименьшее из которых равно нулю, а наибольшее — п(п+ 1)/2. Статистику Т(т) называют стпатистнноб знаковых ранеое Внднонсона.
Можно показать, что если  — истинное значение параметра В функции г"(х;В) Е 1с„то распределение случайной величины Т(т) зависит от разности  — т, и, следовательно, распределение случайной величины Т(В) не зависит от В. В частности, при истинности нулевой гипотезы Ив: В = Ве распределение Т(Ве) не зависит от Ве.
Обозначим символом Т.„ квантиль уровня 7 распределения статистики Т(ве) при истинности гипотезы Ие, определяемую из условия Рв,(т(вв) < Т„) = 7, О < у< 1. (9.18) 1(Ве) > т, . Аналогично гипотезу Нв отклоним в пользу гипотезы Нз.. В > Ве на уровне значимости о, если Критперна знаковых ранеое Виднонсона для проверки гипотезы Но при альтернативной гипотезе одного из трех возможных видов (9.3) построим следующим образом. Гипотезу Не отклоним в пользу гипотезы Нт.' В < Ве на уровне значимости о, О < и < 1, если выборочное значение 1(ве) статистики Т(Ве) удовлетворяет неравенству 384 9.
ИЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СТАТИСТИКИ И наконец, Но отклоним в пользу двусторонней альтернативной гипотезы Нз. В~1 Во, если 1(Во) ( Т 7з или 1(до) > Т1 7з. Это правило мотивируется следующими соображениями. Во-пеРвых, Р(Х; — Ве > 01 > 1/2 в слУчае В > Ве, и, во-втоРых, чем больше В, тем больше вероятность Р1Х; — Во > О), 1 = 1, и. Позтому с ростом В растет вероятность того, что в случайной сумме (9.17) достаточно большим будет и количество ненулевых слагаемых, и каждое слагаемое. Следовательно, большие выборочные значения 1(Ве) статистики Т(Во) должны свидетельствовать об истинности Н1.
Аналогичные доводы можно привести для обоснования отклонения критерием гипотезы Но в пользу Нз и Нз. Заметим, что в отличие от статистики Я(т) критерия знаков статистика Т(т) зависи~ не только от знака каждой разности Х; — т, но и от ее абсолютной величины, т.е. от расстояния между значениями наблюденяя и т. Эта зависимость как раз и определяется рангом Н,(Х„). Оказывается', что если  — истинное значение параметра функции г (х;В), то распределение статистяки Т(В) не зависит не только от В, но и от Г(е) и имеет достаточно простой вид.
В частности, при истинности Нд, т.е, при В = Во, распределение Т(Вд) зависит только от и. При истинности Но и небольших и распределение Т(Ве) при Не табулировано. Имеются несложные рекуррентные формулы для вычисления вероятностей" Ре(Т(В) =Ц, Й=О,п(в+1)/2. Если п велико, то для Т существуют приближенные формулы, основанные на аппроксимации распределения статистики Т(В) нормальным распределением. *См:.
Хееиаеамееереер Т. "См. тем же. 385 9. Ь Одновыоорочнаа эадача о сдвиге Известно', что для любого 1 Е Е при п -+ оо где Мв Т(В) и Пв Т(В) — соответственно математическое ожи- дание и дисперсия случайной величины Т(В), вычисленные в предположении, что  — истинный параметр функции Г(х; В). Для этих величин нерпы формулы МвТ(В) = — п(п+ 1), ЮвТ(В) = — п(п+ 1)(2п+ 1).
(9.19) 1 1 4 24 Этот факт позволяет для вычисления квантилей Т при больших п пользоваться нормальным приближением Т й — п(п+ 1) + и 1 п(п+ 1)(2п+ 1) 4 ' 24 0 < се < 1, (9.20) где и — квантиль уровня о стандартного нормального распределения. В основе построения точечных и интервальных оценок параметра В при Г Е К, лежат уже рассмотренные идеи Ходжеса н Лемана. Сначала определим И = п(п+ 1)/2 случайных величин Кы ", 'г)и вида 1 2 — (Х,+Х ), е,у =1,п, 1<у, (9.21) Т(В) =~у п(И,— В). ю=ь (9.22) 'Смэ Хеттаанеаереер Т. "См.
там же. называемых средпплеи Уолеаа. Оказывается, что статистике Т(В) можно придать форму, схожую со статистикой знаков Я(В), а именно": Ж 386 а иепАРАметрические метОДы стАтистики Фактически статистика Т(В) — это статистика критерия знаков Я(В) вида (9.5), построенная по случайной „выборке" Уы ..., Уи. Точечную и доверительную оценки параметра В, основанные на статистике Т(В), получают по формулам (9.9) — (9.13) с заменой в них и на Ф, Х» на У», Я(В) на Т(В). В качестве оценки В(Х„) параметра В используют медиану последовательности Ум -.-, ~Ъ: 1 — (У(„,) + У( )), 1У вЂ” четное; (9.23) Ф вЂ” нечетное.
У(л»»)~ Доверительный интервал уровня доверия 1 — 2о, основанный на статистике Т(В), определяется либо неравенствами (9.24) 1т,2) «. 10+1 т„„)ь либо неравенствами (9.25) ~ч+»-т, ~,) <В< У1т, „,) где У1т,), УВя+1-т „) У(и+»-т1 „), У1т, „) — элементы вариационного ряда У(1), ..., У(и) с соответствующими номерами, а Т ~з и Т» ~з — квантили уровней о/2 и 1 — о/2 статистики Т(В) при истинном значении В, которые находятся в соответствии с формулой (9.18). Пример 9.3. Имеется выборка наблюдений — 1,90; — 2,53; — 0,53; — 1,04; 1,98; 1,22 (9.26) объема и = 6.
На уровне значимости о = 0,05 проверим гипотезу Но.. В = Во, где Ве — — -2, против альтернативной гипотезы Н1. В < Во. Для этого перейдем от исходной выборки (9.26) к выборке вида (9.16) с т = — 2: 0,10; -0,53; 1,4Т; 0,96; 3,98; 3,22, 387 9.Ь Одиовыяорочиав эадача о сдвиге имеющей вариационный ряд — 0,53; 0,10; 0,96; 1,47; 3,22; 3,98. (9.27) В данном случае последовательность рангов имеет вид (9.28) 2; 1; 4; 3; 6; 5. Поэтому, согласно (9.17), 1( — 2) = 19. По таблицам находим Р-г(Т( — 2) > 18~ = 0,078; Р з(Т(-2) ) 19) = 0,047; Р з(Т( — 2) > 20) = 0,031.
(9.29) -2,53; -2,26; -2,00; -1,78; -1,53; -1,52; -1,26; — 1,04; -0,78; -0,65; — 0,53; -0,39; -0,27; -0,01; 0,09; 0,35; 0,47; 0,73; 1,22, "1,60; 1,98. Так как число Ф = 21 нечетное„ медиана последовательности средних Уолша равна ог, ) = оП П = — 0,53. Значит, э 9 = оП П = — 0,53. Построим доверительный интервал уровня доверия 1 — о = = 1 — 0,062 = 0,938, где о/2 = 0,031. Из (9.29) находим, что Т, ~з = Тодее — — 20, Ж+ 1 — Т1 7з = 21+ 1 — 20 = 2.
Видно, что квантили Тода у распределения случайной величины Т( — 2) не существует. Тем не менее, как следует из (9.29), Но отклоняется в пользу Н1 даже на более низком уровне значимости сс = 0,047. Для нахождения значения 9 оценки 9(Х„) параметра д вычислим И = п(и+ 1)/2 = 21 значений ом ..., о>ч средних Уолша (9.21) наблюдений (9.26).
Возрастающая последовательность значений средних Уолша будет иметь вид 388 а ненАРАметРические метОДы стАтистики Поэтому из (9.25) следует, что с вероятностью 0,938 Так как о1э1 = — 2,26, о1зо1 = 1,60, то доверительный интервал для параметра В уровня доверия 0,938 есть ( — 2,26, 1,60). 9.2. Двухвыборочная задача о сдвиге Пусть ем ..., е +„— независимые одинаково распределенные ненаблюдаемые случайные величины с функцией распределения г'6 А,'о.