Учебник_Бочаров_Печинкин (846435), страница 52
Текст из файла (страница 52)
5, параграф 3). Ввиду дискретности случайной величины Х для проверки гипотезы Но следует использовать критерий Х . Поскольку значение параметра д неизвестно, мы имеем дело со сложной гипотезой Но и должны сначала оценить д. Воспользовавшись методом моментов, получаем опенку д" =гп" = — (Х! Ф...ФХп) = — (144 г...45) =2,92 и 60 (читателю предоставляется возможность убедиться, что оценка максимального правдоподобия также будет совпадать с выборочным средним) В табл. 3 выписаны гипотетические вероятности 292 ' Р!=Р(1;д)=- *, — е ' (1=.О,1,.
), а также числа и! элементов выборки, принявших значение 1, взятые из статистического ряда выборки (табл. 6 гл. 1). Из табл. 3 видно, что числа элементов выборки, принявших значения О, 6, 7, 8 и т.д.. меньше 5. Поэтому объединим Гл. 3. Проверка сшашистических гипотез 244 Таблица 2 — 0,981 — 1,58 — 1,57 -1,46 -1,32 — 1,29 Х,* -2,33 — 1,60 — 1,06 — 1,04 — 0,921 0,18 1 — 1,43 — 1,43 0.08 0,08 У* — '2,08 — 1,45 Ф(У,*) 0,02 0,07 — 1,33 — 1,21 О 09 О,!! — 1,18 — 0,98 — 0,97 0,12 О,!6 0,17 0,19 1 0,05 0,07 0,0! 0,03 0,09 0,11 0,13 0,15 0,17 0,01 ! 0,01 0,04 0,03 0,01 0,00 0,00 0,01 0,01 0,00 — 0,18,' -0,72 -0,53 — 0,52 — 0,90 — 0,88 — 0,80 — 0,79 — 0,28 — 0,27 — 0,22 ,' — 0,69 — 0,53 — 0,52 — 0,85 — 0,83 — 0,76 — 0,75 — 0,31 — 0,30 0,41 Ф1У,*) 0,25 0,30 0,20 0,20 0,22 0,23 0,30 0,38 0,38 0,39 1 0,35 0,21 0,23 0,01 0,03 0,25 0,27 0.29 0,3! 0,33 0,37 0,02 1 0,03 0,04 0,04 0,01 0,03 0,05 0,01 0,32 1 — 0,10 — 0,08 — 0,05 — 0,0! 0,0! 0,0! 0,0! О,!4 0,30 0,21 — О,!6 — 0,14 0,44 0,44 — О, 1! — 0,08 — 0,06 — 0,06 0,46 0,47 0,48 0,48 — 0,06 0,05 0,19 0,58 ! Ф(У*) 0,48 0,52 0,58 0,59 ,' 0,45 0,47 0.49 0,5! 0,53 0,55 0,57 0,41 0,43 0,03 0,01 0,01 0,0! 0,00 0,01 0,03 0,05 0,03 0,01 0,96 1 0,40 0,41 0,52 0,54 0,35 0,35 0,60 0,65 0,74 0,76 1 1" ,0,23 0,23 0,28 0,29 0,38 0,40 О 45 0,49 0,5? 0,78 1 0,79 ,' Ф)У*) 0 59 0 59 0,6! 0,61 0,65 0,66 0,65 0,67 0.69 0,7! 0,04 0,06 0,04 0,05 0,67 0,69 0,72 0,75 0,61 0,63 0,73 0,77 0,01 К 0,02 0,04 0,06 0,06 0,05 3,47 ' 1,02 1,06 1,12 1,27 1,68 1,92 2,15 2,19 2,25 1,59 У, 0,8! 0,85 '2,93 0,90 1,03 1,38 1,79 1,82 1,87 1,00 1 Ф(У*) 0,79 0,80 0,82 0,85 0,92 0,94 0,96 0,97 0,97 Г,* 0,81 0,83 0,99 ,' 0,85 0,87 0.89 0,91 0,95 0,93 0,97 0,01 0,03 0,02 0,03 0,03 Я, 0,02 0,03 0,02 0,00 0,03 нулевой и первый столбцы, а шестой и последующие столбцы присоединим к пятому (табл.
4). Производя последовательно вычисления, представленные в табл. 4, определяем значение статистики Д =~ ' =0,8861,6760,443-1064-0,04=4,09. пР~ 245 5. Критерии согласия Так как число столбцов Е = 5, а число неизвестных параметров и =- 1, то Кз-распределение, используемое для приближенного нахождения критического значения С, имеет Ь вЂ” й — ! = 3 степени свободы В (1, с.!67) находим 0,9-квантиль ~з-распределения с тремя степенями свободы йод =- 6,25!.
Сравнивая значение Хт = 4,09 с ггоэ = 6,251, констатируем, что следует признать справедливость гипотезы Оо о пуассоновости распределения регистрируемых счетчиком Гейгера частиц. Е! Таблица 3 Таблица 4 Пример !О. Вше раз обратимся к проверке гипотезы 77о о нормальности проекции Х вектора скорости молекулы водорода (см. примеры 7 и 8). Воспользуемся критерием К-.
Для этого разобьем всю прямую на 8 интервалов: (-сс, -3), (-3, -2), (-2, — !), (- 1, 0), (О, 1), (1, 2), (2, 3) и (3, сс). Однако поскольку в первые два интервала попало всего одно наблюдение (см. табл 7 гл. 1), объединим их с третьим интервалом.
Аналогично седьмой и восьмой интервалы присоединим к шестому Окончательно получим 4 интервала с числами га попавших в них наблюдений, приведенными в табл.5. Поскольку оценки д," = 0,082 и д.," = 1,34 неизвестных среднего д1 и дисперсии дт нами уже получены, найдем, воспользовавшись (1, с. 112 — 113), гипотетические вероятности Р~ попадания наблюдаемой величины Х в рассматриваемые интервалы; Р~ =Ф( — 1;дыдт)=Ф( ' ) =Ф~ ' ) =Ф( — 0935)=0175, Рз = Ф(О;г)*,,г),") — Ф( — 1;рыб") = = Ф( — О 07! ) — Ф( — 0,935) = 0,472 — О,! 75 = 0,297, Рз = Ф(1;дыд ) — Ф(0;дыдг) = = Ф(0,793) — Ф( — 0,071) = 0,786 — 0,472 = 0,314, Рл = 1 — Ф(1;ды д~) = 1 — Ф(0793) = ! — О 786 = 02!4. 246 Гл. 3. Проверка статистических гипотез Таблица 5 Теперь определим значение статистики Х = 2, = 0,001+ 0,00340,00640,046 = 0,056 птй Число степеней свободы т -распределения равно единице (число интервалов наблюдения Л = 4, число неизвестных параметров к = 2) Сравнивая полученное значение хд =- 0,056 с 0,95-квантилью тд-распределения с одной степенью свободы йддд = 3,841 11, с.
167), видим, что и критерий Хд подтверждает гипотезу Нд. С1 6. Критерии однородности двух выборок В этом параграфе мы обратимся к постановке задачи, несколько отличной от изучавшихся ранее. А именно, будем рассматривать две выборки и проверять гипотезу о том, что эти выборки извлечены из одной и той лсе генеральной совокупности. Итак, пусть мы имеем независимые выборки:Хы ...,Х„, произведенную из генеральной совокупности с неизвестной теоретической функцией распределения Е1(х), и уы ..., Ут, произведенную из генеральной совокупности с неизвестной теоретической функцией распределения Гз(х). Проверяются две сложные непараметрические гипотезы: основная Но, е1(х) = аз(х) и конкурируюшая Нб Г1(х) ф Нз(х).
Будем предполагать, что функции Е1(х) и Гз(х) непрерывны. Поскольку справедливость гипотезы Но, по сути дела, означает, что выборки Хы..., Х„и Уы..., Уа произведены из одной и той же генеральной совокупности, критерии для проверки гипотез Но и Н~ называются критерия,ни однородности двух выборок. Приведем два таких критерия. Критерий Смирнова. Критерий Смирнова использует ту же идею, что и критерий Колмогорова, но только если в критерии Колмогорова эмпирическая функция распределения сравнивается с гипотетической, то в критерии Смирнова между собой сравниваются две эмпирические функции распределения.
Статистика критерия Смирнова задается вы- ражением 247 б. Критерии однородности двух выборок где Е;(х) и Г (х) — эмпирические функции распределения, построенные по выборкам Хы ..Хо и УП...,У,„соответственно. Критерий Смирнова предписывает принять гипотезу Но, если р < С, и отвергнуть в противном случае. При условии справедливости гипотезы Но распределение статистики р (а значит, и уровень значимости о) не зависит от распределения Е~(х) = Ез(х) (доказательство этого факта слово в слово повторяет доказательство инвариантности статистики критерия Колмогорова).
При малых объемах выборок (п,,т < 20) критические значения С для заданных уровней значимости (размеров) критерия ст приведены в табл. 6.5а (1). При п,тп -э ж распределение статистики р сходится к распределению Колмогорова К(х), что позволяет приближенно вычислять уровень значимости критерия Смирнова по формуле сг =- 1 — К(С) (распределение Колмогорова К(х) приведено в табл. 6.1 (1)) и, наоборот, определять критическое значение С при заданном уровне значимости о как (! — о)-квантиль распределения Колмогорова К(х). Пример 11.
Па двух реакторах были проведены сходные эксперименты, в результате которых возникли новые частицы. Для анализа экспериментальных данных были замерены энергии и =- 631 частицы, полученной на первом реакторе, и т = 839 частиц, полученных на втором реакторе, и построены эмпирические функпин распределения энергии частиц Г,*(х) и Р';(х).
Когда Г,"(х) и Г.,*(х) сравнили, оказалось, что вцр ~Р,*(х) — ГТ(х)~ = 0,042. ~«*х Проверим с помощью критерия Смирнова уровня значимости (размера) о = 0,2 гипотезу Нэ о том, что на обоих реакторах возникали одни и те же частицы Для этого вычислим значение статистики критерия 631 839 0 042 = 0 80 р =, зпр (Гч (х) — Гч (х)~ = 'у и -~- т -~<.<~ и сравним полученное значение р с 0,8-квантнлью распределения Колмогорова кп з =- 1,07 (1, с. 346). Поскольку р < кпю то у нас есть основания считать гипотезу Но справедливой.
О Критерий Вилкоксона. Образуем из выборок Хы..., Х„ и Уы..., У„, один общий вариационный ряд (табл. 6) и отметим последовательные порядковые номера (ранги) гы гз, ..., г элементов выборки УП,У в общем вариационном ряду (в табл.б рангами гига,...,гт будут 2,3,...,и+т — 1).
Таблица 6 248 Гл. 3. Проверка статистических гипотез Критерии, позволяющие только на основе рангов гы...,т„, принимать или отверстать гипотезу Но, называются ранговыми критериями. Их достоинством является чрезвычайная простота. Поскольку при условии справедливости гипотезы Но все возможные комбинации рангов гы..., г,„равновероятны (всего таких комбинаций (.) п ьгпт )), то уровень значимости (размер) рангового критерия не зависит от распределения Г1(х) = Гз(я:), Обычно в качестве статистики рангового критерия используют сум- мУ,Г(г!) + .
+ 1(ггп~), где Г(г) — некотоРаЯ фУнкциЯ, опРеделеннаЯ для всех г =- 1, 2, ., п + т. Мы рассмотрим один тип ранговых критериев — критерий Вилкоксона. Пусть (вы вя,..., в„ет) — одна из (и + т)! возможных перестановок чисел 1,2,..., и, х т (т. е. расположенные в произвольном порядке числа 1,2,...,и+ гп). Положим у(г) =- в„(см. табл. 6). Статистика критерия Вилкоксона задается формулой ю =- .вг, + ... + в, Односторонний критерий Вилкоксона предписывает принять гипотезу Но, если и ) С, и отвергнуть, если ц~ < С, где С вЂ” критическое значение одностороннего критерия Вилкоксона. Прн использовании двустороннего критерия Вилкоксона мы должны принять гипотезу Но, если С~ < и < Сз (С~ < Са), и отвергнуть ее, если либо и ) Св, либо и < Сы Нижнее С| и верхнее Сз критические значения двустороннего критерия Вилкоксона связаны между собой соотношением С~ + Сз =.
Я, где Дг = т,(т + и, + 1). Выбор перестановки (вы вз, ..., в„е ) осуществляется до опыта таким образом, чтобы по возможности наилучшим образом разделить вгяборки Хн...,Х„и Ун...,У при наименее благоприятном соотношении между теоретическими функциями Г1(х) и Гз(и) или, иными словами, чтобы прн заданном соотношении между Г| (х) и Гя(м) мощность критерия была бы максимальна. Так, если к наиболее опасным последствиям ведет отождествление наблюдаемых величин Х и У в случае, когда У систематически меньше Х (т.е. Г1(х) < Га(х) при всех и), то естественно положить вг = т и воспояьзоваться односторонним критерием Вилкоксона.
Если же одинаково пагубными представляются и случай Х систематически меньше У, и случай У систематически меньше Х (т.е. одновременно для всех х либо Г~(т) < Гз(х), либо Гз(л) < Г1(л)), то опять-таки нужно взять в„=- г, но использовать двусторонний критерий Вилкоксона. Или еще пример: из каких-то соображений стало известно, что наблюдаемые величины Х и У в среднем приблизительно одинаковы (МХ = МУ), и нужно проверить основную гипотезу Но. разброс случайных величин Х н У одинаков против конкурирующей гипотезы НП разброс У больше разброса Х. При выполнении гипотезы Н~ наблюдаемые значения величины У (выборка Уы ..., У ) будут в основном сосредоточиваться в начале и в конце 249 б.














