XVII Математическая статистика (1081432), страница 28
Текст из файла (страница 28)
Таблица Б.Я Пусть далее р;, = Р (Х = и,э У = иу), рь = Р (Х = и1), рб = Р (У = и1), 1=1,г, у = 11л. Дискретные случайные величины Х и У независимы тогда и только тогда, когда Р(Х=и;, У=иу) =Р(Х =и) Р(У=иу), 1=1,г, 1=1,л. 2З1 В.З. Критерии веэввисимости Поэтому основную гипотезу о независимости дискретных случайных величин Х и У можно представить в следующем виде: Не. 'р; =р,.р ., я=1,г, у =1, в. (5.24) При этом, как правило, в качестве альтернативной используют гипотезу Нт. 'р; фр;р для некоторых т=1,г, у=1,в. (5.25) п,п, я Х (вв~ув) = и ) т=т тьм тк.п.у (5.26) Из закона больших чисел следует, что при и -+ оо и,.
(Х„, У„) и., (Х„, У„) +Рт 1 тр11 и т (Х У ) т Рот т=1,г, у=1,в. Поэтому при истинности гипотезы Не и больших объемах выборки (в„,д„) должно выполняться приближенное равенство и;- прп.тэ т=1,г, у=1,в, и, следовательно, значения (5.26) статистики Хз(Х„,У„) должны быть „не слишком велики . „Слишком большие" значения должны свидетельствовать о том, что Не неверна. Ответ на вопрос о том, какие значения нужно считать слишком большими, а какие — нет, дает следующая теорема. Теорема 5.3. Если истинна гипотеза Не, то распределение -я статистики Х (Х„,У„) при и-+ оо слабо сходится к случайной Для проверки основной гипотезы (5.24) при альтернативной гипотезе (5.25) К.
Пирсон предложил испольэовать статистику ХЯ(Х„,У„), называемую стпптпистпикоб Фишера — Пирсоне„реализация Хя(в„,у„) которой определяется формулой 232 о. ПРОВЕРКА ПЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ величине, имеющей Х2-распределение с числом степеней свобо- ды Й=(г — 1)(л — 1): в к --1 2 1 11п1 Р(Х (Х„,У„)(л)=/ е 2й, л>0. 4Д е 221 Я В соответствии с теоремой 5.3 мрвпвервб мезовмсвмос2твм Хз отклоняет гипотезу Не на уровне значимости 1 — о, если Х'(х,у ) > Х1 .(( — 1)( — 1)) в 2 Х'(я,у ) = пК",».— „'„' — 1).
1ю1 1=1 (5.27) В частном, но очень распространенном случае таблиц сопря- женности при г = л = 2 формула (5,26) для вычисления Х2(У„, й'„) имеет еще более простой вид: П(В11П22 П12П21) Х Янз Уа М1. П2. М.1 П.2 (5.28) Заметим, что для таблиц сопряженности при г = л = 2, как правило, используют статистику Хз(Х„,У„) с реализациями 2 Х (х„,У„), (5.29) 2 (и! в11 пгг — п12в21! — ц/2) В1 П2 П 111'2 Сма Тюрин Ю.В., Макаров А.А.
где Х21 ((г — 1)(л — 1)) — квантиль уровня значимости 1 — а Х2-распределения с числом степеней свободы (г — 1)(л-1). При этом считается', что критерий Х2 можно использовать, если п;.пб/и > 5. Правую часть равенства (5.26) можно преобразовать к форме, более удобной для практического использования: 233 5.3.
Критерии независимости назынаемую стпатпистпикоб Фишера — Пирсона с поправкой Йебтпса на непрерывностпь, распределение которой лучше согласуется с уз-распределением. Пример 5.7. В табл. 5.4 приведены результаты 145 наблюдений двумерного дискретного случайно- Х 4 го вектора (Х, У). Проверим на 0 45 25 15 85 уровне о = 0,05 гипотезу Не о не- 1 11 11 13 35 зависимости случайных величин Х 2 9 9 7 25 65 45 35 145 В рассматриваемом случае г = = 3, в = 3, т.е. случаиные величины Х и У принимают по три различных значения. Вычислим по формуле (5.27) значение Хз(я„,у„) величины Хз(Х„,~„): ~ 45з 25з 15з 11з (~65 ° 85 45 ° 85 35 85 65 ° 35 9з 9з 7з 45.35 35 35 65 25 45-25 35 25 = 145 (0,3665+ 0,1634+ 0,0756+ 0,0532+ + 0,0768+ 0,1380+ 0,0498+ 0,072+ 0,056 — 1) = = 145 - 0,0513 = 7,4385.
По таблице квантилей Хз-распределения (см. табл. П.З) с числом степеней свободы (г — 1)(в- 1) = 4 находим Х1 ((г — 1)(в- 1)) = деяя(4) = 9,49. Таким образом, оснований для отклонения гипотезы Не о независимости случайных величин Х н У недостаточно. 234 а пРОВеРкА непАРАметрическох ГипОтез 5.4. Решение типовых примеров Пример 5.8. Даны выборка объема т = 25 3,98; 3,22; 0,25; -1,36; 0,96; 1,39; 1,07; — 0,52; 0,48; нз расиреоеленил Коши с плотностью 1 к(1+ хз) н выборка объема и = 28 нэ равномерного распределения на отрезке 1 — 1, 1] с плотностью ру(х).
Проверим прн помощи критерия Смирнова статистическую еипотезу о равенстве функций рд н ру. Объединив заданные выборка н построив варнацнонный ряд, по формуле (5.15) найдем соответствующие этому ряду значения бп 1 = 1, И, Ж = 45: 0; 0; 0; 0; 0; 1; 0; 0; 1; 1; 1; 0; 1; 0; 1; 1; 0; 1; 0; 1; 0; 0; 1; 1; 1; 1; 1; 1; 1; 1; 1; 1; 0; 1; 1; 0; 1; 0; 1; 1; О; 1; 1; 1; О; О; 1; О; О; О; О; О; О. =1, Ж, по формуле 1,718. Так как т н Вычислив по формуле (5.16) значения в, З (5.17) получим Р(х„, у„) = 0,473 н ./ +„— 0,00; 0,31; -0,81; — 1,00; — 0,88; 0,49; — 0,98; -0,02; -0,53; -0,64; 1,12; -0,96; 0,41; -0,65; — 0,85; — 0,45; 1,47; -1,26; -0,62; -1,43; — 0,64; 0,59; -0,09; — 0,50; 0,96; — 0,92; -0,66; -1,09 — 0,81; 0,17; — 0,63; 0,40; -0,09; -0,46; 0,68; 0,29; — 0,71; 0,99; 0,02; — 0,17; -0,00; — 0,24; — 0,59; -0,43 235 Л.4.
Решение типовых примеров и велики, то для проверки гипотезы Нв об однородности воспользуемся асимптотической формулой (5.13), в соответствии с которой Р ~/ П(я„,у„) ) 1,718 — 0,004. ~25 ° 28 1' 25+28 Поэтому гипотезу об однородности следует отклонить на уров- не значимосспи сс ) 0,004. Пример 5.9. При 4040 бросаниях монеты Ж.Л.Л. Ввгффон' получил 2048 выпадений „герба" и 1992 выпадений врешки". Совместимо ли это с гипотезой о том, что вероятность выпадения „герба" при одном бросании равна 1/2? Здесь в=4040, г=2, п1(ж„) =2048, пг(У„) =1992,рш —— ргв= =0,5, число степеней свободы г — 1=1, и при ск=0,05 находим Яврл(1) = 3,841. ПРовеРим гипотезУ Не о том, что веРоЯтности Р1 н Рг выпадения „герба" и „решки" равны 1/2.
На основании (5.9) получаем (2048 4040.0 5)г (1992 4040.05)г 4040 ° 0,5 4040 ° 0,5 Так как 0,776 ( 3,841, то статистические данные не противоре- чат гипотезе Не. Пример 6.10. В табл. 5.5 приведены данные о распределении цвета волос на голове и бровей у 46542 человек. Проверим на уровне значимости о = 0,05 гипотезу о независимости этих признаков.
Здесь в=46592, г=всс2, пы =30472, пгг — — 3238, пм =3364, пгг = 9468, п1. = 33710 пг = 12832, п.1 = 33836, п г = 12706, число степеней свободы (г — 1)(л — 1) = 1. Из (5.28) получаем юг(я„,у„) = 19,288. По таблице квантилей 1~г-распределения 'Ж.Л.Л. Бюффон (1707-1788) — французский естеспюисцытвтевь. 236 о. ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ Таблица 5.5 (см. табл.
П.З) находим Хез (1) = 3,84. Так как 19,288 > 3,84, то гипотезу о независимости признаков следует отклонить. Пример 5.11. Бегуны, ранги которых при построении по росту были 1, 2, ..., 10, заняли на состязаниях следующие места: 6, 5, 1, 4, 2, 7, 8, 10, 3, .9. Существует ли зависимость между ростом спортсмена и быстротой бега? Проверим основную гипотезу Но о. независимости между ростом и скоростью бега. Полагал в формуле (5.21) в = 10, в1 = 6, вз = 5, вз = 1, вл = 4, вв = 2, ве = 7, вт = 8> вв = 10, вв = 3, вщ = 9, находим р(У„,у„) = 0,24. По таблице распределения рангового коэффициента корреляции* для уровня значимости о=0,05 находим регв — — 0,56. Так как 0,24 < 0,56, то оснований отклонить Не нет.
Вопросы и задачи 5.1. Какие критерии называются критериями согласия? 5.2. В чем состоит критерий Колмогорова проверки статистических гипотез? 5.3. Какую статистику используют для проверки гипотез прн помощи критерия Колмогорова? Смл Большев Л.Н., Смирнов Н.В. Вопросы и задачи 5.4. В чем состоит критерий мз проверки гипотез? 5.5.
Какую статистику используют для проверки гипотез при помощи критерия мз? 5.6. Какие гипотезы лучше проверять при помощи критерия Колмогорова, а какие — прн помощи критерия мз? 5.7. Можно ли при помощи критериев Колмогорова и из проверять простые гипотезы о математическом ожидании нормального распределения в примерах 4.10, 4.11 и 4.13? 5.8. Как при помощи критерия 1~я проверять гипотезу о виде распределения непрерывной случайной величины? 5.9. Можно ли при помощи критериев Колмогорова и мз проверять сложные гипотезы о виде распределения? 5.10. Что называют рангом элемента последовательности, рангом элемента случайной последовательности? 5.11.
Какими свойствами обладает ранговый коэффициент корреляции Спирмена? 5.12. В чем преимущества и недостатки рангового коэффициента корреляции Спирмена перед выборочным коэффициентом корреляции? 5.13. Какую статистику используют для проверки гипотезы о независимости дискретных случайных величин? По какому закону она распределена? 5Л4.
Что называют таблицей сопряженности признаков? 5.15. Можно ли при помощи рангового критерия и таблиц сопряженности признаков исследовать случайные объекты не- числовой природы? 5.16. Проверьте на уровне значимости а = 0,05 при помощи критерия Колмогорова гипотезу о том, что выборка 2,1; -0,6; 0,2; 3,0; -1,0; 1,3 извлечена из распределения Ф(1,1)? Ответ: данные не противоречат гипотезе. 238 Б. ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ 5.17. Решите предыдущую задачу при помощи критерия мз. О т не т: данные не противоречат гипотезе. 5.18.