Г.И. Ивченко, Ю.И. Медведев - Математическая статистика (1115270), страница 31
Текст из файла (страница 31)
Другими словами, ситуа- цию, соответствующую гипотезе Н„можно охарактеризовать как «полный хаос», или «полный беспорядок». При отклонениях от Н, исходные данные имеют тот или иной порядок, проявляются связи. Следовательно, критерий проверки Н, можно построить на основании статистик, измеряющих степень «беспорядка» исходных данных. Одной из таких статистик является число инверсий в выборке. Эта статистика определяется следующим образом. По- строим вариационный ряд Ха!«...Х,„! выборки Х=(Х1, ..., Х„). Говорят, что компоненты Х, и Хг образуют инверсию, если 1</, но Х! стоит правее Х/ в вариационном ряду, т. е.
наблюдению с меньшим номером соответствует большее значение. Пусть»1!— число инверсий,' образованных компонентой Х! (в варнационном ряду левее Х; стоит !)! элементов выборки с ббльшими номерами), 1=1, ...„и — 1. Тогда. Т„=Т,(Х) жЧ«+...+«) 1»-общее число инверсий для выборки Х. Статистика Т„является естественной мерой «беспорядка» среди наблюдений, и ее можно использовать для проверки гипотезы Н,. Крайние случаи, когда вариацнонный ряд имеет вид Х,<Х,«...Х„илн Хл<Х„1<... =Х„ естественно рассматривать как свидетельства «полного отсутствия беспорядка», т. е.
противоречащие гипотезе Н,. В первом случае статистика Т„принимает минимальное значение, равное О, а во втором случае она максимальна и равна (и — 1)+(и — 2)+... ...+1=и(п — 1)/2. Таким образом, слишком малые значения Т„ н слишком большие (близкие к (и — 1)/2) естественно рассматри- вать как критические для гипотезы Ны Чтобы определить число- вые характеристики этого критерия, найдем распределение ста- тистики Т„„при гипотезе Н,. Из соображений симметрии ясно, что при гипотезе Н, любое из п1 относительных расположений элементов выборки в соответ- ствующем вариацнонном ряду имеет одинаковую вероятность 1/п1 Введенная случайная величина п» определяется расположением компоненты Х! по отношению к Х;,1, ..., Х, в вариацнонном ряду н не зависит от относительного расположения последних между собой, т.
е. «1! прн любом 1=1, ..., п — 2 не зависит от «1!«1, " «1,-! Таким образом, »11, " . !1„1 взаимно независимы. Далее, «1! может с одной н той же вероятностью 1/(и — 1+1) принимать значения О, 1, ..., и — 1, поэтому ее производящая функция имеет вид « — ! !г а!(г)= ~) Р(»1!=с)г'= . (1+г+...+г '), г О а производящая функция статистики ҄— внд г — ! г! — ! Ф„(г) = ~~ Р(Т„=г)гг =Д !р!(г) = —, И(1+г+...+г').
г 1= ! г=! Отс!ода имеем: Еч! =«2! (1) = —, 1)!1, = ~рг (1)+ Е«1, — (Е!)!)' = !2 « — ! л — ! у и (и — », ~! 2«» ~зг!~ — Эп С.~ 4 ' " .~ 72 1=! Итак, среднее значение статистики Т„прн нулевой гипотезе совпадает с серединой промежутка 10, п(п — 1)/21, и в критическую область ч7 »„следует включать все целые точки этого промежутка, достаточно удаленные от середины, т. е.
можно положиты7 „, = =(!1 — п(п — 1)/4(- 1 (п)) (в данном случае 1 (возможное значение статистики Т„) пробегает все целые точки О, !, ..., и (и — 1)/2). Границу 1„(н) при заданном уровне значимости а выбирают из условия Р(2'„«цех !«~Н,) <а нли, что эквивалентно, из условия Р (Т« ~ «г 1а 1Н«) = =Р~ ~ » 1.(п)=Т.~ ~";»+1.(пНН«)==1 а (1, (и) — это минимальное число, удовлетворяющее данному соотношениюю). Раскладывая функцию Ф„(г) в ряд по степеням г и вычисляя коэффициент при г', можно вычислить вероятности Р(Т«=с ~ Н«) прн заданном и и любом г и использовать их для нахождения критической граинцы /„(и). Распределение статистики Т„протабулировано для значений п =2, 3, ..., 12 (21. Для больших объе»!ов выборки и применяют простой асимптотический вариант этого критерия.
Используя производящую функцию Ф„(г), можно показать, что характеристическая функция нормированной статистики ТК = (҄— и (п — 1)/4) (6/п»!») сходится при п- сх» и любом конечном 1 к е — пн — характеристической функции нормального распределения. Зто означает, что Х(Т„"~Н«) — !- -».в:Ф" (О, 1) прн и-!-со. Последний результат дает возможность построить следующее правило проверки гипотезы Н„когда и велико: 'для заданного уровня значимости а определяют число /„из условия Ф ( — / ) =а/2; по фактически наблюдавшимся данным х=(х1,..., х,) вычисляют зна- кениг1=Т„(х) числа инеерсийв выборке; если ~1 — п(п — 1)/4~6/и !«) 1„, пю гипотезу Н«отвергают как противоречаи4ую исхсдныч данным; в противном случае признают, что гипопмза независимости а одинаковой распределенности наблюдений с«мласуется с опытными данными. Вероятность опшбочно отвергнуть прн зтоы истинную гипотезу гга равна Р,'1т„— ~~ —,.—,= (.„~на!„=„.И ( — (ч)= .
п(п — !) ! 6 и ' Это правило можно использовать уже при л ~ 10. гт/ '- . дп,9",с "--'-'-- ' У" чайного вектора, все 8 компонент которого в независимые одинаково распреде'ч( « . Ср леомые случайные величины? 9..Среди 2020 семей, имеющих двух детей, 527 сеней, в которых два мальчика; н 476 †д девочки (в остальных 1017 семьях дети разгюго пола). ьу- Можно ли с уровнем значимости 0,05 считать. что количество мальчиков а семье с двумя детьми †бнномнальн случайная величина? Задачи у Использовать значение у' ., =2,71.
7. Таблица «случайных чйсел» содержит реализации 10000 независимых и одинаково распределенных случайных величин, принимающих звачення О, 1, 2, 3, 4, «, умма 18 30 48 5, 6, 7, 8, 9. Корректно лв предположение 79 173 252 о равиовероятноста этик значеиив, если в 97 203 300 упомяну«ой таблице числа, не превосходящие 4, встречаются 4806 рэз? При каком уровне значи»«ости гипотеза равновероятностн отвергается? \ 8. ~1ожно лн с уровнеч значимости 0,001 счнтэт«ь что последовательность чвсЬг ,05; 1,12; 1,37; 1,50; 1,51; 1,73; 1,85; 1,98 является реализацией слу- «не 5э Сумма 1. При и =4000 независимых нспыта««нй события Аь Аа н Аа, составляющие полную группу, осуществились '1905, 1015 и 1080 раз соответственно. Проверить, согласуются ли эти данные на уровне 0,05 с гипотезой На.
р,= !/2, ра — — р»=1)4, где р,=р(А;). 2. Доказать форчулу (3.8) для дисперсии статистики Х„'. 3. В опытах наблюдалась неотрицательная непрерывная случайная величина я. Ее значения (упорядоченные по величине,и округленные с точностью до 00!) дтя я=50 опытов оказались равными: 001; 001; 004, О,!7; 0,18; 0.22; 0,22; 0,25; 0,25П0,29; 0,42; 0,46; 0,47; 0,56; 0,59; 0,67; 0,68;10,70; 0,72; 0,761 0,78; 0,83; 0,85; 0,87; 0,93; 1,00; 1,01; 1,01; 1,02; 1,03; 1,05; 1,32; 1,34; 1,37; 1,47; 1,50", 1,52; 1,54," 1,59; 1,71; 1,90; 2,10; 2,35; 2,46; 2,46; 2,50; 3,73; 4,07; 6,03. Проверить гипотезу Нгп Ез(х) = 1 — е .«, к дв О, применяя метод группировки с четырьмя рэвновероятиймн интервалами (уровень значимости принять раиным 0,1).
Указан не. Здесь ь«=0288!»»«=0693; ь»=1,386 (Р(ь )=1/4, 1= 1, 2, 3). 7» . а — — 6,25; Х',-'«=3,9. (.« / ~ ~г Реаднэацней выборки (Х,, ..., Ха) является целочисленный вектор (47, 46, 49, 53, 50). Можно ди с уровнем значимости 0,1 считать распределение наблюдавшейся случайной величины пуассоновскнм? 5. Поступающие в институт абитуриенты разбиты иа два потока по 300 человек в кюкдом. Итога экзамена по одному н тому же предмету на каждом потоке оказались следующими; 1-й поток: баллы «2», «Зж «4» и «5» получили соответственво 33, 43, 80 и 144 человека! 2.поток: баллы «2», <3», «4» н «5» получили соответственно 39, 35, 72 и 154 человека. Можно лн считать оба потока однородными (на уровне значимости 0,%)? 'У !йкьй а н и е.
КРитический УРовень Д' ю, э=7,82. ~6/ Из 300 абнтурвентов, поступивших в ннсппут, 97 чежеек имели ба . «5» в школе я 48 получили «5» иа вступительных экзаменах по тому же предмету, причем только 18 человек имели «5» н в школе и на экзамене. С уравнен значимости 0,1 проверить гипотезу о независимости оценок «5» в школе н на экзаменах. У к а з а и и е.
Таблица сопряженности двух признаков (см. табл. 3.2) в даяном случае имеет след юшнй вид: Сумма Сумма 9030 8921 9023 26974 18. Для заданной таблицы сопряженности двух приз««акоп проверить гипотезу независимости (уровень значимости взять равным 0,05). 11. Используя формулы (3.!7), убедиться, что прн м, й -м ж, и/Х -» р)0 ЕР»/У -»е а ПР«!Х- е Я (1 — е Я(!+Р)).
12, Доказать теорему 3.5 об асвмптотнческом поведении мжциостн критерия пустых ящиков 13. Докаэат«ь что число инверсий в повторной выборке обьема я распределено асимптотически нормально пФ" (н (и — !)74, ма)36). и, па а, 3009 2832 3008 8819 ЗОЧ 7 305 ! 2997 909о г«974 ЗОЗВ ЗО!8 ООЗО Параметрические гиг1отезы Гпа Параметрические гипотезы, рассматриваемые е настоящей главе,— зто гипотезы об истинном значении неизвестного параметра, определяющего заданное параметрическое семейство распределений. В данной главе изложены и продемонстрированы на конкретных примерах основньв оринципы построения оптимальных или асимлтотически оптимальных критериав проверки гакик гипотез, в основе которыя лежит предложенный Ю.