4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 32
Текст из файла (страница 32)
что количество мальчиков а семье с двумя детьми †бнномнальн случайная величина? Задачи у Использовать значение у' ., =2,71. 7. Таблица «случайных чйсел» содержит реализации 10000 независимых и одинаково распределенных случайных величин, принимающих звачення О, 1, 2, 3, 4, «, умма 18 30 48 5, 6, 7, 8, 9.
Корректно лв предположение 79 173 252 о равиовероятноста этик значеиив, если в 97 203 300 упомяну«ой таблице числа, не превосходящие 4, встречаются 4806 рэз? При каком уровне значи»«ости гипотеза равновероятностн отвергается? \ 8. ~1ожно лн с уровнеч значимости 0,001 счнтэт«ь что последовательность чвсЬг ,05; 1,12; 1,37; 1,50; 1,51; 1,73; 1,85; 1,98 является реализацией слу- «не 5э Сумма 1. При и =4000 независимых нспыта««нй события Аь Аа н Аа, составляющие полную группу, осуществились '1905, 1015 и 1080 раз соответственно.
Проверить, согласуются ли эти данные на уровне 0,05 с гипотезой На. р,= !/2, ра — — р»=1)4, где р,=р(А;). 2. Доказать форчулу (3.8) для дисперсии статистики Х„'. 3. В опытах наблюдалась неотрицательная непрерывная случайная величина я. Ее значения (упорядоченные по величине,и округленные с точностью до 00!) дтя я=50 опытов оказались равными: 001; 001; 004, О,!7; 0,18; 0.22; 0,22; 0,25; 0,25П0,29; 0,42; 0,46; 0,47; 0,56; 0,59; 0,67; 0,68;10,70; 0,72; 0,761 0,78; 0,83; 0,85; 0,87; 0,93; 1,00; 1,01; 1,01; 1,02; 1,03; 1,05; 1,32; 1,34; 1,37; 1,47; 1,50", 1,52; 1,54," 1,59; 1,71; 1,90; 2,10; 2,35; 2,46; 2,46; 2,50; 3,73; 4,07; 6,03. Проверить гипотезу Нгп Ез(х) = 1 — е .«, к дв О, применяя метод группировки с четырьмя рэвновероятиймн интервалами (уровень значимости принять раиным 0,1). Указан не.
Здесь ь«=0288!»»«=0693; ь»=1,386 (Р(ь )=1/4, 1= 1, 2, 3). 7» . а — — 6,25; Х',-'«=3,9. (.« / ~ ~г Реаднэацней выборки (Х,, ..., Ха) является целочисленный вектор (47, 46, 49, 53, 50). Можно ди с уровнем значимости 0,1 считать распределение наблюдавшейся случайной величины пуассоновскнм? 5. Поступающие в институт абитуриенты разбиты иа два потока по 300 человек в кюкдом.
Итога экзамена по одному н тому же предмету на каждом потоке оказались следующими; 1-й поток: баллы «2», «Зж «4» и «5» получили соответственво 33, 43, 80 и 144 человека! 2.поток: баллы «2», <3», «4» н «5» получили соответственно 39, 35, 72 и 154 человека. Можно лн считать оба потока однородными (на уровне значимости 0,%)? 'У !йкьй а н и е. КРитический УРовень Д' ю, э=7,82. ~6/ Из 300 абнтурвентов, поступивших в ннсппут, 97 чежеек имели ба . «5» в школе я 48 получили «5» иа вступительных экзаменах по тому же предмету, причем только 18 человек имели «5» н в школе и на экзамене. С уравнен значимости 0,1 проверить гипотезу о независимости оценок «5» в школе н на экзаменах.
У к а з а и и е. Таблица сопряженности двух признаков (см. табл. 3.2) в даяном случае имеет след юшнй вид: Сумма Сумма 9030 8921 9023 26974 18. Для заданной таблицы сопряженности двух приз««акоп проверить гипотезу независимости (уровень значимости взять равным 0,05). 11. Используя формулы (3.!7), убедиться, что прн м, й -м ж, и/Х -» р)0 ЕР»/У -»е а ПР«!Х- е Я (1 — е Я(!+Р)). 12, Доказать теорему 3.5 об асвмптотнческом поведении мжциостн критерия пустых ящиков 13.
Докаэат«ь что число инверсий в повторной выборке обьема я распределено асимптотически нормально пФ" (н (и — !)74, ма)36). и, па а, 3009 2832 3008 8819 ЗОЧ 7 305 ! 2997 909о г«974 ЗОЗВ ЗО!8 ООЗО Параметрические гиг1отезы Гпа Параметрические гипотезы, рассматриваемые е настоящей главе,— зто гипотезы об истинном значении неизвестного параметра, определяющего заданное параметрическое семейство распределений. В данной главе изложены и продемонстрированы на конкретных примерах основньв принципы построения оптимальных или асимлтотически оптимальных критериав проверки гакик гипотез, в основе которыя лежит предложенный Ю. Нойманом и Э.
Пирсонам метод отложения правдоподобия. Отдельный параграф посвящен последовательному анализу, основные злвменты которого рассматриваются на примере различения двух простых гипотез. 0 4.1. Общие положения 1. Понятие параметрической гипотезы. Важный класс статистических гипотез составляют гипотезы о параметрических моделях. В этсм случае класс Хдопустимых распределений наблюдаемой случайной величины $ имеет вид У = =(г (х; В), О~ 6), т. е. является классом специального функционального вида. Функции этого класса находят в соответствии со значениями вещественного параметра О=(9„..., В,) из некоторого параметрического множества 6 г: — Йг, поэтому гипотезы, по существу, относятся к неизвестным параметрам распределения и называются параметрическими. Примерами параметрических гипотез являются утверждения следующего типа: 1) Но: В=бы где О, ~ 6 — некоторое фиксированное значение параметра; 2) Но: Вт=" =0 ' 3) Но.д(0)=Во, где у(В) — некоторая (в общем случае векторная) функция О, до — фиксированное значение.
В общем случае параметрическая гипотеза задается указаниеь. некоторого подмножества 6, с: О, элементом которого является, по предположению, иензвестная параметрическая точка О. Записывается это так: Н,: 6 е= Оо. Альтернативная гипотеза имеет вид Н,: 0 гп 6х = 6' 6,; точки 0 еп 6т называют альтернативами.
Если множество 6,(6,) состоит из одной точки, то гипотезу Н, (альтернативу Н,) называтот прсспюй; в противном случае гипотезу (плн альтернативу) называют сложной. Так, например, гипотеза 1) простая, гипотеза 2) — сложная, а гипотеза 3) может быть как простой, так н сложной. Приведем пример конкретной параметрической гипотезы. Пусть класс и =м (8„8,'). Тогда утверждение Но. 6, =Виь 9з = В,о, где Вы, б,о — заданные числа, есть простая гипотеза о нормальном распределении наблюдений.
Гипотеза, выраженная равенством 0,=8то и оставляющая значение дисперсии 0', неопределенным,— сложная. 2. Критерии проверки гипотез. Пусть имеется выборка Х = = (Хх, ..., Х„) из распределения о($) еэ ~, о котором сформулирована некоторая гипотеза Н,:6 ен6„(9 может быть как скаляром, так и вектором). Требуегся выяснить, верна или неверна гипотеза Но, т. е. надо построить такое правило (критерий), которое позволяло бы для каждой реализации х выборки Х принять одно из двух решений: принять гипотезу Н, или отклонить ее (принять Н,).
Тем самым каждому критерню соответствует разбиение выборочного пространства Х на два взаимнодополнительных множества Х, и Хт(ХоХт=((), Хо() Хт=Х), где Хо состоит из точек х, для которых гипотеза Н, принимается, а Хт — нз точек, для которых Н, отвергается. Множество Хо называют областью принятия гипотезы Но.
а Хт — областью ее отклонения или критической сб,тастью. Таким образом, выбор правила проверки гипотезы Н, эквивалентен заданию критической области Х,. Если выбрана критическая область Хг, то критерий можно сформулировать следующим образом: пусть х — наблюдсмтиаяся реализаг(ил выбоРки Х; тогда пРи х еэ Х, гипотезУ Но отвеРгшот (пРинимаюгп альтерналшвную гипотезу Н,), если же х ~ Хо= Х„то гипотезу Но принимтот. Критерий, определяемый критической областью Хы часто для краткости называют критерием Х,. В некоторых случаях удобно рэссьгзтрнвать критерии более сложной структуры — твк называемые рандолизароганнме критерии, когда пря наблтодении х гипотезу Нд отвергают с некоторой вероятностью ф(х) и принимают с дополнительной вероятностью 1 — ф (х).
Рзндомнзировэпный критерий, таким образом, полностью характеризуется краглагеекос функнал1 гр (х) (0(ф(х)=.1, Мх т Х). Воли функция ф(х) принимает только двв значения О и 1, то приходим очевидно, к случаю нерандаяазароеанноео критерия с критической областью лют = (х:ф(х) = 1).
Долее будут рассмотрены в основном нораидомизировэнные критерии, которые, как правило, и используют на практико. 3. Общий принцип выбора критической области критерия. В пропессе проверки гипотезы Ня можно прийти к правильному решению или совершить ошибку первого рода — отклонить Н„ когда она верна„или ошибку второго рода — принять Нв, когда она ложна. Иными словами, ошибка первого рода имеет место, если 'точка х попадает в критическую область Хь в то время как верна нулевая гипотеза Н„а ошибка второго рода — когда х ел Хо, но гипотеза Н, не верна (верна альтернатива Нт). Вероятности этих ошибок можно выразить через функцию мощности 2)т(0) критерия Хз.
%У(0)=%'(Хг; 0)=рв(Х~Хх), Вен 6, (4.3) !40 Именно: вероятности ошибок первого и второго рода равны соответственно !гг (6), 8 ~ О,, и 1 — В'(6), 9 — Вг. иногда удобно эти вероятности записывать в символическом виде: Р(Нг! Н,) (вероятность ошибки первого рода) и Р(Н, Н,) (вероятность ошибки второго рода). В случае рандомизированного критерия, задаваемого критической функцией Ч (х), функция мощности определяется соотношением Ж'(9) = !гл(цг; 8) =Евой(Х) Желательно провести проверку гипотезы так, чтобы свести к минимуму вероятности обоих типов ошибок. Однако при данном числе испытаний и в общем случае невозможно ни при каком выборе критической области одновременно обе эти вероятности сделать как угодно малыми. В то же время, выбирая критическую область, можно добиться произвольной малости вероятности какой- либо одной из ошибок первого и второго рода. Так, положив Яг — -Х, будем иметь чг(8)=1 гс поэтому вероятность ошибки второго рода равна 0; если Х,= С/), то 27(9) — О и нулю равна вероятность ошибки первого рода.