Л.Н. Фадеева, А.В. Лебедев - Теория вероятностей и математическая статистика (1115296), страница 47
Текст из файла (страница 47)
Поэтому будем считать, что У~,: а = ао= 400, а Н,: а = а, > 400. Значение дисперсии а' дохода известно. Находим и, по таблице функции Лапласа, исходя из равенства Фо(и„) = 1/2 — а. Поскольку ао = 400 и и = 1,65, то Н, принимают и, следовательно, филиал открывают, если средний месячный доход 100 жителей х > 400+ 1,65 = 403,3. 20 ~00 ' 2) Вероятность ошибки второго рода 0 можно легко найти, зная мощность критерия, которая равна 1 — 0. Получаем 1 0=Ф~ '/100 165!=Ф(1 35)= +Фо(1 35) 091. (406-400 1 20 ! 2 Отсюда вероятность ошибки второго рода б = 0,09. 3) Используем формулу для необходимого объема выборки. Для этого найдем квантили и, и и с помощью таблицы функции Лапласа и получим и> ' ' 20'=51,84, откуда и = 52.
(1,95+ 1,65)' 100 Э19 ЧАСТЬ И. Математичесиая статистика Замечание. Приведенная формула может давать слишком малые значения и, так как основывается на строго нормальном распределении. На практике п должно быть достаточно велико, чтобы пользоваться асимптотической нормальностью оценок. $ зя.З. Проверка гипотез для одной выборки Рассмотрим простые методы проверки параметрических гипотез в случае нормального распределения (которые являются формально точными), а также гипотезы о вероятности «успехаа в испытаниях Бернулли (на основе асимптотической нормальности). Как и ранее, нас не будет смущать тот факт, что реальные данные, по которым проверяются гипотезы, могут совсем не выглядеть нормальными (например, это целые положительные числа, в то время как нормальное распределение непрерывно и рассредоточено по всей действительной прямой).
Тем не менее широкое практическое применение описываемых методов дает неплохие результаты (зто объясняется, в частности, асимптотической нормальностью оценок). Следующие три типа гипотез проверяются для нормальных данных: ~ е И(а, о'). 1. Гипотезы о неизвестном среднем а нри известной дисперсии о' Основная гипотеза Н;. а = а„альтернативная гипотеза Н, может быть трех видов: а) а тя аа; б) а > аа; в) а < аа. Во всех трех случаях для проверки используется статистика критерия и=' ",/„ а В случае а) критическая точка и„, выбирается из условия Фа(и ) = (1 — сс)/2.
Если ~Ц < и„,, гйпотеза И, принимается, если ~(/~ > и„, — отвергается. Таким образом, в данном случае имеет место двусторонняя критическая область. В случаях б) и в) критическая точка и„, выбирается из условия Фа(и„) = 1/2 — а. В случае б), если (/ < и„,, то гипотеза И, принимается, если У > и„, — отвергается. В случае в), если (/> — и„,, то гипотеза И, принимается, если У < — и — отвергается. яа зао Глава !з ф Здесь имеют место односторонние критические области (правостороннлн и левостороннял соответственно). Замечание.
Этим методом можно пользоваться и в случае неизвестной дисперсии при больших объемах выборки (порядка сотен), когда оценку дисперсии можно принять за ее точное значение. 2. Гипотезы о неизвестном среднем а при иеизвеспюй дисперсии в' Основная гипотеза Н,: а = а„ альтернативная гипотеза Н, может быть трех видов: а) а в а,; б) а > а,; в) а < ав Во всех трех случаях для проверки используется статистика критерия т=" Для проверки берутся критические точки г„л распределения Стьюдента с н — 1 степенью свободы и уровнем значимости а, причем в случае а) — для двусторонней критической области, в случаях б) и в) — для односторонней критической области. В случае а), если ~Т~ < 1, то гипотеза Н, принимается, если (Т) > г — отвергается.
В случае б), если Т < г„,, то гипотеза Н, принимается, если Т > г„, — отвергается. В случае в), если Т > — и„,, то гипотеза Н, принимается, если Т < -и„, — отвергается. 3. Гипотезы о неизвестной дисперсии в' Обычно предполагается, что хотя дисперсия неизвестна, но дана ее несмещенная оценка У. Основная гипотеза Н,: о'= о,', альтернативная гипотеза Н, может быть трех видов: а) о' в о,', б) о' > о,', в) о' < о,'. Во всех трех случаях для проверки используется статистика критерия 2 (л — 1)5 Х = о,' Для проверки берутся критические точки распределения хиквадрат с и — 1 степенями свободы (и различными уровнями значимости). !! Тллрил веро пнллтей ЧАСТЬ !!. Математическая статистика В случае а), если х,' „„.„, <х' < х.'„„„то гипотеза Н, принимается, иначе она отвергается. Заметим, что границы области несимметричны относительно оценки У. В случае б), если т' <у„'!„„то гипотеза Н, принимается, иначе отвергается.
В случае в), если х' > х,' .„„то гипотеза Н, принимается, иначе отвергается. Следующая гипотеза проверяется приближенно, на основе асимптотической нормальности оценки. 4. Гипотеза о неизвестной вероятности «успехв» в испытаниях Бернулли Основная гипотеза Н;! р = р„альтернативная гипотеза Н, может быть трех видов: а) р мр;, б) р > р;, в) р < р,. Во всех трех случаях для проверки используется статистика критерия т» "ре У= ч,я — у т,а — тЮ б д Далее критические точки и области для проверки выбираются так же, как и при проверке гипотезы о неизвестном среднем при известной дисперсии.
Замечание. Этим методом можно пользоваться только при больших объемах выборки (порядка нескольких десятков или сотен). Доказательство. 1) Если нулевая гипотеза справедлива, стах — а Г- тистика критерия ст'= /л имеет стандартное нормальное !т распределение Ж(0, 1). В случае справедливости гипотезы а) эта статистика может СТРЕМИТЬСЯ КаК К + е, таК И К вЂ” е, В ЗаВИСИМОСтИ От ТОГО, а > ае или а < ае. Поэтому область принятия гипотезы Н, следует ограничить с двух сторон, справа и слева. Логично это сделать симметричным образом, в силу симметрии нормального распределения.
Имеем Р(Щ < и) = 2Ф»(и), поэтому выбирая и„из условия Фе(и ) = (1 — а)/2, получаем Р(!ст'! < и ) = 1 — а и Р(!ст"! > и ) = = а, что обеспечивает уровень значимости а. В СЛуЧаЕ СПраВЕдЛИВОСтИ ГИПОТЕЗЫ б) а > ае СтатИСтИКа Ст' стремится к + е, так что область принятия гипотезы Н, следует ограничить справа. Имеем Р(Н < и) = Ф(и) = 1/2 + Фе(и), ззз Глава вз ф поэтому, выбирая и из условия Ф,(и„,) = 1/2 — а, получаем РЯ < и„,) = 1 — а и Р((/> и ) = а, что обеспечивает уровень значимости а. В случае справедливости гипотезы в) а < аа сгатистика У стремится к — в, так что область принятия гипотезы Н, слелует ограничить слева. Имеем Р(Т/> — и) = 1 — Ф( — и) = 1/2 + Фв(и), поэтому выбирая и„, из условия Ф,(и ) = 1/2 — а, получаем Р((/> — и ) = 1 — а й Р((/< — и ) = а, что обеспечивает уровень значимости а.
2) Если нулевая гипотеза справедлива, статистика критерия х — а, Т= /и имеет распределение Стьюдента с и — 1 степенями свободы. Критическая область выбирается в зависимости от альтернативной гипотезы из тех же соображений, что и в случае 1. 3) Если нулевая гипотеза справедлива, статистика критерия в (и — 1)л' х =, имеет распределение хи-квадрат с и — 1 степенями ов свободы. Далее рассуждаем аналогично. 4) Если нулевая гипотеза справедлива, из центральной предельной теоремы (см.
гл. 8) следует, что относительная частота успехов в асимптотически нормальна, с математическим ожиданием р, и дисперсией р,(! — Р,)/п, так что статистика "Р У г д Р л4 я~ Й ял-ы л~~л~~~ л« .3», л г л ших и можно считать, что она имеет стандартное нормальное распределение. Далее рассуждаем, как в случае 1. Описанные критерии проверки гипотез можно представить в виде табл. 15.1. Таблица лбл 323 ЧАСТЬ и.
Математическая статистика Продоткение отаее. 17.1 Задачи 3. Из нормальной генеральной совокупности с известным средним квадратическим отклонением о = 5 извлечена выборка объема и = 100 и по ней найдено выборочное среднее 26,5. Требуется на уровне значимости 0,05 проверить гипотезу Н,: а = ао = 25 против альтернативной гипотезы Н,: а м 25. Изменится ли результат, если заменим альтернативную гипотезу на Н,: а > 25? Решеиие.
Найдем значение статистики критерия: 26,5-25 с00 5 При проверке гипотезы Н,: а м 25 из соотношения Фо(и ) = = 0,95/2 = 0,475 находим и„, = 1,96, и Щ > и„,, так что основная гипотеза отвергается. При проверке гипотезы Н,: а > 25 из соотношения Ф,(и„,) = 0,45 находим и„я = 1,65, и У > и„я, так что основная гипотеза отвергается. В обоих случаях результат одинаков. Глава 23 ф Задача 4. По выборке объема л = 16, извлеченной из нормальной генеральной совокупности, найдены выборочное среднее, равное 12,4, и исправленное среднее квадратическое отклонение, равное 1,2.
Требуется при уровне значимости 0,05 проверить нулевую гипотезу Н;. а = 11,8 при конкурирующей гипотезе Н,: а и 11,8. Решение. Найдем наблюдаемое значение статистики критерия: (х — ав)~/и (12,4 — 11„8) 4 1,2 Поскольку конкурирующая гипотеза имеет вид а ~ а„искомая критическая область двусторонняя.
По таблице критических точек распределения Стьюдента найдем по уровню значимости а = 0,05 и числу степеней свободы и — 1 = 15 критическую точку г„, = 1, (0,05; 15) = 2,13. В силу того что 121 < г„, нет оснований отвергнуть нулевую гипотезу. Задачи 5. Точность работы станка-автомата проверяется по дисперсии размеров изделий, которая не должна превышать (т,' = 0,01 (мм').
По выборке из 25 изделий получена исправленная выборочная дисперсия У = 0,02 мм'. На уровне значимости 0,05 проверить, обеспечивает ли станок необходимую точность. Решение. Найдем значение статистики критерия: 24х0,02 Х = 0,01 Альтернативной гипотезой в данном случае является Н,: о2) (22 в По таблице находим критическую точку распределения хиКаадрат: Х,,вв; 4 — 36,4.