341_4- Сборник задач по математике для втузов. В 4-х ч. Ч.4_ (ред) Ефимов А.В, Поспелов А.С_2003 -432с (987780), страница 46
Текст из файла (страница 46)
При проверке простой параметрической гипотезы Но. 0 = Во в качестве статистики критерия выбирают ту а«е статистику, что и для оценки параметра О, т.е. 0. Проверка статистической гипотезы основывается на принципе, в соответствии с которым маловероятные события считаются невозможными, а события, имеющие большую вероятность, считаются достоверными. Этот принцип можно реализовать следующим образом, Перед анализом выборки фиксируется некоторая малая вероятность а, называемая уровнем экпчи4«осп>п. Пусть 1г — множество значений статистики У, а Ъ'„С $' — такое подмножество, гго при условии истинности гипотезы Йо вероятность попадания статистики критерия в Ь'„равна «>, т.е.
Г [г б ) „УНо) = . Обозначим х«выборочное значение статистики Я, вычисленное по выборке наблюдений. Критерий формулируется следующим образом: отклонить гипотезу Но, если з«е )~; принять гипотезу Но, если з, е е )"')Ъ'„. Критерий, основанный на использовании заранее заданного уровня значимости, называют критерием значимости. Множество Ъ« всех значений статистики критерия Я, при которых принимается решение отклонить гипотезу Но, называется критической областью; область Г')'>'„назгавается областью приклп>ил гипотезы Но.
Уровень значимости а определяет «размер> критической области 1' . Положение критической области на множестве значений статистики Я зависит от формулировки альтернативной гипотезы Н>. Например, если проверяется гипотеза Но. 0 = Во, а альтернативная гипотеза Н« формулируется как Н> . 0 > Во (О < Во), то критическая область размещается О 4. Проверка статистических гипотез 249 И«' 0=0« иг Око„ н„; о-о„ И! ° О ь 0« и„о=о„ ИГ 0»оа Рис. 34 как Н,: О ~ Оо, то критическая область размещается на обоих «хвостах» распределения Я, т.е.
определяется совокупностью неравенств Я < г «э и Я > з, «з, в этом случае критерий называется Овус«лорокяиль На рис. 34 показано расположение критической области $'„ для различных альтернативных гипотез. Здесь 1»(х(Но) — плотность распрепеления статистики Я критерия при условии, что верна гипотеза Но, »''1$'„— область принятия гипотезы, Р ~Я б Г'1Ъ;) = 1 — с«. Таким образом, проверка параметрической статистической гипотезы при помощи критерия значимости может быть разбита на следующие этапы: 1) сформулировать проверяемую (Но) и альтернативную (Н») гипотезы; 2) назначить уровень значимости с»; 3) выбрать статистику Е критерия для проверки гипотезы Но, 4) определить выборочное распределение статистики л при условии, что верна гипотеза Но, б) в зависимости от формулировки альтернативной гипотезы опрепелить критическую область Ъ'„одним из неравенств Я > з«, Я < г или совокупностью неравенств х' > з«уз и У < з «т,.
на правом (левом) «хвосте» распределения статистики Я, т.е. имеет вид неравенства Я > х» (Я < з ), где г« „и з„— квантили распределения статистики Я при условии, что верна гипотеза Но. В этом случае критерий называется оОкосглорокк««з«, соответственно правосторонним и левосторонним. Если альтернативная гипотеза формулируется 250 Гл. 19. Математическая статистика 6) получить выборку наблюдений и вычислить выборочное значение э, статистики критерия; 7) принять статистическое решение; если х, Е Р'„, то отклонить гипотезу Но как не согласующуюся с резудьтатами наблюдений; если г, б Ь''1$'„, то принять гипотезу Но, т.е, считать, что гипотеза Но не противоречит результатам наблюдений.
Замечание. Обычно на этапах 4 — 7 используют статистику, квантили которой табулированы: статистику с нормальным распределением У(0, 1), статистику Стьюдента, статистику Хэ или статистику Фишера. Однако интерпретацию решения и вычисление вероятностей ошибок, допускаемых при проверке гипотез, удобно проводить для статистики, являющейся непосредственной оценкой параметра д, т.е. статистики О. Пример 1. По паспортным данным автомобильного двигателя расход топлива на 100 км пробега составляет 10л.
В результате изменения конструкции двигателя ожидается, что расход топлива уменьшится. Для проверки проводятся испытания 25 случайно отобранных автомобилей с модернизированным двигателем, причем выборочное среднее расходов топлива на 100км пробега по результатам испытаний составило х = 9,3л.
Предположим, что выборка расходов топлива получена из нормально распределенной генеральной совокупности со средним ш и дисперсией оэ = 4лэ. Используя критерий значимости, проверить гипотезу, утверждающую, что изменение конструкции двигателя не повлияло на расход топлива. ° з Проверяется гипотеза о среднем (т) нормально распределенной генеральной совокупности. Проверку гипотезы проведем по этапам: 1) проверяемая гипотеза Но . .гп = 10, альтернативная гипотеза Нм т<10: 2) выберем уровень значимости гг = 0,05; 3) в качестве статистики критерия используем оценку математического ожидания — выборочное среднее Х; 4) так как выборка получена из нормально распределенной генеральной совокупности, выборочное среднее также имеет нормальное распрепэ 4 деление с дисперсией — = —.
При условии, что верна гипотеза Но, я 25 математическое ожидание этого распределения равно 10. Нормирован- Х вЂ” 10 ная статистика критерия У = имеет нормальное распределение ~/4/25 Н(0, 1). 5) альтернативная гипотеза Нг . .т < 10 предполагает уменьшение расхода топлива, следовательно, нужно использовать односторонний критерий. Критическая область определяется неравенством У < и . По таблице П1 находим ко оэ = — ио,ээ = -1,645; 6) выборочное значение нормированной статистики критерия равно и,= ' = — 175; 9,3 — 10 4/25 з 4. Проверка статистических гипотез 251 7) статистическое решение: так как выборочное значение статистики критерия принадлежит критической области, гипотеза Но отклоняется: следует считать, что изменение конструкции двигателя привело к уменьшению расхода топлива.
Граница У, критической области для исходной статистики Х критерия может быть получена из соотношения х, — 10 = -1,645, ~/4/25 откуда получаем х„= 9,342, т.е. критическая область для статистики Х определяется неравенством Х < 9,342. ь Статистическое решение может быть ошибочным. При зтом различают ошибки первого и второго рода. Ошибкой первого рода называется ошибка, состоящая в том, что гипотеза Но отклоняется, в то время как она верна. Вероятность ошибки первого рода равна вероятности попадания статистики критерия в критическую область при условии, что верна гипотеза Не, т.е. равна уровню значимости ео Так в примере 1 вероятность ошибки первого рода равна 0,05. Ошибка вглорого рода происходит в том случае, если гипотеза Но принимается, но в действительности верна альтернативная гипотеза Нм Вероятность ошибки второго рода Д можно вычислить (при простой альтернативной гипотезе Н1) по формуле (2) д = Р [г б 1 1У./Н,].
П р и м е р 2. В условиях примера 1 предположим, что наряду с гипотезой Но. гп = 10 л рассматривается альтернативная гипотеза Нн т = 9 л. В качестве статистики критерия снова возьмем выборочное среднее Х. Предположим, что критическая область задана следующим неравенством Х < 9,44л. Найти вероятности ошибок первого и второго рода для критерия с такой критической областью. а Найдем вероятность ошибки первого рода.
Статистика Х критерия при условии, гто верна гипотеза Но. т = 10, имеет нормальное 'распределение Н(10, ч/4/25). По формуле (1), используя таблицу П1, находим а = Р [Х < 9,44/Но'. гя = 10] = Ф ~ ' ( = /9,44 — 10 ) ~ ь/4/25 ( = Ф ( — 1,4) = 1 — Ф [1,4) 0,08. Это означает, что принятый критерий классифицирует 8% автомобилей, имеющих расход 10 л на 100 км пробега, как автомобили, имеющие меньший расход топлива. Гл. 19. Математическая статистика 252 При условии, что верна гипотеза Н~.
т = 9, статистика Х имеет нормальное распределение Н(9, т/4/25). Вероятность ошибки второго рода по формуле (2) равна Д = Р [Х > 9,44/Нр т = 9] = 1 — Ф ' = 1 — бэ(1,1) 0,136. [ 9,44 — 91 ~ т/4/25 ~ Слеловательно, в соответствии с принятым критерием 13,6% автомобилей, имеющих расход топлива 9л на 100 км пробега, классифипируются 0,4 0,2 Рис.
35 как автомобили, имеющие расход 10л. Вероятности ошибок первого и второго рода показаны в виде заштрихованных областей под кривыми плотностей распределения статистики критерия на рис. 35. > При заданной вероятности сг ошибки первого рода вероятность ошибки второго рода может быть уменьшена путем увеличения объема выборки. Если при этом вероятность ошибки второго рода не должна превышать заданного значения Д, то минимальный объем выборки и можно найти из решения системы; Аналитическое решение этой системы возможно только в простейших случаях. Пример 3.