Гмурман - Теория вероятностей и математическая статистика (969547), страница 48
Текст из файла (страница 48)
Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределенияя. Возможны и другие гипотезы: о равенстве параметров двух или нескольких распределений, о независимости выборок и многие другие. Статистической называют гипптезу о виде неизвестного распределения, или о параметрах известных распределений. , Например, статистическими являются гипотезы: 1) генеральная совокупность распределена по закону Пуассона; 2) дисперсии двух нормальных совокупностей равны между собой. В первой гипотезе сделано предположение о виде неизвестного распределения, во второй — о параметрах двух известных распределений.
Гипотеза «на Марсе есть жизнь» не является статистической, поскольку в ней не идет речь ни о виде, ни о параметрах распределения. Наряду с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречащая гипотеза.По этой причине эти гипотезы целесообразно различать. Нулевой 1осноеной) называют выдвинутую гипотезу Н,. 2В! Конкурирующей (альтернативной) называют гипотезу Н„ которая противоречит нулевой. Например, если нулевая гипотеза состоит в предположении, что математическое ожидание а нормального распределения равно 10, то конкурирующая гипотеза, в частности, может состоять в предположении, что а „-ь 10.
Коротко это записывают так: Н,:а= !О; Н,:а чь 10. Различают гипотезы, которые содержат только одно и более одного предположений. Простой называют гипотезу, содержащую только одно предположение. Например, если Л вЂ” параметр показательного распределения, то гипотеза Н,:Л=5 — простая. Гипотеза Н,: математическое ожидание нормального распределения равно 3 (а известно) — простая. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.
Например, сложная гипотеза Н:Л > 5 состоит из бесчисленного множества простых вида Н;:Л =Ь;, где Ь,— любое число, большее 5. Гипотеза Н;. математическое ожидание нормального распределения равно 3 (онеизвестно) †сложн. $2, Ошибки первого и второго рода Выдвинутая гипотеза может быть правильной нли неправильной, поэтому возникает необходимость ее проверки. Поскольку проверку производят статистическими методами, ее называют статистической.
В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т. е. могут быть допущены ошибки двух родов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Подчеркнем, что последствия этих ошибок могут оказаться весьма различными. Например, если отвергнуто правильное решение, «продолжать строительство жилого дома», то эта ошибка первого рода повлечет материальный ущерб; если же принято неправильное решение «продолжать строительство», несмотря на опасность обвала стройки, то зта ошибка второго рода может повлечь гибель людей. Можно привести примеры, когда ошибка первого рода влечет более тяжелые последствия, чем ошибка второго рода. 262 3 а меча н не 1.
Правильное решение может быть принято также в двух случаях: 1) гипотеза принимается, причем и в действвтельностн она правильная; 2) гипотеза отвергается, причем ы в действительносты она неверна. Замечание 2. Вероятность совершить ошибку первого рода прнкято обозначать через ол ее называют кроен«л значимосии. Йаыболее часто уровень аначимосты прннымают равным 0.05 ылн 0,0!.
Если, напрымер, прынат уровень значимости, равный 0,05, то зто означает, что в йяти случаях из ста имеется риск допустйть ошыбку первого рода (отвергнуть правыльную гыпотезу). й 3. Статистический критерий проверки нулевой гипотезы. Наблюдаемое значение критерия Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Эгу величину обозначают через с) или У., если она распределена нормально, Р или и' — по закону фишера — Снедекора, Т вЂ” по закону Стьюдента, у' — по закону «хи квадрата и т.
д. Поскольку в этом параграфе вид распределения во внимание приниматься не будет, обозначим эту величину в целях общности через К. Статистическим критерием (или просто критерием) называют случайную величину К, которая служит для проверки нулевой гипотезы.
Например, если проверяют гипотезу о равенстве дисперсий двух нормальных генеральных совокупностей, то в качестве критерия К принимают отношение исправленных выборочных дисперсий: Р з,'/зза. Эта.величина случайная, потому что в различных опытах дисперсии принимают различные, наперед неизвестные значения, и распределена по закону Фишера — Снедекора. Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия.
Наблюдаемым значением К„,а, называют значение критерия, вычисленное по выборкам. Например, если подиум выборкам найдены исправленные выборочные дисперсии зх = 20 и зз« =5, то наблюдаемое значение критерия Р Ра«аа —— з,*(4 = 20/5 = 4. й 4. Критическая область. Область принятия гипотезы. Критические точки к„р о к„ ркс. зз После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая — при которых она принимается. Критической областью называют совокупность значений критерия, при которых а) я нулевую гипотезу отвергают.
Фв Областью принятия гипотезы (областью допустимых и о значений) называют совокупность значений критерия, прн которых гипотезу принимают. Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области — гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы — гипотезу принимают. Поскольку критерий К вЂ одномерн случайная величина, все ее возможные значения принадлежат некоторому интервалу.
Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют. Критическими точками (границами) й„называют точки, отделяющие критическую область от области принятия гипотезы. Различают одностороннюю (правосторовнюю или лево- стороннюю) и двустороннюю критические области. Правосторонней называют критическую область, определяемую неравенством К ) Й„э, где Й„э — положительное число (рнс. 23, а). Левосторонней называют критическую область, определяемую неравенством К й„р, где й„р — отрицательное число (рис.
23,б). Односторонней называют правостороннюю или лево- стороннюю критическую область. Двусторонней называют критическую область, определяемую неравенствами К < й„К ) й„где й, ) й,. В частности, если критические точки симметричны 28ч относительно нуля, двусторонняя критическая область определяется неравенствами (в предположении, что Й„>0): К ( — Й „К > Й„р, или равносильным неравенством (К ~> >Й„(рис.
23, в). $5. Отыскание правостороиней критической области Как найти критическую область? Обоснованный ответ на этот вопрос требует привлечения довольно слож. ной теории. Ограничимся ее элементами. Для определенности начнем с нахождения правосторонней критической области, которая определяется неравенством К > Йею где Й„ > О. Видим, что для отыскания правосторонней кри'тической области достаточно найти критическую точку. Следовательно, возникает новый вопрос: как ее найти? Для ее нахождения задаются достаточной малой вероятностью †уровн значимости а.
Затем ищут критическую точку Й„р, исходя из требования, чтобы при условии справедливости нулевой гипотезы вероятность того, что критерий К примет значение, большее Йею была равна принятому уровню значимости: Р (К > Й, ) = а. Для каждого критерия имеются соответствующиетаблицы, по которым и находят критическую точку, удовлетворяющую этому требованию.
3 а ме ч а н не 1. Когда критическая точка уже найдена, вычисляют по данным выборок наблюденное значение критерия и, если окажется, что А„,ал ) й„р, то нулевую гипотезу отвергают; если же Казал < Йкю то йет оснований, чтобы отвергнуть нулевую гипотезу. П о я с н е н и е. Почему правосторонняя критическая область была определена исходя из требования, чтобы прн справедливости нулевой гипотезы выполнялось соотношение Р (К > Й„) = са? Поскольку вероятность события К > Й, мала (а — малая вероятность), такое событие при справедливости нулевой гипотезы, в силу принципа практической невозможности маловероятных событий, в единичном испытании не должно наступить (см. гл.
11, $ 4). Если все же оно произошло, т. е. наблюдаемое значение критерия оказалось больше Й„,, то это можно объяснить тем, что нулевая гипотеза ложна и, следовательно, должна быть отвергнута. Таким образом, требование (в) определяет такие значения критерия, при которых нулевая гипотеза отвергается, а они и составляют правостороннюю критическую область. 3 а и е ч а н и е 2. Наблюдаеиое значаняе критерия может оказаться большим й„, не потому, что нулевая гипотеза ложна, а по другим причинам (малый объем выборки, недостатки методики эксперимента и др.). В этом саучае, отвергнув правильную нулевую гипотезу, совершают ошибку первого рада. Вероятность этой ошибки равна уровню значимости а.