В.Д. Мятлев, Л.А. Панченко, А.Т. Терехин - Основы математической статистики (1118816), страница 5
Текст из файла (страница 5)
Проверка гипотезы о равенстве заданномуматематического ожидания нормально распределеннойчислуслучайной величины с известной дисперсией,и, и пусть имеетсяИтак, пустьобъема n.выборка х1, х2, ..., хп значений случайной величиныПредположим, что H0 верна и выберем в качестве статистики критериястандартизованное выборочное среднееПри верной H0 статистика u имеет стандартное нормальноераспределение,, представленное на рис.
4. На этом рисунке такжеуказана критическая область уровня, состоящая из двух бесконечныхполуинтервалови, вероятность попадания в каждый изкоторых статистики u равна.26Рис. 4. Пример критической области.Имеются формализованные подходы к выбору статистик критериев ипостроению критических областей, приводящие к наиболее мощнымкритериям, но мы их здесь не рассматриваем.
Неформальное же правилосостоит в том, чтобы выбирать в качестве статистики величину,характеризующую степень отклонения от нулевой гипотезы. Очевидно,разностьудовлетворяет этому условию, а деление на константу,сохраняя это качество, приводит к величине u с полностью заданнымраспределением, что позволяет выбрать критическую область с требуемымуровнем значимости. Неформальное правило выбора критической областисостоит в том, чтобы она включала значения статистики, соответствующиенаибольшим отклонениям от нулевой гипотезы - на рис.
4 эта рекомендациясоблюдена.До сих пор мы говорили о свойствах критерия в предположении, чтоверна гипотеза H0. А что происходит, когда верна альтернативная гипотезаH1? В этом случае распределение статистики критерия u изменится. Чтобыего найти, произведем преобразованиеиз которого следует, что при гипотезе H1 распределение статистики uотличается от стандартного нормального сдвигом на величинупри выполнении H1.27, т.е.На рис.статистики u5 взаимное расположение плотностей распределенияпри гипотезах H0 и H1 показано для случаяи n=1.
Вероятности ошибки 2-го родасоответствует площадь под кривой функции плотности при H1 напромежутке от –1.96 до 1.96, где не отвергается гипотеза H0, а следовательно,ошибочно не принимается гипотеза H1. В данном случае ошибка 2-го рода,, довольно велика. Это произошло, главным образом, потому, чтомал объем выборки - имеется всего одно наблюдение, n=1. При увеличении nраспределение, соответствующее альтернативной гипотезе H1, будетбудет увеличиваться, чтосдвигаться вправо, поскольку величинаприведет, как легко понять по рис.
5, к уменьшению ошибки . Очевидносоответствует большаятакже, что большей величине разностивеличина , и следовательно меньшая ошибка 2-го рода. Ошибка 2-го роданаблюдаемой случайнойуменьшается также при уменьшении дисперсиивеличины. Кроме того уменьшается при увеличении , однако не принятобольше 0.05. При уменьшенииошибка, напротив, растет,братьпоэтому не следует брать слишком малым, если число наблюдений n мало,разность между иневелика, а дисперсия- большая.Рис. 5. Взаимосвязь между ошибками 1-го и 2-го рода придвусторонней альтернативе.Содержательно, ошибка 1-го рода - это ошибка ложного обнаружениянесуществующего отклонения от нулевой гипотезы (ложного обнаружения28несуществующего эффекта). Ошибка же 2-го рода - это ошибка ложногонеобнаружения существующего отклонения от нулевой гипотезы (ложногонеобнаружения существующего эффекта).
Мощность критерия - это егоспособность обнаружить имеющееся отклонение от нулевой гипотезы.В приведенном примере мы предполагали, что альтернативной,гипотезе H1 соответствует вполне определенное распределениечто позволило нам найти конкретное значение ошибки 2-го рода. Такого родаальтернативные гипотезы называются простыми альтернативами. Однакона практике чаще встречается ситуация, когда конкретной нулевой гипотезепротивопоставляется целый спектр альтернатив. Например,или.
Такого рода альтернативные гипотезы называютсясложными альтернативами. В случае сложной альтернативной гипотезымы не можем определить величину ошибки второго рода. Например, врассматриваемой ситуации она может быть значительной даже при оченьимало. Поэтому вбольшом числе наблюдений если различие междуситуации, когда статистика критерия не попадает в критическую область, неутверждают категорично, что "нулевая гипотеза принимается", аформулируют вывод более осторожно: " нулевая гипотеза не отвергается".Тем самым подчеркивается, что хотя мы и не обнаружили отклонения отнулевой гипотезы, мы могли его при верной H1 ошибочно не обнаружить свероятностью, которую мы не знаем и которая, возможно, довольнодействительно велика, то утверждениезначительна.
Если же ошибка"нулевая гипотеза принимается" не представляет большой ценности.Например, положив равной нулю ошибку 1-го рода, мы, независимо отрезультатов наблюдений, всегда будем принимать гипотезу H0, посколькукритическая область будет включать всю область определения статистикикритерия. Однако при этом ошибка 2-го рода будет равна единице, т.е. еслидаже отклонение от нулевой гипотезы имеется, то мы его с вероятностьюединица не обнаружим.Сложные альтернативы могут быть двусторонними () иодносторонними (или).
Если имеется достовернаяинформация о направлении отклонения от нулевой гипотезы, тоиспользованиеодностороннейальтернативыпредпочтительнеедвусторонней, поскольку это повышает мощность критерия. Если, например,известно,чтоотклонениематематическогоожиданияотгипотетического значенияможет произойти только в большую сторону,то в качестве альтернативы следует взять гипотезу. Критическаяобласть уровняв этом случае будет состоять не из двух бесконечныхполуинтервалови, из одного .29Рис.
6. Взаимосвязь между ошибками 1-го и 2-го рода приодносторонней альтернативе.На рис. 6 ситуация с односторонней альтернативой представлена дляслучаяи n=1. Вероятности ошибки 2-го родасоответствует площадь под кривой плотности статистики критерия g придо 1.64., чтоусловии, что верна гипотеза H1 на промежутке отменьше, чем для аналогичной двусторонней альтернативы, представленнойна рис. 5 (строго говоря, в ситуации рис. 5 тоже предпочтительнее было быиспользовать альтернативу, поскольку направление отклоненияот нулевой гипотезы было известно).Пример. Известно, что датчик генерирует случайные числа, нормальнораспределенные с дисперсией 1, но есть сомнения в том, что математическоеожидание равно 0.
Требуется проверить гипотезу о равенствематематического ожидания нулю по следующей случайной выборке объемаn=25:0.830 0.177 -0.294 0.471 -0.044 0.635 2.209 -0.394 -0.4041.257 1.137 -0.839 1.668 0.751 0.416 -0.922 1.473 -0.3170.220 0.414 0.428 1.088 -1.130 -0.015 0.142Выборочное среднее равнокритерия получаем, следовательно, для статистики30Значение 1.79 не выходит за двусторонние 5%-ные критическиепределы, поэтому гипотеза не отвергается.На самом деле математическое ожидание датчика было положеноравным 0.25, т.е. отклонение ошибочно не было обнаружено - при проверкегипотезы была сделана ошибка 2-го рода. Очевидно, мощность критерия приданном числе наблюдений n=25, данной разности между гипотетическим ии данной дисперсииистинным математическими ожиданияминедостаточна.В другом эксперименте с этим же датчиком была получена выборказначений объема n=100.
Выборочное среднее оказалось равным, азначение статистики - равным u=2.18, что дало основание отвергнутьнулевую гипотезу.3.3. Проверка гипотезы о равенстве заданномуматематического ожидания нормально распределеннойчислуслучайной величины с неизвестной дисперсией(одновыборочный t-критерий)Аналогично случаю построения доверительного интервала длянеизвестного математического ожидания нормально распределеннойслучайной величины, в случае неизвестной дисперсии мы возьмем в качествестатистики критерия проверки гипотезы о равенстве математическогоожидания заданному числу ту же статистику, что и в случае с известнойдисперсией, но с заменой неизвестного среднеквадратичного отклоненияна его выборочную оценку sСтатистика t имеет t -распределение с n-1 степенями свободы.Соответственно, критическая область для проверки гипотезыпротив двусторонней альтернативыбесконечных полуинтерваловальтернативыбудет состоять из двухи, против односторонней- из одного полуинтервалаодносторонней альтернативыи против- также из одного полуинтервала31, гдеобозначают квантили t-распределения с n-1степенями свободы соответствующего уровня значимости (в силусимметричности t-распределения справедливы равенстваи).Пример.
Рассмотрим пример предыдущего параграфа с 25 случайнымичислами в предположении, что дисперсия неизвестна. В этом случаенеобходимо вычислить оценку среднеквадратичного отклонения, котораяоказывается равной s=0.830. Выборочное значение статистики критерия,соответственно, равноЭто значение должно быть сравнено с 5%-ными двустороннимикритическими пределами, равными. Выборочное значениестатистики выходит за эти пределы, следовательно, гипотеза о равенствематематического ожидания нулю должна быть отвергнута на уровнезначимости 5%.Заметим, что хотя применение t-критерия требует нормальностиисходной случайной величины, он может применяться и при умеренныхотклонениях от нормальности и не слишком малых n.3.4.
Проверка гипотезы о равенстве заданному числу дисперсиинормально распределенной случайной величины(одновыборочный c2-критерий)Для проверки гипотезыо равенстве дисперсиинормально распределенной случайной величинырекомендуется использовать статистикузаданному числуМожно показать, что эта статистика при условии, что верна гипотезаH0, распределена по закону c2 с п-1 степенями свободы.
Критическая областьуровняпри двусторонней альтернативепромежутков:и, где32состоит из двухи- квантили порядкаираспределенияальтернативыс п-1 степенями свободы. Для одностороннейкритическая область имеет видальтернативы- соответственно,, а для.3.5.