Инструкция к № 4(проверка гипотез) (1120102)
Текст из файла
ИНСТРУКЦИЯ К ВЫПОЛНЕНИЮ ЗАДАЧИ № 4
СТАТИСТИЧЕСКАЯ Проверка
СТАТИСТИЧЕСКИХ гипотез
Введение
1.Статистической гипотезой называется гипотеза (предположение)
о виде закона распределения или о параметрах распределения.
В задаче № 4 проверяются гипотезы о параметрах распределения. Гипотезы о виде закона распределения проверяются в задачах № 5,6,7.
Выдвигаемая гипотеза , которую предстоит проверять , называется нулевой гипотезой и обозначается H 0 .
Гипотеза , которая противоречит H 0 , называется альтернативной или конкурирующей и обозначается H 1.
Источником информации при проверке любой гипотезы является только выборка { x 1 , x 2 , x 3 , . . . , x n } и больше ничего. Схема такой проверки состоит в следующем : по значениям x i подсчитывается некоторое число K, которое называется критерием и по величине этого числа судят от том, принимать эту гипотезу или не принимать . Так как числа x i случайны, то и критерий K - тоже случайная величина .
При некоторых значениях критерия гипотезу принимают, при некоторых отвергают. Все значения K, при которых гипотезу принимают, образуют область принятия гипотезы. Все значения K, при которых гипотезу не принимают, образуют критическую область. Точки, отделяющие одну область от другой - это критические точки K кр .
В зависимости от решаемой задачи критическая область может быть двусторонней, правосторонней или левосторонней. В соответствии с этим критических точек может быть две или одна .
Проверяется любая гипотеза по вошедшим в выборку случайным значениям x i . При этом возможны ошибки.
Если гипотеза H 0 верна, а мы ее отвергли, так как подсчитанное по выборке значение критерия (его называют Kнаблюдаемое ) попало в критическую область, то это ошибка первого рода. Вероятность ее обозначается и называется уровень значимости. Желательно, чтобы она была как можно меньше .
Если гипотеза H 0 неверна, а мы ее приняли, так как Kнаблюдаемое попало в область принятия гипотезы, то это ошибка второго рода. Вероятность ее обозначается .
Если известен закон распределения случайной величины K, то по известным правилам можно подсчитать вероятность ее попадания в любую область, в том числе и в критическую область . Приравнивая эту вероятность заданному числу , можно установить связь между и K кр . Для каждого рассматриваемого здесь критерия существуют таблицы, по которым можно найти K кр по заданному . Обычно задают уровень значимости равным 0,01; 0,05; или 0,1.
2.Порядок действий по проверке любой гипотезы :
-
Выбирается критерий, соответствующий данной задаче.
-
По выборке подсчитывается наблюдаемое значение критерия
Kнаблюдаемое;
-
По соответствующим таблицам находим критическое значение критерия K кр , характеризующее критическую область;
-
Если Kнаблюдаемое попало в критическую область, гипотезу отвергаем, если нет - гипотезу H 0 принимаем.
Дальше перечислены некоторые часто встречающиеся гипотезы и записаны критерии, по которым их нужно проверять.
Гипотеза о равенстве дисперсий двух нормальных распределений:
Проведены опыты над двумя случайными величинами X и Y.
Для каждой из них получены выборки :
для X { x 1 , x 2 , x 3 , . . . . , x n } объемом n x
и для Y { y 1 , y 2 , y 3 , . . . . , y m } объемом n y .
По выборкам найдены исправленные выборочные дисперсии
, служащие нам для оценки теоретической дисперсии. Они отличаются друг от друга, но не очень значительно. Выдвигается гипотеза о том, что на самом деле дисперсии D x и D y равны друг другу, а различие между
вызвано случайностью, оно как говорят в статистике, «незначимо » . Т.е., проверяется гипотеза о равенстве дисперсий :
ъ
Порядок проверки гипотезы :
1) Подсчитываем Fнаблюдаемое по найденным по выборке
.
-
По таблицам критических точек распределения Фишера находим :
Fкр = F( ; k 1 ; k 2 ).
k 1 = n большее -1 - число степеней свободы большей дисперсии.
k 2 = n меньшее -1 - число степеней свободы меньшей дисперсии.
( n большее - объем той выборки, у которой дисперсия S 2 больше )
-
Если Fнабл< Fкр то гипотезу о равенстве дисперсий можно принимать,
(различие между
незначимо, оно может быть объяснено случайностью );
Если Fнабл> Fкр то гипотезу о равенстве дисперсий принимать нельзя, (различие между
слишком значительно, чтобы его можно было объяснить случайными причинами) .
Гипотеза о равенстве дисперсии предполагаемому значению:
Предполагается, что истинное значение дисперсии нормальной случайной величины X равно D 0. Для проверки получена выборка объемом n x и по ней найдена исправленная выборочная дисперсия
, служащая для оценки теоретической дисперсии. Величина
отличается от D 0 . Требуется проверить, значимо это отличие или же оно вызвано случайностью.
Порядок проверки гипотезы :
1) Подсчитываем 2наблюдаемое по найденному по выборке
.
-
По таблицам критических точек распределения 2 находим :
2 кр = 2 кр( ; k ).
k - число степеней свободы; k = n - 1;
-
Если 2набл < 2кр то гипотезу можно принимать,
(различие между
незначимо, оно может быть объяснено случайностью );
Если 2набл> 2кр то гипотезу принимать нельзя,
(различие между
слишком значительно) .
Второй случай альтернативной гипотезы:
При такой альтернативной гипотезе критическая область двусторонняя. Нужно искать по таблицам две критические точки : левую и правую.
( 2 кр )лев = 2 кр( 1-/2 ; k ). ( 2 кр )прав = 2 кр( /2 ; k ).
Если наблюдаемое значение критерия лежит между критическими точками , т.е. ( 2 кр )лев < 2набл <( 2 кр )прав , то гипотезу можно принимать.
Если 2набл выходит за эти пределы, т.е. 2набл < ( 2 кр )лев или 2набл >( 2 кр )прав , то гипотезу нужно отвергать .
Третий случай альтернативной гипотезы:
Здесь критическая область левосторонняя. По таблицам ищут левую критическую точку .
( 2 кр )лев = 2 кр( 1-; k ).
Если наблюдаемое значение критерия окажется больше критического , т.е. ( 2 кр )лев < 2набл, то гипотезу можно принимать.
Если 2набл меньше критического значения, т.е. 2набл < ( 2 кр )лев, то гипотезу следует отвергнуть.
Гипотеза о равенстве нескольких дисперсий:
(об однородности дисперсий)
Для нескольких случайных величин X 1 , X 2 , . . . , X m получены выборки и по ним найдены исправленные выборочные дисперсии
, Они отличаются друг от друга, но не очень значительно. Выдвигается гипотеза о том, что на самом деле все дисперсии D 1 , D 2 , D 3 , . . . D m , равны друг другу, а различие между ними вызвано случайностью, оно незначимо.
Т.е., проверяется гипотеза об однородности дисперсий :
1 случай. Все выборки имеют одинаковый объем n .
Гипотеза проверяется по критерию Кочрена :
Порядок проверки гипотезы :
1) Подсчитываем G наблюдаемое .
-
По таблицам критических точек распределения Кочрена находим :
G кр ( ; k ; m ).
Здесь k = n - 1 - число степеней свободы; m - количество выборок.
-
Сравниваем наблюдаемое значение с критическим :
Если G набл < G кр то гипотезу можно принимать,
(различие между
незначимо, оно может быть объяснено случайностью );
Если G набл > G кр то гипотезу принимать нельзя,
(различие между выборочными дисперсиями слишком значительно) .
2 случай. Выборки имеют различные объемы:
n 1 , n 2 , n 3 , . . . n L .
Гипотеза проверяется по критерию Бартлета :
Проверяется такая гипотеза с помощью критерия Стьюдента :
Для того, чтобы можно было пользоваться критерием Стьюдента, дисперсии нормальных распределений должны быть равны. Сформулируем гипотезу о равенстве дисперсий
и проверим ее по критерию Фишера :
-
По таблицам критических точек распределения Фишера находим :
Fкр = F(0,05; 8, 9)= 3,23.
3) Так как Fнабл > Fкр , гипотезу о равенстве дисперсий принять нельзя, и значит нельзя пользоваться критерием Стьюдента. Другого критерия (при различных дисперсиях) нет.
Для того, чтобы прогнозировать поведение случайной величины,
нам нужно знать ее закон распределения: ряд распределения, функцию распределения F(x) или плотность распределения f(x). В некоторых случаях вид закона распределения предсказывает теория ( см. содержание первой контрольной работы). Другой путь получения закона распределения - проведение и обработка эксперимента над случайной величиной X.
Проводится n экспериментов над случайной величиной X. В каждом из них случайная величина принимает какое-то из своих возможных значений. В результате получаем n чисел { x 1 , x 2 , x 3 , . . . , x n }. Каждое число называется «варианта », все они вместе образуют «выборку » , n - «объем выборки » .
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.














