05_3_критерии согласия (Лекции), страница 2
Описание файла
Файл "05_3_критерии согласия " внутри архива находится в следующих папках: Лекции, Матстат 2 конспект. Документ из архива "Лекции", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 4 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Онлайн просмотр документа "05_3_критерии согласия "
Текст 2 страницы из документа "05_3_критерии согласия "
k - число степеней свободы; k = s - 1 - r ; s - число групп (s = 5);
r - число параметров распределения, оцениваемых по выборке ( r = 1).
Находим 2кр(0,05 ; 5-1-1) = 2кр(0,05 ; 3) = 7,8 .
Так как 2набл =4,9501 меньше 2кр = 7,8
то гипотезу о показательном распределении следует принимать.
Пример 2
Задана выборка , полученная для дискретной случайной величины X.
x i | 0 | 1 | 2 | 3 | 4 | 5 | |
n i | 355 | 186 | 59 | 22 | 8 | 3 |
Используя критерий Пирсона проверить гипотезу о том, что случайная величина подчиняется распределению Пуассона ( уровень значимости = 0.05) .
Н
5
еобходимо по формуле Пуассона подсчитать вероятности каждого из значений x i , затем теоретические частоты n i , и сравнить их с n i по критерию Пирсона.В пуассоновском распределении вероятности каждого из возможных значений подсчитываются по формуле Пуассона :
Входящий сюда параметр a совпадает с математическим ожиданием . Поэтому его можно оценить по выборке как выборочную среднюю :
Итак, формулируем гипотезу о виде закона распределения:
H 0 : случайная величина распределена по закону Пуассона с параметром a = 0,6588 .
Находим по формуле Пуассона вероятности p i каждого из значений x i , по ним теоретические частоты n i = p i n. Результаты заносим в таблицу:
x i | 0 | 1 | 2 | 3 | 4 | 5 | |
n i | 355 | 186 | 59 | 22 | 8 | 3 | |
p i | 0,5175 | 0,3409 | 0,1123 | 0,0247 | 0,0041 | 0,0005 | |
n i | 327,58 | 215,79 | 71,09 | 15,64 | 2,60 | 0,32 |
Объединяем малочисленные группы : три последних группы объединяем в одну.
n i | 355 | 186 | 59 | 33 | |
n i | 327,58 | 215,79 | 71,09 | 18,56 |
Подставляем частоты в формулу критерия Пирсона и находим наблюдаемое значение критерия
По таблицам критических точек критерия 2 находим 2кр( k)
= 0,05 - уровень значимости;
k - число степеней свободы: k = s - 1 - r ; s - число групп (s = 4) ;
r - число параметров распределения, оцениваемых по выборке ( r = 1).
Находим 2кр(0,05 ; 4-1-1) = 2кр(0,05 ; 2) = 6,0 .
Так как 2набл = 17,64 больше 2кр = 6,0 то
гипотезу о распределении Пуассона следует отвергнуть.
6
-
КРИТЕРИЙ КОЛМОГОРОВА .
В критерии Пирсона сравниваются теоретические и экспериментальные ряд распределения (для дискретной случайной величины) или плотность распределения (для непрерывной случайной величины).
В критерии Колмогорова сравниваются функции распределения, теоретическая F(x) и эмпирическая (статистическая) F(x) . Если они отклоняются друг от друга незначительно, то гипотезу о виде закона распределения принимаем; если отклонение значительное, то гипотезу отвергаем.
Замечание : при пользовании критерием Колмогорова параметры распределения не оцениваются по выборке, а предполагаются уже известными величинами.
По имеющейся выборке ( x 1 , x 2 , x 3 , . . . x n ) строится эмпирическая функция распределения F(x) . Вы знаете, что в точках x i она имеет скачок , равный относительной частоте w i . Т. е., в каждой экспериментальной точке x i следует брать два значения - предел слева F(xi - 0) и предел справа F(xi + 0).
В этих же экспериментальных точках x i подсчитывается значение теоретической функции распределения F( x i ) по предполагаемой формуле. Понятно, что теоретические и эмпирические значения не совпадают. Если они различаются незначительно, то гипотезу о предполагаемом законе распределения следует принять. Если различие значительно, то гипотезу надо отвергать. В критерии Колмогорова величина, характеризующая различие между F(x) и F(x) - это наибольшая из разностей
i = F(x i) - F(x i)
Наибольшая из этих разностей как раз и служит мерой отклонения между двумя функциями . Если она не превосходит критического значения , n ( ,n) , определяемого по специальным таблицам , то гипотеза принимается. Если превосходит, то отвергается.
7
Пример 3.
Задана выборка.
0,45 | 2,51 | 1,64 | 3,35 | 0,54 | 3,90 | 1,36 | 2,65 | 1,32 | 3,06 |
Используя критерий Колмогорова, проверить гипотезу о том, что это выборка из предлагаемого распределения.
H 0 : равномерное распределение на интервале (0 ; 4)
-
Найдем эмпирическую функцию распределения F(x) .
Для этого сначала запишем вариационный ряд :
0,45 | 0,54 | 1,32 | 1,36 | 1,64 | 2,51 | 2,65 | 3,06 | 3,35 | 3,90 |
Данные не повторяются, поэтому относительная частота каждого из них равна 1/n .
Объем выборки равен 10, значит w i = 0,1 . Так как эмпирическая функция распределения накапливает относительные частоты, то каждый раз при переходе через очередную экспериментальную точку она будет увеличивать на 0,1 .При этом в самой экспериментальной точке она разрывна, происходит скачок на 0,1.
Значение функции в точке разрыва совпадает с пределом слева. Занесем в таблицу значения F(xi) причем будем записывать значения справа и слева от экспериментальной точки, т.е. F(xi-0) и F(xi+0) .
-
Запишем теоретическую функцию распределения F(x) .
Для равномерного распределения она хорошо известна :
( Если задана плотность распределения f(x) то сначала нужно найти функцию распределения по известной формуле .)
Подсчитаем функцию распределения в экспериментальных точках, т.е., F(x i).
Результаты занесем в таблицу.
8
x i | 0,45 | 0,54 | 1,32 | 1,36 | 1,64 | 2,51 | 2,65 | 3,06 | 3,35 | 3,90 |
F(xi) | 0,1125 | 0,1350 | 0,3300 | 0,3400 | 0,4100 | 0,6275 | 0,6625 | 0,7650 | 0,8375 | 0,9750 |
F(xi-0) | 0 | 0,1 | 0,2 | 0,3 | 0,4 | 0,5 | 0,6 | 0,7 | 0,8 | 0,9 |
F(xi+0) | 0,1 | 0,2 | 0,3 | 0,4 | 0,5 | 0,6 | 0,7 | 0,8 | 0,9 | 1,0 |
i | 0,1125 | 0,0650 | 0,1300 | 0,0600 | 0,0900 | 0,1275 | 0,0625 | 0,0650 | 0,0625 | 0,0750 |
Для каждого xi подсчитываем разность между значением теоретической функции распределения F(xi) и значениями эмпирической функции распределения справа и слева от экспериментальной точки, т.е. F(xi-0) и F(xi+0) . Из этих разностей выбираем большую по модулю i и записываем ее в последний ряд таблицы. Затем выбираем наибольшее из чисел i в последней строке, т.е., находим imax = 0,1300 . Этим числом и измеряется отклонение.
Теперь по таблицам критерия Колмогорова находим для n =10 и = 0,05
значение , n = 0,40925 .
Так как отклонение imax = 0,1300 меньше критического , n = 0,40925 ,
то гипотезу о том, что это выборка именно из предполагаемого равномерного распределения, следует принимать.