Лобеева ВКР (1194895), страница 4
Текст из файла (страница 4)
Еще один критерий для анализа наличия погрешностей в выборке – критерий вариационного размаха, принцип работы которого состоит в том, что каждый подозрительный член вариационного ряда проверяют, используя неравенство:
где – среднее арифметическое значение, вычисленное после исключения предполагаемого промаха.
размах вариационного ряда упорядоченной совокупности наблюдений:
критериальное значение, которое зависит от числа членов вариационного ряда, что представлено в таблице 3.4
Таблица 3.4 зависимость критериального значения zот числа членов вариационного ряда
n | 5 | 6 | 7 | 8-9 | 10-11 | 12-15 | 16-22 | 23-25 | 26-63 | 64-150 |
z | 1,7 | 1,6 | 1,5 | 1,4 | 1,3 | 1,2 | 1,1 | 1,0 | 0,9 | 0,8 |
Проверим подозрительные значения для :
Среднее арифметическое выборки с исключением этого значение будет равно
– верно,
что для данного критерия означает не исключение значения из вариационного ряда. Таким образом, тоже остается в выборке.
Проверим подозрительные значения для :
Среднее арифметическое выборки с исключением этого значение будет равно
– верно,
что для данного критерия означает не исключение значения из вариационного ряда. Таким образом, тоже остаются в выборке.
Критерий Шовене применяется для законов, не противоречащих нормальному, и строится на определении числа ожидаемых результатов наблюдений , которые имеют столь же большие погрешности, как и подозрительный. Гипотеза о наличии грубой погрешности принимается, если выполняется условие:
где
а вероятность появления подозрительных результатов в генеральной совокупности определяется из таблицы для интегральной функции нормированного нормального распределения по величине
.
Проверим подозрительные значения для :
Вычисляем квантиль по формуле:
По справочным таблицам определяем вероятность выхода результатов за квантиль :
Тогда ожидаемое число наблюдений с результатом вычислится по формуле:
, то делаем вывод о том, что ошибки в этом результате наблюдения нет.
Проверим подозрительные значения для :
Вычисляем квантиль по формуле:
По таблице Г1 Приложения Г определяем вероятность выхода результатов за квантиль :
Тогда ожидаемое число наблюдений с результатом вычислится по формуле:
, то делаем вывод о том,
что ошибки в этом результате наблюдения нет.
Критерий “правило трех сигм” является одним из простейших для проверки результатов наблюдения. Правило трех сигм звучит так: если случайная величина распределена нормально, то абсолютная величина ее отклонения от математического ожидания не превосходит утроенного среднего квадратического отклонении.
Результат, который удовлетворяет условию , считается имеющим грубую погрешность и удаляется, а ранее вычисленные характеристики распределения уточняются.
Проверим подозрительные значения для :
- не верно,
откуда делаем вывод, что данное значение не содержит грубой ошибки, как и
Проверим подозрительные значения для :
- не верно,
откуда делаем вывод, что данное значение не содержит грубой ошибки, как и
По результату анализа выборки, из нее изымаются значения, не прошедшие проверку по критериям, а потом находят математическое ожидание и среднее квадратическое отклонение для получившейся новой выборки. Но так как большинство критериев показали отсутствие грубой ошибки, то все результаты остаются неисключенными из выборки, и СКО и матожидание для всей выборки остается первоначальным. Проверим данное распределение на нормальность по составному критерию d. При проверке задаются уровнем значимости .
Уровень значимости составного критерия должен удовлетворять условию:
Таблица 3.5 Значения m и P, соответствующие различным n и q
N | M | P при уровне значимости q, равном: | ||
0,01 | 0,02 | 0,05 | ||
1 | 2 | 3 | 4 | 5 |
10 | 1 | 0,98 | 0,98 | 0,96 |
11-14 | 1 | 0,99 | 0,98 | 0,97 |
15-20 | 1 | 0,99 | 0,99 | 0,98 |
21-22 | 2 | 0,98 | 0,97 | 0,96 |
23 | 2 | 0,98 | 0,98 | 0,97 |
23-27 | 2 | 0,98 | 0,98 | 0,97 |
28-32 | 2 | 0,99 | 0,98 | 0,97 |
33-35 | 2 | 0,99 | 0,98 | 0,98 |
36-49 | 2 | 0,99 | 0,99 | 0,98 |
Выберем уровень значимости .
Проверим выполнение первого критерия, для чего определим значение d по формуле:
где - смещенная оценка СКО результата наблюдений, находимая по формуле:
Используя Microsoft Office Excel вычислим значение смещенной оценки: . Откуда
Нулевая гипотеза о принадлежности эмпирического распределения нормальному справедлива, если выполняется условие:
где ,
- квантили распределения
(
).
Из таблицы 3.6.6 находим квантили распределения d после интерполяции:
- верно,
таким образом, гипотеза о нормальности по первому критерию подтверждается.
Таблица 3.6 Квантили распределения статистики d
n | d0.01 | d0.05 | d0.10 | d0.90 | d0.95 | d0.99 |
1 | 2 | 3 | 4 | 5 | 6 | 7 |
11 | 0,9359 | 0,9073 | 0,8899 | 0,7409 | 0,7153 | 0,6675 |
16 | 0,9137 | 0,8884 | 0,8733 | 0,7452 | 0,7236 | 0,6829 |
21 | 0,9001 | 0,8768 | 0,8631 | 0,7495 | 0,7304 | 0,6950 |
26 | 0,8901 | 0,8625 | 0,8570 | 0,7530 | 0,7360 | 0,7040 |
31 | 0,8827 | 0,8625 | 0,8511 | 0,7559 | 0,7404 | 0,7110 |
36 | 0,8769 | 0,8578 | 0,8468 | 0,7583 | 0,7440 | 0,7167 |
41 | 0,8722 | 0,8540 | 0,8436 | 0,7604 | 0,7470 | 0,7216 |
46 | 0,8682 | 0,8508 | 0,8409 | 0,7621 | 0,7496 | 0,7256 |
51 | 0,8648 | 0,8481 | 0,8385 | 0,7636 | 0,7518 | 0,7291 |
Проведем проверку по второму критерию.
Гипотеза о нормальности распределения по второму критерию подтверждается, если не менее m разновидностей превзошли значения
.
Из таблицы 3.6.5 можно определить, что m=2, а P=0,99. Верхняя квантиль нормированного распределения Лапласса, отвечающая
вероятности находится по таблице 3.6.7.
Таблица 3.7 Квантили
Р | 0,90 | 0,95 | 0,96 | 0,97 | 0,98 | 0,99 |
| 1,65 | 1,96 | 2,06 | 2,17 | 2,33 | 2,58 |
Таким образом,