Лобеева ВКР (1194895), страница 5
Текст из файла (страница 5)
Откуда:
– верно.
Таким образом, гипотеза о нормальности данного распределения подтверждается по составному критерию d.
Правило трех сигм утверждает, что с вероятностью в 0,9973 значение нормально распределенной случайной величины лежит в интервале .
Так как нормальность данного распределения подтверждена, то можно утверждать, что фактически каждый разговор с пунктом N будет длиться
Используя аналогичные рассуждения, произведем расчеты и для разговоров с пунктом M.
3. 3 Анализ данных по пункту M
Представим выборку в виде вариационного ряда (x1 ≤ x2 ≤ ... ≤ xn ).
Таблица 3. 8 Характеристики распределения для переговоров с пунктом M
№ п/п | Xi, мин | mi | Pi |
1 | 18 | 1 | 0,0625 |
2 | 19 | 2 | 0,125 |
3 | 20 | 2 | 0,125 |
4 | 21 | 2 | 0,125 |
5 | 22 | 3 | 0,1875 |
6 | 23 | 1 | 0,0625 |
7 | 24 | 2 | 0,125 |
8 | 25 | 1 | 0,0625 |
9 | 27 | 1 | 0,0625 |
10 | 28 | 1 | 0,0625 |
Сумма | 355 | 16 | 1 |
Найдем вероятность появления каждого события по формуле:
при mi=1,
при mi=2,
при mi=3,
Результаты вычислений приведены в таблице 3.6.8
Найдем оценки центра распределения.
Определим среднее арифметическое:
Среднее арифметическое 90% выборки находится по формуле:
Медиана Xм для n –четного рассчитывается по формуле:
Срединный размахXR определяют в зависимости от кратности членов ряда.
При n , кратном 4 находится по формуле:
Центр размаха вариационного ряда вычисляется по формуле:
где X1, Xn– крайние значения вариационного ряда.
Расположим все полученные оценки распределения ,
,
,
,
в вариационный ряд.
22 | 22 | 22,0714 | 22,1875 | 23 |
Центр распределения будет соответствовать медиане данного вариационного ряда.Отсюда следует, что за оценку центра распределения для данной выборки (переговоры с пунктом M) принимаем значение среднего арифметического 90 процентов выборки, так как эта оценка занимает медианное положение в ряду оценок:
Среднее квадратическое отклонение при обработке результатов измерений может быть вычислено по формуле с использованием программы Microsoft Office Excel:
Аналогично произведем расчет СКО для найденного центра распределения:
Следующим шагом будет исключение из выборки тех результатов, вероятность возникновения которых настолько мала, что их присутствие в выборке можно не учитывать при ее анализе.
По критерию Романовского, гипотеза о наличии грубых погрешностей в подозрительных результатах подтверждается, если выполняется неравенство:
Подозрительными для нашей выборки считаются результаты: 18, 27, 28. Таким образом, число степеней свободы будет равно:
Для выбранной доверительной вероятности в 0,95 квантиль Стьюдента находится по таблице 2.6.3, и будет равен 2,17.
Проверим подозрительные значения для :
- не верно,
откуда следует, что для этого значения гипотеза о наличии грубых ошибок не подтверждается
Для :
– не верно,
откуда следует, что для этого значения гипотеза о наличии грубых ошибок не подтверждается, как и для
Еще один критерий для анализа наличия погрешностей в выборке – критерий вариационного размаха, где каждый подозрительный член вариационного ряда проверяют, используя неравенство:
где – среднее арифметическое значение, вычисленное после исключения предполагаемого промаха.
размах вариационного ряда упорядоченной совокупности наблюдений:
критериальное значение, которое зависит от числа членов вариационного ряда, что представлено в таблице 3.6.4
Проверим подозрительные значения для :
Среднее арифметическое выборки с исключением этого значение будет равно
– верно,
что для данного критерия означает неисключение значения из вариационного ряда.
Для :
Среднее арифметическое выборки с исключением этого значение будет равно
– верно,
что для данного критерия означает неисключение значения из вариационного ряда, как и .
Критерий Шовене. Гипотеза о наличии грубой погрешности принимается, если выполняется условие:
где а вероятность появления подозрительных результатов в генеральной совокупности
определяется из таблицы для интегральной функции нормированного нормального распределения по величине
.
Проверим подозрительные значения:
для :
Вычисляем квантиль по формуле:
По таблице Г1 Приложения Г определяем вероятность выхода
результатов за квантиль :
Тогда ожидаемое число наблюдений с результатом вычислится по формуле:
, то делаем вывод о том,
что ошибки в этом результате наблюдения нет.
для :
Вычисляем квантиль по формуле:
По таблице Г1 Приложения Г определяем вероятность выхода
результатов за квантиль :
Тогда ожидаемое число наблюдений с результатом вычислится по формуле:
, то делаем вывод о том,
что ошибки в этом результате наблюдения нет.
Критерий “правило трех сигм” является одним из простейших для проверки результатов наблюдения. Результат, который удовлетворяет условию , считается имеющим грубую погрешность и удаляется, а ранее вычисленные характеристики распределения уточняются.
Проверим подозрительные значения для :
- не верно,
откуда делаем вывод, что данное значение не содержит грубой ошибки
Проверим подозрительные значения для :
- не верно,
откуда делаем вывод, что данное значение не содержит грубой ошибки, как и
Так как все показали отсутствие грубой ошибки, то все результаты остаются не исключенными из выборки, а, значит, СКО и оценка центра распределения не нуждаются в уточнении.
Проверим данное распределение на нормальность по составному критерию d. При проверке задаются уровнем значимости . Уровень значимости составного критерия должен удовлетворять условию:
Выберем уровень значимости .
Проверим выполнение первого критерия, для чего определим значение d по формуле:
где - смещенная оценка СКО результата наблюдений, находимая по формуле:
Используя Microsoft Office Excel вычислим значение смещенной оценки: . Откуда
Нулевая гипотеза о принадлежности эмпирического распределения нормальному справедлива, если выполняется условие:
где ,
- квантили распределения
(
).
Из таблицы 3.6 находим квантили распределения d после интерполяции:
- верно,
таким образом, гипотеза о нормальности по первому критерию подтверждается.
Проведем проверку по второму критерию.
Гипотеза о нормальности распределения по второму критерию подтверждается, если не менее m разновидностей превзошли значения
.
Можно определить, что m=2, аP=0,99. Верхняя квантиль нормированного распределения Лапласса , отвечающая вероятности
. Таким образом,
Откуда:
– верно.
Таким образом, гипотеза о нормальности данного распределения подтверждается по составному критерию d. Правило трех сигм утверждает, что с вероятностью в 0,9973 значение нормально распределенной случайной величины лежит в интервале . Так как нормальность данного распределения подтверждена, то можно утверждать, что фактически каждый разговор с пунктом M будет длиться
Проанализировав результаты выборок за год, вернемся к первоначальной задаче – определению необходимого объема памяти для записи разговоров.
Из полученных характеристик распределения можно узнать количество минут разговоров в год. Каждый из разговоров с пунктом N будет длиться . Исходя из нормальности данного распределения, за разовое время разговора можно взять его оценку центра распределения(29 минут), но, тогда будет существовать небольшая возможность того, что объема памяти, рассчитанного по данному значению, может не хватить. Поэтому для расчетов имеет смысл за разовое время разговора взять максимальное количество минут:
. Откуда суммарное время разговоров в год для пункта N: