Лобеева ВКР (1194895), страница 3
Текст из файла (страница 3)
Для определения вероятности появления каждого события, нужно сопоставить каждый элемент с частотой его появления
Таблица 3.2 Характеристики распределения для переговоров с пунктом N.
№ п/п | Xi, мин. | mi | Pi | № п/п | Xi, мин. | mi | Pi |
1 | 13 | 1 | 0,0222 | 15 | 30 | 2 | 0,0444 |
2 | 14 | 1 | 0,0222 | 16 | 31 | 3 | 0,0667 |
3 | 15 | 2 | 0,0444 | 17 | 32 | 2 | 0,0444 |
4 | 16 | 1 | 0,0222 | 18 | 33 | 1 | 0,0222 |
5 | 17 | 2 | 0,0444 | 19 | 34 | 1 | 0,0222 |
6 | 18 | 1 | 0,0222 | 20 | 35 | 1 | 0,0222 |
7 | 19 | 1 | 0,0222 | 21 | 37 | 1 | 0,0222 |
8 | 20 | 2 | 0,0444 | 22 | 38 | 2 | 0,0444 |
9 | 24 | 2 | 0,0444 | 23 | 39 | 1 | 0,0222 |
10 | 25 | 1 | 0,0222 | 24 | 42 | 2 | 0,0444 |
11 | 26 | 2 | 0,0444 | 25 | 43 | 1 | 0,0222 |
12 | 27 | 2 | 0,0444 | 26 | 44 | 1 | 0,0222 |
13 | 28 | 4 | 0,0889 | 27 | 46 | 1 | 0,0222 |
14 | 29 | 3 | 0,0667 | 28 | 49 | 1 | 0,0222 |
Сумма | 1299 | 45 | 1 |
Найдем вероятность появления события по формуле:
где удовлетворяет соотношению:
а частоты m1, m2, … mk удовлетворяют соотношению:
Так как в нашей выборке количество повторений одного результата не велико, то не трудно будет рассчитать вероятность для каждого значения частоты при постоянном значении количества событий:
при mi=1,
при mi=2,
при mi=3,
при mi=4.
Результаты вычислений приведены в таблице 3.2.
Следующим шагом будет оценка центра распределения. В качестве оценки центра распределения может выбираться одна из следующих оценок (в зависимости от типа распределения): среднее арифметическое, медиана, центр размаха, срединный размах. При выборе оценок центра распределения следует учитывать, что они имеют различную чувствительность к наличию промахов в обрабатываемой совокупности исходных данных.
В условиях, когда отсутствуют сведения о законе и виде распределения за оценку центра распределения рекомендуется принимать медиану оценок ,
,
,
,
, расположенных в вариационный ряд. Для начала найдем все эти оценки.
Определим среднее арифметическое:
Среднее арифметическое 90% выборки менее чувствительная оценка к погрешностям, поскольку при обработке 90 % объема данных отбрасываются из концов вариационного ряда по 5 % наиболее удаленных результатов, в которых могут содержаться грубые погрешности.
Среднее арифметическое 90% выборки находится по формуле:
МедианойXм называют наблюдаемое значение (так называемую варианту), которая делит вариационный ряд на две части, равные по числу вариант.
Медиана Xм для n – нечетного рассчитывается по формуле:
Срединный размахXR определяют в зависимости от кратности членов ряда. При (n −1), кратном 4, срединный размах находится по формуле:
Для ограниченных распределений (равномерных, треугольных, трапецеидальных и др.) эффективной оценкой центра распределения может служить центр размаха вариационного ряда, вычисляемый по формуле:
где X1, Xn– крайние значения вариационного ряда.
Однако эта оценка очень чувствительна к результатам с грубой погрешностью, так как она определяется по наиболее удаленным от центра распределения результатам наблюдений, каковыми и являются промахи.
Расположим все полученные оценки распределения ,
,
,
,
в вариационный ряд.
28,7032 | 28,8667 | 29 | 29 | 31 |
Центр распределения будет соответствовать медиане данного вариационного ряда. Отсюда следует, что за оценку центра распределения для данной выборки (переговоры пунктом N) принимаем значение серединного размаха и медианы, так как эта оценка занимает медианное положение в ряду оценок:
Среднее квадратическое отклонение наиболее распространенный и точный показатель рассеивания случайной величины относительно ее центра распределения. СКО при обработке результатов измерений может быть вычислено по формуле:
.
Таким образом, СКО для распределения времени разговоров с пунктом N, рассчитанное с использованием программы Microsoft Office Excel, будет составлять:
Аналогично произведем расчет СКО для найденного центра распределения:
Следующим шагом будет исключение из выборки тех результатов, вероятность возникновения которых настолько мала, что их присутствие в выборке можно не учитывать при ее анализе. Результаты будут исключены, если по большинству критериев они будут признаны ошибочными.
По критерию Романовского, гипотеза о наличии грубых погрешностей в подозрительных результатах подтверждается, если выполняется неравенство:
где - квантиль распределения Стьюдента при заданной доверительной вероятности с числом степеней свободы
где
- число подозрительных результатов наблюдени.
Фрагмент квантилей для распределения Стьюдента представлен в таблице 3.3.
Таблица 3.3 критерий Стьюдента (квантили для критерия
Число степеней свободы k | ||||||||||||||
Довери-тельная вероят-ность p | 3 | 4 | 5 | 6 | 8 | 10 | 12 | 18 | 22 | 30 | 40 | 60 | 20 | 8 |
0,90 | 2,35 | 2,13 | 2,01 | 1,94 | 1,86 | 1,81 | 1,78 | 1,73 | 1,72 | 1,70 | 1,68 | 1,67 | 1,66 | 1,64 |
0,95 | 3,18 | 2,78 | 2,57 | 2,45 | 2,31 | 2,23 | 2,18 | 2,10 | 2,07 | 2,04 | 2,02 | 2,00 | 1,98 | 1,96 |
0,99 | 5,84 | 4,60 | 4,03 | 3,71 | 3,36 | 3,17 | 3,06 | 2,98 | 2,82 | 2,75 | 2,70 | 2,86 | 2,62 | 2,58 |
Подозрительными для нашей выборки считаются результаты: 13, 14, 44, 46, 49. Таким образом, число степеней свободы будет равно:
Для выбранной доверительной вероятности в 0,95 квантиль Стьюдента будет равен 2,02.
Проверим подозрительные значения для :
- не верно,
откуда следует, что для этого значения гипотеза о наличии грубых ошибок не подтверждается, как и, соответственно для
для :
- верно,
откуда следует, что по критерию Романовского необходимо исключить этот результат из выборки.
для :
– не верно,
откуда следует, что по критерию Романовского попадает в конечную выборку, а, значит и
тоже.