Гмурман - Теория вероятностей и математическая статистика (969547), страница 58
Текст из файла (страница 58)
гл. ХЧ!1, $8). 3 а и е ч а н и е 3. Для контроля вычисленйй формулу ("») преобразуют н виду Хй»ба =[~л~~~л!/л»1 — и. 331 Рекомендуем читателю выполнить это преобразование самостоятельно, для чего надо в (еь» возвести в квадрат чвазность частот, сократить реаультат на сц и учесть, что ~~~~о!=л,,~~л1=л. Прпмер. При уровне значимости 0,05 проверить гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические и теоретические частоты: эмп. частоты .....6 ! 3 38 74 106 85 30 !4 теорет. частоты...3 !4 42 82 99 76 37 !3 Р е ш е н и е.
Вычислим уйееа, для чего составим расчетную табл. 26, Контроль: уйеел=7,!9: [~~~и!/лг] — и = 373,19 — 366 = 7,19. Вычнслекия произведены правильно. Найдем число степеней свободы, учитывая, что число групп выборки (число различных вариант) з=8; 8=8 — 3=5. Тяблица 26 По таблице критических точек распределения )(з (см. приложение 5), по уровню аначимостн сс=0,05 и числу степеней свободы 8=5 находим у~э(0,05: 5)=11,1.
Так как уа,ел < Кзр — нет оснований отвергнуть нулевую гипотезу. Другими словами, расхождение эмпирических в теоретических частот незначимое. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности. $24. Методика вычисления теоретических частот нормального распределения Как следует из предыдущего параграфа, сущность критерия согласия Пирсона состоит в сравнении эмпирических и теоретических частот. Ясно, что эмпирические частоты находят из опыта. Как найти теоретические частоты, если предполагается, что генеральная совокупность распределена нормально? Ниже приведен один из способов решения этой задачи.
1. Весь интервал наблюдаемых значений Х (выборки объема а) делят на а частичных интервалов (х„х,+,) одинаковой длины. Находят середины частичных интервалов х~ =(х;+х,+,)?2; в качестве частоты и, варианты х; принимают число вариант, которые попали в (-й интервал. В итоге получают последовательность равноотстоящих вариант и соответствующих им частот: х,'х,...х, и, и, ... и, При этом ч~~„'а,=а.
2. Вычисляют, например методом произведений„выборочную среднюю х и выборочное среднее квадратическое отклонение о'. 3. Нормируют случайную величину Х, т. е. переходят к величине х. =(Х вЂ” х )/о' и вычисляют концы интервалов (го г~+ а): г,=(х,— х')/о, г;+,— — (х,+т — х')/о', причем наименьшее значение Е, т. е. го полагают равным — оо, а наибольшее, т. е. г„полагают равным оо.
4. Вычисляют теоретические вероятности р; попадания Х в интервалы (х,, х,+,) по равенству (Ф(г) — функция Лапласа) ре —— Ф (гее,) — Ф (гс) и, наконец, находят искомые теоретические частоты Пример, Найти теоретические частоты по ааданкому интервальному распределению выборки объема п =200, предполагая, что генеральная совокупность распределена нормально (табл. 27).
Р е ш е н и е К Найдем середины интервалов х =(к~+к~+1)/2. Например, х'=(4+6)/2=5. Поступая аналогично, получим последова- тельиость равноотстоящих вариант л' и соответствующих им частот пу'. с х( 5 7 9 11 13 15 17 19 21 и1 15 26 25 30 26 21 24 20 13 2. Пользуясь методом произведений, найдем выборочную срединно и выборочное среднее квадратическое отклонение: Р= 12 63 ое 4 695 3.
Найдем интервалы ~аб а1+,), учитывая, что ла= 12,63, ое= = 4,695, 17ае=0,213, для чего составим расчетйую табл. 28. Таблица 27 4. Найдем теоретические вероятности л1 и искомые теоретические частоты л'=лрь для чего составим расчетную табл. 29. Таблица 28 Таблнца 29 Искомые теоретнческне частоты помещены в последнем столбце табл. 29.
й 25. Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости Допустим, что объекты генеральной совокупности обладают двумя качественными признаками. Под качеспыенмым подразумевается признак, который невозможно измерить точно, но он позволяет сравнивать объекты между собой и, следовательно, расположить их в порядке убывания или возрастания качества. Для определенности будем всегда р а с пола гать объекты в по рядке ухудшения качеств а. При таком «ранжировании» на первом месте находится объект наилучшего качества по сравнению с остальными; на втором месте окажется объект «хуже» первого, ио «лучше» других, и т. д. Пусть выборка объема а содержит независимые объекты, которые обладают двумя качественными признаками А и В.
Для оценки степени связи признаков вводят, в частности, коэффициенты ранговой корреляции Спирмена (изложен в настоящем параграфе) и Кендалла (см. $ 26). Для практических целей использование ранговой кор- реляции весьма полезно. Например, если установлена высокая ранговая корреляция между двумя качественными признаками изделий, то достаточно контролировать изделия только по одному из признаков, что удешевляет и ускоряет контроль. Расположим сначала объекты выборки в порядке ухудшения качества по признаку А при допущении, что все объекты нмеют ра зличное качество по обоим п р и з и а к а м (случай, когда это допущение не выполняется, рассмотрим ниже).
Припишем объекту, стоящему на 1-м месте, число — ранг хо равный порядковому номеру объекта. Например, ранг объекта, занимающего первое место, х, = 1; объект, расположенный на втором месте, имеет ранг х, = 2, и т. д. В итоге получим последовательность рангов по признаку А: х,=1, х,=2, ..., х„=а. Расположим теперь объекты в порядке убывания качества по признаку В и припишем каждому из иих ранг у„однако (для удобства сравнения рангов) и н де к с 1 при у будет по-прежнему равен порядковому номеру объекта по признаку А.
Например, запись у,=б означает, что по признаку А объект стоит на втором месте, а по признаку  — на пятом. В итоге получим две последовательности рангов: по признаку А ... х„х„..., х„ по признаку В ° ° у» У» - У Заметим, что в первой строке индекс 1 совпадает с порядковым номером объекта, а во второй, вообще говоря, не совпадает. Итак, в общем случае х;эьУ;. Рассмотрим два «крайних случая».
1. Пусть ранги по признакам А и В совпадают при всех значениях индекса 1:х,=У;. В этом случае ухудшение качества по одному признаку влечет ухудшение качества по другому. Очевидно, признаки связаны: имеет место «полная прямая зависимость». 2. Пусть ранги по признакам А и В противоположны в том смысле, что если х,= 1, то у,=п; если х,=2, то у, = и — 1; ..., если х„= а, то у„= 1. В этом случае ухудшение качества по одному признаку влечет улучшение по другому. Очевидно, признаки связаны — имеет место «противоположная зависимость».
На практике чаще будет встречаться промежуточный случай, когда ухудшение качества по одному признаку влечет для некоторых объектов ухудшение, а для других — улучшение качества. Задача состоят в том, чтобы 336 оценить связь между признаками. Для ее решения рассмотрим ранги х„ х„ ...,х„ как возможные значения случайной величины Х, а у„ у„..., у„ †к возможные значения случайной величины У. Таким образом,о связи между качественными признаками А и В можно судить по связи между случайными величинами Х и 1', для оценки которой используем коэффициент корреляции.
Вычислим выборочный коэффициент корреляции случайных величин Х и 1' в условных вариантах (см. гл. ХЧ111, 3 8): ~~~~ ~и~о; ла„л„ («) Таким образом, надо найти ,'Яи,о;, о, и а . Выразим ~э~',и;о; через известные числа — объем выборки и и разности рангов и'; =х; — у;. Заметим, что поскольку средние значения рангов х=(1 + 2 +...
+п)(п и у=(1+2+... +пуп равны между собой, то у — х= О. Используем последнее равенство: Й; = х; — у; = х; — у; + (у — х) = (х — х) — (у; — у) = и; — о;. Следовательно, Учитывая, что (см. далее пояснение) ;Я и;* = ~~~' о,' = (и' — п)(12, (««) 337 э7~0 приняв в качестве условных вариант отклонения и; = = х; — х, о; = у; — у. Каждому рангу х; соответствует только один ранг у;, поэтому частота любой пары рангов с одинаковыми индексами, а следовательно, и любой пары условных вариант с одинаковыми индексами равна единице: п„= 1.
Очевидно, что частота любой пары а ! вариант с разными индексами равна нулю. Учитывая, кроме того, что среднее значение отклонения равно нулю (см. гл. ХЧ1, 3 7, следствие), т. е. и =ц= О, получим более простую формулу вычисления выборочного коэффициента корреляции: имеем ;Я Н,' =,'Я (и; — ог)' = ~~1, 'и,' — 2 ~~~~ ~ир; +,"~; о~ = — 1(ૠ— а)(61 — 2 ~", и р,. Отсюда ~~~, 'ирр —— 1(а' — а)/121 — ~ч~~ й)/2. («««) Остается найти о, и о,. По определению выборочной дисперсии, учитывая, что и=О, и используя (««), получим Р = ~~~~ ~(и — и)'/а = '!~~ и~ (и =- (а' — а)/12а =- (а' — 1)(12.
Отсюда среднее квадратическое отклонение . - ~' ~Р:ТЫ12. Аналогично найдем о, = )/ (а' — 1)/12. Следовательно, ао„о, = (а' — а)/12. Подставив правые части этого равенства и соотношения («««) в («), окончательно получим выборочный «овффициеат рааговой «орреляции Спармена Я где и'; = х; — у,-. Пояснение. Покажем, что,Я~и~=(а* — а)/12. Дей- ствительно, учитывая, что „Я~ х; = 1 + 2+... + а = (1 + а) а(2, х = ~~~~х;/а = (1+ а)/2, ~~~~ ~х,' = 1'+ 2' +... + а* = ~а (а + 1) (2а + 1) ~(б, ,"Е и~с =,'5, '(х~ — х)' = ~~.", х) — 2х,'~~ х;+ а (х)', после элементарных выкладок получим 2, 'и) = (а' а)(12.