Гмурман - Теория вероятностей и математическая статистика (969547), страница 59
Текст из файла (страница 59)
Аналогично можно показать, что ~~)', о1 = (а* — а)(12. 338 Приведем свойства выборочного коэффициента корреляции Спирмеиа. С в о й с т в о 1. Если между качественными признаками А и В имеется «полная прямая зависимость» в том смысле, что ранги объектное совпадают при всех значениях г, то выборочный ковффициент ранговой корреляции Спирмена равен единице. Действительно, подставив с(, =х,— у! — — О в (инни), по- лучим Свойство 2. Если между качественными признаками А и В имеется «противоположная зависимость» в том смысле, что рангу х, = 1 соответствует ранг у, = л; рангу х, соответствует ранг у,=л — 1; ...; рангу х„=л соответствует ранг у„=1, то выборочный коэффициент ранговой корреляции Слирмена равен минус единице.
Действительно, й, =1 — л, с(» =3 — п, ..., И„=(2л — 1) — л. Следовательно, Ха!' = (1 — л)»+ (3 — л)'+... + [(2л — 1) — л]' = =[1'+3'+... +(2п — 1)*] — 2л [1+3+... +(2п — 1)]+ + и л'= [л (4па — 1)73] — 2п ла-)-па= (п' — п)!З. Подставив,'~„'й,' = (и' — л)/3 в (инин), окончательно получим р Свойство 3. Если между качесгпвенными признаками А и В нет ни «полной прямой», ни «противоположной» зависимостей, то коэффициенп! Р„заключен между — 1 и + 1, причем чем ближе к нулю его абсолютная величина, тем зависимость меньше. Пример 1. Найти выборочный козффиннент рангоаой корреляции Спармена ио данным ранга объектов аыборкн объема и=10: я!123456 78910 у!6481251037 9 Ре иге ни е. Найдем разности рангон И!=я! — В~.
'— 5, — 2, — 5, 3, 3, 1, — 3, 5, 2, !. Вычислйм сумму квадратов разностей раигои: ~а~~ аВг = 25+ 4+ 25+ 9+ 9+ 1+ 9-1-25+ 4+ 1 = 112. Найдем искомый козффицкент ранговой корреляции, учитывая, что и=10: Рв = 1 — 16 ~~~~ ~бУ(пв — и)] = 1 — ]6 112/(1000 — ! О)] =0 32, Замечание. Если выборка содержит объекты с одинаковым на честном, то каждому из них приписывается ранг, равный среднему арифметическому порядковых номеров объектов. Например, если объекты одинакового качества по признаку А имеют порядковые номера 5 н 6, то их ранги соответственно равны: ха= = (5+6)/2=5,5; х«=5,5.
Приведем правило, позволяющее установить значимость или незначимость ранговой корреляции связи для выборок объема л)9. Если л <9, то пользуются таблицами (см., например, табл. 6.10а, 6.!06 в книге: Вол ьшев Л. Н., Сми рно в Н. В. Таблицы математической статистики. М., «Наука», 1966). Правило. Для того чтобы при уровне значимости и проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции р, Спирмена при конкурирующей гипотезе и,:р,чь0, надо вычислить критическую точку: т =1„,и; Й)~( — ро!( — и, где а — объем выборки, р,— выборочный коэффициент ранговой корреляции Спирмена, („р (сс; й) — критическая точка двусторонней критической области, которуюнаходят по таблице критических точек распределения Стьюдеита, по уровню значимости х и числу степеней свободы)х=п — 2.
Если ] р,] < Т„р — нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками незначима. Если ) Р,] ) Твр — нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь. Пример 2.
При уровне значимости 0,05 проверить, является ли ранговая корреляционная связь, вычисленйая в принере 1, значимойр Ре ше н ие. Найдем критическую точку двусторонней критической'области распределения Стьюдента по уровню значимости с«=0,05 и числу степеней свободы й=л — 2=10 — 2=8 (см, приложение 6): !вр(0,05; 8)=2,3!. Найдем критическую точку.' Т„=г„р(оя А)$ (1 — рв)l(п — 2) ° Подставив !вр —— 2,31, и=10, р =0,24, получим Т„р — — 0,79.
Итак, Т„р — — 0,79, р»=0,24. Так как рв < Т„р — нет оснований отвергнуть нулевую гипотезур ранговая корреляциойиан связь между признаками незначимая, 340 й 26. Выборочный коэффициент ранговой корреляции Кендалла и проверка гипотезы о его значимости Можно оценивать связь между двумя качественными признаками, используя коэффициент ранговой корреляции Кендалла. Пусть ранги объектов выборки объема и (здесь сохранены все обозначения ~ 25): по признаку А х„х„..., х„ по признаку В у„у„..., у„ Допустим, что правее у, имеется Я! рангов, ббльших у,; правее у, имеется Д'» рангов, ббльших у; ...; правее у„ имеется И„! рангов, ббльших у„,. Введем обозначейие суммы рангов Й!(1=-1, 2, ..., и — 1): Р = Р»+Л»+ + й„!. Выборочный коэффициент рангоеой коррешщии Кендалла определяется формулой т» = [4Я/а (а — 1Ц вЂ” 1, ь-! где а — объем выборки, Я=,~, Рп к=! Убедимся, что коэффициент Кендалла имеет те же свойства, что и коэффициент Спирмена.
1. В случае «полной прямой зависимости» признаков х,=1, х,=2, ..., х„=п у,=-1, у,=2, ..., у„=п Правее у, имеется и — 1 рангов, больших у„поэтому Я! =п — 1. Очевидно, что Я,= и — 2, ..., Я„!= 1. Следовательно, Я=(п — 1)+(и — 2)+... +1=а(а — 1)/2. (»») Подставив (»») в (»), получим т,= 1. 2. В случае «противоположной зависимости» х,=1, х,=2; ..., х„=а у,=п, у,=а — 1, ..., у„=1 з«! Правее у, нет рангов, ббльщих у,; поэтому Я,=О. Очевидно, что Из=Из=... =И„,=О. Следовательно, гг =О.
(»»») Подставив (»»») в (»), получим т = — 1. в Замечание. Прн достаточно большом объеме выборки и при значениях коэффициентов ранговой корреляции, не близких к единице, имеет место и р ибл и жени ое равенство рз=(3/2) тв. Пример 1. Найти выборочный коэффициент ранговой корреляции Кендалла по данным рангам объектов выборки объема л=10: по признаку А ...
к! 1 2 3 4 5 6 17 8 9 1О по признаку В ... у/ 6 4 8 1 2 5 10 3 7 9 Решение. Правее р,=б имеется 4 ранга (8, 10, 7, 9), ббльших уь поэтому /7д=4. Аналогично найдем. /7з=5, /7з=2, )7з=б, /7з=б /]а=3 /7г=О, /7з —— 2, /7р — — 1. Счедовательно, сумма рангов /7=28.
Найдем искомый коэффициент ранговой корреляции Кендалла, учитывая, что л=!О' тэ = [4/!/л (и — 1)] — 1 = [4 28/10. 9] — ! = 0,24. Приведем правило, позволяющее установить значимость или незначимость раиговой корреляционной связи Кендалла. Правило. Для того чтобы при уровне значимости ог, проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции т„ Кендалла при конкурирующей гипотезе Н,:т„чьО, надо вычислить критическую точку: -з / 2 (2л + 5) У 9л (и — 1) где и — объем выборки; г„э — критическая точка двусторонней критической областй, которую находят по таблице функции Лапласа по равенству Ф(за ) = (1 — ог)/2. Если ]т,((Т„„— нет оснований отвергнуть нулевую гипотезу.
Ранговая корреляционная связь между качественными признаками незначимая. Если ] т, ] > ҄— нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь. Пример 2. При уровне значимости 0,05 проверить, является лн ранговая корреляционная связь та=0,24, вычисленная в примере 1, значимой) 342 Решен ие.
Найдем критическую точку г„р.' Ф (гар) = (1 — а)/2 = (1 — 0,05)/2 = 0,475 По таблице функции Лапласа (см. приложение 2) находим г„р — — 1,96 Найдем критическую точку: . / 2 (2л + 5) 7 ар=акр )Г 9 Подставив г„р — — 1,9б и о=10, получим Т„р — — 0,487.
В примере ! та=о 24. Так как та < Т„р — нет оснований отвергнуть нулевую гипотезу; раиговая корреляционная связь между признаками иезначимая. $27. Критерий Вилкоксона н проверка гипотезы об однородности двух выборок Критерий Вилкоксона "' служит для проверки однородности двух независимых выборок: х„х„..., х„и у„ у„..., у„,. Достоинство этого критерия состоит в том, что он прйменим к случайным величинам, распределения которых неизвестны; требуется лишь, чтобы величины были непрерывными. Если выборки однородны, то считают, что они извлечены из одной и той же генеральной совокупности и, следовательно, имеют одинаковые, причем неизвестные, непрерывные функции распределения Р,(х) н Р,(х).
Таким образом, нулевая гипотеза состоит в том, что при всех значениях аргумента (обозиачим его через х) функции распределения равны между собой: Р, (х)= Р, (х). Конкурирующими являются следующие гипотезы: Р,(х) ~ Р,(х), Р,(х) < Р, (х) н Р, (х) > Р,(х). Заметим, что принятие конкурирующей гипотезы Н;. Р, (х) < Р, (х) означает, что Х > г. Действительно, неравенство Р, (х) < Р, (х) равносильно неравенству Р(Х < х) < Р(г) < х). Отсюда легко получить, что Р (Х > х) > Р ()'> х). Другими словами, вероятность того, что случайная величина Х превзойдет фиксированное действительное число х, больше, чем вероятность случайной величине г оказаться большей, чем х; в этом смысле Х > ) . Аналогично, если справедлива конкурирукицая гипотеза Н,:Р,(х) > Р,(у), то Х < ) .
"~ В 1945 г. Вилкоксон опубликовал критерий сравнения двух выборок одинакового объема. в 1947 г. Манн и Уитни обобщили критерии иа выборки различного объема. Йалее предполагается, что объем первой выборки меньше (не больше) объема второй: л, ~л,; если это не так, то выборки можно перенумеровать (поменять местами). А.
Проверка нулевой гипотезы в случае, если объем обеих выборок не превосходит 25. Правило 1. Для того чтобы при заданном уровне значимости а=-29 проверить нулевую гипотезу Н,1Р,(х) =Р,(х) об однородности двух независимых выборок объемов й1 и л, (л, (ла) при конку- рирующей гипотезе Н,:Р,(х) ~Ре(х), надо: 1) расположить варианты обеих выборок в возрастаю- щем порядке, т. е. в виде одного в ар и а цио нного ряда, и найти в этом ряду наблюдаемое значение кри- терия Ф'„,з,— сумму порядковых номеров вариант п е р- вой выборки; 2) найти по таблице приложения 1О нижнюю крити- ческую точку гя„„„„рЯ; л„л,), где Д =а72; 3) найти верхнюю критическую точку по формуле говерла. нр (п1+ ла + 1) л1 геннжн.
нр Если Ф «азл е гонима. нр или Ф наел ) гоаерхн. «р — нулевую гипотезу отвергают. Если ге„„„„р <))у„,з, < гп„ржо „вЂ” нет оснований от- вергнуть нулевую гипотезу. Пример 1. При уровне значимости 0,05 проверить нулевую гипо- тезу об однородности двух выборок. объемов л1=6 и л =8: х; 15 23 25 26 28 29 у; !2 14 18 20 22 24 27 30 при конкурирующей гипотезе Не:ге (х) Ф ге (х). Р еще и ке. Расположим варианты обеих выборок в виде одного вариациозиого ряда и переиумеруем их: порядковые номера ...
1 2 3 4 5 6 7 8 У 1О 11 12 78 14 вариаиты ... 12 14 15 18 20 22 23 24 25 26 27 28 29 30 Найдем наблюдаемое зиачеиие критерия Вилкоксопа — сумму по- рядиовых номеров (оии иабравы курсивом) вариант первой выборки: Агнаал = 3+ 7+ 9+ ! О+ 12+ 13 = 54, Найдем по таблице приложеиия 10 иижикко критическую точку, учитывая, что Я=а!2=00572=0 025, л,=б, па=8: юннжн. нр (О 025' 6, 8) = 29. Найдем верхнюю критическую точну: Юиерлн. ар = (л1+ ла + 1 ) ле — щи лжи. ар = (6+ 8+ ! ) -6 — 29 =- 61.