XVII Математическая статистика (1081432), страница 27
Текст из файла (страница 27)
223 иг.кр р . с объединенной случайной еыборки Хз, ..., Х, Уз, ..., У„. Можно показать, что Значение Р(я,у„) статистики Р(Х,У„) удобнее вычислять следующим образом. Пусть 5*= 1, лб1 — одно из наблюдений Х; (5.15) О, л(0 — одно нз наблюдений У, 1 ЯУИ ч-~ лу' у 5ь у 1 Ж Ж (5.16) Тогда Р (ззв э уэъ) — щах Сл1 з " . ъ ли) Ж (5.17) Пример 5.4. Пусть Х н У вЂ” непрерывные случайные величины с функциями распределения г'(1) и С(1) соответственно. Даны выборка Уц> с элементами -0,15; 8,60; 5,00; 3,71; 4,29; 7,74; 2,48; 3,25; -1,15; 8,38 я выборка ую с элементами 2,55; 12,07; 0,46; 0,35; 2,69; -0,94; 1,73; 0,73; — 0,35; -0,37.
а Проверим на уровне значимости о = 0,05 гипотезу (5.10) против альтернативной гипотезы (5.11). Выписываем значения объединенного вариационного ряда заданных выборок 0,73; 1,73; 2,48; 5,00; 7,74; 8,38; -1,15; — 0,94; 2,55; 2,69; 8,60; 12,07 — 0,37; -0,35; 0,46; 3,25; 3,71; 4,29; где лб1 — значение случайной величины Я10, 1 = 1, 1Ч. Положим 224 о. ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ и последовательность чисел бч т = 1, 20, 1; 0; 0; 0; 1; 0; 0; 0; 0; 1; 0; 0; 1; 1; 1; 1; 1; 1; 1; О. Вычислив по формуле (5.16) значения величин в, у = 1,20, н подставив их в (5.17), определим, что Р(хнь утв) = 6. В табли-, це кваитилей распределения статистики' Р(Х„„т'„) квантили Рт „— — Рвдв нет, но есть квантиль Ро,в4тв = 6.
Поэтому гипотезу (5.10) следует отклонить в пользу альтернативной гипотезы (5.11) на уровне значимости о = 0,0524. 5.3. Критерии независимости Критерий Спирмена. Пусть имеется случайнал выборка (Хт, ут), ..., (Х„, У„) из генеральной совакупностпи двумерной непрерывной случайной величины (Х, У) с функцией распределення Г(С,г), а Гх(С) и Гу(г) — функции распределения случайных величин Х и У соответственно. Если случайные величины Х и т' имеют нормальные распределения, то для проверки стпатпистпической гипотпезы об их независимости Нв. Г(С,т) = Гх(С) Гу(г) (5.18) можно испольэовать процедуру, связанную с вычислениями выборочного коэффипиенпта корреляции (см.
формулу (6.12) ). Если же о распределениях непрерывных случайных величии Х и У ничего не известно, то для проверки основной гипотпеэы (5.18) при альтпернатпивной гитштпеэе Нт. .Г(С,т) ф Гл(С) Гг(г) для некоторых (С, т) й Кз используют ранговый критерий Спирмена, основанный на следующем понятии. Определение 5.1. Гангом Н,(уи) элементпа г; числовой последоватпельностпи уч = (лт, ..., ги) называют его порядковый номер в вариапионном ряду .т10, ..., г11ор 'См.: Большев Л.Н., Смирнов И.В.
225 Б.З. Критерии иеэаииеиивсти Согласно определению, В;(21и) — это число элементов последовательности лм ..., хм, не больших чем л;, которое можно записать следующим образом: В;(ящ) = 1+ ~ ц(гч — яь), где ц(Ф) — функция Хевисабди Ранг любого элемента последовательности лк — это натуральное число в диапазоне от 1 до Ф, причем ранг наименьшего элемента последовательности равен 1, а ранг наибольшего — № Пример 5.5. Рассмотрим выборку 74=(3,8, 4,7, -2,6, 17,3). Ее вариацпонный ряд имеет вид — 2,6; 3,8; 4,7; 17,3.
Поэтому В1(эе) = 2з В2(24) = 3~ Вз(ле) = 11 В4(яе) = 4. Определение 5.2. Ромном эяементпо У; слуиойноб выборки Я~и = (Ям ..., У~и) называют случайную величину В;(Яр~), реализация которой В;(лк) есть ранг реализации л; случайной величины У; в вариационном ряду э(11, ..., я1к1. Обозначим через В; = В;(Х„) — ранг элемента Х; случайной выборки Хм ..., Х„, а через 5; = 5;(т'„) — ранг элемента У,. случайной выборки Уы ..., У„. Ранеовым ноэффициентпом корреляции Спирмена назовем случайную величину (5.19) где — 1 В=-~~ Вч 226 Б. ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ Спипппсгпика (5.19) является выборочным коэффициентом корреляции последовательностей рангов Вм ..., В„и Яы ..., Я„.
Согласно определению рангов В;, Яо 1 = 1, и, — — 1 ч-~, и+1 В=Я= — ээ 1= —, п~ 2 2=1 п можно показать, что и р(Х.,У„) =1 —, ~~ (В;-Е,)2. (6.29) 1=1 Без ограничения общности можно считать, что значения пар наблюдений (х;, у;), г = 1, и, занумерованы в порядке возрастания их первых элементов, т.е.
так, что выполняются неравенства х1 <х2«...х„. В этом случае реализация г; ранга В; равна 2', 2' = 1, и, и значение р(х„,у„) статистики р(Х„,У„) можно вычислить по формуле п 2 Е 2=1 где г; — реализация ранга 5;, 1 = 1,п. Известно (см. 6.3), что выборочный коэффициент корреляции приспособлен для обнаружения линейной зависимости между случайными величинами Х и У. Если же между Х и У имеется функциональнал, но не линейная зависимость, то выборочный коэффициент корреляции может быть равен нулю.
Примерно так же обстоит дело и с ранговым коэффициентом (5.19), с тем только (впрочем, немаловажным) различием, что он улавливает любую монотонную зависимость, а не только линейную. 5.3. Критерии неэевися»»ости 227 Доказательство этого начнем с исследования статистики р(Х„,У„) при линейной зависимости У = аХ + Ь, а б К, Ь б К, между случайнымн величинами Х и У.
Если а ) О, то ббльшим значениям х; соответствуют ббльшие значения у;, н, наоборот, меньшим значениям х, — меньшие значения у,, 1=1, в. Если пары наблюдений (х;, р;), 1= 1, и, занумерованы по возрастанию первых элементов, то будут иметь место неравенства уз « ... д„. Поэтому г; = л; для всех 1 = 1, и, н нз (5.21) следует, что р(х„, у„) = 1. Если же а < О, то большим значениям х; соответствуют меньшие значения у;, а меньшим значениям х; — ббльшне значения у»ч $ = 1, и. В этОм случае Г» — л»»-»+1» л» = г»»-»+1» 1= 1, и, и р(х„, у„) = -1. Заметим, что если»р(х) — возрастающая функция, то ранг элемента х; в последовательности хм ..., х„равен рангу у(х;) в последовательности»д(х~), ..., »р(х„).
Поэтому если случайные величины Х и У связаны функциональной зависимостью У = р(Х), то р(х„, у„) = 1. Аналогично, если У = ~р(Х), где»р(х) — убывающая функция, то р(х„,д„) = — 1. Условие (р(Х„,У„)( < 1 выполняется всегда, так как оно выполняется для выборочного коэффициента корреляции, а р(Х„,У„) — это выборочный коэффициент корреляции, построенный по последовательностям рангов наблюдений. Рассмотрим теперь другой крайний случай, когда случайные величины Х н У независимы, т.е. когда основная гипотеза Нд является истинной.
В этой ситуации случайный вектор (Ям ..., Я„) принимает с равной вероятностью любое свое возможное значение, являющееся одной из и! перестанонок, составленной из чисел 1, 2, ..., и. Следовательно, вероятность того, что статистика р(Х„,У„) примет любое из своих возможных значений р(х„,у„) при истинности основной гипотезы (5.18), не зависит от распределений случайных величин Х и У. 228 и ПРОВЕРКА НЕИАРАМЕТРИЧЕСКИХ ГИПОТЕЭ Можно показать, что при истинности основной гипотезы (5.18) Ъ1Р(Хн1Ун) =О, ОР(ХньУн) = —, (522) и, следовательно, при этом емборочные значеин.в статистики р(Х„,У„) невелики и группируются около нуля.
Поэтому (и это кажется достаточно естественным) ранговый критерий Спирмена отклоняет Не на уровне значимости о, если !Р(хн~ рн)1 > Р1-о1ъ где р1 1з — квантиль уровня 1 — о/2 распределения случайной величины р(А„,Ун) при истинности основной гипотезы (5.18). При небольших о это распределение табулировано'. Известно, что при и -+ оо и при истинности основной гипотезы (5.18) т.е. квантили случайной величины р(Х„,У„) можно прибли- женно вычислять при помощи таблиц квантилей стандартного нормального распределения. Пример 6.6. В табл.
5.1 представлены и = 10 значений (х,, д;), 1= 1, 10, непрерывной двумерной случайной величины (Х, У). Проверим на уровне значимости о = 0,05 гипотезу Не о независимости случайных величин Х и У. Томища 5.1 х; -1,63 1,11 1,15 -1,93 0,38 -1,08 -0,31 0,60 0,12 0,92 рл 0,54 0,88 -1,21 0,89 — 0,64 — 0,21 0,08 -0,74 0,79 0,14 Сил Большев Л.Н., Смирнов Н.В. ( р(Х„,У„) — Мр(Х„,У„) Дрых„, х„~ ю =Фо(1)= — у е х дк, 5.3. Критерии независимости Строим последовательность рангов (табл.
5.2). По формуле (5.20) вычисляем реализацию статистики р(Х„, У„) р(я„,р„) = 1 — ((2-7) +(9-9 )+(10 — 1)з+(1-10)з+ 10(10з — 1) +(6-3)з+(3-4) +(4-5) +(7-2) +(5-8) +(8 — 6)~) = 6 = 1 — — ~25+0+ 81+81+9+1+1+25+ 9+21 ~ — 0 4118. 990 ~ По таблицам распределения статистики р(Х„,У„) рангового критерия Спирмена находим квантили ,оо,ааз = 0,6726> ре,ат = 0>7374, ре,ааз = 0>80223> (5 23) а квантили р1 ~з = ро,ета нет, так как р(Х„,У„) — дискретная случайная величина. Тем не менее, из значений квантилей (5.23) заключаем, что ~р(я„,у„)( < реваз и Не не отклоняется даже на болыпем уровне значимости. Таблицы сопряженности признаков и критерий Хз.
Пусть имеется случаиная выборка из генеральной совокупности двумерной дискретной случайной величины (Х, У), где случайная величина Х может принимать значения пы ..., в„, а случайная величина У вЂ” значения ом ..., и,. Определим случайную величину пу(Х„,У„), реализация щ- которой равна количеству элементов выборки (ин>в»н) ((з1>91)» (жн>вн))> совпадающих с элементом (и;, пу), е = 1, г, т' = 1, а 'Сил Большев л>.Н., Смирнов Н.В. 230 5. ПРОВЕРКА НЕПА РАМЕТРИЧЕСКИХ ГИПОТЕЗ Введем случайные величины и;.(Х„,У„) и п.-(Х„,У„), значения и;.
и и. которых определим по формулам н .-=~~) и; . 1=1 При этом и;. — количество элементов выборки (з„, у„), в которых встретилось значение ич а и. — количество элементов выборки (ж„, у„), в которых встретилось значение и;. Кроме того, имеют место очевидные равенства 1=1 г=1 В рассматриваемом случае результаты наблюдений удобно оформлять в виде таблицы, называемой тнаблицеб сонрлженностпи признанов (табл. 5.3).