Большев Л.Н., Смирнов Н.В, Таблицы математической статистики (1983) (1186204), страница 34
Текст из файла (страница 34)
Этим же свой»твом обладает лругой пепараметрическвй критервй лы. (69]), для которого /(г) — математическое ожида- нке квадрата г-го члена варнацконного ряда, построенного по выборке объема лз + л ка нормальпон совокупности с параметрамн [О, 1). Подробнее о вычнеленнв мощности ем.[144). Таблицы для критерия Клотца даны в работе [56[. Об нспольаовавнн етатнетяк ранговых критериев для построенвя точечных оценок параметра сдвига см.
[142[. Таблицы б 10. Ранговая корреляция 1, 2, 3, ..., п~ з Г1, ГЮ ГЗ ° ., Г„/ (48) где гз — порядковый номер (по второму признаку) того индивидуума, который по первому признаку имеет номер 1. Коэффициент ранговой корреляции р был введен в 1904 г. Спирменоы [117): е 65р р=1— из — в Я„= ~) (гз — 1)з. (49) з=1 Другой коэффициент ранговой корреляции предложен Кендаллом [53): 2о 1=1 1=~+1 (50) Функция з[ип х принимает два значения: +1, если х)0, и — 1, еслих(0. Из определения Яз следует, что Я = 2У вЂ” п (и — 1)/2, (51) где У вЂ” количество тех пар индивидуумов, длч которых ) ) 1 и г/) г; одновременно.
Практически Х рекомендуется вычислять по л, н. ползшее, н. В. смирнов Рассмотрим совокупность индивидуумов, обладающих таким признаком, который, может быть, и не поддается точной количественной оценке, однако позволяет сравнивать индивидуумы друг с другом. Таким образом, в результате подобного сравнения всю совокулность можно «ранжировать», приписав каждому индивидууму порядковый номер, соответствующий итогам сравнения с остальными индивидуумами.
Если индивидуумы могут обладать не одним, а двумя признаками, то для исследования их влияния друг на друга обычно рассматривают выборку кз п независимых индивидуумов и каждому индивидууму приписывают два порядковых номера в соответствии с «ранжировками» по обоим признакам. Выборочными мерами связи признаков служат так называемые коэффициенты раягоэой корреляции. Эти коэффициенты инвариантны относительно перестановки элементов выборки, поэтому, оценивая ранговую корреляцию, результаты «ранжировок» можно записать в виде подстановки формуло Если количество исследуемых признаков т больше двух, то результаты «ранжировок» по этим признакам можно записать в виде матрицы, 1-я строка которой содерзкит результаты «ранжировки» по 1-му признаку (1 = = 1, 2,..., т), а столбцы соответствуют индивидуумам, принадлежащим исследуемой выборке (при этом в первой строке, конечно, моя<но было бы вместо г,,„г,з,...
снова написать 1, 2,...): [ »ьз 11и ° . »ь л 1'з, г,, ... гз (гм, ~ гзл, з геъ л (53) В качестве единой выборочной меры связи т признаков Кендалл и Бэбингтон Смит предложили коэффициент согласованности И', называемый также коэффициентом конкорданции: Иг = 122зг щз (пз к) з1 11 Если по таблице (53) вычислить коэффициенты ранговой корреляции р для каждой из т(т — 1)/2 пар признаков, то арифметическое среднее таких р будет равняться (тИ'— — 1)/(т — 1). В частности, если т = 2, то р = 2И1 — 1. Все три коэффициента [ р [, [у [ и И принимают значения из отрезка [О, 1) и используются для проверки гипотезы //е о независимости признаков.
Признаки называются независимыми, если для наугад выбранного столбца таблицы (53) ранги (порядковые номера) гз и г,,у,..., г; являются взаимно независимыми случайными величинами. Если гипотеза /Хе верна, то Мр=О, М«=0, МИ'='— М5» =,, Мяз = О, Мя„= Ор= —, 0т= 1 2 [2л + 5] л — 1 ' Ул(л — 1) ззИ' =- (55) л" = лгз + /[/з ... + /Ум „(52) где при каждом фиксированном 1 величина Л'1 есть количество тех гу в подстановке (48), длЯ котоРых У ) 1 и одновРеменно гу ) г,. Таким образом, г = 4/з'/(п (и — 1)) — 1.
пг (и -)-1)г)п — 1) ( я п (п — 1)12п+ б) ы = ОЯгг = т (ы — 1)(п.+ 1)(п' — 1)п' (55) Соответствующие гипотезе Но дополнения функцнй распределения случайных величин Яр, Я, и Як до единицы указаны в таблицах 6.10. Т а б л н ц а 6ЛОа. Распределение коэффициента рангокой коррыяцнн р Спармена В таолнце даны значения вероятностей ()р (з' л) = Р (Яр ь э) для и = 4 (1) 10 (см.
формулы (49)). Так как распределение суммы Яр симметрично относительно (пз — и)!6 и сосредоточено на отрезке 0 ( г ( (и' — п)!3, то значения вероятностей Р (Яр ( г) можно вычислять по формуле Р (Яр ~( г) = Д~ ((и' — и)/3 — г; и). Величины (иэ — п)/3 указаны в последней строке таблицы 6.10а. Пусть, например, при и = 9 нужно вычислить нижнее и верхнее критические значения для р, соответствующие номинальным уровням значимости 0,05. По таблице 6.10а находим, что с)р (196; 9) = 0,038 и ()р (188; 9) =- 0,060, поэтому 196 — верхнее критическое значение для Яр и по формуле (49) г = 1— — 2 196'240 = — 0,633 — нижнее критическое значение для р.
Так как коэффициент р распределен симметрично относительно нуля, то 77 = 0,633 — верхнее критическое значение. При этом истинные уровни значимости равны 0,038, следовательно, критической области ) р ) ) 0,633 прн п = 9 соответствует вероятность ошибки первого рода 0,076. Т а б л н ц а 6ЛОб. Раснределенке коэффнцнента ранговой коррялкцкн г Кендалла В таблице даны значения вероятностей (7, (л; п) = Р (Я, > г) для и — — 4 (1) 10 (см. формулы (50), (51) и (52)). Тэк как случайная величина Я, распределена симметрично относительно нуля, то вероятность Р (Я, ( г) можно вычислять по формуле (Я,«) = (Я.>-) =а(-',-).
Например, прн и = 9 по таблице 6.10б находим, что 18 — верхнее критическое значение для Я„соответствующее уровню значпмостп 0,038, и по формуле (50) Т = ==- 2 18)72 = 0,5 — верхнее критическое значение для т. Нижним критическим значением является 1 = — 0,5. Таким образом, критической области ! т ! ) 0,5 отвечает вероятность ошибки первого рода, равная 0,076. Т а б л к ц а ОЛОк. Распределение комКкщнекта согласоганнжтк П' В табак го воны зна.екня вероятностей 1~О (г;т, и) =Р(Ягг~л) для и = 3, ш = 3 (1) 10; п = 4, т = 3 (1) 6 и и = 5, т = 3 (см. формулы (54)). Например, из таблицы 6ЛОв следует, что при >г = 5 и т = 3 критическому значению 66 соответствует уровень значимости 0,038, поэтому в силу формулы (54) неравенством И':л 12 66/1080 = 0,733 определяется критическая область критерия ранговой некоррелированности трех признаков.
Вероятность ошибки первого рода равна 0,038. Если п ) 10, то для вычисления критических значений коэффициентов ранговой корреляции р и т можно воспользоваться тем, что этн статистики распределены приближенно нормально с параметрами, заданными формулами (55)1 Р(р-ь Л)=— =1 — Ф~~~/и 1д 14 г)~"уlпг 3 ')11 — 1 — Ф (ф'л — 1Л) 7(((); п) = Ч'~1 — О) ~1 ОЛО (Ч„® Ч' (1 — Е Уп — 1 Р(г.-. Т) 1 1 ( ~ 1 ~ ( 1 ) ~ Т 2 1 ) где Ф (х) и Ч" (р) — функция и обратная функция нормального распределения с параметрами (О, 1) (см.
таблицы 1.1 и 1.3), () — уровень значимости одностороннего критерпя, гг' и Т вЂ” верхние критические значения коэффициентов ранговой корреляции р и х. Коэффициент согласованности И' распределен асимметрично на отрезке 0 ( Иг ( 1. Его распределение удовлетворительно аппроксимируется В-распределением (см. таблицы 3.3 и 3.4, а также таблицы (Т251): Р (И' ~~ ю) = 1„(а, б), и ((); т, и) = 1 — Х (1,); О, а) + где ( те(из — и) ) (--- 24 зие(из — и) ) 1+ 36 тз (из — и) 5=: — —, а=(т — $) 5. и — 1 1 2 т ' Например, при (7 = 0,038 по таблипе 1.3 находим, что Т (1 — 4)) =- 1,7744, поэтому при и = 9 по приблнзкеппым формулам получаем 1,7744 г 0,19 Л (0,038; 9) ' (1 — — ° 0,15 = 0,625, 8 ~ 8 2 /И,5 1 Т (0,038; 9) — ~/ — 1 7744 + —.. = 0,500.
— 9 У/ 8 36— Вычисленные выше точные значения этих функпнй равнялись соответственно 0,633 и 0,500, Для того чтобы оценить, сколь значительна погрешность в первом слу. чае, вычислим по формуле (49) соответствующее приближенное критическое значение для Яс: [Л(Я; и) + 1) 120.1,625 =- 195. Истинный уровень значимости представляет собой вероятность события (Ю > 195). По таблице 6ЛОа находим Р (8 > 195) = д (195' 9) = 47 (196; 9) = 0,038. Следовательно, приближенное критическое значение для р в силу дискретности распределения оказалось вквивалентным точному. Подробнее о ранговой корреляции и ее применениях, о ьшщности критериев некоррелированностн признаков, о предельных теоремах и т.
п. см. монографии (28) н (53). Таблицы 6ЛО заимствованы нз сборника (Т2 ) Более обширные таблицы имеются в работах (Т54, Т55]. У11. ВСПОМОГАТЕЛЬНЫЕ ТАБЛ1ЩЫ вЂ” 100— За исключением таблиц 7 1, заимствованных из книги [Т201, все помещенные в этом разделе таблицы воспроизводятся по сборнику таблиц Пирсона и Хартли (Т271. Таблица 7 1а. Равномерно распределенные случайные числа В таблице даны 12 500 цифр от 0 до 9.
Эти данные можно рассматривать как реализации взапм. о независимых и одинаково распределенных случайных величин, принимающих значения О, 1, 2,..., 9 с одной и той же вероятностью, равной 0,1. Табулированные цифры сгруппированы по две. Каждая пара представляет собой реализацию случайной величины, которая может принимать любые целочисленные значения от 00 до 99 с одинаковыми вероятностями, равными 0,01. Разумеется, аналогичный результат получится, если цифры сгруппировать не по две, а по три, четыре и т. д. Если каждую группу из й цифр, рассматриваемую как целое число, умножить на 10 "', то получим реализации случайных величин принимающих )л-разрядные значения от 0 до (1 — 10-") с одинаковыми вероятностями, равными 10 л. Такое распределение вероятностей близко к равномерному на отрезке [О, 1], причем разность соответствующих функций распределения не превосходит 10 л.
Следовательно, реализации $ можно рассматривать как реализации случайных величин, равномерно распределенных на отрезке [О, 1]. Эти реализации и называют обычно равномерно распределенными случайными числами. Если требуется построить случайные числа с функцией непрерывного распределения Р (х), отличной от фуннции равномерного распределения на отрезке [О, 1], то для этой цели можно воспользоваться последователыюстью чисел вида Р ' (З), где $ — равномерно распределенные случайные числа, а г ' (у) — функция, обратная функции распределения у = Р (х). Подробнее о равномерно распределенных случайных числах, нх преобразованиях, контроле таблиц, а также о прилленениях случайных чисел см.
[19, 23, 68, Т11, Т43]. Таблица 7.1б. Нормально распределенные случайные числа В таблице даны 2500 чисел (с тремя десятичными знаками), которые моялно рассматривать как округленные до трех знаков реализации взаимно независимых случайных величин, подчиняющихся нормальному распределению с параметрами (О, 1) (см. описание таблиц раздела 1). Для получения последовательности случайных чисел, соответствующих нормальному распределению с параметрами (а, а), следует табличные значения умножить на о и к результату прибавить а (а ) О, ] а ] ( оо). Числа типа ох+а и будут требуемыми случайными числами.