Большев Л.Н., Смирнов Н.В, Таблицы математической статистики (1983) (1186204), страница 33
Текст из файла (страница 33)
Рааумеется, все это верно лишь тогда, когда вэрна основная гипотеза ХХ,. В этом случае т(У+1) т(т+и+1) тп (Й'+ 1) тс(т+ в+ 1) ( ) (41) 12 12 Нижнее критическое значение и>((); т, и) статистики И', соответствующее уровню значимости () (0(~) ~(0,5), при заданных т и и определяется как целочисленное решение неравенств Р(Иг (и>(ф т, п)) <Д, Р(УУ. юа п)+1))0. Так йак распределенце случацной величины И' симметрично относительцр математического ояоцдания, то верхние критические значения И' © т, и) связаны с нижними критическими значениями соотношением И' (Х); т, и) = 2М% — и (Ч; т, п).
(42) Пара чисел (к> (О; т, и), Иг (1",; т, и)) определяет критические значения двустороннего критерия Вилкоксона с уровнем значимости 2(). В таблице 6.8 даны нижние критические значения к>(1Х) т, п) для т = 1(1) 25, и = = т (1) 25 0,05; 0,10. В последнем столбце указано удвоенное математическое ожидание 2МИг как функция от т и и. Верхнце критические вначения следует вычислять по формуле (42). Если хотя бы один из объемов выборок т и п превосходцт 25, то для вычисления критических значений может оказаться полезной теорема, доказанная в работе [78). Согласно этой теореме при т - со и и -+ со случайная величина И" распределена асимптотически нормально с параметрами, заданными формулами (41).
Еще более точная аппроксимация указана в работе (129): Р (И' ( ю) = 6> (х) + где 6>(х) и ~у (х) — фу>(кция и плотностьнормального распределения с параметрами (О, 1) (см. таблццы 1.1 и 1.2) и х = (и> — МИ' + + 0,5)!'уг0И'. Из формулы (43) получаем следующие приближенные выражения для нижних критиче скпх значений (первое выражение более точное): ~ т(т+и + 1) — 1 (1 ( 2 3) тг+иг+тп+т+и ) Х ') [ + гпп (т -)- и + 1) ) [ т (ги + и + 1) — 1 12 2 / тп (т+ и+ 1) 12 (44) где [21 — целая часть числа з и ф =- Т (1 — г)) — значение обратной функции нормального распределения с параметрами (О, 1) (см.
таблицу 1.3). Например, при т =-. 5, и =25 и () = 0,025 по таблице 1.3 находим %(0,975)= = 1,9600, поэтому согласно второй формуле (44) иг(0,025; 5, 25) = 41 и' согласно первой, более точной формуле иг(0,025; 5, 25) = 42. Точное значение, указанное в таблице 6.8, равно 42, Аппроксимации (43) и (44) действуют удовлетворительно при всех и 'э т 5, если только нет совпадений вида $г = $; (хотя в случае непрерывных распределений ' совпадения могут возникать в принципе лишь с нулевой вероятностью, однако практически они наблюдаются довольно часто и являются следствием неизбежных ошибок округления). При наличии совпадения рекомендуется всем совпавшим величинам приписывать одинаковый ранг, равный арифметическому среднему тех рангов, которые имели бы эти величины до совпадения.
В атом случае математическое ожидание статистики И' будет по-прежнему выражаться первой формулой (41), а дисперсия примет вид И тп (т+ и+1) (т + п) г(т+ и — 1) ' ~~~ зз где й — общее количество групп, состоящих из совпавших величин, принадлежащих разным выборкам, 1~ — количество совпавших величин в группе с номером 1(1 = 1, 2, ..., й). Подчеркнем еще раз, что совпадения следует учитывать Лишь тогда, когда совпавшие величины принадлежат разным выборкам, Совпадения, целиком состоящие из элементов какой-либо одной выборки, на величину статистики И' не влияют.
Если количество совпавших элементов не очень велико, то для определения критических значений статистики Иг рекомендуется пользоваться таблицей 6.8. Сравнение формул (41) и (45) показывает, что это приведет к построению приблиягенного критерия. уровень значимости которого несколько менее задан- ного. Разумеется, если критические значения для И' определяются с помощью нормального приближения, то для вычисления дисперсии (с учетом совпадений) следует воспользоваться формулой (45).
Таблица 6.8 заимствована из работы [Т461. Подробнее'о критерии Вплкоксопа и его применениях см. [28, 31, 33, 69, 71, 78, 107, 136]. Таблица 6.9а. Критические значения статистики Х критерия Ван-дер-Вардена Критерий Х Ван-дер-Вардена предназначен для проверки однородности двух выборок н отличается от критерия Вилкоксона заданием функции ) (и) (см. описание таблицы 6.8): 7' (и) = Ч" (з (и) ЦИ + 1)) ()1г = т + и), где функция з (и) определяется заранее фиксированной подстановкой (40) и Ф' (р) есть р-квантиль нормального распределения с параметрами (О, 1). Выбор подстановки (40) осуществляется так, чтобы для заданной конкурирующей гипотезы Н, мощность критерия была, по возможности, наиболыпей. Например, если согласно гипотезе Вг прв всех действительных х Р ($ ( х) ( Р Д' ( х) или Р($(х)) Р(6'(х), то, как и в случае критерия Вилкоксона, целесообразно положить з (и) = — и.
Следует помнить, что критерий Ван-дер-Вардена предназначен для решения задачи двух выборок в тех случаях, когда функции распределения исследуемых совокупностей могут отличаться лишь параметром сдвига. Особенно полезен этот критерий, если обе совокупности нормальны или бливки к нормальным (см. [331). Статистика И~ критерия Ван-дер-Вардена представляет собой сумму где и; — ранги случайных величин з, (предполагается, что т ( и; в противном случае следует заменить на $;). Так как Т(' ',)+т~ ',)+...+Т( "',)=О, (46) то для контроля рекомендуется независнмс от Х вычислить величину ОХ= пл + и — 1 МХ =О, где '= +Е ~ (''+ Г ='- ' 1~Ч" ( ~ ))'+З вЂ” ',1.
—,1. (47) Таким образом, если /У велико, то Р(Х (х) — /В(.с 1//с . ), поатому х ф; т + и, и — т) = Ч" (1 — /)) а»+ а — 1 где Я определяется формулой (47) и Ч" (р)— обратная функция нормального распределения с параметрами (О, 1) (см. таблицу 1.3). Таблица 6.9б. Вспомогптельнпя тпблнци для вычисления дисперсии статистики Л' критерия Вин-дер-Вирденп В таблице 6.9б табулирозана (с тремя десятичными знаками) функция Я для Ф = т + + и = 1 (1) 150 (см. форлгулу (47)). Таблицы 6.9 перепечатаны из учебника [28), е котором можно найти более подробное изложение свойств критерия Х„исследование его мощности и рекомендации относительно вычисления Х в тех случаях, когда среди значении Е> и $; имеются совпадающие.
Более подробные таблицы см. в (Т61. где Л/ — ранги случайных величин 5>. В силу тождества (46) дол>кис выполняться равенство Х+)' =О. В таблице 6.9а даны (с двумя десятичными знаками) верхние критические значения х (); щ + и, и — >и) статистики Х, соответствующие и> + и =6 (1) 50, и — >и = 0 (1) 5 и уровням значимости () = 0,005; 0,010; 0,025. Нижние критические значения равны верхним, взятым со знаком «минус», поэтоыу в качестве статистики двустороннего критерия обычно выбирают ] Х ]; з атом случае х ((); т + и, и — т) будет критическим значением двустороннего 'критерия Ван-дер-Вардена с уровнем значимости 2/).
Если А> = >и + и- оо, то случайная величина Х распределена асимптотически нормально (сы. (28]) вне зависимости от того, стремятся ли в отдельности т и и к бесконечности или нет. В качестве параметров нормального распределения следует ваять соответствующие числовые характеристики распределения статистики Х: ДРУГИЕ РАНГОВЫЕ КРИТЕРИИ Как уже отмечалось, критерии Вилкоксоиа и Вандер-Вардена представляют собой частные случаи рангоеых критериев, предназначенных для проверки однородности двух выборок и основанных на статистиках типа / (г,) + / (гл) + ... + / (г,„). Если функции двух сраввиваеиых распределений могут отличаться лищь параметрами сдвига и масштаба (обозначим для определенности зги фунКции символ»ми Р(з) в Р (с»+ а)), то 1) пря с = 1 задача проверки однородности двух выборок сводится к проверке гипотезы а = О; 2) прв а = 0 зта задача эквивалентна задаче о проверке гипотезы с = 1.
В тех случаях, когда функция распределения а (з) иавества, для проверки указанвых гипотез (при естественных альтернативах) удается построить либо наиболее мощный критерий, либо зсимптотяческв наиболее мощный критерий яри веогравичевно увеличивающихся объемах выборок (сы. (28, 68, 72, 85]). Этот критерий, разумеется, уже не будет вепараметрвческпы, так как распределавие его статистики, как еравило, супюствевво зависит от функции ' (з). Однако можно указать в непвраметричаскяй критерий, моп>вость которого арв заданной функции Р (х> асипптотически зкввеалевтва мщцвоств вавболее ыошиого критерия. Как показано в рабою Гаека (33], для этого достаточно в качестве / (г) выбрать функцию )~ ~,~ с )а а+аж где Р л (у) — фупкпия, обратяая з = Р(з). В частности, если с = 1 в проверяется гвпожза а О, то асиыптотически ваиболее моюнммв крвтервяии вепараметрического типа будут: для ае/>/з = е И(/2 — критерий знаков, для аР/лх = с"/(1 -(- са)з — критерии Вилкоксова И>, лля аР/ах = а /з/т' 2л — крвтерив Вав-дер-Вардева Х, Укаааввый способ выбора функции / (г) не являевл едивствевво возможным.
Например, з последнем случае асимптотвчаски наиболее мощным будет также критерий анормальных очков» (см. !69]), для котореаэ / (г) — математическое ожидание г-го члене вврпапиовного ряда, построенного по выборке обьвма щ+ л вз нормальной совокупности с параыатраып (О, 1). Аналогичным обрааом обстоит дело и во втором случае, когда а = 0 в проверяется гппотеаа с = 1. Указанное з онисавви таблицы 6.8 видоизменение критерия Вилкоксона (сп. также ]107]) имев удовлетворительную мощность для распределения Коши с плотвостью вероятвоств аР/аз = (я (1 + зз)]-*.
Если ям Р(з) — функция нормального распределения, то предельная ктивносгь етого критерия составляет лщпь 0,61 зффектпзпоств Р-критерия (см. опвсапяе таблиц 3.5). Клотп (56] предложил новый критерий, историй построен по аналогии с критерием Х Ван-дер-Вардев» в для которого ( а»+ а+1 )1 Мощность критерия Клотца асвмптотвчески зквпвалентва мощности Р-критерия (е предположение, что Р (з)— фуакпля воризлького распределеввя).