Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 64
Текст из файла (страница 64)
Подстаповка о, =- О(х,) = Ф(х) переводит левую ис1ь (3) в левую часть (6). Однако неравенство (3) можно легко видоизменить таким образом, чтобы в результате той же подстановки получалась левая шсть (7). Для этого нужно лишь о, формально заменить величинами 'зе(в,), гче аг — функция, обратная фуикппи Ф. В результате получае1ся пидоизме~ енный критерий, согласно которому пулевая гипотеза отвергается тогда, когда сумма (10) превосходит надлежащим образом вь.,бранную границу с. Если в (10) положить в = Ф(х.), (11) Ф то сумма Я перейдет в х, + х, и получится критерий (7), При произвольном д вместо (10) нужно рассматривать сумму 8 = эг~ — „'~ + Ч'( — „") +...
+ 'йе( — йа ) . (12) Однако соответствующий критерий будет иметь один недостаток, связаиный с тем, что слагаемые суммы (12) могут обращаться рл. ХП. Пор»дкоеые криекерьи 348 в — (при и, = 0) нли в + (прн и, = Ь); в этих случаях вычисление суммы невозможно. Для того чтобы преодолеть зто затруднение, все х, (а вместе с ними н ие) располагают в порядке возрастания их величины, затем и, заменяют числами (13) т,=и,+1, т,=и,+2, „~ =ие+д, и, наконец, в знаменатели вместо Ь подставляют и+1=д+Ь+1. Таким образом, возникает окончательное выражение Х = У ( + ) + У( + ) + ... + У ~ — е Т), (14) Числа т„..., т, определенные равенствами (13), равны порядковым номерам х,,..., хе в общем вариационном ряду, составленном по ооъединенной выборке х,,, ха, ун..., д».
Порядковые номера т, могут принимать лишь значения от 1 до и = д+ Ь, поэтому слагаемые (14) никогда не обращаются в + Если отвлечься от крайнего случая, когда в (12) неко»орые и! близки к 0 или к Ь (для очень больших Ь этот случай все равно является очснь маловероятным), то окажется, что асимптотнческ при Ь вЂ” сумма (!4) ведет себя так же, как сумма (12). Изложенный выше эвристический вывод, который сперва привел нас к сумме Я н критерию 8 ) с, приводит, таким образом, к более удобнсй для приложений сумме Х и к следуюц1ему критерию. Б. критерий х х=- ~-д ~.
",) (15) у= з у( — '-,) (16) В интервале 0 < ! с 1 функция у(!) принимает лншь нонеч. ные значения и удовлетворяет условию (17) у (1 — !) = — у(!), поэтому сумма Х + У всегда равна нулю: Х+У У~ ! )+У~ 2 )+ ь УР) О (]Я) Пусть и = д+ Ь случайных величин х,,..., хе н Уе, У» расположены в порядке их возрастания, и пусты, (илн просто т)— порядковый номер х, и»» (нлн просто а) — порядковый номер д». Образуем суммы 34З д ва. Критерий Х При перемене ролей х и у величина Х переходит в У = — Х.
Если затем изменить еще и порядок следования (т. е. расположить все х н у не в порядке их возрасчания, а н порядке убывания), то — Х снова перейдет в Х. Границу Х» следует определить таким образом, чтобы вероятность события (! 9) вычисленная в предположении, по все и! перестановок из х„ ..., х, у„ ..., у„ являются равновероятнымн, была наибольшей и при этом не превосходила )5. Указанное предположение является с.педствием нулевой гипотезы Н, которая утверждает, что все х! н у„независимы и обладают сдннаковымн функциями распределения Р(х). Сначала эту функцию мы будем считать непрерывной н поэтсму вазможность осуществления таких собь!тий, как х, = у,, можно не принимать в расчет. Согласно одностороннему критерию Х, нулевая гипотеза отвергается, коль скоро сумма Х превосходит границу Х. Этот критерий применяется тогда, когда интересуются, не будут лн хи вообще говоря, больше, чем у„? Уровень значимости этого критерия не превосходит 1).
Согласно двустороннему критерию Х, нулевая гипотеза отвергается тогда, когда Х или е превосходят границу Х». Если оказываечся, что Х> Х, то считают, что х в среднем больше, чем у. В пропшоположнссть этому если е' > Х, то полагают, что у в среднем больше, чем х. Уровень значимости двустороннего критерия не превосходит 2р. в. вычисление х» При малых д и Ь границу Х» можно вычислить точно с помощьк! непосредственного перечисления равнонозможных сочетаний.
В качестве примера снова рассмотрим случай д = 4, Ь = б и пол!:- жим )а =. — = 0,025, слсдователык, 2р* = -. = 0,05, 1 1 40 ' ' " ' 20 !10! Количество различных сочечаний вида худ... х равно ~ ~.)! = 2)0. Сороковая часть этого количества' ранна 5. Таким образом. ' Как и а случае критерия Вилкоксоиа, алеса илст речь о целой час!и '()1~ )). — Прим.
перев. Гл. Х1Д Иорлдьсвиг хрип>грив мы должны выписать 5 таких сочетаний, для которых ссотаезствук>щие значения Х являк>тся наибольшими. Сначала составим таблппу значений Ч'. округлеппых до двух десятичных зпакоьч Ч' ф .= — 1,34 >Р~ ) =- — 0,91 Ч Я) =0,11 Ч Я) =-0,35 Ч-'~ ! =.
— 0.60 >У~ -~ = 0,60 >з >8> )и " )11)в Ч' ~,4,) = — 0,35 Чи Д = 0,9! Ч> 110) ! 34 Р ( —;, ! . - - - О,11 С и м> щыо зтсй таблицы для каждого такого сочетания, как у у у у х у у х х х, можно теперь вычислить зпачеиис Х по Формуле (15). !!!<сть>о со !стапиямп с паиболыпими зшшспиями Х являкпся 1.
у у у у у у х х х х Х = 3 31 2. ууууухуххх Х=296 3. у у у у х у у х х х Х = 2,74 4. уууууххухх Х=271 5. у у у,т у у у х х х Х =- 2,50 6. у у у у х у х у х х Х = 2,49 Если мы положим Х =- 2,49, то лишь для пяти сочетаиий » зпачения Х будут превосходить Х„. 11ри этом проди»,>агпется> что в пракпшческих применениях кри перия Х знсгчен»я Х вычислячотся лишь с двумя десятичныли> знакалш и что нолевая гипотеза отвгргаеп>ся только >погда. когда вычисленное значение Х оказывается строго болыие, чем Хх .1!ля контроля целесообразно >иряду с Х вычислят> также и Г. Сумма Х т К должна быть зг>чпо равна пул>о (даже при округлеипых зпачеппях Ч').
Указаьп>ос здесь перечисление всг.. возможных случаев практически удобно лишь прп д -, 'А~20. !)ри сблыпих зпачепиях д и /> приход>пся переходить к асимптозических> сцепкам. д бок критерий х Г, СРЕДИЕР ЗНАЧЕНИЕ И ДИСПЕРСИЯ Х Обозначим зпачсппя Че буквамп ао..., а„: (уб) СП1ласпо (15), статистика Х предстагляст собой с)мму Х =- Р,' а, = ап + а,, —... + а„,, (21) (22) Для того чтобы вычислить диспсрси~о случайпой величины Х, определим сначала среднее значение для а,'. Так как о,' принимает значения а2» ..., а~ с одинаковыми всроятнсстями, то Р' а2 = — (а2 -1- ...
-1- а2) = ф, 1 (23) Определим теперь среднее значение пропзведеиия ае ае, Это произведение приппмает значения вида аа» (2 ф )е) с сдпп аксвьми вероятностями, псэыму — !ф» — — З а2=-— (24) »(~-1) -' Если (21) позвести в кгадрат и вычислить среднее значение, 2О ПОЛЧЧИМ ,', х» = д Я а,' -1- д(д — 1],~ а„а„= дч)— д)д — 1) д(и — д) или Р2 дл к и — 1 (2б) При этом ч), ссчласьо (23), спредсляс~ся е)гормулой где г,, ге — нскотс рая выборка объема д, извлеченная из совокупесстй п возможпых индексов 2 == 1,2,,п. В случае справедливости пулевой гипотезы Рос такие выборки равновсроятпы. Каждое отдельпое слагаемое а, суммы (2!) принимает зпгчепия ап..., а„с одинаковыми вероятностями.
Следовательно, математическое ожидаппс каждого а, равно пуз|о, а псэтсму 362 Гя. Х11. Норядкооие критерии Среднее значение и дисперсия случайной величины Х задаются формулами (22) и (25). Величины Я табулированы в табл. 12. Д. АСИМПТОТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ Х Пусть х„ , , хв и у, , у» — независимые, одинаково распределенныс случайные величины, и пусть сначала Ь велико сравнительно с д. При этом безразлично, велико д или нет. В таком случае справедлива теорема: случайная величина Х распределена асимптотически нормальна с нулевым средним значением и квадратичным отклонением <г .
Доказательство не представляет трудности; его можно найти в моей работе о критерии Х, опубликованной в журнале МаВТ. Апп., 126 (1953), 94. Согласно только что сформулированной теореме для каждого е ~ 0 найдется таксе М, что при всех Ь/д~ М функция распределения Х будет отличаться от соответствующей функции нормального распределения менее чем на е. Это же самое справедливо и для д/Ь- М. Таким образом, мы должны еще рассмотреть лишь случай, когда оба отношения д/Ь и Ь/д не превссходят М и прн этом и = д и Ь безгранично возрастает.
В 91см случае теорема об асимптотической нормальности также справедлива, но доказывается она много тяжелее. В реферате моей ~олько что цитированной работы (реферативный журнал Маг)!. Ввч!еъз, 15, 4б, референт 6, Е. Акое!)!ег) отмечается, что доказаяельс гео можно провести с помощью одной теоремы Вальда н Вольфовица, которую в свою очередь можно доказать методом моментов, указанным в 9 63 В. Полностью это доказательство провел Стокер в своей Амстердамской диссертации: (см.
3!о)сег. В. Ю. Оог 'и )г)аа тап $ое!з!Пез-егоо!11еде ч!г гйе ргоЫееш чап Ткгее з1ее)гргоекче !1955) (. Поэтому при и — случайная величина Х распределена асимптотичсски нормально, независимо от того, стремятся в отдельности д и Ь к бесконечности илн нет. Таким образом, статистика Х и число инверсий бг асимптотически ведут себя различно.
На основе этой теоремы были вычислены таблицы" для критерия Х. При этом для малых п (т. е. для малых д и Ь) граница Хо определялась точно, путем перечисления возможных случаев. Для больших п использовалось асимптотическое нормальное распределение. При этом особое внимание уделялось членам а, и аи, которые могут встретиться среди слагаемых суммы (21).
Это позволило существенно улучшить приближение. ' Ъ'ап йег '1чаегдеп В. В. ппп' 1Ч!ечегяе1с Е., Таге!паню Чегя!е!ов кто!ег Змовргокеп пп!Ге!о Х-Товч ши! яе!свеи!еяь, Зрыпяег— Чег!ая, 1956. заз Э ои. Крииаериа Х Е. СЛУЧАЙ. КОГДА НЕКОТОРЫЕ х И Р МОГУТ БЫТЬ РАВНЫМИ До сих пор мы предполагали, что х н у обладают непрерывными функциями распределения и отсюда следовало, что возможность осуществления события х, = у„можно не принимать в расчет. Однако на практике х, и у» всегда представляются округленными числами и, следовательно, имеют дискретное распределение; поэтому вполне возможен случай, когда х, = уге Спрашивается, как в таком случае нужно определять порядковые номера т, и а„, которые используются при вычислении Х и д по формулам (15) и (16)Р Такой же вопрос возникает также и в случае критерия Вилкоксона. Были предложены различные методы.