Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 65
Текст из файла (страница 65)
Например, для того чтобы решить, какую из двух равных величин х, и у„считать большей, можно бросать монету. Можно также условиться приписывать средний порядковый номер т + х/а тем равным ВЕЛИЧИНаМ Х, = Уги КОТОРЫЕ, В СЛУЧаЕ ИХ НЕРаВЕНСтна, ДОЛЖНЫ были бы иметь порядковые номера т н т + 1. Однако наилучшим оказывается следующий метод. Мы рассмотрим сейчас наиболее общий случай, когда имеется с = а + Ь равных величин х„..., х, и у„..., у», занимающих места с порядковыми номерами т, т+1, „т+ с — 1. Расположим величины х„..., х„у„..., у, на имеющихся в нашем распоряжении с местах всеми с! возможными способами, для каждой такой перестановки вычислим Х и нз всех полученных значений Х образуем арифметическое среднее. При практических расчетах этот метод можно упростить. Следует суммировать не с! слагаемых, а лишь с.
А именно, нужно по имеющимся в нашем распоряжении порядковым номерам построить сумму Яе=Яг~ " )+У(" )+... -~-1е( ) (26) и к суммам Х и д, вычисленным по остальным порядковым номе- рам, добавить дроби, соответственно равные (27) Если в другом месте имеешься еще с' = а'+ Ь' равных друг другу величин х, и у, то вычисляют аналогичное выражение и т.
д. Суммированием всех таких выражений' получают Х и соответственно д". а Зтот прием формально применим и в случае с = 1, т. е. тогда, когда лва соседних члена вариационного ряда не равны друг другж Поэтому Х и У можно считать суммами выражений вида (27). — Прим. иерее. 23 Б. Л. аан дер Вардан -1066 Гт ХП. Порядковые критерии Эта модификация оказывает лишь небольшое влияние на функцию распределения Х.
Квадратичное отклонение Х (а вместе с ним, вероятно, и истинный уровень значимости критерия) несколько уменьшается. Следовательно, если граница Хр остается неизменной, то указанная модификация лишь увеличивает надежность критерия. ж. сравнение с критерием стьюдннтл Предположим теперь„что все х, н ук независимы и распределены нормально с единичной дисперсией и средними значениями р.и О (для х) и О (для у).
Далее, предположим, что д фиксировано н Ь стремится к бесконечности. В этих предположениях мы хотим найти асимптотическую оценку для мощности критерия Х и сравнить ее с мощностью критерия Стьюдепта. Функция мощности Р(р) критерия Хопределяется как вероятность события (28) Так как все перестановки величин х„..., хе являются равно- вероятными, то мы можем считать, что х, с х, < ... < х, В эком случае формулы (13) снова оназываются справедливыми, и вместо (28) можно записать (и,-~-ъ + (и +1) + (ие+д) (29) Если в этом неравенстве, согласно (1), положить ие — Ьие перейдет в (Ьеэ (хд+ е) (а+а+1 Если, кроме того, в числителе и знаменателе пренебречь теми членами, которые малы сравнительно с Ь, то получим У (Ф(х,.)~ = х, н и = д + Ь, то получим ~р( Ь,+1), Ч ) Ь +З )+ +т~ Ье+р)> Х 186) Теперь мы так же, как в З 64 Г, заменим частоты и, близкими к ним вероятностямн.
Тогда выражение д 85. Критерий Х и (30) перейдет в х, + х, +... + хе ) Хр. (31) Наконец, если при Ь вЂ” Х. заменить соответствующим асимптотнческим выражением, то (31) перейдет в неравенство х| + х2 + + хе ) 2 д Р (1 В)" (32) Этот результат является обоб|цепием критерия (7) на случай произвольного д. В том, что мы вернулись к этому критерию, нет ничего удивительного, так как в разделе А этого параграфа мы вывели критерий Х, исходя из неравенства (7). В данном же случае мы шлн тем жс путем, по только в обратном направлении.
Только что полученньш результат показывает, что асимптотически при Ь- критерий Х имеет ту же самую функцию мощности, что и критерий (32). Как мы уже видели, среди всех критериев для проверки нулевой гипотезы, обладающих точным уровнем значимости )3, критерий (32) является равномерно наиболее мощным. Легко можно вычислить функцию мощности критерия (32), Находим Р'(ф = Ф(Ь'22 — с), (33) где Ь'= 9 н с=-1Р(1 — р). (34, Следовательно, асимптотическн функция мощности критерия Х задается формулой (33).
В $ 64 В мы видели, что функция мощности критерия Стьюдента также задается асимптотической формулой (ЗЗ). Таким образом, при поспюлнном д и при Ь— критерий Х имеет такую же мощность, как а критерий Стьюдента. В данном случае я хотел лишь изложить основные идеи и наметить путь доказательства. Точный вывод можно найти в работе, цитированной выше (Ма1)2. Апп., 126, $ 5, 103). Я подозреваю, что этот же результатостанется справедливым п тогда, когда оба параметра д и Ь стремятся к бесконечности.
3. РАОПРеделения, Отличные От нОРмАльнОГО Критерий Стьюдента предназначен для проверки нулевой гипотезы в предположении, что в обеих выборках случайные величины распределены нормально с одинаковыми дисперсиями. Большим преимуществом порядковых критериев является их полная независимость от предположения нормальности. При этом, независимо от выбора непрерывной функции распределения е"(х), уровень значимости таких критериев всегда не превосходит д, ези звв Ге.
Х11. Порядковые критерии Что касается критерия Стьюдента, то его истинный уровень значимости может превышать 13, если только распределения х и у отличны от нормального. Однако прн соответствующих предположениях о функции У(х) и при больших д и Ь превышение заданного уровня значимости критерия Стьюдента оказывается не очень значительным. А именно, при достаточно большом д выборочное среднее х независимых случайных величин х„..., х распределено приближенно нормально, точно так же распределено и выборочное среднее у при достаточно большом Ь, следовательно, разность Ю = х — у распределена приближенно нормально: При больших я = д+ Ь знаменатель 8 стьюдентовского отношения можно приближенно заменить истинным квадратичным отклонением ор разности Ю.
Таким образом, отношение Ю/Я распределено приближенно нормально с квадратичным отклонением, стремящимся к единице при д+ Ь . Поэтому если все х и у имеют одинаковые и не слишком дикие функции распределения я'(1) и если д н Ь велики, то истинный уровень значимости критерия Стьюдента будет приближенно равен заданному значению р. Однако при распределениях, отличных от нормального, критерий Стыодента, в противоположность порядковым критериям, обладает другим недостатком, а именно незначительной мощностью. В $ б моей уже упоминавшейся работы (Ма1Ь. Апп., 126, 106) я рассматривал случай, когда функции распределения К н 0 случайных величии х и у устроены таким образом, что при некотором однозначном преобразовании случайных величин (35) х' =т(х), у' = т(у) оба распределения переходит в нормальные распределения с равными дисперсиями, но различными средними значениями.
Мощность критерия Х точно так же, как и мощность любого другого порядкового критерия, при таком преобразовании остается, конечно, неизменной. Что касается функции мощности критерия Стьюдента, то она вследствие преобразования (35) может значительно уменьшиться. В частности, такое уменьшение происходит тогда, когда благодаря преобразованию (35) квадратичные отклонения ~як и о- увеличиваются сильнее, чем разность средних значений х — у. В одной из следующих заметок (Ргос. Коп.
Айвб, Аша1егбаш, А 56, 311) я рассмотрел другой случай, когда х,,..., х, распределены равномерно между нулем и единицей, а у„..., ув распределены равномерно между нулем и 1 + у,. При этом оказалось, что при 1в - функции мощности порядковых критериев стремятся к единице, а функция мощности критерия Стьюдента к единице не стремится.
й 65. Критерий Х 35? Мне и на практике приходилось иметь дело со случаями, в которых гипотеза о нормальном распределении х и у с равными дисперсиями заведомо не имела места и в которых критерий Х нулевую гипотезу отвергал, в то время как критерий Стыодента (с тем же уровнем значимости) не позволял сделать такой же вывод. Пример 25. На одном промышленном предприятии измерялось время простоев, подверженное сильному рассеянию. Числовые значения я, к сожалению, забыл; поэточу мы воспользуемся теми даннымн, которые указаны в упоминавшихся ранее таблицах нан дер Вардена н Нивергельта: хх = 11, х, = 34, хт = 13, ха — — !8.
После реорганизации производства время простоев сократилось и рассеяние уменьшилось, например: у, = 8, у, = 10, у, = 7, у4 =- 6. В паннам случае возможность применения критерия Стьюдента является весьма сомнительной, так как результаты наблюдений показывают, что распределения едва ли являются нормальными и что дисперсии не равны друг другу; кроме того, д и Ь не очень велики. Если тем не менее все-такн применить критерий Стьюдсита (двусторонний критерий с уровнем значимости 0,05), то нулевая гипотеза не будет отвергнута: отношение С в данном случае принимает значение 2,1, а соответствующая граница (по табл.
7) равна 2,4. Критерий Вилкаксона нулевую гипотезу немедленно отвергает. Так как все х больше любого нз у, то количество инверсий равно 16. Для того чтобы применить табл. !О, нужно х и у поменять местами; в этом случае количество инверсий станет равным нчлю. В столбце (4; 4) при м = 0 находим, что вероятность события П = 0 равна 0,0143.
Так как зта вероятность меньше чем 0,025, та, согласно одностороннему критерию с ф =: 0,025 нли согласно двустороннему критерию с 2)Г = 0,05, нулевую гипотезу следует отвергнуть. Для применения критерия Х нужно все х и у расположить в порядке возрастания их величины (при этом хг буду~ иметь порядковые номера 5, 8, 6 и 7) и вычислить (5) ~8 ) (61 ~7) = 0,14 + 1,22 + 0,43 + 0,76 = 2,55. Для вычисления Х можно воспользоваться табл.
2, в конце этой книги, или более удобной табл. 2 ван дер Вердена — Нивергельта. При и = 8 и д — Ь = 0 двусторонняя 5зюная граница равна 2,40 (табл. 11). Следовательно, по критерию Х нулевую гипотезу нужно также отвергнуть. ГЛАВА ХШ КОРРЕЛЯ ЦИЯ В этой главе будет предполагаться известным лишь содержание первых шести глав. з 66. Ковариация и коэффициент корреляции А ИСТИННЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ Если х и у — две зависимые случайные величины, то дисперсия суммы Лх+у, помимо дисперсий слагаемых Л х и у, содержит еще член, линейный относительно Л: Я(Л х -ь у — Л х — у)' = Ле С,(х — х)е + +2Л С',(х — х) (у — у) + Я(у — у)'-, (1) Коэффициент нри 2Л в прагой части (1) называется ковариацией случайных величин х и у, Если ковариацию разделить на произведение квадратичных отклонений т„<тх, которые предполагаются отличными от нуля, то получится истинный коэффиг(иент корреляции о: с е= с,(х — х) (у — у1 (2) С помощью (2) формулу (1) можно записать так: а1,+е — — Лго~ + 2Л оо',сг + оЯ.