В.Д. Мятлев, Л.А. Панченко, А.Т. Терехин - Основы математической статистики (1118816), страница 9
Текст из файла (страница 9)
расположим в порядкевозрастания), сохранив информацию о принадлежности к выборке:Ранг123174174175456789185185187183179181Сумма рангов выборки значений случайной величиныравнаW=1+2+3+6=12. Это значение не выходит за двусторонние критическиепределы W0.025=11 и W0.975=34 уровня значимости 5%. Выборочное значениестатистики U=2 и соответствующее ему p=0.032 меньше 0.05 и,следовательно, у нас нет оснований отвергнуть нулевую гипотезу о том, чтосдвиг между распределениями F(x) и G(x) отсутствует.49Заметим, что приведенные данные были получены с помощью датчикаинормально распределенных случайных чисел. Приведенные выше значения могли бы быть, например,значениями роста четырех случайно выбранных французов и пяти случайновыбранных норвежцев (средний рост взрослых мужчин Франции и Норвегииравен 175 и 180 см, соответственно).
Т.е. в действительности сдвиг междураспределениями отличен от нуля (он равен =175-180=-5) и гипотезаневерна, но критерии Вилкоксона и Манна - Уитни не обнаружилиразличия между распределениями F(x) и G(x). Если применить кприведенным данным t-критерий Стьюдента для сравнения математическихожиданий двух нормально распределенных случайных величин снеизвестными дисперсиями, то получим выборочное значение t=-2.72 длястатистики критерия.
Поскольку это значение выходит за 5%-ныекритические пределы t7,0.025=-2.36 и t7,0.975=2.36 t-распределения с 4+5-2=7степенями свободы, то гипотеза о равенстве математических ожиданийдолжна быть отвергнута. Это типичная ситуация - непараметрическиекритерии обладают меньшей мощностью по сравнению с аналогичнымипараметрическимикритериями,использующимидополнительнуюинформацию о наблюдаемых случайных величинах. Поэтому, если имеетсядостоверная дополнительная информация, то предпочтительнее использоватькритерий, учитывающий эту информацию.Гипотезу об отсутствии сдвига можно проверить также с помощьюкритерия Ван-дер-Вардена. Обозначим N=n+m.
Статистика критерия имеетвидгде R(xi) - ранг наблюдения xi, анормального распределения.- p-квантиль стандартногоЕсли нулевая гипотеза H0 верна, топоследовательностей длиной Nиз xi и yi являются равновероятными. При малых n и m критические значенияможно вычислить точно с помощью непосредственного перебораравновозможных последовательностей из x и y. Верхнее,, и нижнее,, критические значения, соответствующие уровню значимости , призаданных n и m связаны соотношением. Критическая областьуровня значимостиальтернативыиальтернативыдля проверки гипотезыпротив двустороннейбудет состоять из двух бесконечных полуинтервалов. Критическая область против правосторонней- изодного полуинтервала50и противлевосторонней альтернативы- также из одного полуинтервала.
При, независимо от поведения n и m по отдельности,.статистика X распределена асимптотически нормально,КритерийВан-дер-Варденаявляетсянаиболеемощнымнепараметрическим критерием для решения задачи двух выборок, еслифункции распределений F(x) и G(x) отличаются лишь параметром сдвига.Если обе выборки извлечены из нормальных совокупностей, то прикритерий Ван-дер-Вардена имеет такую же мощность,постоянном n икак и двухвыборочный t-критерий.Случай связанных выборокПусть x1,…, xn и y1,…, yn – связанные выборки из непрерывныхраспределений F(x) и G(x), соответственно, причем.
Например,каждая пара наблюдений (xi, yi), i=1,…, n, принадлежит одному объекту, либо(xi, yi) попарно связаны тем, что условия проведения наблюдений менялисьот опыта к опыту, но для каждой пары (xi, yi) оставались постоянными, что впрактике биологического эксперимента встречается очень часто.Обозначим через zi=xi - yi. Тогда задача об отсутствии сдвига междуF(x) и G(x) сводится к одновыборочной задаче, рассмотренной в 3.11.1. Идля проверки гипотезы H0 можно применить критерий знаков или критерийзнаковых рангов.Асимптотическая относительная эффективность критерия знаков длясвязанных выборок по отношению к двухвыборочному t-критерию длясвязанных выборок равна 0.637, а критерия знаковых рангов Вилкоксона –0.955.3.11.3.
Критерии однородностиКритерии Манна – Уитни (Вилкоксона) и Ван-дер-Вардена позволяютобнаруживать лишь различия в центральных тенденциях распределений двухслучайных величин. Если важно обнаружить любые расхождения в формераспределений, то пользуются критериями однородности, например,двухвыборочным критерием Смирнова. С помощью этого критерияпроверяется гипотезаигипотезыо том, что функции распределенияслучайных величиниидентичны против альтернативнойо том, что они различны.51Статистика критерия Смирнова Dm,n определяется как максимуммодуля разности между эмпирической функцией, построенной повыборке х1, х2, ..., хп, и эмпирической функциейвыборке y1, y2, ..., ym, построенной поимеетПри справедливости гипотезы H0 статистикаасимптотическое (притак, что отношение m/n остаетсяпостоянным) распределение Колмогорова. Критическая область уровнязначимости для проверки гипотезы H0 против двусторонней альтернативыH1 будет состоять из одного полуинтервалараспределения статистикипри H0 порядка, где- квантиль.Заметим, что в англоязычной литературе и в ППП критерийоднородности двух выборок Смирнова называют двухвыборочнымкритерием Колмогорова-Смирнова.3.11.4.
Проверка гипотезы о независимостиПусть имеется двумерная выборка (x1, y1), (x2, y2), …, (xn, yn) изнеизвестного двумерного распределения. Причем наблюдаемые признакимогут быть как количественными, так и порядковыми. Найдем ранги, R(xi) иR(yi), в последовательностях x1, x2, …, xn и y1, y2, …, yn, упорядоченных поотдельности. Мерой зависимости двух случайных величин, каждая изкоторых может быть как количественной, так и порядковой, являетсякоэффициент ранговой корреляции Спирмена, определяемый формулойгде di= R(xi)-R(yi). Как и обычный коэффициент корреляции,коэффициент ранговой корреляции rs принимает значения, причемrs=+1, когда R(xi)=R(yi), i=1, …, n, и rs=-1, когда последовательности ранговполностью противоположны, R(xi)=(n+1)-R(yi), i=1, …, n.
Коэффициент rsиспользуется для проверки гипотезы о независимости признаков. Нулеваягипотеза формулируется как. Чаще всего H0 проверяется противальтернативы. Статистикой критерия является rs. Если нулеваягипотеза H0 верна, то распределение rs симметрично относительно 0 с Mrs=0и Drs=1/(n-1).
Следовательно, множество принятия нулевой гипотезы имеет52вид, где– верхнее критическое значение статистикикритерия rs, соответствующее уровню значимости при заданном n.Если верна нулевая гипотеза, случайная величинаприраспределена асимптотически нормально с параметрами (0, 1). Прикритические значения статистики критерия находят по таблицам точногораспределения rs при H0, а при n>10 пользуются нормальнойаппроксимацией.Асимптотическая относительная эффективность критерия, основанногона rs, по отношению к критерию, основанному на выборочном коэффициентекорреляции, равна 0.912.53ЛИТЕРАТУРА1.Благовещенский Ю.Н., Самсонова В.П., Дмитриев Е.А.Непараметрические методы в почвенных исследованиях.
М.: Наука,1987.2.Большев Л.Н., Смирновстатистики. М.: Наука, 1983.Н.В.Таблицыматематической3.Кендалл М.Дж., Стьюарт А. Статистические выводы и связи. М.:Наука, 19734.Компьютерная биометрика. М.: Изд-во МГУ, 19905.Тюрин Ю.Н. Непараметрические методы статистики. М.: Знание,1978.6.Хан Г., Шапиро С. Статистические модели в инженерных задачах.М.: Cтатистика, 1980.7.Холлендер М., Вульф Д. Непараметрические методы статистики.М.: Финансы и статистика, 1983.8.Lilliefors H.W. The Kolmogorov-Smirnov Test for Normality withMean and Variance Unknown. J.
Amer. Stat. Assn. v.62: 399-402.9.Sokal R.R., Rohlf F.J. Biometry. The Principles and Practice ofStatistics in Biological Research. N-Y, 1995.54.