Стентон Гланц - Медико-биологическая статистика (1034784), страница 46
Текст из файла (страница 46)
H. Zar. Bio-statsticalanalisys. 2nd ed. Prentice-Hall, Englewood Cliffs, N. J., 1984 и W. J. Dixon, F.J. Massey, Jr. Introduction to statistical analisys. 4th ed., McGraw-Hill, NewYork, 1983.НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ327перечисленных способов выбрать, а в том, что объем выборкислишком мал, чтобы применить любой из них. Убедительные свидетельства в пользу гипотезы нормальности или против нее встречаются редко. Гораздо чаще все решают интуиция, привычка ивкус исследователя. Существуют две точки зрения на то, как следует поступать в таких случаях. Согласно одной, в отсутствиеочевидных противоречий между данными и гипотезой их нормального распределения следует применить параметрическийметод.
Согласно другой, если нет явного подтверждения гипотезы нормальности распределения, лучше воспользоваться непараметрическим методом. Сторонники первой точки зрения упирают на то, что параметрические методы более чувствительны иболее известны. Приверженцы второй резонно замечают, чтоисследователь не должен исходить из предположений, которыенельзя проверить, и что, применяя непараметрические критерии,мы почти ничем не рискуем — ведь даже в случае нормальногораспределения их чувствительность не намного ниже чувствительности параметрических. Ни одна из сторон пока не одержала верх, и похоже, этого не произойдет никогда.СРАВНЕНИЕ ДВУХ ВЫБОРОК: КРИТЕРИЙ МАННА—УИТНИНапомним схему, по которой строились все параметрическиеметоды, будь то критерий Стьюдента, дисперсионный или корреляционный анализ.
Из нормально распределенной совокупности мы извлекали все возможные выборки определенного объема и строили распределение значений соответствующего критерия. Теперь, упорядочив значения признака и перейдя от реальных значений к рангам, мы поступим несколько иначе. Мыпросто перечислим все возможные варианты упорядочиваниядвух групп.Как это сделать, мы покажем на простом примере. Чтобы вариантов упорядочивания было не слишком много, рассмотримопыт с участием 7 добровольцев. Из них 3 принимают плацебо(контрольная группа), а 4 препарат, предположительно диуретик(экспериментальная группа).
В табл. 10.1 приведены данные осуточном диурезе. Против каждого значения диуреза указан328ГЛАВА 10Таблица 10.1. Эксперимент с диуретикомПлацебоПрепарат(контрольная группа)(экспериментальная группа)СуточныйСуточныйдиурез, млРангдиурез, млРанг10001140061380516007120031180212204Т=9его ранг — место в общем упорядоченном ряду. Рангом наименьшей величины будет 1; ранг наибольшей величины равен числунаблюдений, то есть 7. Если препарат увеличивает диурез, торанги в экспериментальной группе должны быть больше, чем Вконтрольной.
Мерой отличия изберем сумму рангов в меньшейиз групп и обозначим ее Т. В нашем примере меньшая группа— контрольная. Соответствующее значение Т равно 9.Достаточно ли мало значение T, чтобы отклонить гипотезуоб отсутствии действия препарата?Для ответа на этот вопрос рассмотрим совокупность всех возможных перестановок. Заметьте, после перехода к рангам намуже не нужно рассматривать сами исходные величины и совокупность их возможных значений. Поэтому наши дальнейшиерассуждения полностью применимы к любым двум группам наблюдений по 3 и 4 наблюдения в каждой.Итак, нулевая гипотеза — гипотеза об отсутствии влиянияпрепарата на диурез. Если она справедлива, любой ранг можетравновероятно оказаться в любой из групп.
Чтобы узнать, великали вероятность случайно получить перестановку из табл. 10.1,рассмотрим все возможные перестановки. Понятно, что распределить ранги по двум группам — это то же самое, что набрать ранги для одной из групп (оставшиеся автоматически попадут во вторую). Тогда, перечислив все варианты выбора 3 рангов из 7, мытем самым перечислим все варианты распределения семи ранговпо двум группам.
Число способов по-разному выбрать 3 ранга из7 равно 35. Все 35 вариантов приведены в табл. 10.2. Крестикомпомечены ранги, попадающие в контрольную группу. В правомНЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ329Таблица 10.2. Варианты разделения 7 рангов на две группы по3 и 4 рангаРангиСумма1234567рангов×××6×××7×××8×××9×××10×××8×××9×××10×××11×××10×××11×××12×××12×××13×××14×××9×××10×××11×××12×××11×××12×××13×××13×××14×××15×××12×××13×××14×××14×××15×××16×××15×××16×××17×××18330ГЛАВА 10Рис.
10.1. 35 возможных сумм рангов для меньшей из групп (см. табл. 10.2).столбце для каждого из вариантов указана величина T — суммарангов меньшей (контрольной) группы. Если нанести значенияT на график, получится распределение, показанное на рис. 10.1.Если справедлива нулевая гипотеза, то все сочетания рангов равновероятны. Это значит, что если, например, Т = 12 в 5 вариантах из 35, то вероятность случайно получить значение T = 12равна 5/35. Таким образом, на рис. 10.1 изображено распределение значений T в случае справедливости нулевой гипотезы оботсутствии действия препарата.
По форме оно напоминаетраспределение t (рис. 4.5). Однако есть и отличия. Действительно, распределение t непрерывно. Оно построено по бесконечной совокупности значений, вычисленных для бесконечногочисла выборок из бесконечной нормально распределеннойсовокупности. Напротив, распределение Т конечно и дискретно, то есть имеет ступенчатый вид, принимая значения лишь вконечном числе целочисленных точек.Глядя на рис. 10.1, легко определить вероятность получитьто или иное значение Т при условии справедливости нулевойгипотезы. Например, значения T = 9 и Т = 15 наблюдаются в 3вариантах, то есть вероятность появления каждой из этих суммравна 3/15. Вероятность получить значение Т, равное 8 или 16,составляет 2/35 = 0,057.
Будем считать эти значения T критическими. В нашем опыте Т = 9, так что нулевую гипотезу отвергнуть мы не можем.Уровень значимости обычно принимают равным 5% или 1%.Можно ли установить такой уровень в нашем примере? Оказывается, нет. У нас есть всего 13 разных значений Т, поэтому уровень значимости может меняться только скачками. Назвав произвольный уровень значимости α, мы скорее всего обнаружим,что нет такого значения Т, которому бы он соответствовал. Вкачестве критического берут то значение Т, которому соответ-НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ331ствует уровень значимости, наиболее близкий к 1 или 5%. Внашем примере ближе всего к 5% находится уровень значимости 5,7%, соответствующий Т = 8.Критические значения критерия Манна— Уитни приведеныв табл.
10.3. Столбец критических значений содержит пары чисел. Различия статистически значимы, если Т не больше первого из них или не меньше второго. Например, когда в одной группе3 человека, а в другой 6, различия статистически значимы, еслиT ≤ 7 или T ≥ 23.Изложенный вариант критерия известен как T-критерий Манна—Уитни*.
Порядок его вычисления таков.• Данные обеих групп объединяют и упорядочивают по возрастанию. Ранг 1 присваивают наименьшему из всех значений,ранг 2 — следующему и так далее. Наибольший ранг присваивают самому большому среди значений в обеих группах. Еслизначения совпадают, им присваивают один и тот же среднийранг (например, если два значения поделили 3-е и 4-е места,обоим присваивают ранг 3,5).• Для меньшей группы вычисляют Т — сумму рангов ее членов. Если численность групп одинакова, Т можно вычислитьдля любой из них.• Полученное значение T сравнивают с критическими значениями. Если Т меньше или равно первому из них либо большеили равно второму, то нулевая гипотеза отвергается (различия статистически значимы).Что делать, если нужной численности групп в таблице неоказалось? Можно самому построить распределение Т.
К сожалению, с ростом численности групп сделать это становится всетруднее. Например, если объем каждой из групп равен 10, то*Существует еще U-критерий Манна—Уитни, в котором вместо Т вычисляют U, при этом U = T – nм (nм + 1)/2, где n м — численностьменьшей из групп. Об этом варианте критерия можно прочесть вкниге S. Siegel, N. J. Castellan. Nonparametric Statistics for the Behavioral Sciences, 2nd ed.
McGraw-Hill, N. Y., 1988. Подробный вывод Ткритерия и его связь с U-критерием приведены в книге F. Mosteller,R. Rourke. Sturdy Statistics: Nonparametrics and Order Statistics,Addison-Wesley, Reading, Mass., 1973.332ГЛАВА 10Таблица 10.3. Критические значения критерия (двустороннийвариант) Манна— УитниЧисленность Приблизительный уровень значимости αгруппы0,050,01ТочноеТочноемень- боль- Критические значе- Критические значешей шейзначенияние α значенияние α346180,05756210,03657200,07167230,0486240,02477260,0336270,01778250,06788280,0426300,0124411250,05710260,026511290,03210300,016512280,063612320,03810340,010713350,04210380,012814380,04811410,008812400,0165517380,03215400,008518370,05616390,016619410,05216440,010720450,04817480,010821490,04518520,0116626520,04123550,009624540,015728560,05124600,008725590,014829610,04325650,008830600,05926640,0137737680,05333720,011839730,05434780,0098849870,05044920,010НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ333число вариантов равно 184756.