Стентон Гланц - Медико-биологическая статистика (1034784), страница 48
Текст из файла (страница 48)
10.3). В четырех случаях значение W no абсолютной величине равно или превосходит19. Таким образом, отвергая нулевую гипотезу при |W| > 19, мыобеспечим уровень значимости 4/64 = 0,0625. Изменение диуреза в нашем опыте надо признать статистически не значимым:340ГЛАВА 10Таблица 10.6. Возможные сочетания знаковых рангов для 6 паризмеренийРангиСумма зна123456ковых рангов–––––––21+––––––19–+–––––17––+––––15–––+–––13––––+––11–––––+–9++–––––15+–+––––13+––+–––11+–––+––9+––––+–7–++––––11–+–+–––9–+––+––7–+–––+–5––++–––7––+–+––5––+––+–3–––++––3–––+–+–1––––++1+++––––9++–+–––7++––+––5++–––+–3+–++–––5+–+–+––3+–+––+–1+––++––1+––+–+1+–––++3НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИТаблица 10.6.
ОкончаниеРанги1234–+++–++––++––+–+–+–+–+––––++––++––+––––++++++++–+++–++–+++–+++––+–+++–+++–+–+––+–+++–+++–++––+–+––+++++++++++++–++–++–++–+++++++5–+–+–++–++–+–+–++–+++–++++–+++++3416––+–++–+++––+–++–+++–++++–++++++Сумма знаковых рангов–3–111353579–11335757911791113159111315171921ГЛАВА 10342Рис. 10.3. 64 возможные суммы рангов для группы из 6 человек (см. табл. 10.6).
4 наибольших по абсолютной величине значения помечены черным.Р < 0,0625. На самом деле в таблице имеется 14 значений W, поабсолютной величине не меньших 13. Поскольку 14/64 = 0,219,мы могли бы записать Р < 14/64.Как и в случае критерия Манна— Уитни, распределение Wне является непрерывным и поэтому нельзя указать критическое значение, для которого уровень значимости в точности равнялся бы, например, 5%. В табл.
10.7 приведены критическиезначения, наиболее близкие к 5 и 1% уровням значимости дляслучая, когда численность группы не превосходит 20.Если число пар измерений больше 20, то распределение Wдостаточно близко к нормальному со средним µW = 0 и стандартным отклонениемσW =n ( n + 1)( 2n + 1),6где n — число пар наблюдений (то есть численность группы).Можно, таким образом, использоватьzW =W − µW=σWW.n ( n + 1)( 2n + 1)6Чтобы приближение было более точным, воспользуемся поправкой Йейтса на непрерывность:zW =12.n ( n + 1)( 2n + 1)6W −НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ343Таблица 10.7. Критические значения W (двусторонний вариант)пWРпWР5150,06213650,0226210,032570,048190,06214730,0207280,016630,050240,04615800,0228320,024700,048280,05416880,0229390,020760,050330,05417970,02010450,020830,050390,048181050,02011520,018910,048440,054191140,02012580,020980,050500,052201240,0201060,048F.
Mostellerand R. Rourke. Sturdy statistics: nonparametrics and order statistics, AddisonWesley, Reading, Mass., 1973.При анализе наблюдений до—после встречается два вида совпадений. Это, во-первых, совпадение величин, которым присваиваются ранги. Такая ситуация возникает при использованиилюбого рангового метода, будь то критерий Манна—Уитни иликоэффициент корреляции Спирмена.
Как всегда, совпадающимвеличинам присваивается общий ранг, равный среднему мест,занимаемых ими в упорядоченном наборе*.Единственная особенность — то, что в случае наблюдений(до—после) речь идет о совпадении не самих величин наблюдае*Если некоторые значения совпадают, стандартное отклонение должно бытьуменьшено в соответствии со следующей формулой:σW =n ( n + 1)( 2n + 1)−∑(τi − 1) τi (τi + 1) ,612где n — численность группы, τi, - число значений i-го ранга.ГЛАВА 10344мого признака, а их изменений. Другой вид совпадения — совпадение значений «до» и «после». Каждую такую пару наблюдений нужно исключать из расчета, соответственно уменьшая наединицу объем выборки.Повторим последовательность шагов, позволяющую по наблюдениям, выполненным до и после лечения, проверить егоэффективность.• Вычислите величины изменений наблюдаемого признака.
Отбросьте пары наблюдений, которым соответствует нулевоеизменение.• Упорядочите изменения по возрастанию их абсолютной величины и присвойте соответствующие ранги. Рангами одинаковых величин назначьте средние тех мест, которые ониделят в упорядоченном ряду.• Присвойте каждому рангу знак в соответствии с направлением изменения: если значение увеличилось — «+», еслиуменьшилось — «–».• Вычислите сумму знаковых рангов W*.• Сравните полученную величину W с критическим значением. Если она больше критического значения, изменение показателя статистически значимо.А теперь применим критерий Уилкоксона к анализу рассмотренного в гл. 9 эксперимента Левина.Курение и функция тромбоцитовВ гл.
9 мы разобрали исследование Левина, посвященное влиянию курения на функцию тромбоцитов. В частности, на рис.9.2 приведены результаты опыта с выкуриванием сигареты: агрегация тромбоцитов до и после этого вредоносного воздействия.Рассмотрим еще раз эти данные (табл. 10.8). Обратим вниманиена 4-й столбец: здесь показана величина изменения интересую*Существует вариант критерия Уилкоксона, в котором суммируюттолько положительные или только отрицательные знаковые ранги.На выводе это никак не сказывается, однако значение W, естественно, получается другим. Поэтому важно знать, на какой варианткритерия рассчитана имеющаяся в вашем распоряжении таблицакритических значений.НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ345Таблица 10.8.
Агрегация тромбоцитов до и после сигаретывыкуриванияУчаст- ДоПосле Измене- Ранг изме- Знаковый рангниккурения курения ниененияизменения125272222252943,53,53273710664445612775304616101066782158,58,57535743,53,58538027111195261955106059–11–1112843158,58,5W = 64Рис. 10.4. Изменение агрегации тромбоцитов после выкуривания сигареты. Врядли мы имеем дело с нормальным распределением, об этом свидетельствует, в частности, «выпадающее» значение 27%. В таких случаях непараметрические методы, например критерий Уилкоксона, предпочтительнее параметрических, таких,как критерий Стьюдента.щего нас показателя.
Можно ли считать распределение изменения нормальным? При большом желании да, но следует всеже признать, что для суждения о типе распределения данныхслишком мало. Смущает и «выскакивающее» значение 27% —оно наводит на мысль о возможной асимметрии распределения.В подобных случаях лучше не рисковать и воспользоваться непараметрическим критерием.
Применим критерий Уилкоксона.Выпишем абсолютные величины изменений в порядке возрастания. Полученные ранги приведены в пятом столбце табл.10.8, а шестой столбец содержит те же ранги, но со знаками,соответствующими направлению изменения. Сумма знаковых346ГЛАВА 10рангов W = 2 + 3,5 + 6 + 7 + 10 + 8,5 + 3,5 + 11 + 5 + (–l) + 8,5 = 64.В табл.
10.7 находим 1,8% критическое Значение для суммы рангов. Оно равно 52, то есть меньше полученного нами. Поэтомумы признаем изменение агрегации тромбоцитов статистическизначимым (Р < 0,018).СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП:КРИТЕРИЙ КРУСКАЛА-УОЛЛИСАВ гл. 3 была рассмотрена задача сравнения нескольких выборок. Эта задача возникает, например, когда нужно определить,одинаково ли эффективны несколько методов лечения, каждыйиз которых испытывается на отдельной группе. Предполагалось,что данные, полученные для каждой из групп, подчиняются нормальному распределению, причем дисперсии по всем группампримерно одинаковы. На этом допущении и основан изложенный в гл. 3 однофакторный дисперсионный анализ. Сейчас мыпознакомимся с его непараметрическим аналогом, не.
требующим предположения о нормальности распределения. Это критерий Крускала—Уоллиса.Критерий Крускала—Уоллиса представляет собой обобщение критерия Манна—Уитни. Сначала все значения, независимоот того, какой выборке они принадлежат, упорядочивают по возрастанию. Каждому значению присваивается ранг — номер егоместа в упорядоченном ряду.
(Совпадающим значениям присваивают общий ранг, равный среднему тех мест, которые этивеличины делят между собой в общем упорядоченном ряду.)Затем вычисляют суммы рангов, относящихся к каждой группе,и для каждой группы определяют средний ранг. При отсутствиимежгрупповых различий средние ранги групп должны оказаться близки. Напротив, если существует значительное расхождение средних рангов, то гипотезу об отсутствии межгрупповыхразличий следует отвергнуть. Значение критерия Крускала—Уоллиса H и является мерой такого расхождения средних рангов.Для простоты положим, что групп всего три. Обобщение набольшее число групп получится автоматически.
Имеются результаты измерения некоторого признака в трех группах. Чис-НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ347ленность групп — n1, n2 и n3. Значения объединим, упорядочими каждому присвоим ранг. Вычислим сумму рангов для каждойгруппы — R1, R2 и R3. Найдем средние ранги: R1 = R1 n1 , R2 = R2 n2и R3 = R3 n3 .Общее число наблюдений N = n1 + n2 + n3. Для объединеннойгруппы рангами являются числа 1,2, ..., N и общая сумма ранговравна1 + 2 + … + ( N − 1) + N =N ( N + 1).2Тогда средний ранг R для объединенной группы равен1+ 2 +…+ NN +1=.N2Теперь найдем величину D, равнуюR=D = n1 ( R1 − R ) + n2 ( R2 − R ) + n3 ( R3 − R ) .Это прямой аналог межгрупповой вариации, знакомой нампо гл.