Лекция 15_ (Лекции в электронном виде)
Описание файла
Файл "Лекция 15_" внутри архива находится в папке "Лекции в электронном виде". Документ из архива "Лекции в электронном виде", который расположен в категории "". Всё это находится в предмете "методы и техника медико-биологических исследований" из 10 семестр (2 семестр магистратуры), которые можно найти в файловом архиве МГТУ им. Н.Э.Баумана. Не смотря на прямую связь этого архива с МГТУ им. Н.Э.Баумана, его также можно найти и в других разделах. Архив можно найти в разделе "лекции и семинары", в предмете "методы и техника медико-биологических исследований" в общих файлах.
Онлайн просмотр документа "Лекция 15_"
Текст из документа "Лекция 15_"
Лекция 15.
9. НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ
Математическая модель, которая используется при построении дисперсионного анализа, предполагает нормальное распределение. Поэтому критические значения F и t дадут правильное представление о статистической значимости различий только в случае, если выборки извлечены именно из совокупности с нормальным распределением.
Параметрические методы, как видно уже из их названия, оперируют параметрами распределения. В частности, дисперсионный анализ и его частный случай, критерий Стьюдента, основаны на сравнении средних и дисперсий. Но эти параметры правильно описывают только нормально распределенную совокупность. Если распределение далеко от нормального, среднее и дисперсия дадут о нем неверное представление. Столь же неверными окажутся и критерии, основанные на этих параметрах. Непараметрические методы, которые мы рассмотрим в этом разделе, заменяют реальные значения признака рангами. При этом мы сохраняем большую часть информации о распределении, но избавляемся от необходимости знать, что это за распределение. Нас не интересуют более параметры распределения, отпадает и необходимость равенства дисперсий. Остается в силе только предположение, что тип распределения во всех случаях одинаков.
Если выполняется условие нормальности распределения, параметрические критерии обеспечивают наибольшую чувствительность. Если же это условие не выполняется хотя бы приблизительно, их чувствительность существенно снижается и непараметрические критерии дают больше шансов выявить реально существующие различия.
9.1. Сравнение двух выборок. Критерий Манна-Уитни
Напомним схему, по которой строились все параметрические методы, будь то критерий Стьюдента, дисперсионный или корреляционный анализ. Из нормально распределенной совокупности мы извлекали все возможные выборки определенного объема и строили распределение значений соответствующего критерия. Теперь, упорядочив значения признака и перейдя от реальных значений к рангам, мы поступим несколько иначе. Мы просто перечислим все возможные варианты упорядочивания двух групп.
Как это сделать, мы покажем на простом примере. Чтобы вариантов упорядочивания было не слишком много, рассмотрим опыт с участием 7 добровольцев. Из них 3 принимают плацебо (контрольная группа), а 4 препарат, предположительно диуретик (экспериментальная группа). В табл. 8.1 приведены данные о суточном диурезе. Против каждого значения диуреза указан его ранг – место в общем упорядоченном ряду.
Плацебо Препарат(контрольная группа) (экспериментальная группа) | |||
Суточный диурез, мл | Ранг | Суточный диурез, мл | Ранг |
1000 1380 1200 | 1 5 3 Т=9 | 1400 1600 1180 1220 | 6 7 2 4 |
Рангом наименьшей величины будет 1; ранг наибольшей величины равен числу наблюдений, то есть 7. Если препарат увеличивает диурез, то ранги в экспериментальной группе должны быть больше, чем в контрольной. Мерой отличия изберем сумму рангов в меньшей из групп и обозначим ее Т. В нашем примере меньшая группа – контрольная. Соответствующее значение Т равно 9.
Достаточно ли мало значение Т, чтобы отклонить гипотезу об отсутствии действия препарата?
Для ответа на этот вопрос рассмотрим совокупность всех возможных перестановок. Заметьте, после перехода к рангам нам уже не нужно рассматривать сами исходные величины и совокупность их возможных значений. Поэтому наши дальнейшие рассуждения полностью применимы к любым двум группам наблюдений по 3 и 4 наблюдения в каждой.
Итак, нулевая гипотеза – гипотеза об отсутствии влияния препарата на диурез. Если она справедлива, любой ранг может равновероятно оказаться в любой из групп. Чтобы узнать, велика ли вероятность случайно получить перестановку из табл. 8.1, рассмотрим все возможные перестановки. Понятно, что распределить ранги по двум группам - это то же самое, что набрать ранги для одной из групп (оставшиеся автоматически попадут во вторую). Тогда, перечислив все варианты выбора 3 рангов из 7, мы тем самым перечислим все варианты распределения семи рангов по двум группам. Число способов по-разному выбрать 3 ранга из 7 равно 35. Все 35 вариантов приведены в табл. 8.2. Крестиком помечены ранги, попадающие в контрольную группу. В правом
Ранги | Сумма | ||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | рангов |
X | X | X | 6 | ||||
X | X | X | 7 | ||||
X | X | X | 8 | ||||
X | X | X | 9 | ||||
X | X | X | 10 | ||||
X | X | X | 8 | ||||
X | X | X | 9 | ||||
X | X | X | 10 | ||||
X | X | X | 11 | ||||
X | X | X | 10 | ||||
X | X | X | 11 | ||||
X | X | X | 12 | ||||
X | X | X | 12 | ||||
X | X | X | 13 | ||||
X | X | X | 14 | ||||
X | X | X | 9 | ||||
X | X | X | 10 | ||||
X | X | X | 11 | ||||
X | X | X | 12 | ||||
X | X | X | 11 | ||||
X | X | X | 12 | ||||
X | X | X | 13 | ||||
X | X | X | 13 | ||||
X | X | X | 14 | ||||
X | X | X | 15 | ||||
X | X | X | 12 | ||||
X | X | X | 13 | ||||
X | X | X | 14 | ||||
X | X | X | 14 | ||||
X | X | X | 15 | ||||
X | X | X | 16 | ||||
X | X | X | 15 | ||||
X | X | X | 16 | ||||
X | X | X | 17 | ||||
X | X | X | 18 |
столбце для каждого из вариантов указана величина Т – сумма рангов меньшей (контрольной) группы. Если нанести значения Т на график, получится распределение. По форме оно напоминает распределение t. Однако есть и отличия. Действительно, распределение t непрерывно. Оно построено по бесконечной совокупности значений, вычисленных для бесконечного числа выборок из бесконечной нормально распределенной совокупности. Напротив, распределение Т конечно и дискретно, то есть имеет ступенчатый вид, принимая значения лишь в конечном числе целочисленных точек.
Это распределение табулировано. Поэтому легко определить вероятность получить то или иное значение Т при условии справедливости нулевой гипотезы. Например, значения Т = 9 и Т = 15 наблюдаются в 3 вариантах, то есть вероятность появления каждой из этих сумм равна 3/35. Вероятность получить значение Т, равное 8 или 16, составляет 2/35 = 0,057. Будем считать эти значения Т критическими. В нашем опыте Т = 9, так что нулевую гипотезу отвергнуть мы не можем.
Уровень значимости обычно принимают равным 5% или 1%. Можно ли установить такой уровень в нашем примере? Оказывается, нет. У нас есть всего 13 разных значений Т, поэтому уровень значимости может меняться только скачками. Назвав произвольный уровень значимости α, мы скорее всего обнаружим, что нет такого значения Т, которому бы он соответствовал. В качестве критического берут то значение Т, которому соответствует уровень значимости, наиболее близкий к 1 или 5%. В нашем примере ближе всего к 5% находится уровень значимости 5,7%, соответствующий Т = 8.
Критические значения критерия Манна-Уитни приведены в табл. 8.3. Столбец критических значений содержит пары чисел. Различия статистически значимы, если Т не больше первого из них или не меньше второго. Например, когда в одной группе 3 человека, а в другой 6, различия статистически значимы, если Т < 7 или Т > 23.