Стентон Гланц - Медико-биологическая статистика (1034784), страница 17
Текст из файла (страница 17)
В критерии Тьюки при всех сравненияхвместо l берут число групп m, таким образом, критическое значение q все время одно и то же. Критерий Ньюмена-Кейлса былразработан как усовершенствование критерия Тьюки.Применяя критерии Тьюки к только что рассмотренной задаче о влиянии бега на частоту менструации нужно было быприравнять l к числу групп m = 3. Соответствующее критическое значение равно 3,385 и неизменно при всех сравнениях. Внашем примере при двух последних сравнениях критическиезначения по Тьюки будут больше чем по Ньюмену-Кейлсу.
Однако в данном случае результат применения обоих критериеводин и тот же. Разумеется, так будет не всегда. Поскольку в критерии Тьюки при всех сравнениях используется максимальноекритическое значение q, различия будут выявляться реже, чемпри использовании критерия Ньюмена-Кейлса.СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА113Критерий Тьюки слишком жесток и отвергает существованиеразличий чаще, чем нужно, а критерий Ньюмена–Кейлса напротив слишком мягок. В общем, выбор критерия определяется скорее психологическим фактором, чего больше боится исследователь найти отличия там, где их нет или пропустить их там, гдеони есть. Автор предпочитает критерий Ньюмена–Кейлса.МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ С КОНТРОЛЬНОЙГРУППОЙ*Иногда задача заключается в том, чтобы сравнить несколькогрупп с единственной — контрольной.
Конечно, можно былобы использовать любой из описанных методов множественногосравнения (критерий Стьюдента с поправкой Бонферрони, Ньюмена—Кейлса или Тьюки): попарно сравнить все группы, а затем отобрать те сравнения, в которых участвовала контрольнаягруппа. Однако в любом случае (особенно при применении поправки Бонферрони) из-за большого числа лишних сравненийкритическое значение окажется неоправданно высоким. Иными словами мы слишком часто будем пропускать реально существующие различия. Преодолеть эту трудность позволяют специальные методы сравнения, из которых мы разберем два. Этоеще одна модификация критерия Стьюдента с поправкой Бонферрони и критерии Даннета. Как и другие методы множественного сравнения их следует применять только после того, как спомощью дисперсионного анализа отвергнута нулевая гипотеза о равенстве всех средних.Поправка БонферрониПрименить поправку Бонферрони к сравнению нескольких группс одной контрольной очень просто.
Ход вычислений такой жечто и при применении поправки Бонферрони в общем случае.Надо только учесть, что число сравнений k составляет теперь*Этот материал важен для тех, кто использует нашу книгу как руководство для анализа данных. Во вводном курсе этот раздел можноопустить.56789101112131415161718192024304060120∞ν22,572,452,362,312,262,232,202,182,162,142,132,122,112,102,092,092,062,042,022,001,981,9633,032,862,752,672,612,572,532,502,482,462,442,422,412,402,392,382,352,322,292,272,242,2143,293,102,972,882,812,762,722,682,652,632,612,592,582,562,552,542,512,472,442,412,382,3553,483,263,123,022,952,892,842,812,782,752,732,712,692,682,662,652,612,582,542,512,472,4463,623,393,243,133,052,992,942,902,872,842,822,802,782,762,752,732,702,662,622,582,552,5173,733,493,333,223,143,073,022,982,942,912,892,872,852,832,812,802,762,722,682,642,602,5783,823,573,413,293,203,143,083,043,002,972,952,922,902,892,872,862,812,772,732,692,652,6193,903,643,473,353,263,193,143,093,063,023,002,972,952,942,922,902,862,822,772,732,692,65Интервал сравнения lТаблица 4.4А.
Критические значения q′ для α′ = 0,05103,973,713,533,413,323,243,193,143,103,073,043,023,002,982,962,952,902,862,812,772,732,69114,033,763,583,463,363,293,233,183,143,113,083,063,033,013,002,982,942,892,852,802,762,72124,093,813,633,503,403,333,273,223,183,143,123,093,073,053,033,022,972,922,872,832,792,74134,143,863,673,543,443,363,303,253,213,183,153,123,103,083,063,053,002,952,902,862,812,77164,263,973,783,643,533,453,393,343,293,263,233,203,183,163,143,123,073,022,972,922,872,83214,424,113,913,763,653,573,503,453,403,363,333,303,273,253,233,223,163,113,063,002,952,9111424,033,713,503,363,253,173,113,053,012,982,952,922,902,882,862,852,802,752,702,662,622,5834,634,213,953,773,633,533,453,393,333,293,253,223,193,173,153,133,073,012,952,902,852,7944,984,514,214,003,853,743,653,583,523,473,433,393,363,333,313,293,223,153,093,032,972,9255,224,714,394,174,013,883,793,713,653,593,553,513,473,443,423,403,323,253,193,123,063,0065,414,874,534,294,123,993,893,813,743,693,643,603,563,533,503,483,403,333,263,193,123,06Интервал сравнения l7895,565,695,805,005,105,204,644,744,824,404,484,564,224,304,374,084,164,223,984,054,113,893,964,023,823,893,943,763,833,883,713,783,833,673,733,783,633,693,743,603,663,713,573,633,683,553,603,653,473,523,573,393,443,493,323,373,413,253,293,333,183,223,263,113,153,19105,895,284,894,624,434,284,164,073,993,933,883,833,793,753,723,693,613,523,443,373,293,22С.
W, Dunnett. New tables for multiple comparisons with a control. Biometrics, 20:482—491, 1964.ν56789101112131415161718192024304060120∞Таблица 4.4Б. Критические значения q′ для α′ = 0,01115,985,354,954,684,484,334,214,124,043,973,923,873,833,793,763,733,643,563,483,403,323,25126,055,415,014,734,534,374,254,164,084,013,953,913,863,833,793,773,683,593,513,423,353,27136,125,475,064,784,574,424,294,194,114,053,993,943,903,863,833,803,703,623,533,453,373,29166,305,625,194,904,684,524,304,294,204,134,074,023,983,943,903,873,783,693,603,513,433,35216,525,815,365,054,824,654,524,414,324,244,184,134,084,044,003,973,873,783,683,593,512,42115116ГЛАВА 4m – 1 и соответственно рассчитать уровень значимости в каждом из сравнений α = α′/k.
Применим этот метод к исследованию частоты менструаций. Сравним спортсменок и физкультурниц с контрольной группой. Число сравнений k – 2 (а не 3как при всех возможных сравнениях). Чтобы полная вероятностьошибочно обнаружить различия не превышала 0,05 при каждом сравнении, уровень значимости должен быть 0,05/2 = 0,025(вместо 0,05/3 = 0,017). Число степеней свободы — 75; критическое значение t = 2,31 (при всех возможных сравнениях онобы составило 2,45). Величину l для сравнения физкультурниц испортсменок с контролем мы уже рассчитывали — 2,54 и 4,35соответственно. Таким образом, и спортсменки и физкультурницы статистически значимо отличаются от контрольной группы.
В данном случае вывод получился тот же, что и при применении поправки Бонферрони в общем случае. Ясно, однако, чтоза счет снижения критического уровня t чувствительность метода повышается. Обратите внимание, что в данном случае мыне делаем никакого заключения о различии спортсменок и физкультурниц.Критерии ДаннетаКритерии Даннета — это вариант критерия Ньюмена–Кейлса для сравнения нескольких групп с одной контрольной.
Онвычисляется какq′ =X кон − X A.112sвну+ nкон n A Число сравнении равно числу групп не считая контрольной, исущественно меньше числа сравнений в исходном критерии Ньюмена–Кейлса. Соответственно меньше и критические значения(табл. 4.4). Как и в критерии Ньюмена–Кейлса сначала средниезначения для всех групп упорядочиваются только теперь — по абсолютной величине их отличия от контрольной группы. Затем контрольную группу сравнивают с остальными начиная с наиболееотличной от контрольной.
Если различия с очередной группой ненайдены вычисления прекращают. Параметр l постоянен и равенСРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА117числу групп включая контрольную. Число степеней свободы вычисляют как в критерии Ньюмена–Кейлса: ν = N – m.Применим критерий Даннета к анализу влияния бега на менструации. Сначала сравним с контрольной наиболее от нее отличную группу спортсменок:q′ =X кон − X 1=11, 5 − 9, 1= 4, 35.11 3, 95 + 26 26 12 1+ sвну nкон n1 Общее число средних равно трем, поэтому l = 3.
Число степеней свободы равно 75. По таблице 4.4 находим критическое значение для уровня значимости 0,05. Оно равно 2,28. Вычисленноезначение больше критического. Тем самым различие между спортсменками и контрольной группой статистически значимо и сравнения можно продолжать.Теперь сравним с контрольной группу физкультурницq′ =X кон − X 2=11, 5 − 10, 1= 2, 54.11 3, 95 + 26 26 12 1+ sвну nкон n2 Критическое значение, q′ по-прежнему равно 2,28. Вычисленное значение больше. Различие между физкультурницами иконтрольной группой статистически значимо.Критерии Даннета, как вариант критерия Ньюмена-Кейлсаболее чувствителен, чем критерий Стьюдента с поправкой Бонферрони, особенно при большом числе групп. Если бы группбыло больше, мы убедились бы, что критерии Ньюмена-Кейлсаобнаруживает те различия, которые упускает критерии Стьюдента с поправкой Бонферрони завышающей критические значения t.ЧТО ОЗНАЧАЕТ РПоговорим еще раз о вероятности справедливости нулевой гипотезы Р.
Понимание смысла Р требует понимания логики проверки статистической гипотезы. Например, исследователь хочет118ГЛАВА 4узнать, влияет ли некий препарат на температуру тела. Очевидная схема эксперимента: взять две группы, одной дать препаратдругой плацебо измерить температуру и вычислить для обеихгрупп среднюю температуру и стандартное отклонение. Средние температуры вряд ли совпадут, даже если препарат не обладает никаким действием. Поэтому естественен вопрос сколь вероятно, что наблюдаемое различие случайно?Для ответа на этот вопрос, прежде всего, нужно выразить различия одним числом — критерием значимости. Со многими изних мы уже встречались — это критерии F, t, q и q′.