Стентон Гланц - Медико-биологическая статистика (1034784), страница 16
Текст из файла (страница 16)
Из неравенства Бонферрони следует, что если мы хотим обеспечитьвероятность ошибки α′, то в каждом из сравнений мы должныпринять уровень значимости α′/k — это и есть поправка Бонферрони. Например, при трехкратном сравнении уровень значимости должен быть 0,05/3 = 1,7%.*Некоторые авторы считают этап дисперсионного анализа излишними предлагают сразу применить методы множественного сравнения.Этот подход изложен в В. W. Broun, Jr., M. Hollander. Statistics: abiomedical introduction. Wiley, NewYork, 1977, chap. 10.
Analysis of Ksamples problems.106ГЛАВА 4Поправка Бонферрони хорошо работает, если число сравнений невелико. Если оно превышает 8, метод становится слишком «строгим и даже весьма большие различия приходится признавать статистически незначимыми*. Существуют не столь жесткие методы множественного сравнения, например критерииНьюмена-Кейлса (его мы рассмотрим в следующем разделе). Всеметоды множественного сравнения схожи с поправкой Бонферрони в том что, будучи модификацией критерия Стьюдента, учитывают многократность сравнений.Один из способов смягчить строгость поправки Бонферрони состоит в том, чтобы увеличить число степеней свободы, воспользовавшись знакомой из дисперсионного анализа внутригрупповой оценкой дисперсии.
Вспомним чтоt=X1 − X 2,s2 s2+n1 n2где s2 – объединенная оценка дисперсии совокупности.Используя в качестве такой оценки внутригрупповую дис2персию sвну(гл. 3), получим:t=X1 − X 22sвнуn1+2sвну.n2Если объемы выборок одинаковы тоt=X1 − X 222 sвну.nЧисло степеней свободы ν = m(n – 1). Если число групп mбольше 2, то число степеней свободы при таком расчете будет*Способность критерия выявлять различия называется чувствительностью,она обсуждается в гл. 6.СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА107больше 2(n – 1) благодаря чему критическое значение t уменьшится.Бег и менструации. Продолжение анализаВ предыдущей главе мы выяснили, что различия в ежегодномчисле менструальных циклов в группах спортсменок физкультурниц и в контрольной группе статистически значимы.
Однако осталось неясным, отличаются ли от контрольной группы испортсменки и физкультурницы или только спортсменки? Отличаются ли спортсменки от физкультурниц? Способа определить межгрупповые различия у нас не было. Теперь, используякритерий Стьюдента с поправкой Бонферрони, мы можем попарно сравнить все три группы.2Внутригрупповая оценка дисперсии sвну = 3,95. Число группm = 3, численность каждой группы n = 26. Следовательно, число степеней свободы ν = m(n – 1) = 3(26 – 1) = 75. (Если бы мыоценивали дисперсию по двум группам, число степеней свободы было бы 2(n – 1) = 2(26 – 1) = 50).
Произведем попарное сравнение трех групп.При сравнении контрольной группы и группы физкультурниц имеем:t=X 2 − X12вну2s=10,1 − 11,5= −2,54,2 × 3,9526nпри сравнении контрольной группы и группы спортсменок:t=X 3 − X12вну2s=9,1 − 11,5= −4,35,2 × 3,9526nи при сравнении группы физкультурниц и группы спортсменок:t=X2 − X32вну2s=10,1 − 9,1= 1,81.2 × 3,9526nМы провели 3 сравнения, поэтому уровень значимости в каж-108ГЛАВА 4дом должен быть 0,05/3, то есть примерно 0,017.
По таблице 4.1находим*, что при 75 степенях свободы критическое значениесоставляет примерно 2,45.Таким образом, мы можем заключить, что и у спортсменок иу физкультурниц частота менструации ниже, чем в контрольнойгруппе при этом у спортсменок и физкультурниц она не отличается.КРИТЕРИЙ НЬЮМЕНА-КЕЙЛСА**При большом числе сравнении поправка Бонферрони делаеткритерии Стьюдента излишне жестким. Более изощренный критерий Ньюмена–Кейлса дает более точную оценку вероятностиα′; чувствительность его выше, чем критерия Стьюдента с поправкой. Бонферрони.Сначала нужно с помощью дисперсионного анализа проверить нулевую гипотезу о равенстве всех средних. Если она отвергается, все средние упорядочивают по возрастанию и сравнивают попарно, каждый раз вычисляя значение критерия Ньюмена–Кейлса:q=*XA − XB2внуs 11 + 2 n A nB ,Собственно говоря, значения для α = 0,017 в таблице нет.
В таких случаяхможно либо использовать ближайшее меньшее значение (в нашем примере это 0,01) либо приблизительно рассчитать нужное критическое значение по соседним. Если нужное нам значение αн находится между α1 иα2, которым соответствуют критические значения t1 и t2 тоtн = t1 + (t2 − t1 )(α н − α1 ) ,(α 2 − α1 )где tн — критическое значение для уровня значимости aн.** Этот раздел важен для тех, кто использует нашу книгу как руководство поанализу данных.
Его можно опустить без ущерба для пони мания остального материала.СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА1092где X A и X B — сравниваемые средние, sвну— внутригрупповаядисперсия, а nA и nB численность групп.Вычисленное значение q сравнивается с критическим значением (табл. 4.3). Критическое значение зависит от α′ (вероятностьошибочно обнаружить различия хотя бы в одной из всех сравниваемых пар, то есть истинный уровень значимости) числа степеней свободы ν = N – m (где N – сумма численностей всех групп, m– число групп) и величины l, которая называется интервалом сравнения.
Интервал сравнения определятся так. Если сравниваютсясредние стоящие соответственно на j-м и i-м месте в упорядоченном ряду, то интервал сравнения l = j – i + 1. Например, при сравнении 4-го и 1-го членов этого рядаl = 4 – 1 + 1 = 4, присравнении 2-го и 1-го l = 2 – 1 + 1 = 2.Результат применения критерия Ньюмена-Кейлса зависит оточередности сравнений, поэтому их следует проводить в определенном порядке. Этот порядок задается двумя правилами.1.
Если мы расположили средние от меньшего к большему(от 1 до m), то сначала нужно сравнить наибольшее с наименьшим, то есть m-оe с 1-ым, затем m-ое со 2-ым, 3-м и так далеевплоть до m – 1-го. Затем предпоследнее (m – 1-е) тем же порядком сравниваем с 1-м, 2-м и так далее до m – 2-го. Продолжаемэти «стягивающие сравнения» пока не переберем все пары. Например, в случае 4 групп порядок сравнений такой: 4 – 1, 4 – 2,4 – 3, 3 – 1, 3 – 2, 2 – 1.2. Перебирать все пары впрочем, приходится не всегда. Есликакие-либо средние не различаются, то все средние лежащиемежду ними тоже не различаются. Например, если не выявленоразличий между 3-м и 1-м средним, не нужно сравнивать ни 3-есо 2-м, ни 2-е с 1-м.Бег и менструации.
Продолжение анализаВоспользуемся критерием Ньюмена-Кейлса для анализа связичастоты менструации с занятиями физкультурой и спортом. Среднегодовое число менструаций в контрольной группе составило11,5 у физкультурниц — 10,1 и у спортсменок 9,1. Упорядочимэти средние по возрастанию 9,1, 10,1, 11,5 (спортсменки физкультурницы контроль) и обозначим их X 1, X 2, X 3 соответственно.2Оценка внутригрупповой дисперсии sвну= 3,95, число степе-110ГЛАВА 4Таблица 4.3А.
Критические значения q для α′ = 0,05Интервал сравнения l56737,08 40,4143,1210,88 11,7412,447,502 8,0378,4786,287 6,7077,0535,673 6,0336,330ν12345217,976,0854,5013,9273,635326,988,3315,9105,0404,602432,829,7986,8255,7575,2186789103,4613,3443,2613,1993,1514,3394,1654,0413,9493,8774,8964,6814,5294,4154,3275,3055,0604,8864,7564,6545,6285,3595,1675,0244,91211121314153,1133,0823,0553,0333,0143,823,7733,7353,7023,6744,2564,1994,1514,1114,0764,5744,5084,4534,4074,36716171819202,9982,9842,9712,9602,9503,6493,6283,6093,5933,5784,0464,0203,9973,9773,95824304060120∞2,9192,8882,8582,8292,8002,7723,5323,4863,4423,3993,3563,3143,9013,8453,7913,7373,6853,633845,4013,038,8537,3476,582947,3613,549,1777,6026,8021049,0713,999,4627,8266,9955,8955,6065,3995,2445,1246,1225,8155,5975,4325,3056,3195,9985,7675,5955,4616,4936,1585,9185,7395,5994,8234,7514,6904,6394,5955,0284,9504,8854,8294,7825,2025,1195,0494,9904,9405,3535,2655,1925,1315,0775,4875,3955,3185,2545,1984,3334,3034,2774,2534,2324,5574,5244,4954,4694,4454,7414,7054,6734,6454,6204,8974,8584,8244,7944,7685,0314,9914,9564,9244,8965,155,1085,0715,0385,0084,1664,1024,0393,9773,9173,8584,3734,3024,2324,1634,0964,0304,5414,4644,3894,3144,2414,1704,6844,6024,5214,4414,3634,2864,8074,7204,6354,5504,4684,3874,9154,8244,7354,6464,5604,474ней свободы n = 75, численность каждой группы 26 человек.
Теперь мы можем воспользоваться критерием Ньюмена—Кейлса.Сравним X 3 и X 1 . Имеем:q=X 3 − X12внуs=11, 5 − 9, 1= 6, 157.3, 95 11 +2 26 26 11 + 2 n3 n1 Интервал сравнения в данном случае l = 3 – 1 + 1 = 3. Потаблице 4.ЗА находим, что для уровня значимости α′ = 0,05 числастепеней свободы ν = 75 и интервала сравнения l = 3 критическоеСРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА111Таблица 4.3Б. Критические значения q для α′ = 0,01Интервал сравнения l567185,6 202,2215,824,72 26,6328,213,33 14,24159,958 10,5811,18,421 8,9139,321ν12345290,0314,048,2616,5125,702313519,0210,628,126,9764164,322,2912,179,1737,8046789105,2434,9494,7464,5964,4826,3315,9195,6355,4285,277,0336,5436,2045,9575,7697,5567,0056,6256,3486,1367,9737,3736,966,6586,42811121314154,3924,324,264,214,1685,1465,0464,9644,8954,8365,6215,5025,4045,3225,2525,975,8365,7275,6345,55616171819204,1314,0994,0714,0464,0244,7864,7424,7034,674,6395,1925,145,0945,0545,01824304060120∞3,9563,8893,8253,7623,7023,6434,5464,4554,3674,2824,24,124,9074,7994,6964,5954,4974,4038227,229,5315,6411,559,669923730,6816,211,939,97210245,631,6916,6912,2710,248,3187,6797,2376,9156,6698,6137,9397,4747,1346,8758,8698,1667,6817,3257,0559,0978,3687,8637,4957,2136,2476,1015,9815,8815,7966,4766,3216,1926,0855,9946,6726,5076,3726,2586,1626,8426,676,5286,4096,3096,9926,8146,6676,5436,4395,4895,435,3795,3345,2945,7225,6595,6035,5545,515,9155,8475,7885,7355,6886,0796,0075,9445,8895,8396,2226,1476,0816,0225,976,3496,276,2016,1416,0875,1685,0484,9314,8184,7094,6035,3745,2425,1144,9914,8724,7575,5425,4015,2655,1335,0054,8825,6855,5365,3925,2535,1184,9875,8095,6535,5025,3565,2145,0785,9195,7565,5595,4475,2995,157H.
I. Наrtег. Order statistics and their use in testing and estimation. Vol. 1: Tests based onrange and studentized range of samples from a normal population. U.S. Government PrintingOffice, Washington, D.C., 1970.значение q равно 3,385, то есть меньше чем поучилось у нас.Следовательно, различие статистически значимо.Теперь сравним X 3 и X 2 .q=X3 − X22sвну11 + 2 n3 n2 =11, 5 − 10, 1= 3, 592.3, 95 11 +2 26 26 112ГЛАВА 4Величины α′ и ν те же, что и раньше, но теперь l = 3 – 2 + 1 = 2.По таблице 4.3А находим критическое значение q = 2,822. Полученное нами значение снова превосходит критическое.
Различиестатистически значимо.Для X 2 и X 1 имеем:q=X 2 − X12внуs=10, 1 − 9, 1= 2, 566.3, 95 11 +2 26 26 11 + 2 n2 n1 Величины α′, ν и l = 2 – 1 + 1 = 2 те же, что и в предыдущемсравнении, соответственно то же и критическое значение. Онобольше вычисленного, следовательно, различие статистическине значимо.В данном случае вывод не отличается от полученного приприменении критерия Стьюдента с поправкой Бонферрони.КРИТЕРИИ ТЬЮКИКритерии Тьюки совпадает с критерием Ньюмена-Кейлса вовсем кроме способа определения критического значения. В критерии Ньюмена-Кейлса критическое значение q зависит от интервала сравнения l.