Шеффе Г. - Дисперсионный анализ (1185347), страница 77
Текст из файла (страница 77)
Полагая У! = )Ае (1 + У!) 1и, Ут = (1 + Ус) ' и, О! = йоя и пренебрегая членами порядка 1/а, мы находим, что при больших и отношение (10.2,10) имеет распределение й!(0, (О+)т) ()ТО+1)-'). Если объемы выборок равны Я = 1), то это отношение при больших и распределено !т'(О, 1), т. е. так же как в нормальной теории при равных дисперсиях, хотя эти две популяции могут быть ненормальными, а дисперсии неравными. Это означает, что вычисленные в предположениях нормальности и равенства дисперсий доверительные вероятности и уровни значимости остаются при больших и справедливыми и в том случае, когда эти предположения нарушаются, если только рассматривается однофакторный анализ с двумя равными группами.
Влияние неравенства дисперсий (О Ф 1) на истинные вероятности, соответствуюгцие номинальной доверительной вероятности 1 — а и номинальной вероятности ошибки первого рода а, мы можем изучить при больших и, полагая н (10.2.7) 385 гл. !о. влияние нлрушшгия Основных предположении ! 5 ! 2 5 а) 0,050 0,12 0,22 0,38 0,750 0,014 0,002 1 10 0,050 0,029 0,014 0,006 0,050 0,17 0,38 1,00 0,050 0,080 0,12 0,17 0,050 0,050 О,ОБО 0,050 0,050 0,00б 1 ° 1О 0 '! Наяистижииыа ирааааьяые случаи иоиазызают гранады изыаиаииа аероатиасти.
Мощность критерия для проверки гипотезы Ь = Ье зависит от распределения (!0.2.10), в котором Л заменено на Ьр Рассуждая так же, как и раньше, мы находим, что зто распределение при больших а нормально со средним где (о')„„— взвешенное среднее (ат!) с весами т! (уза, + 1 от) (7 +7) (10.2. 12) и с дисперсией (8+ й) ()гО+ 1) ' (10.2.13) =о,'=с', то среднее (10.1.!2) пре- Если дисперсии равны о"; вращается в 8=( — + ) аа (10.2.14) а дисперсия (10.2.13) — в единицу, Если мы проведем вычисления так, как будто ат! и о,' равны и имеют общее значение от, то, для того чтобы (10.2.14) совпало с (10.2.12), мы должны заменить о' в (10.2.!4) на (а')„„. Однако если условие равен- При сс = 0,03 некоторые значения показаны в таблице 10.2.3.
Предельные значения 8 = О, оо, конечно, недосягаемы, однако они дают возможность установить границы поведения вероятностей в каждой строке; аналогичную роль играет )т = оо в каждом столбце. Та блина 10.2.3, Влияние неравенства дисперсий ошибок н неравенства объемов групп на нстнннув вероятность того, что вбта ДОВЕРИТЕЛЬНЫЙ НитЕРВап ДЛЯ В! — Рз НЕ ПОКРЫВаЕт НетииНОЕ значение при больших и 8 — отношение дисперсий, )7 — отношение объемов групп % !ел.
некоторые элементхрные подсчеты 387 (10.2.13) оно имеет г"-распределение с / — 1 и ~„(!'! — 1) ст. св.), ( в котором и! у! /ен б ~ /!О!/х~~~ / ! Я,=ХР,— 1) зт,!Х(У,— 1), ! а у! из'; — выборочные среднее и дисперсия !'-й группы, Предположим теперь, что (т!), а следовательно и в=~У„ велики*); при этом мы будем просто говорить, что «велико л». Мы можем, рассматривая распределение (10.2.15), заменить з) в 55, иа пе; так как п велико, то мы можем заменить Я, 2'/ ае на (пе)„= — среднее взвешенное (пт!) с весамн (ц. ! Мы можем применить к (и!) центральную предельнуео теорему, *1 Мы произведет! аспыптотяческяе расчеты прп и-еос я постоянных (б/п) ства дисперсий нарушено (О чь 1), результат вычисления ме1щности будет правильным тогда и только тогда, когда объемы групп одинаковы ()с = 1), так как в других случаях дисперсия (10,2.13) отлична от единицы, как это требуется для правичь.
ного результата. Случай двух равных групп очень благоприятен в смысле устойчивости против нарушений условия равенства дисперсий, так как при больших и влияние этого нарушении равно нулю. рассмотрим теперь случай !' групп в однофакторном анализе. Мы найдем, что в модели с постоянными факторами нарушение условия равенства дисперсий оказывает некоторое, хотя и небольшое, влияние и при равных объемах групп, если /) 2.
Предположим, что случайные выборки (у!!,..., у!! ), ! = 1, ..., /, независимы, имеют средние /х!, дисперсии пт/ и эксцессы уе,!. Вычисления в гл. 3 (произведенные в условиях нормальности (у!!) и равенства (а!)) уровня значимости г-критерия для гипотезы р! — — ре — — ... = р!, доверительных эллипсоидов / — 1 независимых сравнений (/х!) и Я-метода множественного сравнения для (/ь) основаны на отношении (/ 1) ~ / (и! и) 55 заа гл. кс влияния нлвкшшшя основных пгпдположепии по которой (п~) независимы и распределены й((0, фХ,.); таким образом, при больших и (10.2.15) распределено как (! — !)-' ~7, (а, — а)' !пз) (10.2.16) (10.2.17) где (а'-"1,„— невзвешенное среднее (аД, а ее дисперсия равна (! — 1) ' ( 21 (1 + У„) ~ —,!'" ~ — 4 Р— 2 ~, (10.2.18) где ~'„и 11 — квадраты иевзвешенных и взвешенных коэффициентов вариации (аД, т. е.
Р")'Г' Е М- (")*Л' с ри ! Е(") ХХ~;М-(")..3 В предположениях нормальности и равенства дисперсий (10.2.15) распределено при больших и как (1 — 1) 'Х,', с математическим ожиданием единица и дисперсией 2/(1 — 1). Из формулы (10.2.17) видно, что (10.2,16) будет иметь то же самое математическое ожидание (единицу) в общем случае тогда и только тогда, когда взвешенное среднее (а~)„,„равно невзвешенному среднему (и'),„Это условие будет выполняться для всех (о ) тогда и только тогда, когда все (Ц равны.
Если все (Л) равны, то Р = Р„и дисперсия (10.2.18) превращается в (10.2.19) Если ! = 2 или если (пД равны, то У = 0; тогда (10.2.16) имеет номинальную дисперсию 2!(7 — 1); в остальных случаях дисперсия будет больше номинального значения (из-за множителя, стоящего в скобках в (10.2.19)). Некоторое представление о величине этого мномсителя можно получить из первого, вто.
рого и последнего столбцов таблицы 10.4.2 (приведенной ниже), Для вычисления среднего и дисперсии Я=~~' У,(п,— д)' при- меним лемму конца $7.6. После небольших выкладок резуль- тат можно выразить следующим образом. При больших и ма- тематическое ожидание случайной величины (10.2.16) равно 1 ю.е. пекотоРые элемеггтАРные подсчеты ЗВ9 где даны его значения для некоторых множеств (оД, При больших и (10.2.16) представляет собой квадратичную форму ! цеитрированных нормальных величин (ьч), и поэтому распределено как линейная комбинация независимых величия )га (задача Ч.
2). Эта случайная ="личина неотрицательна; показано *), что в этом случае хорошее приближение к ее распределению дает распределение еуе„ причем константа с и число ст. св. т подбираются так, чтобы совпадали первые два момента. Отсюда и из (10.2.19) вытекает, что истинные вероятности ошибок первого рода, ошибок в доверительных эллппсоидах и 5-методе множественного сравнения больше номинального значения а, если в однофакторном анализе'*) объемы групп равны, а дисперсии не равны (величину этого превышения можно вычислить с помощью только что установленного приближения).
Вычисление мощности, по-видимому, менее элементарно. Однако правило вычисления М(Я) в начале $ 10А наводит на мысль, что при равных (Ц мощность приближенно равна той мощности, которую можно вычислить в предположении равных дисперсий, если в правиле ! 9 2.6 заменить оа на среднее (аа)тн Наш последний пример касается влияния ненормальности в модели со случайными факторами. Рассмотрим простейший пример (из 9 7.2) однофакторного анализа с т' группами по з' наблюдений в каждой. В этом случае уравнение модели равно уп — — )а+ аз+ е,), (! 0.2.20) где )т — генеральное среднее, (а,) — главные эффекты фактора А, (егг) — ошибки; предполагается также, что (аг) и (егг) полностью независимы.
Предположим, что (аг) является случайной выборкой из популяции эффектов с нулевым средним, дисперсией а'„- и эксцессом ух,л, а (е,Д вЂ” случайной выборкой из популяции с нулевмм средним, дисперсией о' и эксцессом у,, В этом случае 55 равны Ю,=! '(т 1) 'ЕХ(у, — у,„) =Г'(з — !) '~'„~'.,(е,. — е„)' и Ы„=(! — 1) 'УХ(у,.— у„,)'=(! — 1) 'УЕ(оз — о„)', *) См. Бокс (Вох, 1954а, таблнпа 1, стр. 294). **) Это верно также и в двухфакториом анализе, когда числа наблюдс.
ннй в ячейках равны и велики (задача !0.7), однако это, вообгне говоря, неверно, сслн в двухфакторном анализе имеется по одному паблютенп1о в ягейкс; в этом случае в знаменателе У стоит остаточный 55, а пе 55, выч~ сленный по ячейкам. 39О ГЛ Ю. ВЛИЯНИЕ НДРУПзвиия ОСНОВНЫХ ПРЕДПОЛОЖЕНИЯ где о,. = а, + е!.. (10.2.21) Напомним, что в нормальной теории 55, и 55А независимы, 55, равно а';Х-',/тю где те = !'(У вЂ” 1).
55А равно (а', + зал) уз !/(1 — 1); отсюда мы получаем, что 1!+)а) '~~А (10.2.22) ВА равно г! !,, если обозначить О= —. На этом распределее' ат е нии основано обычное вычисление доверительных интервалов для 0 и вероятностей ошибок обоих родов при проверке гипотезы: а'„-=О, или более общей гипотезы: 0 (сопз(. Исследуя распределение (10.2.22) прн больших е', мы обнаружим существенное расхождение между двумя случаямн: аз =0 и аз > О. Если аз =О, то распределение (10.2,22) должно совпадать с распределением статистики 9 для проверки гипотезы равенства средних в модели с постояннымп факторами, рассмотренной выше, когда все (Ц равны з' и все (а'-,.) равны а',; в этом случае структура наблюдений (10.2.20) дается только что описанной схемой.
Но мы видели, что в этом случае наша статистика при больших т' распределена так же, как и в предположении нормальности. Отсюда следует, что ненормальность при больших 1 не влияет на вероятность ошибки первого рода при проверке гипотезы а' = — О. Если а'„) О, то мы, исследуя распределение (10.2.22), заменяем опять 55, на а', и рассматриваем распределение ()+уз) '58А (1 0.2.23) ае которое можно записать* ) а виде з";=(1 — 1) '2,(о! — о,)т, и ! а',=од+1 ла~. Таким образом, з„распределено как выборочная дисперсия случайной выборки объема 1 из популяции (о); поэтому в силу (10.2.5) М вЂ” 'ч =1 О Ъ = ' + — "" *) Следующие ниже вычисления при болмпих е' можно упростить.