Шеффе Г. - Дисперсионный анализ (1185347), страница 78
Текст из файла (страница 78)
Для этого иапо заменить е!. па О, твк как е!. сходится к нулю по вероятности, и опустить члсиы порядка е — '. Я предпочитаю предложеииое вычисление, так как оиа дает прввильиое значение дисперсии о5 при всех е', 1 Н.з. исследоилиие Влияния иеиопмлльиости 391 Из формулы (1О.!.3) с й) =,)+1, х, = е,ь ст = У-' для / = 1, ..., т', хл —— а, и сл = ! вытекает тт и (0 )-1) та А+(0 )-1) )а Таким образом, среднее (!0.2.23) такое же, как в нормальной теории, а дисперсия, вообще говоря, отличается, завися от эксцессов уа,л н та,', при больших 1 она равна + 2 ттА~' При больших l мы приходим в этом примере к следующему заключению. Если эксцесс уа,л случайного фактора А равен нулю, то ненормальность этого фактора или ошибок ие влияет на выводы относительно О=пал/о';; но если у,,л ~ О, то доверительная вероятность 1 — а и вероятности ошибок обоих родов изменяются, за исключением вероятности ошибки первого рода при проверке гипотезы оа = О.
Если доверительная вероятность равна 1 — а, а уровни значимости та, то истинное а будет меньше номинального а, если уа, А С О, и больше, если уа, А ) О, причем величина этого влияния *) растет вместе с величиной уа, А. Следствия из примеров этого параграфа можно кратко резюмировать так.
(1) Ненормальность почти не влияет на выводы о средних, но серьезно влияет на выводы о дисперсиях случайных факторов, эксцессы уа которых отличны от нуля. (11) Неравенство дисперсий в ячейках классификации мало влияет на выводы о средних, если числа наблюдений в ячейках равны, и сильно влияет, если они не равны друг другу. (111) Корреляция наблюдений может оказывать серьезное влияние на выводы о средних.
й 10.3. Дальнейшее исследование влияния ненормальности В этом параграфе мы будем предполагать, если не огово. рено противное, что все ошибки имеют одинаковые асимметрии уьа н одинаковые эксцессы уа, Мы начнем изложение с исследования влияния ненормальности на точечные оценки. Напомним читателю, что в прошлых главах мы установили, что ненормальность не нарушает свойства несмещенности наших точечных оценок функций, допускающих оценку ($ !А), а также наших точечных оценок компонент дисперсий, Однако ненор. а) йе можно приближенно вычислить, считан (!0.2.23) приближенно равным СХа, а С и т определин иа первых двух моментов (10,2.23), 392 ГЛ. Ю.
ВЛИЯНИЕ НАРУШЕНИЯ ОСНОВИЬ!Х ПРЕДПОЛОЖВН!!И мальность делает, вообще говоря, неверными формулы, выведенные в нормальной теории для дисперсий точечных оценок компонент дисперсий; эти формулы основываются иа том, что средний квадрат распределен как величина, кратная Хэ, а это распределение, как мы видели в предыдущих примерах, является плохим приближением, если эксцесс Тв не равен нулю. Дисперсии и ковариации точечных оценок в модели со случайными факторами были вычислены*) без предположения нормальности в следующих случаях: в однофакторном анализе с неравными группами, в двухфакторном и многофакторном анализе с равными числами наблюдений в ячейках, в плане с латинскими квадратами, в сбалансированных неполных блоках; во всех этих случаях предполагалось, что взаимодействия равны нулю*э).
Вид получающихся формул мы проиллюстрируем на случае однофакторного анализа с равными группами (в предположениях последнего примера 9 10.2). Если через Ь'„ и Оз обозначить оценки компонент дисперсий йл — ! (ЮА 55е)1 бе Я~э то для получения 0(Ь'„) надо к формуле (7.2.16), полученной в нормальной теории, добавить член ! 'у, ла'„; для получения 0(а~) надо добавить к (7.2.16) член ! '! 'у,,а,'; ковариация Соч(дт„, б,') остается равной (7.2.)ба) без изменений. В общем случае дисперсия оценок компонент дисперсий зависит от диспеРсии О' и эксцессов Уз Различных эффектов и ошибок. Если числа наблюдений в ячейках одно-, двухи многофакторном анализе равны, то ненормальность ошибок мало влияет на результаты, так как в этом случае дисперсии оценок компонент дисперсий, отличных от компоненты ошибок й;., не зависят от эксцесса ошибок. В критериях проверки гипотез больше всего изучено влияние ненормальности на ошибки первого рода.
Имеется много результатов о влиянии ненормальности на 1-критерии; приведем некоторые из них. Из многих выборочных экспериментов с ненормальными распределениями был сделан вывод **э), что кри- *) Тычки (Тцйеу, 1956, 1957в); некоторые нз этих результатов были опубликованы раньше Хяммерсли (Нэгпгпегз1еу, 1949). Тычки получил ре.
зультзты в более общей форме, чем мы их двем здесь (они включают также случай, когдз эффекты выбираются из конечных популяций). '*) Тычки (Тпйеу, 1956) в тех случаях, когда он не полагает взаимо. лействия пулевыми, предполагает, что они полностью иезэвцсимы, з это, квк мы внделн в $7А, в случае неиормзльности неревльио. Хук (Ноойе, 1956) получил некоторые результаты при более естественном предположении о взаимодействиях, по опи очень сложны. "*) Пирсон (Рй Реегзоп, 1929, 193!), 4 юз.
нсслндоплннн влияния нщюпмлльностп 393 терни, основанные на !1( или 12 и применяемые для выводов о среднем одной популяции (они эквивалентны Р-критериям с 1 ст. св. в числителе), нечувствительны к асимметрии Т! ошибок; это не так в случае, когда 1 используется для проверки односторонней гипотезы. Что касается эксцесса ув ошибок, то хотя он и влияет на распределение 1, это влияние, вообще говоря, невелико.
Эти эмпирические выводы подтверждаются приближенными расчетами моментов в). Такие расчеты моментов показывают, что даже при одностороннем использовании 1 для проверки разности двух средних (в однофакторном анализе с двумя группами) влияние ненулевой асимметрии у! малб, если группы имеют одинаковый объем, одинаковые у, и одинаковые дисперсии. Это влияние величины Т! увеличивается, если Т! различны для двух групп, или группы имеют разные объемы или разные дисперсии. Если мы вспомним замечания, сделанные нами относительно вычисления асимметрии разности переднегоо арифметического по формуле (!О.!.2), то эти результаты пе покажутся нам удивительными. Экспериментальные выборки ее) в однофакторном анализе с числом групп, большим двух, также указывают на то, что ненормальность ошибок мало влияет на Р-критерий для проверки гипотезы равенства средних.
В этих экспериментах изучалось эмпирическое распределение б-преобразования статистики У' ($9.3). Результаты этих экспериментальных выборок Т а б л и и а 10.3.! *). Результаты вкспериментальных выборок, показывающие влиинне ненормальности ошибок иа распределение статистики У дли проверки равенства средних в однофакторном анализе !О 5 100 0 — 0,5 0,7 1О 5 100 0 1,1 0,7 10 5 100 0 4,! 0,2 10 5 100 1,0 3,8 0,07 1 (число групп) 1 (объем групп) Число выборок У! ошибок в ошибок 5 5 200 0 4,1 0,5 5 5 200 0,5 0,7 0,97 5 5 200 1,0 0,8 0,5 !О 4 50 0 — 1,2 0,9 10 10 50 0,5 0,7 0,3 показаны в таблице 10.3.1. Мы не воспроизводим здесь эмпирические распределения.
В последней строке таблицы, озаглавленной буквой Р, помещены вероятности того, что статистика построенная для теоретического р-распределения, подобранного по эмпирическому распределению в предположении *) Барглетт (Вагнен, 1935) а Гири (беату, 1936, 1947). '*) Пирсон (Е. Реагзоп, 1931). '! Запмствовапо пв тае апв!увм о! чаггапсе гп свеев о! поппоггпа! чаг!аппп, П. и. Реаг. воп, Вюгпе!гна. т. 23 Псвн. 594 гл. ю. влияние нлягшнния основных пнндположнпип нормальности, превосходит свое наблюденное значение. Конечно, не следует применять критерий )(з (таблица 10.3.1) для проверки нулевой гипотезы в рассматриваемом случае; величину Р следует понимать скорее как условную меру соответствия, выраженную на языке, знакомом статистикам; величины, меньшие 0,05, указывают на плохое соответствие.
В случае, когда перестаповочный критерий строится па основе У статистики, можно применить остроумный способ ') оценки влияния ненормальности с помощью изменения чисел ст. св.; мы, таким образом, можем оценить во всяком случае влияние на первые два момента Б-преобразования (г' нашей статистики ($9.3). Предположим, что мы имеем формулы для М„(У) и Мл((гз), где М, означает математическое ожидание, вычисленное по перестановочному распределению. При любом распределении У выборочного у мы можем рассматривать этн математические ожидания как условные а*) (см. 9 9.3) и выразить безусловные соответствующие математические ожидания в виде (здесь М означает математическое ожидание по У) М ((Р) = М (М, ((1')) (г = 1,2).
(10,3.! ) Если нам удается вычислить (хотя бы и приближенно) правые части (103.!), то мы можем подобрать р-распределение к (г' по этим первым двум моментам; это приближение, вообще говоря, к непрерывному распределению (г' должно быть лучше, чем аналогичное приближение к дискретному распределению 9 9.3. Сравнивая числа ст. св. этого приближенного Б-распределения (/ с числами ст, св. У илн У при условии нормальности и равенства дисперсий, мы можем выразить влияние ненормальности на распределение Бг в виде поправок к числам ст. св, (как это мы делали в 9 9.3). Если предположить, что в двухфакторном анализе '**) с факторами А и В имеется по одному наблюдению в ячейке, ошибки независимы и одинаково распределены, и отсутствуют взаимодействия, то мы можем проверять гипотезу Нл об отсутствии эффекта фактора А с помощью перестановочного критерия для случайных блоков, основанного на статистике Бг (этот ') Этот способ предложен Боксом н Андерсеном (Бох, Лпбегзеп, 1955).