Шеффе Г. - Дисперсионный анализ (1185347), страница 76
Текст из файла (страница 76)
Совсем иную картину мы имеем при выводах относительно пг. Выводы***) относительно и' в нормальной теории основы- (и — 1) зг ваются иа распределении,, равной )('„„или величины зг/пг, равной )(г,/(и — 1).Для этого распределения (10.2.3) (10.2.4) Уже отсюда мы можем видеть, что при сильно отличающихся от нуля уг при любых п все сильно меняется, так как, хотя (10.2.3) остается тем же, вместо (10.2.4) мы имеем из (3.8.1) (10.2.5) Отношение (10.2.5) к (10.2.4) равно 2п (10.2.6) При больших и это отношение приближается к 1+ — у„а з ! 2 становится нормальным "аеа). Отсюда следует, что при боль- -'Ь з ших п ( ) ( —, — 1) распределено как гтг(0, 1+ — у,); ') Крамер (Сгащег, 1946, % 17.4).
") Мы предполагаем конечность уь однако, настоящее утверждение можно доказать при условии конечности только а'. "') Вычисление мощности критерия для проверки гипотезы о =о~ основано на распределении з гоо, но зта величина равна а /а, умноженной гl г на ог/ггщ *"') Крамер (Сгащег, 1946, й 28.8), При строгом подходе возникает вопрос о том, можно ли дисперсию предельного закона заменять пределом дисперсии; однако теорема Крамера непосредственно даег нужный результат, если в следующей ниже формуле и — 1 заменить на и.
562 гл. ю. влияния нарушения основных предположении в общем случае это распределение отлично от М(0, 1) (получаю. щегося в нормальной теории); когда уя = О. Если ут сильно отличается от нуля, то это является очевидной причиной серьезных ошибок при определении доверительного коэффициента, уровня значимости и мощности по нормальной теории. Например, если при больших и мы воспользуемся доверительным интервалом с доверительной вероятностью 1 — а для от, полученным по нормальной теори 1, то вероятность того, что интервал не покроет ав, будет рав .а 1 2(2п) ' ~ ехр( — — Р)111 г П1В (!0.2.7) вместо 1 2(2п) ' ~ ехр ( — — 7в)111.
(10.2.8) Здесь г 7я означает верхний — -предел )т'(О, 1), определенный а (10.2.8), а 1 Некоторые значения этой вероятности при а = 0,05 показаны в таблице 10.2.1. В таблице 10.2.1 даны вероятности ошибок первого рода для обычного двустороннего критерия гипотезы се=о', при номинальном бел уровне значимости. Таблица 10.2.1. Влияние невормальности иа истинную вероятность того, что номинальный 951в довервтельныа интервал ов не покрывает истинное вначеиие от прн больших а 0,5 ~ ! ~ 2 ~ 4 ~ 7 0,060 ! 0,1 1 ~ 0,1 7 ~ 0,26 ~ 0,36 — 15~ -1 )-05~ 0 Вероятность ~9 10 ~ 0,006~ 0,024~ 0,050 Мы будем называть выводы, относящиеся только к постоянным эффектам уравнения модели дисперсионного анализа, «выводами о средних», а выводы, относящиеся только к случайным эффектам, «выводами о дисперсиях».
Примерами выводов о средних являются критерии для гипотез, относящихся к постоянным главным эффектам и взаимодействиям, доверительные эллипсоиды функций, допускающих оценки, о- и Т-методы множественного сравнения, Примерами выводов о дисперсиях эта,а.некьтОРые элементАРные пОдсчеты 383 М (У ) = Р, 0 (у.) = — „~1 + 2р (1 — — „)], М (з') = оа(1 — — ~) . (10.2.9) ') Это явление было замечено Е. Пирсоном (Е. Реагаоп, )93!); причины его установлены Боксом (Вох, !953), являются доверительные интервалы для дисперсии ошибки оз„ для компоненты дисперсии озд, где А — случайный фактор, или для отношения компонент дисперсий, и критерии равенства дисперсий.
Результаты, установленные нами в случае единственной выборки, будут сохраняться в каждом разобранном случае, причем причина этого в основном остается прежней. Нарушение нормальности оказывает слабое влияние на выводы о средних, но очень опасно при выводах о дисперсиях *). Причина этого явления состоит в следуюшем. В обоих случаях выводы о параметрах (средних и дисперсиях) основываются на распределении отклонений (в некотором смысле) оценок от своих параметров (это отклонение в нашем примере является разностью для )з, отношением для аа). Однако, в то время как в случае средних наблюденное отклонение измеряется его отношением к оценке ошибки, вычисленной по наблюдениям (а это справедливо и без предположения нормальности), в случае дисперсии оно измеряется сравнением с некоторой процентной точкой теоретического распределения, вычисленного в предположении, что эффекты, связанные с нашими дисперсиями, нормальны; это теоретическое распределение имеет вычисленное нами математическое ожидание и, по крайней мере при больших и, принятую нами форму, но если уз эффектов отличны от нуля, то это распределение имеет другое рассеяние.
Другими словами, в случае средних мы пользовались критериями, «стьюдентизированными» вторыми моментами оценок, а в случае дисперсий — нет. Чтобы показать возможное влияние нарушения предположения независимости, изменим предыдуший пример, считая наблюдения (уг) серийно коррелированными с серийным коэффициентом корреляции р, введенным в конце $10.1. Для упрощения мы будем предполагать, что и наблюдений совместно нормальны, так что (у,) имеют многомерное нормальное распределение с М(у;) = )з, 0(у;) = оа, коэффициент корреляции у; и унч равен р для ! = 1, ..., и — 1, а остальные коэффициенты корреляции равны нулю.
Тогда выборочное среднее у, нормально; для у, и выборочной дисперсии за легко вычислить 384 ГЛ Ю. ВЛИЯНИГ НЛРКШННИЯ ОСНОВНЫХ ПГГДПОЛОжвпня Таблица 10.2.2. Влняние серийной корреляции на истинную вероятность того, что номинальный вате доверительный интервал р не покрывает истинное значение р при больших я р ) -0,4 ~ — О,З! — 0,2~ — 0,1! 0 ! О,! ) 0,2 О,з ~ 0,4 Вероятность ~1 10 ~ 0,002! 0,011~ 0,028) 0,000 0,074) 0,093 012 ! О!4 Простейший пример, на котором мы можем увидеть влияние нарушения предположения о равенстве дисперсий ошибок, состоит из двух выборок, Рассмотрим однофакторный анализ, состоящий из двух групп объема У! и Ув Предположим, что две случайные выборки (уг!, Вяю..., уды, !' = 1, 2, независимы и имеют средние !сь дисперсии и',.
и эксцессы уи ь Обозначим уь и з', (1'=1, 2) выборочные средние и выборочные дисперсии. Последнюю формулу можно получить, вычисляя сначала матеп е л с магическое ожидание от ~ (у, — д.)'= ~, у',— и ' ~ ~ у,у! 1-1 г-! г-! г-! (при этом мы можем предположить, что М(йч) = 0 и М(ус!)=оа) и полагая затем математические ожидания в двойной сумме равными нулю, за исключением и членов !' = !' (они равны оа) и 2(п — 1) членов, в которых 1 и 1' разнятся на единицу (они равны ро'). Мы уже знаем, что уровни значимости и доверительные вероятности, вычисленные на основе обычной нормальной теории, при выводах о р основываются на отношении (10.2.1), имеющем браспределение с п — 1 ст. св., а следовательно, распределенными У(0,1) при больших и.
Опустим в (10.2.9) член порядка 1/ла. В распределении отношения вида (10.2.1) при больших лзв можно заменить на его математическое ожидание а', а следовательно, з на о; применяя формулы (10.2.9), мы находим, что (10.2.1) имеет при больших и распределение 1т'(О, 1+2р) вместо )т'(О,1). Вероятность того, что доверительный интервал с номинальной доверительной вероятностью 1 — а не покрывает !с, а также вероятность ошибки первого рода двустороннего критерия для проверки р с номинальным уровнем значимости а даются формулой (10,2.7) с В=(1+2р)м. Когда р приближается к эта вероятность приближается к нулю.
Когда р приближается к !/с, эта вероятность приближается к 0,17, если а = 0,05. Некоторые другие значения показаны в таблице 10.2,2, из которой видно, что серийная корреляция может серьезно влиять на выводы о средних. $ !О.т 11ГКОТОРЫЕ ЭЛЕМЕ ° ТАРНЫЕ ПОДСЧЕТЫ 888 Будем предполагать, что У! и Ут, а следовательно, и н = У!+ Ух, велики; иод выражением «для больших и» мы будем понимать т У, о; «для больших У! и Ут». Обозначим )те= —, 0= —, отношеа.,' ния объемов выборок и дисперсий. Обычные доверительные интервалы, построенные по нормальной теории для разности средних Л = р, — рь илп обычные вычисления уровня значимости критерия для гипотезы Л = Лв основаны на отношении у „— у,— Ь !* 2 1 Ну '+у ') =8.7 (10.2.10) которсе при О', = О, 'имеет 1-распределение с и — 2 ст.
св,, а при больших и имеет распределение Уе!(О,1); здесь 55, получается из объединенного 55 для ошибок (У! 1) 21+ (У2 !) 22 у,+у,— я (10.2.11) ') Статистика оо, сходится к (1+ Гт) 1(9)+!) О22, по вероятности, если и- . а и и 8 постоянны. 13 Г,, Шеффа При больших и величина ум имеет распределение У!1()21, От/У1), поэтому числитель (10.2.10) имеет распределение Ф(0, У О"-,+У 'а22). В знаменателе (102.10) мы можем заменить*) з', на сг'; и з' на о'„которые входят и 55, по формуле (1О 2.11) .