Шеффе Г. - Дисперсионный анализ (1185347), страница 22
Текст из файла (страница 22)
10, отсюда не следует, что до применения диспер. сиоиного анализа должна быть проведена предварительная проверка итого предположения. Иногда тем не менее имеет прямой смысл сравнить дисперсии нескольких популяций. Эти популяции могут быть «ячейками» в однофакторном или многофакторном анализе.
Стандартный критерий е) однородности дисперсий чрезвычайно чувствителен к нарушению нормаль- ') Критерий Бартлетга (Вагпецч 1937) является видоиамеиением ирнтерня отношения наибольшего правдоподобии, предлохсенного Нейманом и Пирсоном (Хенбсап б реагаоп, 1931); вместе с теблнцамн он описан Пнрсо. иом и Хартли (Реагаап б Наг()еу, 1954, стр. б7). $ з.а. сРАВнения диспвРсии ности (гл. 10).
Мы рассмотрим приближенный критерий, основанный на анализе дисперсии логарифмов выборочных дисперсий*). Тогда задача сводится к сравнению средних, а дисперсионный анализ, как отмечено в гл. 10, довольна нечувствителен к форме распределений выборочных средних. Предположим, что через ла обозначена выборочная дисперсия случайной выборки объема а из популяции с дисперсией аа; таким образом, если (хьха,...,хя) является выборкой, то „,)а Тогда М(ла) = оа, из леммы в конце $7.6 можно получить, что Ь вЂ” '(+ а)' (3.8.1) где уа — мера эксцесса (зта мера рассматривается в абзацах 2, 3, 4 $10.1), равная та а 4ра — 31 (3.6.2) )з, являетая четвертым центральным моментом популяции*а) и, следовательно, для нормальной популяции уа = О.
Пусть ***) у = !из'. Обычные приближенные формулы для среднего и дисперсии функции от случайной величины (читатель, незнакомый с ними, должен прочитать сноску ****) ) дают М (у) !и оа, Оу + —. 2 тз Рассмотрим следующий случай. Пусть из каждой популяции, дисперсии которых мы хотим сравнивать, производится выборка наблюдений объема два или больше. Пусть, кроме того, популяции распадаются на 1 множеств, для которых у нас есть основания предположить, что популяции из одного и того же множества имеют равные дисперсии.
Итак, если имеется Х; е) Я использую разговор с д-ром Боксом и проф. Тьюки. ее) г(ы допускаем, что популяция бесконечна, а )з, конечен. е'*) Удобство етого преобразования для приложения дисперсиоииого анализа к сравнению дисперсий была указана Бартлеттом и Кеидаллом (Вагиеп а Р. 6. Кепоа11, 1946); однако оин предлагали применять его только в случае, когда наблюдения распределены нормально. ~"*~) Вели д=[(а), то )гл (()г ) и оая [1'(Из) о), где Из М(2), о =П(л) н т. д. Зги формулы получены путем аппроксимации у линейной а функцией а в окрестности л (зз. 1ов Гл. д ОднОФАктОРнын АнАлиз. множистВеннои сРАВнение популяций в (-м множестве и лин является выборочной дисперсией Х-й популяции из (-го множества, то при ь1-предположениях мы заключаем, что М(з'н) от, (1=1, 2, ..., Хк), Мы хотим проверить гипотезу Н: от=от= .. =От.
а ''' /' где Худ. у= ч,= Х(Х, — 1). Ф При Н эта статистика (приближенно) имеет Р-распределение с Х вЂ” 1 и т, степенями свободы. Если объемы выборок (ао) не все одинаковы, то число степеней свободы л', равно тн = пн — 1. е) Однако можно ожидать, что ик распределение ближе к нормальному. чем распределение (л Ч). Пусть у, =1п зт. Тогда при ь1 М (у, ) цо где т1,. = 1п о', и л тип 0 (енн) + л — 1 и Здесь пп является объемом выборки, по которой вычислялась з',, а у, — мера эксцесса (3.8.2) для соответствующей популяции.
Добавим теперь к ь) предположение, что мера эксцесса ужо имеет одно и то же значение ут для всех популяций. Гипотеза Н эквивалентна равенствам ч)1 = т1З = ... = т)ь Мы разберем случай, когда ие каждое из Х множеств состоит из единственной популяции, т. е.
когда не все Х; = 1. Число ст. св. знаменателя критерия, аппроксимирующего Р-критерий, равно 2 (Х, — 1); случай, когда все Х; = 1, или ~,(Х, — 1) очень ! мала, рассматривается ниже. Если все объемы выборок (пп) одинаковы, то (в пределах точности принятого выше прибли. жения) все (уо) имеют одинаковые дисперсии, и, таким образом, имеем случай $3.1, за исключением того, что (уп) не распределены нормально *).
Статистика критерия равна ХХ,(ум-й)' те с д д.(уг р )' ! 1 з.а сРАВнение дисперсии !от Тогда Р(уц) приблизительно обратно пропорциональна чц, так как 0(уц) — + е = — 12+ та, 1 (383) «ц «ц+' «ц (. '+«!! 1 а величина в квадратных скобках не сильно изменяется с изменением ч!!. Если эту величину обозначить через 6, то е 1/ (Уц) - —. "ц Тогда можно применять дисперсионный анализ, основанный на взвешенной сумме квадратов *) ($1.5) с весами (чц), связанными с (уц), Минимум взвешенной 55 У=ХЕ«ц(уц Ч!) с / при Й равен Уо=Х ~~чц(у!/ — 1)!)' Х «цвц где т)!= ич,= ~,ч,!, тогда как при со = НП 11 минимум / «! ! У.= Х Хчц(уц — Ч)', / где Х~ "цкц — и ч=~,ч!=~ ~ ч/.
«« ! с ! Если мы вычислим 55 числителя как Уг — Уго, то найдем, что Р-статистика для проверки Н равна ~ «(/) й)г Е Е «ц (у!/- ч!)' / а ее степенями свободы являются ! — 1 ич, =Х(!'! — 1). Для численного вычисления (3.8.4) запишем в виде Х «!и! «ч «е «!/у!! — ~ «!ч~! с ! ! ° ') Критерий и его мои/ность можно также легко получить путем пере- кода к величинам(в = 1/« /у ) н приложением к ннм теории равных дне. персий. 193 Гл. а ОднОФАктопныи АнАлиз, множественное сРАпнение Для вычисления мощности этого Р-критерия заметим, что статистика (3.8.4) при Я имеет приближенно нецентральное Р-распределение с У вЂ” 1, уа ст.
св. и параметром нецентральности ,,-ф тг(чг — ч)з — 2, 9 Дисперсия оценки Уп величины т),=!позг равна 8/ть а оценной 8 является Ю знаменателя, т. е. 8= 8=~' те с Величина уз8/8 приближенно распределена )(Ят,. 5-метод множественного сравнения может быть применен к (т)г); но из полученных таким образом выводов о (О;) представляют интерес только те, которые получаются из сравнений (т);), являющихся разностями, а это приводит к утверждениям вида А~»т)с — т)/ ~ <В, (3.8.5) полУченные неРавенства эквивалентны ЕЛ»КазгУот)»»ев. Т-метод является, конечно, более эффективным для утверждений вида (8.8.5), когда он применим; однако им можно пользоваться только в случае, когда все (у ) равны. Приведенный выше метод для проверки Н неприменим, если все У; = 1, и не чувствителен, если очень мала ~.
(У; — !), являющаяся числом ст, св. знаменателя Р-статистики. В этом случае мы предложим *) разбить достаточное количество выборок на две (или больше) меньшие выборки с тем, чтобы изложенный метод можно было применять с разумным числом ст. св. Это разбиение возможно только для выборок объема четыре или больше; разбиение должно быть сделано с помощью таблицы случайных чисел. Так, например, мы можем проверить равенство десяти дисперсий, каждая из которых оценивалась по выборке объема пять, если разобьем каждую выборку на выборку объема два е*) и выборку объема три, а затем применим полученные раньше методы с У = 10, Уг = Уз = "° = Ум, пп = 2 или Э, пи + п,з = 5.
') Если уа в (3.3.3) известно, то несмещенные оценки (уц) параметров (чн) будут иметь известные дисперсии, и тогда для пронерки равенства (чц) можно построить критерий Х'. Заманчиво попытаться оценить уз по каждой выборке, истовые обычно малы, выбрать оценку и заменить атой оценкой уз, входящее в Х.критерий. Хлопоты, связанные с этим, заключаются в трудно. стп выбора оцеилн уз по малым выборкам. аа) Некоторое змпирическое основание, которое было получено Боксом (Вох, 1933, стр.
323) при помощи зксперимеитальиой выборки из равномерного распределения, показывает, что, предложенный критерий ведет себя удо. влетворительно с ниг порядка 2. ЗАДАЧИ ЗАДАЧИ 109 3.1. В таблице А прияеденъг веса (в фунтах) поросят, родившихся в восьми опоросах. Таблица А') 4 ~ б ~ 6 7 3,1 2,9 3,! 2,5 2,4 3,0 1,5 3,2 З,З 3,2 3,3 2,5 2,6 2,8 3,3 3,6 2,6 3,! 3,2 3,3 2,9 3,4 3,2 3,2 2,6 2,6 2,9 2,0 2,0 2,! 2,6 2,0 2,8 3,3 3,2 4,4 3„6 1,9 3,3 2,8 1,1 3,5 2,8 3,2 3,5 2,3 2,4 2,0 1,6 ') Заимствовано нз 61ана1)са) Мсшоба, васдссог, !она З)а1с Со)!сяе Ргсаа Атсг..
5.с наданнс (1956), стр. 969, таблица 16.16.!. а) Построить таблицу дисперсионнаго анализа. Проверить с уровнем значимости 0,10 гипотезу отсутствия различия между среднимн весамн в восьми приплодах. б) Предположить, что опоросы 1, 3, 4 получены от одной свиноматки, а другие пять от другой. Значимо лн различие между среднимн весами в этих Двух группах) в) Значимо лн различие между средними весамн больших опоросов (№№ 1, 2, 3, 4) н меньших (№ 5, 6, 7, 8) Р Указские. При выборе метода (г-критерий илн Ю-метод) для решения вопросов б) н в) предположить, что эксперимент планировался для исследования различия производителей, н вопрос в) возник в резулътате осмотре полученных данных.
См, обсуждение в 3 3.7. 3,2. Прн сравнении нескольких экспериментальных образцов с контрольнымн может оказаться, что предпочтнтелънее изготовить контралъных образцов больше, чем экспериментальных, так как онн входят в каждую исследуемую разность. Это подтверждается слелующей моделью. Пусть каждый экспериментальный образец изготоилен ! раз, а контрольный — с раз. Пусть уа является 1-м наблюдением 1-го экспериментального образца (! = 1, ..., т; ) = 1, ..., !), Предположим, что уч тг+ сс, где са — независимые случай.
ные величины с нулевым средним и дисперсиями, равными аа. Тогда мкк-оценкой разности Ог = ач — тс является 8) = уг* — уг. (1 = 1, ..., т). Доказать, что прн фиксированном общем числе наблюдений, т. е. с+ т ! сопИ, Р(6)) минимальна, если с/! = 1/т. 3.3. Результаты опыта по сравнению вкусовых качеств четырех сортов продуктов приведены в таблнне Б. Опыт проводится следующим образом. Из четырех сортов было образовано 12 упорядоченных пар (1, !). По каждой паре для пробы было дано !2 пар сортов продуктов. Требовалось сделать одну нз семи оценок.
я предпочитаю ! по сравнению с ! сильно (опенка 3), умеренно (оценка 2), слабо (оценка 1), нет различия (оценка О), я предпочитаю ! по сравнению с ! слабо (оценка — 1) н т. д. В таблице Б некоторые упорядоченные пары получнлн очень высокие нли очень низкие оценки. По. 118 ГЛ. 3. ОЙНОФАКТОРНЫЙ АНАЛИЗ. МНОЖЕСТВЕННОЕ СРАВНЕНИЕ Таблица Бе) Количество оценок, ревнын -3 -2 -1 0 ! 2 В Суммернея оценке Пара ц. !) 3 3 2 4 ! ! 2 2 4 1 2 4 1 2 5 5 1 2 ! 1 1 1 5 4 1 4 4 2 4 4 ! 7 1 3 1 ~1, 2) (1, 3) (3, 1~ (4, 1) (2, 3~ (2, 4) (4, 2) (3, 4) (4, 3) 19 — 22 18 — 2 27 — 13 — 17 22 14 — 2 27 — 8 3 1 3 4 1 4 3 4 3 1 2 2 2 5 1 1 ') Заимствовано не Ап епв!уме о! евг!впсе 1ог ре!геа сотрвг!еопе ясьепе, А Атее.
щв!. Авеое., 2. е? !!%2). стр. з21. ') Этот результат мне сообщил проф. Тычки. является опасность, что неоднородность дисперсий является результатом того, что оценки, появляющиеся на одном из концов шкалы, играют домнин. рующую роль в образовании суммарной оценки. Используя метод $ 3.8 для сравнения выборочных дисперсий оценок для четырех пар, имеющих наибольшую цо абсолютной величине суммарную оценку, с выборочными дисперсиями оставшихся восьми пар (здесь имеется только две группы выборочных дисперсий); можно воспользоваться односторонним критерием).