Шеффе Г. - Дисперсионный анализ (1185347), страница 51
Текст из файла (страница 51)
таблице эта скорость обозначена через у, а вес в начале недели — через х. Таблица Бв). Корм В С Самка Свмяв Пврвмвв- пвп Загон Самка Самец Самец Самец у х у к у к у х у *) Звпцптвпввпп пв Сптгппппев))Ь Впгввц ог Р)впг Вгвещпя впл Овпвнвв Тв«Ьп)пв) спмпшп)св!)пп 1э, Р)вы тг1«1 и: тьв Апп)т»1» пг спчпг!впсц )пыл вг)выг!, свтьгыяв Сп17.
Ргввв. СвтЬчЫК« НИО), таблица Н, стр. 17, а) Провеств ковариациониый анализ с линейной регрессией у иа х, очи. тая, что коэффициенты регрессии одинаковы для каждого поросенка и что возможно взаимодействие «корм Х нол», ио иет лругих взаимодействий. б) Какие пары из трех исследуемых составов кормов значимо разли. чаются по 5-методу с а = 0,10? 6.3.
В таблице В приведены за три года годовые урожаи у пшеницы в центнерах на акр на шести английских сельскохозяйственных станинах вме. сте с высотой растений г (в дюймах) в период появления колосьев н числом ю растений из однгко куста. а) Существует ли значимое (с уровнем 0,05) изменение урожая от года к году но трехлетнему периоду, которое не объясняется регрессией у иа г н ю? б) Проверить с уровнем 0,05 гипотезу, что отсутствует регрессии яо числу растений из одного куста.
9,52 38 8,21 35 9,32 41 10,56 48 10,42 43 9,94 48 9,48 32 9,32 35 ! 0,90 46 8,82 32 8,51 39 9,95 8,43 46 8,86 40 9,20 40 10,00 48 9,24 32 9,34 4! 9,68 46 9,67 37 9,11 48 8,50 37 8,90 42 9,51 42 8,76 40 9,75 48 8,66 28 7,63 33 10,37 50 8,57 30 ЗАДАЧИ Т а б л н ц а В е). Местность 266 Перемен- ивп Зргпп- вгпп ЯпсЬвпе в!ее Зеа! Нвтпе Ыепрпг! ВпВЬвн Р!нпср!оп Год 1933 1934 !935 '! Заимствпваип ив Зсацвцса! Ме!впав, С. Цг.
Зпедесог, соме в!все Сенеке Реева. Б.е явдааи», !рае, твевиив !сл.г, стр. 427. в) В 1934 г, в Сврвустане наблюдался большей урожай ошеннцы на корню; в цернад раста были получены аначення л = 27 н э =!О. Получить точечную оценку среднего урожая, который можно была ожнлать цо атому урожаю на корню.
р а р р 19,0 25,6 14,9 32,4 25,4 7,2 26,2 27,2 18,6 22,2 26,4 13,3 32,2 28.3 9,6 34,7 22,2 35,3 30,8 4,6 43,7 35,3 6,8 40,0 32,5 10,0 32,8 33,0 14,7 35,7 32,4 9,7 29,6 27,5 17,6 25.3 28,6 12,8 28,3 25,9 9,2 20,6 23,7 14,4 35,8 28,0 7,5 35,2 24,2 Т,б 4Т,2 32,9 7,9 ЧАСТЬ ВТОРАЯ ДИСПЕРСИОННЫЙ АНАЛИЗ В ПРИМЕНЕНИИ К ДРУГИМ МОДЕЛЯМ Глава 7 МОДЕЛИ СО СЛУЧАЙНЫМИ ФАКТОРАМИ й 7.1. Введение Модели со случайными факторами в дисперсионном анализе называются также (по причинам, которые выяснятся ниже) жо.
делями со случайными компонентами. В 9 1.2 мы уже дали обшее определение моделей трех типов: с постоянными факторами, со случайными факторами и смешанную модель. Для моделей, отличных от модели с постоянными факторами, не сушествует обшей теории, сравнимой с тео. рией, которая развита в гл, 1 и 2. В настояшее время мы весьма мало знаем об оптимальных свойствах статистических методов, используемых при изучении этих моделей а). Модели со случайными факторами, так же как и модели с постоянными факторами, возникли из астрономических задач; задолго до того, как статистики придумали модели со случай.
ными факторами, астрономы ввели их в свои расчеты, но в дальнейшем эти модели были статистиками усложнены ее). $7.2. Однофакторный анализ Рассмотрим следуюший производственный эксперимент. Станок, управляемый одним рабочим, выпускает небольшимн партиями некоторые изделия; ежедневно на этом станке произво.
дится большое число таких партий. На этом станке попеременно работают 1 рабочих, причем дневная выработка каждого из ннх испытывает значительные колебания (нам будет удобно рассматривагь эту выработку как непрерывную случайную величину). Мы будем предполагать, что во время эксперимента ') Некоторые результаты опубликоааиы Греябиллом (бгауЫ11. 1954), Томпсоиом (ТЬошрзоп, 1955) и Хербахом (НегЬасЬ, 1957). '*) Некоторые исторические спрааки см. у Шеффе (5снеНА !956Ь), й тл. однофакториыя анализ можно пренебречь временнйм трендом станка. Предположим, что каждый рабочий работает на этом станке в течение У дней эксперимента.
Пусть у;; — выработка (-го рабочего на )-й день его работы на этом стайке. Предположим, что уравнение модели имеет вид (7.2,1) ун = тг+ ен, где птг — «истинное» среднее для (-го рабочего, а еп — «ошибка» на )-й день г-го рабочего; ниже мы попытаемся мотивировать это предположение. Мы можем рассматривать птг как идеализированную дневную среднюю выработку (-го рабочего, который уже прошел период обучения и выработка которого относительно устойчива. Колебание выработки (-го рабочего около ее «истинного» среднего лтг может быть измерено дисперсией ов. Мы будем предполагать, что ) рабочих, участвующих в эксперименте, представляют собой случайную выборку из большой совокупности рабочих, которую мы будем считать бесконечной.
Большинство наших результатов основывается на этом основном предположении, поэтому в приложениях всегда надо представлять себе, какова та возможная популяция, случайной выборкой из которой можно считать ! рабочих, участвующих в эксперименте. Предположим, что каждый рабочий в популяции снабжен некоторым индексом ') щ Нам будет удобно обозначать через У распределение о в популяции, хотя оно не войдет в наши расчеты непосредственно. Пусть пт(п) и ол(о) обозначают «истинные» среднее и дисперсию дневной выработки рабочего, обозначенного в популяции индексом о. Пусть (оь ...е пг) — выбранное случайно множество индексов 7 рабочих, участвующих в эксперименте; это множество представляет собой случайную выборку из У, а введенные выше параметры тг и о,'.
(-го рабочего представимы в виде тг= т(ог) и о',=от(ог). Пусть (х и алв обозначают среднее и дисперсию «истинных» дневных выработок рабочих в популяции, т. е. )г н о'„являются математическим ожиданием и дисперсией случайной величины лт(с), вычисленными относительно распределения У в популяции; тогда ') Не будет большой беды, если читатель будет представлять себе о действительным числам, а У вЂ” распределением случайной величины, приии. мающей значения (о). Читатель, математически более подготовленный, может считать У распределением вероятностей на некотором абстрактном вероятностном пространстве точек (о), а гп(о) н о'(о) — случайными величинами.
В й 7.4 мы столкнемся с понятием произведении двух вероятностных про. странств, одного с распределением У, на пространстве точек (о), другого— с распределением й, иа пространстве точек (и), и со случайной величиной т(и, о). Настоящее примечание применимо и к последующим параграфам. й Г. Шеффе Гл. г. мойили со случлиными ФАктОРАми вба (тг) независимы и одинаково распределены со средним )г и дисперсией о-'„. Сделаем теперь упрощающее предположение о том, что па(в) одинакова для всех рабочих из популяции; обозначим ее общее значение в',. Заметим, что это предположение менее разумно, чем предыдущее. Вполне вероятно, что наряду с «истинными» средними меняются и дисперсии рабочих.
Возможно, например, предполагать, что более хорошие рабочие, имеющие более высокие значения т(п), работают более ровно и имеют меньшие дисперсии; или предполагать, что стандартное отклонение оа(о) пропорционально среднему т(п). Тем не менее мы примем это предположение, поскольку в настоящее время не получено результатов для более сложных моделей '). В силу принятого предположения (еу) в (7.2.1) имеют нулевые средние и одинаковые дисперсии в,', мы предположим, далее, что они независимы, одинаково распределены и независимы от (тг). Мы определим эффект рабочего, имеющего в популяции индекс о, разностью а(о) = т(о) — 1г, так что эффект 1-го рабочего, участвующего в эксперименте равен а(ог), которое мы будем записывать в виде а = тг — )а.
Таким образом, (7.2.1) превращается в (7.2.2) уу = )г+ аг + ег), где (аг), (ег)) независимы в совокупности и имеют нулевые сРедние, (а;7 одинаково РаспРеделены с .диспеРсией ввл, (е,.) одинаково распределены с дисперсией в,'. Дисперсия наблюдения у;1 равна в'„ = в'„ + о',, поэтому уместно называть о'„ и о'-' Компонентами дисперсии (т. е. компонентами дисперсии одного наблюдения). Заметим, что принятые нами допущения приводят к следующему основному отличию как только что определенной, так и общих моделей со случайными факторами от моделей с постоянными факторами: !) все наблюдения имеют одинаковое математическое ожидание, 11) наблюдения не являются статистически независимыми.
Статистическая зависимость в приведенной выше модели со случайными факторами (а также в ее обобщении, когда мы допускаем неравные числа (Хг), где 7;— число измерений в рм классе) определяется через полезное в генетике понятие коэффициента внутриклассовой корреляции *'). О п р е д е л е н и е. Коэффициент внутриклассовой корреляции р — это обычный коэффициент корреляции между любыми ') Предыдущее обобщение нашей модели предложил мне проф. Леман. «*) Это важное поиитие было введено Р. А.
Фишером (Р)внег, 1925, гл.т). $7.2. ОДНОФАКТОРНЫИ АНАЛИЗ двумя наблюдениями уп и ун О'~() в одном классе (т, е. при одинаковом () М [(У»7 Р) (У;7 Р)[ М [(а; + ен) (аз+ ен,)[ М (а,.) ОА следовательно, р = 2, . Ниже мы увидим, как строить доОзл+ от верительный интервал для р в случае, когда к предыдущим предположениям добавляется предположение нормальности е). Если, как мы до сих пор предполагали, числа (Ц равны, то классификация по одному признаку называется сбалансированной. В более общем случае полная классификация по р признакам называется сбалансированной, если числа наблюдений в ячейках равны.
Если некоторые факторы группируются, то классификация может быть названа сбалансированной в случае, когда число уровней грунпированного фактора одинаково для каждой комбинации тех факторов, по.которым происходит' группировка, а пересекающиеся факторы (если они суще. ству7от)пересекаются полностью ($ 5.3); более того, число повторений (уровней «фактора ошибки>) должно быть одинаково для каждой комбинации (других) факторов, участвующих в эксперименте. Для получения критериев и оценок сбалансированных моделей со случайными факторами и смешанных мо; делей рассматриваются все средние квадраты для обычной таблицы дисперсионного анализа в модели с постоянными факторами, того же плана.