Шеффе Г. - Дисперсионный анализ (1185347), страница 45
Текст из файла (страница 45)
Применить критерий, построенный в задаче 5.9, к данным задачи 5.2. ') Эти двииые были приготовлены ори помаши таблицы иормальиых случайиык чи. сел, а звачеиия параметров были оценены са реальным дааиым, которые сами по себе ие годятся для иашей задачи. ЗЛДДЧО Таблица Же! ЬСО ярдов Кии ярдов ШОО ярдов О ярдов 1ООО ардан 2ШО ярдов Расстояние межлу саседннмя нарами нспмтанна 1 2 ! 2 1 2 "1 Заимствовано из Ев1аЫ1вЫаи сопЬо1 о1 Иге согб 1ев11пи1аЬога1оггев, Р.
Акцгамгса, н. м. тгнвн. 1пбцягггв1 яна1112 сапгго1, т. 13 11ВОО1, эъ 2, таблица 1. стр. 4. Катушка 1 2 3 Завод 1 4 5 6 7 8 Катушка 9 1О 11 12 Завод П !3 14 15 !6 -1 -5 1 !О 2 -3 6 !О -1 — 8 — 1 -!О -9 -2 0 2 1О 8 9 12 0 8 5 9 -1 †! 7 16 — 5 1 1О 9 — 2 -8 ! 2 5 -5 ! 5 5 -10 — 8 -8 5 -2 5 — 2 — 5 6 6 15 !2 6 2 !6 11 !9 15 11 — 2 1О !О !5 -2 3 2 2 1 -! 0 5 ! — 5 -2 2 7 — 2 5 3 2 13 15 12 2 0 !5 5 12 10 12 12 12 15 9 16 -3 -4 10 -4 -6 ! — 2 — 2 1 — 4 0 -3 — 2 — 2 !Π— 1 7 !5 18 16 5 4 2! 18 ! 20 8 12 2 13 12 11 0 — 1 — 4 3 2 5 ! ! 5 -5 -8 — 1 — ! 2 4 ! 17 !4 13 10 18 8 15 1! 13 9 22 11 10 10 18 20 — 12 4 4 8 7 5 5 9 3 6 — 2 -4 10 5 7 — ! 18 11 9 11 6 8 18 !5 4 6 12 2! 7 5 11 15 Глава 6 КОВАРИАЦИОННЫИ АНАЛИЗ й 6.1.
Введение Приложения обшей теории, изложенной в гл. ! и 2, можно разделить на три различные группы, связанные с тремя видами анализа: дисперсионным, ковариационным н регрессионным. Границы между этими тремя группами не являются очень точными или общепринятыми. В настоящей монографии мы не будем пытаться делать их более точными. Некоторые из факторов (мы используем это слово в смысле гл. 4 и 5), изменяющихся в эксперименте или в ряде наблюдений, могут быть качественными, например сорта зерна, а другие — количественными, например температура.
Один и тот же количественный фактор в математической модели можно рассматривать или как качественный, или как количественный. Например, пусть температура является одним из факторов, изменяющихся в эксперименте, а эксперимент проводится только при пяти различных температурах. Если фактическое значение температуры входит в используемую формулу математического ожидания (-го наблюдения (если, например, она содержит член уА+ уД где г'; — температура, при которой проводится аче наблюдение), то мы можем сказать, что этот фактор считается количественным.
С другой стороны, фактическое значение температуры может не входить в формулу, которая содержит только пять главных эффектов температуры и, возможно, взаимодействия, т. е. температура входит как качественный фактор. В этом случае*) количественный фактор рассматривается как качественный. т) Если а~ является главным аффектом Его уровня температуры, то сум 5 ма 2; хна~ должна входить в фоРмУлУ математического ожиданиа Ьго на- /:~ бвюдеиня, где хл =! в том случае, когда Ье наблюдение проводится при ри уровне температуры, и хл 0 в остальных случаях.
Конечно, ковффи. % ЕЛ. ВВЕДЕИИЕ Теперь мы можем сказать, что отличие трех видов анализа заключается в том, что в дислерсионном анализе все факторы исследуются качественно, в регрессионном анализе все факторы являются количественными н исследуются количественно, тогда как в ковариациониом анализе одна часть рассматриваемых факторов исследуется качественно, а другая часть количественно. В этой книге мы будем, конечно, как и раньше, допускать, что в каждом случае неизвестные параметры входят в формулу математического ожидания наблюдения линейно.
Примерами такого вида задач являются следующие: для дисперсионного анализа — все случаи, рассмотренные в гл. 3, 4 и 5; для регрессионного анализа — примеры 1 и 2 в 6 1.2; для ковариационного анализа примеры будут даны ниже. Сделаем следующее замечание. Пусть в практических приложениях количественный фактор исследуется качественно, а его уровни соответствуют равным приращениям количественного фактора (например, если фактор является температурой, то его уровнями могут быть значения температуры 600, 650, 700, 750, 800'Г). Если есть основания считать, что главные эффекты фактора значимо отличаются, то очень полезный технический прием дальнейшего анализа этих эффектов состоит в использовании сравнений линейных эффектов, квадратичных эффектов и т. д.
Значениями этих сравнений, за исключением сравнений известных постоянных факторов, являются коэффициенты ортогонального полинама, подобранного методом наименьших квадратов; полипом может быть легко вычислен при помощи таблицы ХХ1П Фишера и Иэйтса (Р)з)тег и Уа1ез, 1943); выводы о рассматриваемых сравнениях (наряду со всеми другими сравнениями) могут быть сделаны при помощи Я-метода. Однако если полученное уравнение полиномнальной регрессии используется для предсказания, то важно рассмотреть относительное значение следующих двух видов ошибок в выборе степени полинома: выбор более высокой степени, чем необходимо, и неподходящий выбор степени из слишком низких степеней. Первая ошибка менее вредна, а так как вероятность второй ошибки относительно велика, то неразумно проверять, какой коэффициент значимо отличается от нуля по Я-критерию ч).
Различный полиномиальный выбор количественного фактора циенты (хн) можно рассматривать иаи фуницни температуры хи = й(б); их отличие от коэффициентов в количественном случае (в приведенном выше примере оии равны б и Гт) состоит в том, что фуиииин (хл) используются только каи переменные. счетчики или переменные-указатели ($ !.2). ч) Задачей с неоднозначным выбором степени полинома является, например, выбор кривой, лля которой еше не получено удовлетворительное теоретическое решение; другие примеры вилточают выбор между различными виламн фуиипин, например полиномиалЬной н вкспоиеицяальиой.
гл. е ковлридционнып анализ может быть сделан для различных уровней или исследуемых комбинаций других факторов; разности линейных, квадратичных и т. д. сравнений, связанных с этими полиномами, можно анализировать как соответствующие «ортогональные ст. св.», выделенные из 55 взаимодействия (5 4.8 и задачи 4.17 и 4.18). Термин независимое переменное *) указывает на то, что в ковариационном и регрессионном анализе фактор исследуется количественно. По этой терминологии наблюдения (уе), сведенные в общей теории, являются тогда зависимыми переменными. Простым примером ковариационного анализа с одной независимой переменной является следующий *а): для сравнения качества различных видов крахмала (крахмал из пшеницы, картофельный крахмал и т. д.) был проведен эксперимент, в котором измерялась прочность крахмальных пленок.
Обычный одиофакторный анализ показал высокую значимость разностей прочности для различных видов крахмала. Однако большое различие прочности может объясниться, если принять в расчет толщину крахмальной пленки, Пусть в нашем примере ун является )чм измерением прочности (зависимое переменное) 1-го вида крахмала, Если это измерение было проведено для крахмальной пленки толщины гп (независимое переменное) и если мы допустим, что «истинная» прочность линейно зависит от толщины, то уравнение нашей модели может быть записано в виде уз) =)ь+аг+ )зн+ен (1=1, ..., 1, у=1, ..., Х~), (6.1.1) где )ь — аддитивная постоянная, се~ — главный эффект 1-го вида крахмала, у — коэффициент регрессии зависимости прочности от толщииы и вп — ошибка.
Конечно, использование в (6.1.1) у вместо т~ включает предположение, что линейная зависимость имеет один и тот же коэффициент для каждого вида крахмала. Для изучения общей теории следующего параграфа будет полезно иметь несколько больше примеров, Если в приведенном примере мы хотим рассматривать квадратичную регрессию от толщины вместо линейной, то наша модель должна быть изменена так: д, =)а+а, +угп+ Ьз'; +е, . Анализ этой модели является таким же, как анализ линейной регрессии с двумя независимыми переменными, которыми ') Автор отмечает, что для этой цели используются два термина: 1пе)ерепцеп1 тапаЫе и сопсотцап1 напаЫе.
В книге используется последний. (Ириаь нерее.) т«) Фриман (Рееепзап, 1942). $ вь авздение 229 в этом случае являются толщина и квадрат толщины. Если в двухфакторном анализе с одним наблюдением в ячейке переменного у, зависящего от независимого переменного г, мы допустим, что взаимодействия факторов строк и столбцов равны нулю, а регрессия линейна по г, то модель должна определяться уравнением ун = 14+ а;+ 6> + угу + еп. (6.!.3) Если имеются две независимые переменные г н ш, взаимодеиствия равны нулю, а регрессия линейна, то уп —— !»+ а;+ 6~+ угу + бац+ е„ (6.1.4) В этих равенствах (уп,го) и (уп,гп,ззп) являются наблюдениями в (с,!)-ячейке, р является аддитивной постоянной, (а,) — главными эффектами строк, (6,) — столбцов, у и б— коэффициентами регрессии.