Шеффе Г. - Дисперсионный анализ (1185347), страница 83
Текст из файла (страница 83)
Важно помнить, что эти преобразования меняют не только дисперсии, но и средние; так, для преобразованной величины приближенно М(г) = 1(р), а это может либо помочь, либо помешать нашему анализу. Примером, когда это преобразование помогает анализу, является эксперимент по превращению некоторого химического вещества на опытной установке в конечный продукт с помощью катализатора; мы намереваемся изменять следующие четыре фактора: (1) вид катализатора, (П) количество первоначального вещества, (П1) время контакта катализатора с этим веществом, (1Ч) температура реакции. Обозначим у количество вещества, превратившегося в конечный продукт при одном цикле работы опытной установки.
Если для множества уровней факторов в эксперименте изменения у очень большие (в процентах) и если относительная ошибка д меньше ее абсолютной ошибки, то для стабилизации дисперсии можно воспользоваться преобразованием 1(у) =1пу. Что касается изменения с помощью этого преобразования средних, то оно в этом случае выгодно, так как количество прореагировавшего вещества лучше выражается в виде произведения четырех функций от четырех факторов, чем в виде их суммы; поэтому скорее М (!и у), чем М (у), представляет собой линейную комбинацию четырех функций, зависящих от эффектов факторов.
Мы вернемся к этому примеру ниже. При проверке гипотезы равенства групповых средних в од. нофакгорном анализе преобразование, казалось бы, не должно создавать какие-либо трудности, так как при взаимно однозначном преобразовании первоначальные средние будут равны друг другу тогда и только тогда, когда равны преобразованные средние, Однако если после преобразования наша гипотеза отвергается по Р-критерию, и мы хотим провести дальнейшее исследование по методу множественного сравнения илп по какому-нибудь другому методу, то, пользуясь первоначальной шкалой средних, мы можем получить более значительные результаты, чем в преобразованной шкале, Пусть, например, ц равно наблюденной доле больных животных, вылеченных одним пз нескольких лекарств, сравниваемых в эксперименте. Если обозначить и, и рз математические ожидания этих долей при первом и втором лекарствах, то легче использовать и оценить 4!4 ГЛ.
Ю ВЛИЯНИЕ ИАРУШЕПИЯ ОСИОПНЫХ ПРЕДПОЛОЖЕНИЙ тот факт, что !А~ — !Ап лежит в определенном интервале, чем аналогичное УтвеРждение длЯ агсз)п о/и, — агсз)п ~/!Ае. В двух- и многофакторном анализе возникает вопрос не только о значении различных шкал при сравнении нли оценке, по и о зависимости обычно проверяемых гипотез от этих шкал. !у)ы уже видели, что это так для гипотез об отсутствии взаимодействий (Э 4.!); при наличии взаимодействия (взаимодействие будет по крайней мере в одной из двух шкал, если преобразование нелинейно) это также имеет место для гипотез о главных эффектах.
Рассмотрим пример ") двухфакторного анализа, в котором один фактор представляет собой тип инсектицида, а второй — метод распыления; наблюдение пл равно доле уничтоженных насекомых, когда )-й инсектицид распылялся )-м методом; пусть М(уп) = рп. Если мы вспомним, что главный эффект !-го инсектицида равен среднему по методам распыления, то мы увидим, что если гипотеза об отсутствии разности между главными эффектами справедлива для множества (!АД или (агсз)п рД, то она, вообще говоря, несправедлива для другого нз этих множеств.
Рассмотрим теперь возможный экономический аспект этих параметров. Если известно, что различные методы распыления применяются на практике с частотами (пылю...), то разумной мерой эффективности !-го инсектицида будет 2 ллеоэ однако т едва ли можно было бы рассматривать ~~' и агсз!п !е,'.)е как подобную меру. Иногда встречается мнение, что преобразование, уравнивающее дисперсии, устраняет также ненормальность и неаддитивность. Аддитивность и равенство дисперсий могут быть несовместными, как показывает следующий пример, в котором мы можем получить только одно свойство ценой нарушения другого. Пусть имеется !+1+ ! независимых пуассоновских переменных, (и,) со среднимп (а;), (пД со средними (!Ь) и ш со средним у.
Пусть наблюдение уп в ячейке й ! двухфакториого анализа имеет структуру и~+ п~+ ш. Тогда М(уп) = ап+ б~+ + у, и мы имеем аддитивность; однако Оуи = ои+ ()т+ у, н мы не получаем равенства дисперсий, если только не равны друг другу все (а) и (бт). Преобразование (!07.!), уравнивающее дисперсию, превращается для пуассоновского распределения в г = уоп, а это нарушает аддитивность.
Неясно, какая в случае пуассоновского распределения из величин д нли дп' ближе к нормальной величине, однако сейчас это для иас неважно. ") Этот пример предложен проф. Крееиалом. $ РХХ ПРЯОВРАЗОВАНИЯ НАБЛЮДЕНИЙ Если наши сведения об исследуемом явлении не ограничиваются эмпирическими фактами, а частично вытекают из некоторых теоретических принципов, то эти теоретические предпосылки часто указывают нам полезные и важные преобразования. Проиллюстрируем это на разобранном выше примере с превращением химического вещества. Если обозначить через А количество первоначального вещества н если возможна такая реакция, когда почти все вещество превращается в конечный продукт, то физически невозможно получить большую флуктуацию количества превращенного вещества у, так как оио ограничено числом А.
В этом случае можно ожидать, что п„ошибки будет уменьшаться, когда у приближается к А„поэтому преобразование !'(у) =!ну не будет выравнивать дисперсию. Для того чтобы стабилизировать дисперсию, надо учесть влияние границы, растягивая шкалу у около у = А, подобно тому, как преобразование арксинуса дает растяжение шкалы около концов. Из интуитивных соображений мы потребуем, чтобы растяжение масштаба в разных частях шкалы было приблизительно пропорционально трудности увеличения значения нашей величины в соответствующем месте (например, обычно труднее увеличить у от 0,98 А до 0,99 А, чем от 0,90 А до 0,91 А).
Предположим, что реакция должна происходить примерно по схеме мономолекулярной реакции; в этом случае 1п — „= й1, А (10.7.2) где ! — время реакции. За преобразование ((у) можно взять 1(у), определенную левой частью (10.7.2); это преобразование будет растягивать шкалу нужным нам способом. Преобразованная величина физически осмысленна, так как она тесно связана с теоретическим коэффициентом скорости реакции й в (!0.2.7), который является одним из основных физических параметров. Далее, это преобразование делает зависимость от времени реакции одного из факторов эксперимента более близкой к линейной (тем более близкой, чем точнее выполняется (!0.2.7)).
Заметим также, что дальнейшие теоретические сведения о процессе могут указать природу взаимодействия между факторами температуры и времени реакции, а это в свою очередь может помочь в планировании эксперимента. В заключение рассмотрим связь между теоретическим уравнением (!0.7.2) н рассмотренным выше логарифмическим преобразованием. Запишем (!0,7.2) в виде Рй (У) = А(1 — е-м), (10.7.3) заменяя у в (10.7.2) на М(у), так как фактически (10.7.2) относится к у, освобожденному от ошибок, Если мы положим 416 ГЛ.
~о ВЛИЯниЯ ЫдпвШГПНя оСНОВнмх ПРЕДПОЛОЖСЫИП й = й(1, Т), где 1 — номер катализатора, а Т вЂ” температура, то мы получим, что М(у) представляет собой функцию от й ! и Т, умноженную на функцию от А (в нашем случае просто на А). Далее, если рассматривать й(, малые по сравнению с единицей, то приближенно М(у) = А(е( и М(у) не достигает на у-шкале окрестности точки А, где действует эффект барьера.
В этом случае М(у) разлагается на произведение функции от А на функцию от 1 и на функцию от 1 и Т. Логарифмированне здесь дает полезное преобразование, так как оно делает эффекты факторов А и 1, коэффициент й(й Т) аддитивнымп. Во всяком случае это так, если теоретическое соотношенне (10.7.2) выполняется точно. Если это соотношение выполняется приближенно, то можно омсидать, что анализ !ну будет несколько проще, чем анализ у. ЗАДАЧИ !0.1. Примените приближенные Р-критерии, описанные в связи с (10.6.1), к данным задачи 4.8 и сравните полученные трн г-отношения с точнымп значениями, получающимися в задаче 4.8. 10.2.
Дайте объяснение, почему приведенные в $10.1 (уь уз) имеют большее положительное у1 для возрастов невест и женихов? Почему возраст отцов н матерей имеет меньшее значение уг? Почему уз больше у отцов, чем у матерей? 10,3. Пусть У, и Уз — объемы выборок У-критерия (с номинальным уровнем сз) для проверки разности двух средних. Покажите, что при У, и Уз-ь с (любым способом) и постоянном а вероятность ошибки второго рода стра.