Шеффе Г. - Дисперсионный анализ (1185347), страница 50
Текст из файла (страница 50)
у/ тр + е/ (6.6.1) с йл(е/) = 0'„теперь мы аналогично допустим, что наблюденное значение е// отличается от «истинного» значения г// на случай« ГЛ а КОВАРНАЦИонный АНАЛИЗ АЗО ную ошибку 1!! г!! = гГ!+ (Г! (6.5.2) с М((г!)=О (1 = 1, ..., й;1=1, ..., п). Основные предположения $ 6.2 без предположения нормальности могут быть записаны в виде у!=Ч!+е!, (е!) независимы, гт! (е,) = О, 0 (е!) = оз, Р А ч,= Х.„6,+Х ! ! с-! (6.5.3) В случае регрессионного анализа все х!! = О.
В новой модели этого параграфа линейные соотношения между зависимыми и независимыми переменными будут соотношениями между истинными значениями, так что последняя строка в (6.5.3) заменяется на А т), = ~ хГ!6;+ ~ гитн (6.5.4) !1 !! Мы будем предполагать, что (й+1)Х(й+1)-ковариационная матрица ошибок (е!,(!!,...,(А!)' (6.5.5) в Г-м наблюдении является одной и той же прн всех Г; обозначим ее (6.5.6) Мы уже предположили, что М(е!)= О, М((Г!)= О. Наконец, предположим, что и случайных векторов ошибок (6.5.5) независимы. Модель будет недостаточно полной, пока мы не укажем, как наблюдаются значения (гн) или как отбираются истинные значения (гГ!) независимых переменных. В некоторых случаях может быть целесообразным рассматривать (г,!) как выборку из некоторого распределения, не зависящую от распределения ошибок. В такой модели получить статистические выводы обычно очень трудно.
Если мы допустим, что полученные зна. чения (г,!) являются постоянными, заранее отобранными экспериментатором, то модель останется широко применимой к действительным экспериментам, а выводы можно будет получать относительно просто. В этом последнем предположении переменные гь „,, гА мы будем называть контролируемыми переменными, измереннь!АГи $ а.з. линЕЙБАя РеГРессия 251 с ошибко/уе). (Если некоторое г/ контролируется без ошибки, то его можно включить в рассматриваемую схему как частный случай с соответствующим о;/, равным нулю.) Тогда (г/!) в (6.5.2) будут заранее заданными постоянными, а случайными величинами являются ошибки (//!) и истинные значения г/! = гп — //!, (6.5.7) совместное распределение которых определяется предположениями, сделанными нами о совместном распределении (//!), а также значениями постоянных (г/!); зто распределение будет полностью определено, если мы еще предположим, что (///) нормально распределены.
Относительная простота модели получена в результате ее сведения к предыдущим основным предположениям (6.5,3) с другим оз = Р(у!). Если мы подставим (6.5.7) в (6.5.4), то р э получим т)!= г„х/!()/+ 2„(г/; — //!)у/, Отсюда и из (6.5.1) / ! / ! Р а у! = г, х !р + г, г,.у + еи / ! / ! где е',=е,— ), у///!. (6.5.8) / ! Так как е/ зависят только от !-го вектора ошибок (6.5.5), то отсюда и из предположения независимости этих векторов следует, что (ес!) независимы. Кроме того, по (6.5.8) М(е!) =О, а э я э (У (е!) = о, — 2 г, у о, + г, 4, у у,о , (6.5,9) и не зависит от !. Таким образом, предположения (6.5.3) выполняются с (е!), замененными на (е',), а пэ на (6.5.9). Отсюда следует **), что все выводы можно получать так же, как в рас- ') Основная идея этого параграфа принадлежит Борисову (Вегкзоп, 1950), который развил ее в приложении к выбору прямых линий.
Шеффе (Бойе((е, 1958) распространил ее на случай, в котором два параметра изучаютси как случайные эффекты. Хотя по обозначеиним модель этого параграфа аналогична некоторым другим моделям (используемым, например, в экономике), включаюшии ошибки всех переменных и линейные соотношения между истинными значениями, но по предположениям о распределении она сильно отличается; обычно коэффициент корреляции ошибки //! и истинного значения з,! равен О, а в этой модели он равен — 1.
") Отсюда следует также, что ковариапионная матрица (6 5.6) неотождествпма, если ошибки имеют совместное нормальное распределение; действительно, при заданных (у!) любая ковариацнонная матрица, дающая одно н то же значение (6.5.9), должна давать одно и то же распределение наблюдений (параметры распределения выборки неотождестзииы, если одно и то же распределение может быть получено при различных значениях параметров), гл. з.
ковлридционныи ыздлиз 252 смотренной ранее модели, если полученные значения независимых переменных считать истинными значениями, полученными без ошибки. Исключением является следующий случай. Если (неизвестная) дисперсия ошибки зависимого переменного у, обозначенная через о' в первой модели и через оео в рассматриваемой, входит в выводы, полученные по первой модели, то она должна быть заменена на (нсизвсстную) постоянную (6.5.9); в частности, (6.5.9) оценивается точно так же, как аз в первой теории.
Теперь мы рассмогрим более подробно приложения этой модели. Главное требование заключается в том, чтобы экспериментатор заранее (на практике, возможно, после некоторых предварительных наблюдений) выбирал, какие значения независимых переменных будут использованы в эксперименте. Такой выбор, возможно, является обычным в физических экспериментах, частым в биологии, но совсем нечастым в социальных науках (где данные обычно не появляются из эксперимента). Более точно, независимые переменные контролируются так, чтобы подогнать их наблюдения (показания приборов, номинальные дозировки и т. д,) к заранес выбранным значениям.
Предположения М(е,) = О и М()„) = О включают несмещенность ошибок, которая может быть нарушена, например, если ошибка была результатом смещения измерительного инструмента такого, как сдвиг правильной калибровочной кривой. Наблюдения независимых переменных так жс, как и зависимых, должны быть статистически независимыми при различных 1.
Таким образом, если повторные наблюдения зависимого переменного должны проводиться при тех же значениях независимых переменных, то для того, чтобы получить необходимую независимость, нужно изменить (а не оставлять покоящимися) установленные значения независимых переменных, а затем снова вернуться к ним так же, как в предшествующем наблюдении, И, наконец, функциональная зависимость от независимых переменных должна быть строго линейной; схема, предложенная ниже (6.1.2) для исследования, например, квадратичной регрессии от независимого переменного гь теперь должна быть исключена, если г; нс контролируется без ошибки. В самом деле, возводя в квадрат (6.5.7), мы должны получить член который нарушает условие М (е',) = О.
ЗАДАЧИ 6.1, В таблине А принедены значения прочности р а граммах и толщина х н 1О-' дюйма, полученные при проверке семи сортов крахмальных пленок. а) Проверить различие сортов крахмала по математическим ожиданиям прочности без учета х-данных, ЭАДАЧИ ° с а ь сю в"ьв л йо ч с чс с» й с- -"сю ь Сб в вЮ» ьо авсюсосо и»С сюсюи» О ю и ю б М ° с с с сьвьь юсю ю сч ьь со а» ос ьс сбсо ч' с'» с' сб ч' с'» с' сб б и а и си ьсбс.,сч олсю лсо об»сб-ссч — л сс с5со ь юс" "в ьь"сч" в"ь" б сб"счбч" ч'сб" сб бб бб ь со ь ь сю ь ь ь а л. в„с ь сб » а л" а ь ь сч сб ь сю ь" сч со сб ч ь сб" и сб» с'сю а(юсбач'ьавв1 счи»с ввс си о»ю»счсисюс-сюсбсисю вью» ьсбсч-ч с всюсбс.-сил-си си всю в„сч сю с с ю" сю а сю и» и» б» сю сю сю сю сю сю сю с ь ь л сю ь ь ь а с ь а об с., о» сб л и» а — ь .» со сб а ь" а со сю сч ь а сб сч" с-" ю» с сч с» ььв-ьсбьсчо»ч сбаоосл ав л л а а сб .с Ф а Я ч а сб ч сб а а ь а а л сто сю .с ь с ю сч ь а а л л"а а"-"сааб»"-"ь"а»"сь" о»"сч" лььльсчьсб с и ос, ььььааи аьб» В С'О' сбСЧ СЧб»Ю»сю с сюс вввобс сюсюс ю»Ф» л со-лси ссбасюь ~ с сюсс»сюсюаб»с 0»с Оюсб с- а а сб а в а ь со а ь и»бч».
сч" с.."ь с ю" чссчи» ю а в сб сю сч с- ь ь сч а со а а сб а и» а а и»и»а ба вал сб соьсч а сб-а сои»ьч счл си ч в с-, со в а. сб ь а с с сю сб л а ь в л л сю ь сб сбьсчсчсбсчсчасчч»ьь "счсо сюаьсюь соааь сбю» — со -сюсбс-си-с-сч сю ю сч с'»с»бч счб»с'»сбс»с'ссбсюч'си био»б»си »с Ж ,и о » » Е и о и ю о и ч (б гл. а. КОВАРНАционныи АнАлиз 254 б) Предположив, что коэффициенты регрессии у по х одинаковы для всех сортов крахмала, проверить различие сортов с учетом различия, обусловленного толщиной илеики.
в) Пусть через ун и хл обозначено (-е измерение 1-го сорта крахмала. Вписать в дополнительные столбцы таблицы значения (ум) для семи различных сортов крахмала н значеяня (уо — Б(х!. — хЦ, где х является средним (х!.), а Б оиеикой коэффнняеита регрессии у иа х. * 6.2. Данные в таблице Б волучены из экспериментального свяиариика, приспособленного для индивидуального вскармливания шести свиней в каждом из пяти загонов.
От каждого нз пяти опоросов было отобрано шесть поросят (три самца и трн самки) н распределено по загонам. Было нсиользоваио трк состава корма. Обозначим нх через Л, В, С в порядке, соответствующем увеличению содержания (рл < рв < рс) белка. В каждом загоне корм каждого состава выдавался одному самцу и одной самке. Поросята индивидуально взвешивались каждую неделю в течение 1о недель. Для каждого поросенка была вычислена скорость прироста в фунтах иа неделю как гловой коэффициент прямой, иодобраииой методом наименьших квадратов.