Шеффе Г. - Дисперсионный анализ (1185347), страница 9
Текст из файла (страница 9)
(2.4.2) Покажем, что критерии, основанные на (2.4.1) н (2,4.2), совпадают. Было показано, что тр" = С'() = РСр = Рф, где ()— любая лснк-оценка. Отсюда находим В'= О ТГй, — — о ТРГ Рг=РВР' ф"В' 'ф*=тр'Р'(РВР') ' Рф=$'В 'фр. Это доказывает равносильность неравенств (2.4.1) и (2.4.2), а следовательно, совпадение критериев. Функция мощности этого критерия определяется теорией распределений, которая будет развита в $ 2.6 (вместе с результатами $2.7)1 разбор таблицы и диаграммы мощности дается в $2.8, а оптимальные свойства в $2.10. 3 З.б.
Критерий, построенный по отношению правдоподобия. Статистика У Принцип отношения правдоподобия *) может быть использован для получения большинства обычно применяемых статистических критериев. В общем случае проверки гипотезы Н ы основных предположениях й удобно ввести обозначение ш = Н () 14, мзйеющее смысл множества предположений, полученного доОавлением условий гипотезы Н к предположениям 1). Если а) Этот принпип был сформулирован Нейманом и Пирсоном (Меншап б йнавтяоп, !928). Критерии отношения правдоподобия, построенные в й 2.5 и в мй)юннческой форме в й 2.6, были получены Колодаейчиком (Ко(одаецсауц 2286) для случая, когда г(Х) = р. 4б гл.
з. оншнп постновззив доввоитвльных эллипсоидов через у обозначены наблюдения или выборка, а через р(у)— плотность распределения у, то статистику отношения правдоподобия, служащую для проверки гипотезы Н, определяют формулой ') шах р (р) )ь= шах р (р) Заметим, что О ~ )с ( (, так как каждое значение р(у), воз- можное на ш, является возможным и на И. Интуитивно ясно**), что чаще всего вектор у попадает в ту окрестность значевнй наблюдений, в которой р(у)с(у достигает максимума при истин- ных значениях параметров.
Тогда, чем меньше максимум в ю по сравнению с максимумом в И, тем больше мы должны со- мневаться в истинности гипотезы Н, Критерий отношения прав- доподобия отвергает гипотезу Н, если ) (аа, где )з выби- рается так, чтобы получить желаемый уровень значимости. Приведем две эквивалентные формы И- и оэ-предположений. В каждой форме у является и-мерным вектором, а ю = Н П И. Первая форма (мы использовали ее в $2.4): И: у имеет распределение Ф(Х'(э, пзг), г(Хш"ю) = г; Н: Э=тра= . =Ф«=О, где (тр;) — заданные линейно независимые функции, допускаю- гцие оценку. Вторая форма (она более полезна в геометрнче. ских рассуждениях): И: у имеет распределение Л/(т),оза), т) ~ У„ где У,— заданное г-мерное подпространство У,; Н: т) ~ У, « — подпространство У, где Уг ч — заданное (г — д)-мерное подпространство Пространство У, из второй формы порождается столбцами матрицы Х' из первой формы, а У, является подпростран.
СтВОМ, К КОТОРОМУ ВЕКТОР т) ПРИНаДЛЕжИт ПО УСЛОВИЯМ »Р1 = =ф = =ф =О. ') Математически более искушенный читатель захочет написать Х= впр ре(У)! вор р«(р),где 9 — «точка» в й,а ро(р) заменяет определено е««а ную выше функцию р(р), ««) Эта мысль не может быть логически обоснована в общем случае. Математики построили патологические примеры, в которых мощности крите.
рия отношения правдоподобия меньше, чем мощность «критерия», не учитывающего опытные данные и принимающего или отбрасывающего гипотезы согласно таблице случайных чисел так, что вероятность отвергнуть гипотезу равняется 1; см. Леман ().ейшапп, 1959). Тем ие менее иа практике, когда существует «стандартный» критерий, отношение правдоподобия очень часто позволяет найти этот критерий или близкий к нему. $ ЕЗ. ОТНОШЕНИЕ ПРАВДОПОДОБИЯ. СТАТИСТИКА 47 Для доказательства эквивалентности этих форм (чигатель, желающий принять эту эквивалентность без доказательства, может пропустить этот и следующий абзацы) обозначим предположения ет в этих формах через в1 и ав а гипотезы Н через Н, н Нь Очевидно, что предположения й в двух формах совпадают, поэтому нам нужно доказать эквивалентность Вт1 = = Н, П О н ыт = Нг П Р.
Переходя в (1.2.4) к математическим ожиданиям получим ф = Ат1. Из рассуждений, проведенных перед (2.!.3), вытекает, что если а,'. является (-й строкой А, то а;еп )7„а из рассуждений, следующих за (2.3.4), вытекает, что ранг А = д. Согласно Н1 ф = Ат1 = О или т) Л.
)7А, где 17А— с-мерное подпространство Р„порожденное (а„..., а ). Множество всех векторов в (г„ортогональных к РА, образует (г — д) -мерное подпространство (обозначим его )7," ) пространства 17,; назовем это подпространство ортогональным дополнением 17А в (7, (см. конец приложения 1). Таким образом, из ы1 вытекает, что т1 ~ 'Р'; илн что ат следует нз Вт, н 17, =У; Докажем, что Вт, следует из а,. Пусть УА' — ортогональное дополнение 17„, в 17,; выберем векторы (ан ..,, а'~, порождающие 17'„. Через А' обозначим (д,к', и)-матрицу со строками, равными а",, ..., а",. Тогда из ет, следует, что т).) )7А или т1 ортогонален любому а', или А*т) = О.
Определим теперь ф'=С"О с С'=А"Х', так что ф'=Аз). Тогда координаты (ф) ,вектора ф' допускают оценку и несмещенная оценка ф' равна А'у, Осталось показать, что (ф',) являются линейно независимыми функциями параметров Щ. (Для этого недостаточно, чтобы г(А") =-с; необходимо еще, чтобы ргС" =с.) Предположим, что с,ф,'=О тождественно по (1 или с'ф"— = О.
Тогда из тождества с-~ с'А'А'О == О следует с'А'Х' = О или и'Х' = О, где и = А*'с, т. е. и = с,а, + ... + с„а',. (2.5.1) С одной стороны, равенство и'Х' = О показывает, что и перпендикулярен к столбцам Х', т. е. и.(. Р'„с другой стороны, из (2.5.1) вытекает, что и ~ У„так как а', еп 17,. Следовательно, и = О.
Тогда, учитывая линейную независимость (а',.), из (2.5.1) получаем с;= О при любом й Итак, (ф,') линейно независимы. Мы показали теперь, что в, следует из вз с линейно независимыми функциями ф,.=ф'„1= 1, 2, ..., д. При вычислении а предположениях (т статистики отношения правдоподобия для проверки гипотезы Н нам потребуется 43 Гл. г ОБшее постРОение дозеРнтельных эллипсоидоа плотность совместного распределения наблюдений р(у) = = р<(у!) р,(уг) ... р„(у.), где Р г р,(у,) =(2>гаг) ' ехр~ Это произведение можно записать так: ! — 2 р(у) = (2ггаг) ' ехр~ (2,5.2) для О ( ог ( ОО и >1~ Р<п.
Для этого можно сначала найти максимум по переменной т> ~ Р<о при фиксированном Ог, а затем искать максимальное значение полученного выражения по О. При фиксированном ог (2.5.3) максимально, когда минимальна величина <у — т)<г, а эта величина по теореме 2 приложения 1 минимальна, если т) является проекцией у на У<о. Итак, максимум (2.5.3) при фиксированном Ог равен ! 1'- — и„'1 (2иог) ' ехр1, !, (2.5.4) где Уа =!1 у — т)о<Р и т)а> — проекция у на т<о. Приравнивая к нулю производную по О' от логарифма (2.5.4), т.
е. производную от ! ! г'Уо<'т — 2 П 1П (2И»') — 2 ~ — г(, (2.5.5) а Уо> получим — — + — О, или 2»г 2», и'а! »г В (2.5.6) При таком значении Ог (2.5.5) достигает максимума, так как вторая производная от (2.5.5) по»', равная 2 >О <л — о БУР<, где т (у,й) = >(у — Х'(1 Р является суммой квадратов, которая минимизировалась в теории мнк-оценок ($ !.3). Мы будем искать максимум р(у) при й и»>.
Для упрощения записи положим й = й>, е> = йг, 'т', = Р<>>, у, » = у<г>. Нам нужно найти максимум (2.5.2) в предположениях И< (1= 1,2) или максимум р(у)=(2ПО) ' ехр ( — 2 О <<у — Ч<<г~ $ Я5. ОТНОШЕНИЕ ПРАВДОПОДОБИЯ.
СТАТИСТИКА 49 отрицательна при о'= Уа,/и. Подставляя (2.5.6) в (2.5.4), по- лучим у -рд 1 п1ах р (у) = ( ) ехр ( — — и), г у х д откуда Л=~ — ш~), или Л=® (2.5.7) Нам больше не потребуются временные Ипобозначення, поэтому мы их здесь оставим и введем постоянные обозначения. Обозначим проекции у на р', и р, „через 5!я и 1), а мнк-оценкн в И и е! — через ()а н !), соответственно. В дальнейшем мы будем обходиться без нижнего индекса И в т)а и ()а, записывая для этих часто встречающихся величин просто 11 и )). В формуле (2.5.7) статистики отношения правдоподобия Л величины Уя и У„, являющиеся минимумом У(у,!)) соответственно прн И и при ет, задаются формулами Уе = !! у — Ч !!', У = !! у+ Ч !!'.
Уа=У(у, 5) и У„=У(у, ()„). Установим зависимость между проекциями т), т) и мнк-оценками. Если (й1, ..., $р) — столбцы Х', то любой вектор в может быть выражен в виде линейной комбинации ~~' ЬД. 1-! За мнк-оценки (р1) и (рь„) можно тогда взять любое множесзво коэффициентов (Ь;) соответственно в выражениях р Ь!$т=ц и ~, ЬД=т)„; практически они будут линейными 1' ! формами наблюдений (у1) с независящими от неизвестных параметров коэффициентами.
По лемме 3 приложения 1 мнкоценка (в и нлн в 51) единственна тогда н толька тогда, когда г= р, На практике удобно использовать две мнк-оценки, а именно: Р=(()„..., Рр) — любаЯ А!на-оценка в И; Р„=(Р! „, ..., Рр,„)— любая мнк-оценка в е!. Используя этн оценки, можно найти Уо н У„ по формулам бо гл. к овшни постиовнии доввинтильных эллипсоидов На практике статистика *) (2.5.8) используется вместо )с. Критерий с этой статистикой совпадает с д-критерием.
Действительно, У =-У (Ц= — "'(Д-"" — 1), Ч где ~(Х) является однозначной функцией от Х, всюду убывающей на отрезке 0 () (1. Если мы определим У'о = ~(Хе), то Х (2е в том и только в том случае, когда У ) У е. Следовательно, ),-критерий отвергает Н тогда и только тогда, когда У ) Уса, где постоЯннаЯ ~е выбиРаетсЯ так, чтобы полУчить требуемый уровень значимости. В $ 2.6 будет доказано, что статистика ~ имеет Р-распределение при ш и нецентральное и-распределение при зз. Статистике У можно дать наглядное объяснение.
Как было отмечено раньше (9 1.3), У(у,р) можно рассматривать как меру точности подбора оценок рг, ..., рл по наблюдениям у,, у„: чем меньше У, тем лучше выбор оценок. Таким образом, У оценивает наилучший выбор, который может быть сделан в предположениях ш = Н () а), и может рассматриваться как мера согласованности Н с опытными данными, тогда как Уо показывает нам, насколько мала может быть эта мера, если оставить только основные предположения аз. Таким образом, Х-зги = У./Уп показывает, насколько хУже выбоР по данным в предположениях ш по сравнению с Й. !Чы отвергаем Н, если У„/Уп квелико».
Это равносильно отбрасыванию Н прн «больших» значениях У. Геометрическая интерпретация ста. тистики У будет дана в $2.9. Критерий для проверки гипотезы Н в предположениях з), построенный в этом параграфе при помощи статистики У, называют обычно Р-критерием, так как У имеет г"-распределение при ш. Распределение У при (з, которое определяет мощность а) я использую символ г для центральной случайной величины, имеющей г-распределение; символ У вЂ” для статистики (25.8) в модели с постояннымн факторами; символ й — для отногпения средних квадратов во всякой другой модели н для г-преобразования Ужстатистикн Хотеллннга.