Учебник_Бочаров_Печинкин (846435), страница 50
Текст из файла (страница 50)
!1, табл. 2.!а)), и, что следует отметить особо, уровень значимости при большом объеме выборки практически не зависит от истинного значения параметра 8. Если же, наоборот, задан уровень значимости сг, то критическое значение С приближенно совпадает с 7М вЂ” (1 — сг)-квантилью Хз-распределения с й — т степенями свободы [1, табл. 2.2а). Пример 5. Выборка Хь,Х„произведена из нормальной генеральной совокупности с неизвестными средним д~ н дисперсией дг. Требуется построить критерий уровня значимости а для проверки сложной основной гипотезы Нц. д~ = пм против сложной конкурирующей гипотезы Н1 д~ ф тз. В этом примере множество всех возможных значений параметров д1 н дз представляет полуплоскость дг ) О, а гипотеза Нэ выделяет в этой полуплоскости полупрямую д~ = тш Функция правдоподобия имеет вид 7(Хь,..,ХГбдндз) = !) с згг! 1,;Г2 яд а,/ Для определения значения в* = (д*,, д.*,), доставляющего максимум функции правдоподобия в множестве й, обратимся к примеру 25 нз гл.
2. Тогда д|=т, дз=о*, 2* 4. Многопараметрические гипотезы 235 г где т* и и * — выборочные среднее и дисперсия, и, значит, само максимальное значение Д'(Х(,..., Х„) = ! ) — г„((лр — и'гг (-....((Х вЂ” "! ) ( ! )" — (г =( э(2яиз* ( тг 2 тиг* Найдем теперь до — — (д;(,д*( ), максимизируюшее функцию правдоподобия в подмножестве йо.
Для этого заметим, что поскольку д( = то, то система уравнений правдоподобия преврашается в одно уравнение (1п г (Х(,..., Х, то, денд =( и ! г — — 1п(2пдг) — — ~(Х( — то) -« .. ч-(Մ— п(о) ~ ) 2 2дг( дг и ! г г! — — — — ~(Х( — то) -г ... -«(Մ— то) ] = О, 2де 2д,". ( решая которое, получаем .(О( ! д;( = то, дг = — '((Х( — то) « .. -«(Х, — ттго)") = и *. Таким образом, йо(Х(,...,Х.) = ),,:э ((х д « ° д«(х И! ( ! ) — рг =( )", .'- ' ' =( ъ 2янг* Ъ' 2ядз Отношение правдоподобия имеет вид л= „ ' " =(, Ь" (Хи, Х„) тнг') "гз Ц (Х(,, Хи) ие* а сам критерий предписывает нам принять гипотезу Но, если Л = 21пЛ < С, и отвергнуть ее, если Л ) С.
Поскольку множество Н имеет размерность й = 2. а подмножество Оо — размерность т = 1, то критическое значение С = 6( где !ги — и-квантиль Хг-распределения с одной степенью свободы. Полученный критерий удобно записать в несколько ином виде Действи- тельно, производя элементарные преобразования, имеем и' * = о.'" «(т* — ттгд)". Используя теперь монотонность функции 1(х) =!пх, видим, что неравенство 2Л = п1п(и (газ*) < С эквивалентно неравенству п(т* — то) < С(зе*, где С( — — (и — 1)(г 'г" — !), или, что то же самое, неравенству,/и (т" — то! < < С(ъ'зг" . Иными словами, мы пришли к естественному критерию; принять гипоте- зу Не, если < С(, и отвергнуть в противном случае.
— 'о~ ~гз'(и Поскольк статистика у иги (ти — тпо! имеет (-распределение (см. гл, 1, параграф 4), то критическое значение С( пРи РазмеРе кРитеРиЯ ио пРедставлает собой (( (г — (1 — иог(2)-квантиль (-распределения с и — ! степенями свободы. 236 Гл. 3. Проверка статистических гипотез Отметим (12), что построенный критерий является равномерно наиболее мощным несмещенным для проверки гипотез Но и Н!. П Пример 6. Предположим, мы произвели опыт, состоящий из и испытаний, а результат каждого испытания характеризуется двумя случайными факторами (показателями), причем первый фактор может принимать значения (уровни действия фактора) 1,2,...,ти!, а второй — 1,2,, газ. Результаты опыта можно представить в виде табл, 1, где и„— число испытаний, в которых первый фактор подействовал на уровне и а второй — на уровне ~'. Наша задача — проверить, действуют ли эти факторы независимо (гипотеза Но) или между ними существует зависимость (гипотеза Н!).
Таблица 1 Здесь мы имеем дело с так называемой двухфакторной (ги!, птз)-уровневой моделью. Опишем эту модель. Прежде всего, если не делать предположения о независимости факторов, то имеется т!тз неизвестных параметров д„— вероятностей того, что первый фактор подействует на уровне !2 а второй— на уровне у. Значит, множество О представляет собой (ги!ш! — 1)-мерное подпространство пространства й ""', выделяемое соотношениями д„ > О, т! ттгт = 1 (в силУ последнего Равенства РазмеРность пРостРанства !В Равна =! т.=.! т!шз — 1, а не га!тпз). В свою очередь, в силу независимости факторов подмножество Йо является ((ги! — 1) + (тз — 1))-мерным подпространством пространства Нт'т', задаваемым ограничениями р р! И р1з1 ! Выпишем логарифм функции правдоподобия г т т! 2 =- 1п Ь =- 1и и Ц д„— 2 2 ' и„)п!ты.
=! т=! 238 Гл. 3. Проверка статистических гипотез 5. Критерии согласия Предположим, что выборка Хь..., Хп произведена из генеральной совокупности с неизвестной теоретической функцией распределения, относительно которой имеются две непараметрические гипотезы: простая основная Но. с(х) =- Ро(х) и сложная конкурирующая Ни с(х) ~ со(х), где со(х) — известная функция распределения. Иными словами, мы хотим проверить, согласуются эмпири геские данные с нашим гипотетическим предположением относительно теоретической функции распределения или нет.
Поэтому критерии для проверки гипотез Но и Н1 носят название критериев согласия. Приведем три наиболее часто употребляемых критерия согласия. Критерий Колмогорова. Уже говорилось (параграф 3 гл. 1), что в силу теоремы Гливенко — Кантелли эмпирическая функция распределения с *(х) представляет собой состоятельную оценку теоретической функции распределения с'(х). Поэтому можно сравнить эмпирическую функцию распределения с *(х) с гипотетической Ро(х) и, если мера расхождения между ними мала, то считать справедливой гипотезу Но.
Наиболее естественной и про- 1,: стой из таких мер (будем предполагать, что со(х) -- непрерывная функция) является равномерное расстояние рн = рн(Р*(х), ро(х)) = зцр ~с "(х) — со(х)~ Гх (рис, б и параграф 5 гл. 2). Однако при построении критерия Колмогорова более удобно пользоваться нормированным расстоянием р =,~и рн. Итак, рассмотрим статистику р = р(Хп ...,Х„) = хги вцр ~Г*(х) — со(х)Е Критерий Колмогорова предписывает принять гипотезу Но, если р < С, и отвергнуть в противном случае, где С вЂ” критическое значение критерия. Если гипотеза Но справедлива, то распределение статистики р не зависит от гипотетической функции распределения со(х) (доказательство этого факта следует из инвариантности статистики критерия Колмогорова относительно монотонных преобразований, в частности преобразования у(х) = Р~ ~(х), где го (х) — обратная к го(х) функция; преобразование д(х) приводит выборку Хь ...,Х„ к равномерно распределенной на отрезке (0,1)).
Поэтому можно рассчитать таблицы, 239 5. Критерии согласия которые по заданному объему выборки п и критическому значению С позволяют определить уровень значимости критерия гл. Поскольку на практике обычно, наоборот, считают известными уровень значимости сл и объем выборки и, а затем по ним определяют критическое значение С. то именно такая таблица приведена в [1, табл.
6.2). При и — ос распределение статистики р сходится к распределению Колмогорова [1, табл. 6.1], и критическое значение С при большом объеме выборки практически совпадает с (1 — сг)-квантилью 19 распределения Колмогорова. При практической реализации критерия Колмогорова сначала по выборке Хы ...,Х„ составляют вариационный ряд Х,*,...,Х„'. Затем находят хо(Х,*) и определяют значения статистики р по формуле р = тгп [ шах хо(Х, ) — -2 + Наконец, сравнивают полученное значение р с критическим значением С для заданного уровня значимости о и принимают или отвергают гипотезу Но.
Критерий огз. Пусть х)(х) — некоторая функция распределения, не совпадающая с хо(х). Критерий Колмогорова хорошо разделяет выборки (имеет большую мощность) из генеральных совокупностей с теоретическими функциями распределения Ео(х) и Е~(х), если [Ео(х) — Е1(х)[ достаточно велико хотя бы на малом интервале изменения т. Встречается и обратная ситуация, когда [Го(х) — е'1(х)[ мало, но постоянно на достаточно большом интервале изменения х.
В этом случае для разделения гипотез Но и Н1 естественно пользоваться каким-либо интегральным расстоянием, например расстоянием игз (см. параграф 5 гл. 2). Статистика иг~ критерия си~ задается выражением ир = шз(Хп...,Хи) = п ~ [Г'(х) — Го(х)1 ро(х)с1х (мы предполагаем, что гипотетическая функция распределения со(х) имеет плотность распределения ро(х)), а критическая область гг', состоит из всех тех точек (хы ..., хи), для которых иг~ ) С, где С вЂ” критическое значение критерия. Используя вариационный ряд Х,*,...,Х„', статистику ига можно записать в более удобном для практических расчетов виде Распределение статистики ига при условии справедливости гипотезы Но также не зависит от гипотетической функции распределения хо(х) (это доказывается точно так же, как и инвариантность распре- 240 Ель 3.















