Б.А. Севастьянов - Курс теории вероятностей и математической статистики (1119910), страница 28
Текст из файла (страница 28)
Рассмотрим функцию от с й(с)= Р(Рг($) > сР,(г) (Но) в предположении, что верна гипотеза Но. Функция 1 — й(с)= Р( ~'(".! .-.с)Н,~ есть функция распределения случайной величины Рг('ь)/Ро(я), поэтому она непрерывна справа и д(оо) = Гл. !с стлтистмческне кРитеРии О, п(0 †) = !. Определим с„ из условия п(с,) а < п(с„— 0), Если я(са)<п(са — 0), то выбираем а — я (са) я (с — О) — д (са) ' (9) ((р" — (р)(р, — с,рс)с(х + ~ (!р' †!р)(р, — с„рс)((х.
(10) В первом слагаемом интегрирование производится по точкам х, для которых Ч*(х) ) (р(х) ~ О, поэтому в этом интеграле р((х) ) с ра(х), т. е. подынтегральная функция неотрицательна. Аналогично, во втором интеграле (10) (р*(х) < (р(х) < 1, поэтому р((х) < сара(х), и подынтегральная функция также неотрицательна. Отсюда заключаем, что интеграл (9) неотрнцателеп, т, е, ((р' — сс) р, ((х ) с, ~ ((р" — ср) рс((х! Если й!(са) = д(са — 0), то полагаем е„= О. В случае, когда и(с) =— а для целого отрезка с! с < сь принимаем за с любую точку этого отрезка, например, самую левую.
Полагая с и е в (8) равными найденным с и а, строим функцию (р'. Докажем, что полученный (р'-критерий имеет уровень значимости а и обладает свойством оптималыюсти (7). Докажем сначала, что уровень значимости (р"-критерия равен а. Имеем Мсср = ~ рс (х) ((х + Р! (ст>сасо(с) и (с — О) — е (с„) ) Р! (с) с сс(х) Пусть !р — любой другой критерий с Мсср~~а.
Покажем, что тогда М((р') М(!р. Рассмотрим интеграл ~ ((р'(х) — (р(х)) (р, (х) — саре (х)) с(х. Разобьем его на два слагаемых ф М, ОПТИМАЛЪНЫЕ КРИТЕРИИ ф 55. Оптимальные критерии для проверки гипотез о параметрах нормального и биномиального распределений Пусть (1) есть независимая выборка из вормального распределения с параметрами (а, о). Пусть о Известно, а относительно а имеются две гипотезы: гипотеза Нюг а = аю гипотеза Н,: а=а, > аю. Построим оптимальный критерий Неймана — Пирсона, В этом случае ц — г ~~~~~ (цг-а )ц р()= ' -', !=о 1, (2ч)ц оц — — ехр(пх(а, — аю) 2ею (а( — аю~) ~' (11) где х — выборочное среднее. Из (11) следует, что об:,асть значений х, для которых р1(х)/рю(х)) С, определяется неравенством х > С, при некотором Сь Как из1сстпо, среднее х распределено нормально с парамег.
е рами (а, — ~. Определим теперь ошибки первого и г/' второго рода: а=Р(х>С1 1Ню)== 1 "ц'2" с а с,-а, — яц 9 = Р (х (~ С1 ) Н1) = = ч/2л ц* е=' г(и=1-Ф ( г— '"4и), (12) ц1 е з г(и = Ф( — '' 1~го) . о (13) или МЛ" — М р ) с, (а — МФ =з О, что и требовалось доказать. 3 а м е ч а и и е. Теорема справедлива и для дискретных распределений рю(х) и р1(х). В доказательстве в этом случае надо везде интегралы заменять суммами. ГЛ.
И. СТАТИСТИЧЕСКИЕ КРИТЕРИИ Обозначим и„ то значение, для которого 1 — Ф(ат) = у. (14) и„ носит название хаантихо нормального распределения. Тогда из (12) н (13) и ат = — и~ „ вытекает Ъ~л =и ~ "о'и = и» о а С =а+и — =а — и = — о о ту- — ~ а (15) (о1 — оо) Равенство (15) дает тот объем выборки, который при оптимальном критерии обеспечивает ошибки первого и второго рода а н 5 (если правая часть (15) — нецелая, то за а надо брать ближайшее большее целое число), Рассмотрим теперь следующие две гипотезы; Но: а=О, о=по Н,о а = О, о = и, > оо. В этом случае отношение правдоподобия о приводит к критическому множеству 2 х';)С,.
о ! Поскольку случайная величина и 1 ! имеет прн гипотезе (О,о) 11о-распределение с л степенями свободы с функцией распределения К„(х) = ~ й„(оо)аи, х «) О, о о 66. ОПТИМАЛЬНЫЕ КРНТГРИИ п плотностью л х ха е ', х)О, й„(х) = в'г (-,") то ошибки псрвого и второго рода опрсдсля(отса из ра. Вснств Построим оптимальный критерий в схеме Бернулли. Пусть О < ро < р! < 1.
Рассмотрим следующие двс гипотезы: Н: р,(х)=С„'р„"(1 — р„)л ", х=О, 1...., и, Н,: р! (х) = С„"р"! (1 — ро)" ", х = О, 1, ..., и, Оптимальный критерий для проверки гипотезы Но против конкурирующей гипотезы Н! строится, исходя из неравенства Р (х) 1" Р (! — Ро) 1' (' — Ра)"- Ро(х) (.
Ро (! Ра)1 (! Ра) которос равносильно неравенству х С, прн некотором С!. Для вычисления ошибок первого и второго рода воспользуемся тем, что число полохкительных успехов х асимптотически нормально с параметрами ( л аа!р !а — ра ). и о=Р(х)С 1Но)=Р~ " "'" „=- ' 'Р' 1Но~, Ъ'лРо (! — Ро) Ч(лро (! — Ро) Р=Р(х <с,(н!)=Р1, ' ' ' < ' Р' 1но~. (.~' Р (! — Ра) а(лР (! — Р) Отсюда, используя каантнль и, определенную (14), по )туманы прн заданных и и 1) границу с,-,р,а..а/~д7:р,а р,— раас,н — ра ГЛ.
1Е СТАТИСТИЧЕСКИЕ КРИТЕРИИ 204 и необходимый объем выборки ( ант н+" тго )у (Ре — Р~) $56. Критерии для проверки сложных гипотез ае Рис, 14. Функиия мощности %' (а) кри а терна я ) не+ иа =. ч/а На примерах выборок из нормального распределения разберем те задачи, которые возникают при проверке сложных гипотез. Пример 3. Пусть независимая выборка (1) взята из нормального распределения с параметрами (а, о), причем о известно. и(а) Рассмотрим простую 1 проверяемую гипотезу Но.
а = ао и одностороннюю сложную конкурирующую гипотезу и Н,: а ) ао. Действуя О а так же, как в $55 прн различении двух простых гипотез, находим, что критерий х ) С1 = = ао + пап~1/а будет иметь уровень значимости а и будет наиболее мощным для любой простой гипотезы а, ) ао. Функция мощности этого критерия В'(а) будет иметь график, изображенный на рис.
14, и ошибка второго рода 5(а)= 1 — ()т(а) прн а ( ао в пределе равна 1 — сс. Поэтому по критсрию х)С1 мы можем лишь с малой ошибкой а отвергнуть гипотезу Но. В случае х ( С1 мы не имеем больших осно. ваний утверждать только на основе выборки (1), что а = ао, а не а ) ас, так как при п, близких к ао, вероятность события х ( С, близка к единице. Поэтому при х ( С, мы говорим, что выборка (1) не противоречит гипотезе Но, и если эта гипотеза имеет какое. либо обоснование, независимое от выборки (1), то вы» йорка в этом случае ее подтверждает.
Пример 4. Пусть гипотеза Но остается прежней, а конкурирующая гипотеза будет двусторонней Н;: ачьпо. В этом случае для значений а=а~ ~по и 1 М. КРИТЕРИИ ДЛЯ ПРОВГРКИ СЛОЖНЫХ ГИПОТЕЗ Мз а = а1 «ао теорема Неймана — Пирсона дает разные оптимальные критерии х( С, и х) Си т, е. не существует такого критерия с уровнем значимости ск, который максимизировал бы функцию мощности )Р'(а) во Рис. 15, Функция могциости Ят (а) диустороннето критерия аннет )х — а) >=.
~л всех точках ачьао. В этом случае применяют двусторонний критерий, по которому гипотеза тто отвергается, когда а, ~те Функция мощности такого критерия равна а а т с "~ "а,'2 а 1 Ю(а)=1 — = ~ е ' с(х. ,еа .) — ч'- а о Уровень значимости этого критерия равен а, а график имеет вид, изображенный на рис, !5. Пример 5.
Пусть имеются две независимые выборки: выборка х„х„..., х„из нормального распределения (О, о,) и выборка у„у„..., у„из нормального распределения (О, от). Рассмотрим основную гипотезу Н;. О,=о„и конкурирующую гипотезу Н;. О,~о,. ГЛ. 14. СТЕТИСТИЧЕСКИЕ КРИТЕРИИ Статистика ! ! а, ! (16) $57. Непараметрическне критерии В математической статистике часто требуется проверить гипотезу, что независимая выборка х„х,,..., х„ (17) взята нз генеральной совокупности с функцией распределения Р(х). Относительно конкурирующей гипотезь1, кроме независимости х; в (17), других предполоисепий ие делается.
В этом случае применяются так называемые иепараметрические статистические критерии, которые строятся на основе какой-либо статистики д(х„... ..., х„, Р), зависящей от Р, причем распределение этой статистики при спранедливостн основной п1потезы известно '!очно илн аснмптотическн нри н-~ со. Обычно СтатнетИКа ПОЛОжинтЕЛЬН, И При ЕИОбОй КОНКурнруЮщЕй гипотезе ее значение возрастает. Выбирается такое и„, чтобы л ) д„при основной гипотезе выполнялось с вероятностью ошибки первого рода и.
Основная гипотеза ИРИН!И!аетСЯ, ЕСЛИ д < д,, И ОтВЕРГаЕтСЯ, ЕСЛИ Е ~ да. Одним пз наиболее известных таких критериев является у'-критерий Пирсона.. В!!берем точки га= — оо <г, <гг « .. г,, < < г,= оо. По известной функции Р(х) вычисляем веро- имеет прн гипотезе Н, Р-распределение Фишера. Кри- терий можно построить на основе статистики (16).Пус ь Рт — такая квантиль Р-статистики (16), что Р(Р- Рт(НА)=у, БУДем пРинимать гипотезУ Па тогДа и только тогД1, когда Р1-«н<»Р <»Рака Этот критерий имеет уровень значимости !х.