Б.А. Севастьянов - Курс теории вероятностей и математической статистики (1115332), страница 29
Текст из файла (страница 29)
Имеем П=Р(х'-РС!)На)=Р~ . '" ) ' "" )На~, .ус)ср.(1 — р:) 1 ро(1 — !а) й=Р(х<Сс!Н!)=Р( ' ' < ' '' 1Нс~. Ч/асп (1 — а,) уСар, (1 — р~! Отсюда, используя кваптиль н, оппедслснну!о (14), по. отучаем прп задаппык сх и р гранину С, =пРо+сса ЦПРа(! — Ра) = пР, — п„.УПР,(1 — Р,) ГЛ. И. СТАТИСТИЧЕСКИЕ КРИТЕРИИ 204 и необходимый объем выборки $ 56.
Критерии для проверки сложных гипотез На примерах выборок из нормального распределения разберем те задачи, которые возникают при проверке сложных гипотез. Пример 3. Пусть независимая выборка (1) взята из нормального распределения с параметрами (а, а), причем о известно. 'я(я) Рассмотрим простую ропнюю сложву|о конкурирующую гипотезу аа Н1. а > ас. Действуя О аа а так же, как в $ 55 прн различении двух про- 1'ис. 14. Фракции моя~носта 11а (а) кРЯ- стых гипотез, находим, теряя х > аа + ия = что критерий х ~ С~ = " ~п = ас + паат~ ~п будет иметь уровень значимости а и будет нанболсе мощным для любой простой гипотезы а~ ) ас, Функция мощности этого критерия %'(а) будет иметь график, изображенный нз рис.
14, и ошибка второго рода р(а) = 1 — 1Р'(а) при а 4 ас в пРеделе Равна 1 — а. ПоэтомУ по кРитсРию х)Са мы можем лишь с малой ошибкой сс отвергнуть гипотезу Нс. В случае х ~ С1 мы пе имеем больших осно. наний утверждать только на основе выборки (1), что а = ас, а не а ~ ас, так как прн а, близких к ас, вероятность события х:- .С1 близка к единице. Поэтому при х ~ С~ мы говорим, что выборка (1) не противоречит гнпотезе Н„ и если эта гипотеза имеет какое.
либо обоснование, независимое от выборки (!), то выборка в этом случае ее подтверждает. Пример 4. Пусть гипотеза Нс остается прежней, а конкурирующая гнпотсза будет двусторонней Н,: а Ф ас, В этом случае для значений а = а, < ас и к 66. критеРии пля пРОьРРки сложных ГБИОтез 2ОЗ а = а| > ао теорема Неймана — Пирсона даст разные оптимальныс критерии ха С1 н х ~ С,, т. е. не существует такого критерия с уровнем значимости ст, который макспмнзировал бы функцию мощности ))т(а) во Рпс.
1З. йтуикпии поганости йт (а) двустороннего критерия )х — а! > — ~ — — ° всех точках а Ф ао. В этом слУчае пРнмсннют двУсторонннй критерий, по которому гипотеза Н„отвергается, когда иа>.,о 1й — оо 1=-- — "' з/и Функция мощности такого критерия равна а.— а — ' — ти Риаа 1 Ю' (а) = — 1 — = ~ е '-' с1х. т/2и и Уровень значимости этого критерии равен Гс, а график имеет вид, изображенный на рис. 15. П р п м е р 5. Пусть имеются две независимые выборки: выборка х„х,„..., х„из нормального распределения (О, о,) и выборка тт„у„..., ра пз нормального распределения (О, о.).
Рассмотрим основную гипотезу Но'. а, = о, и конкурирующую гипотезу Н,: о,~ьот. ГЛ. 14. ГТЛТИСТПЧЕСКИЕ КРПТЕР!И! Статистика 1 х' (Рй) Лр имеет прп гипотезе И!) Р-распределение Фишера. 1(рптерий можно построить на основе статистики (16). Пус ь Рт — такая квантиль Р-статистики (16), что Р (Р) р,! уд =у. Будем принимать гипотезу Л, тогда и только тогд), когда Р! -))Тл елл р ~ ~ри,'". Этот критерий имеет уровень значимости !х. ф 57. Непараметрические критерии В математической статистике ча то требуется проверить гипотезу, по независимая выборка хп ха, ..., х„ (17) пзята из генеральной совокупности с функ!!Вой распределения Р(х).
Относительно конкурирующей! гипотез кроме независимости х в (1У), других предпоз!Онлени1! пе делается. В этом случае применяются так называем!яе нспарамстричсскнс статисГИ~1сскпе критерии, которые строятся на основе какой-либо статисгнкн ц(х), ... ..., х,.„г), зависящей от Р, грнчем распределение этой статно!Пки прп сп авсдлнззстн основной г!шотезь! и)- постно То~но нлн зш!и!поти'!Сскп пои и — ~. м. Обычно статистика положптелы!з, и и; и г!!Об! й ко:)курпру)оил!)1 1ИПОТЕЗЕ РЕ Знал!ЕППС ВОЗРЯСТ;1ЕТ. !зЫОИРЗЕТСЯ ТЯКОЕ Я», л!тобы Р » «Да пйи Основной ! П)юте.!с вы!!Олачлось с Ве роятпосгыо ошибки первого рода а.
Основная гипотез) ПРИНИМЯСТСЯ, ССАИ Г! ( Д„, И ОТВСРГЗЕТСЯ, СЕЛИ ьа» Ял. Одним пз наиболее известных таких критериев является 7х-кратсрай И1)ргона. Выбсрсм точки !) = Со ') в! ( Е) ( ° ° ° ( ал ! С По известнои Функиии Р (х) вы'п!Слясм перо- 207 $ 57. ИепзззметРичгские кгг>теРии ятности рг,= Г(зе) — Р(х„>), /г = — 1, ..., г. Обозначим т>г число тех хг из выборки (17), которые удовлетворяют условпго ее > < х;: ее. Тогда при справедливости основной гипотезы случай>>Его величины (18) тг ° ° ~ "г имеют полицомпзльнос распределение гг, + ...
+п, =гг. (19) Первоначальную задачу мы редуцнрусм теперь к проверке гипотсзы о том, что частоты (18) получены из полиномнального распределения (19) с вероагностямн исходов Р> Рн ° ° ° Рг. Статистика, пз основе которой строится критсрий, называется рг-стиг>гетиной 1>ггреона и определяется сумм ой> (20) "и,г > ир е=7 Тсорсм а 2. Раепреде.ление у', при и — >-со слабо сходится к уг-раепределегило с (г — 1)-й етепенгно ееоооды с функчней Раепределенпн и г-> и г К,,(х)= — „, 7)гг е ' ои, (,, 1 Д о к а з а т ел ь с т в о. 11з теоремы 8 8 йГ> следует, ЧтО СЛуЧайНЫй ВЕКтОр 71Ь>7=-. (>)',и>, ..., 71,'и') С КОМПОПЕН- тами Е '7> (21) !>,>7> > сходится при п — я со к пормалы>ому распредслегнио с пулевыми средними и мзтрицей ковариацпи 11 Со>7 (7)ы 717) ~~ = 1( б>,г,— ч~рерг 1 Гл.
и. статистические кРитеРии (будем обозначать 212 случайные величины с предельным нормальным распределением). Характеристическая функция предельного нормального распределения равна ! — о (и е ' ч , где Преобразуем вектор Ч ортогональным преобразованием е = СЧ. Тогда характеристические функции )ь и („свсзаны соотношением ~з (и) = ) „(С'и), и = (и !, ..., и,), где С' — преобразование, сопряженное С (см. свойство 7) из $ 43). Если 1= С"и, то и = С2, ! =((ь ...
..., 1,). Выберем С так, чтобы и! = ~7р! !! + ... + ~/р, 2„ (23) а остальные иь — — ~~ се!!! подбеРем так, чтобы матРица 2=! с=~ 27р! тгр2 °" ь'л СМ С22 ... С2Г С„С,2 ... Сг, была ортогональной. Тогда в )! (и) = е ! ' квадр атич (и я! ная форма, в силу (22) и (23), равна г г г Яг (и) =-0„(С'и) = ~ (,', — и-', = ~". и', — и', = ,'Е и'„, 2=! 2=-! 2-2 т. е. вектор е=(';!, ..., Е,) имеет независимые конно ненты, причем ВЕ! = О, с2, ..., $, распределены пор. мальпо с параметрами (О, 1).
Из предельной теоремь! и формул (20), (21) следует, что Х',=2)!,"Р+ ... +Ч',"" сходится к распределен!по 21', + ... + т),". В силу ортогональности преобразования С сумма 212, + ... + 212 переходит в сумму К'-;+Ц+ ... + С!, что и доказывает тео ем с еделспие )(2-распределения в $ 46). олученный результат применяется следующим способом. Задаемся уровнем значимости а, Тогда, в силу г г Ч2 Я (()= )' Р— ~ У У „!р р! = ~' Р— ~~,2„/у> ( ~ . (22) 20з $57. Напьглмвтеичвскна кгитсгии теоремы 2, при больших п с вероятностью, приближенно равной с!, выполняется неравенство где й„(г — 1) — а-квантпль у'-распределения с (г — 1)-Й степенью свободы (см.
~ 64. п. в)). Мы считаем основную гипотезу принятой, сслн т,'-„' < >г„(г — 1), и отвер! ° нутой, если выполнено обратное неравенство. Выбор точек деления гь ..., г, ! должен удовле>ворять двум требованиям. Во-первых, вероятности р>, рь ..., р, должны достаточно хорошо отражать впд функции распределения Р(х) (для этого г должно быть больше и р! — меньше). Во-вторых, для того чтобы можно было пользоваться предельной теоремой, пр! и, соответственно, т>! должны быть не очень маленькими (для этого ! должно быть не очень большим). Обычно иа практике гребу>от, чтобы пр! - 10, з>! ~ )10. Из этих противополо>кпых требований н выбираются точки гь ..., г.-!.
Другим примером непараметрического критерия является критерий Кол.иогороеа. Этот критерий основан на статистике П„= зцр ) Рп(х) — Е(х) ~, (24) <х< где Р(х) — непрерывная фупкц>и распределения генеральной совокупности, Р„(х) — эмпирическая функцш! распределения, построенная по выборке (1): Докажем, что распределение случайной вел~~и~~ О„ инвариантно относительно Г(х). Теорема 3. Если Р(х) непрерывна, то распределение статистики х>„не записи! от Г(х). Доказательство.
Докажем, !то 0„при любой непрерывной Г(х) имеет такое >ке распределение, как 210 ГЛ. И. СТЛТИСТИЧЕСКИС КРИТЕРИИ п в случае, когда В(х) задает равномерное распределс. пис на отрезке 10, 1). Пусть ";1, ..., $„— независимые случайпыс величии« и каждая из них имеет функиию распределения г" (х>. Предположим, что гч(а)=0, В(Ь)=1 п О.С В(х)~ 1 ири а: х ~ Ь, причем а и Ь могут быть и бесконечными.
Обозначим через В множество, состг>ящсе из тех точек а - х. Ь, для которь!х при любом а = 0 г" (х)~ < В(х+ е). Нетрудно видеть, по прил>обом О < у < 1 существует единственная тс !ка х ~ В, лля которой ! (х)= у. Примем это х зз значение обратной функции>: х =- В (у). Введем случагсиые величины чь =- Р-!( >,), Ь =- 1, ...