Б.А. Севастьянов - Курс теории вероятностей и математической статистики (1119910), страница 29
Текст из файла (страница 29)
ч ет. непАРАметпические квитеени 207 ятности ре=р(ге) — Р(ге !), 1=1...„г. Обозначим че число тех х, из гыборкн (17), которые удовлетворяют условию еь, < х, ем Тогда при справедливости основной гипотезы случайные величины (18) имеют полиномиальное распредеченпе и, + ... +п,=п.
(19) Первоначальную задачу мы редуцируем теперь к проверке гипотезы о том, что частоты (18) получены из полиномиальиого распределения (19) с вероятностями исходов Р» р ° ° рг Статистика, на основе которой строится критерий, называется уз-статистикой Пирсона и определяется сум. мой (20) Теорем а 2. Распределение т'„- при п- со слабо сходится к р„'-распределена!о с (г — 1)-й степенью свободы с функцией распределения л ~ -! 1Г (х) — ~ а е е з (а х,з0 2е Г( — )!! Доказательство.
Из теоремы 8 8 46 следует, что случайный вектор 8!"! =(Ч!!!!, ..., т1о'!) с компонентами !)ы!— (2! ) ,!„! лрл сходится прн и - оо к нормальному распределеги~о с цулевыми средними и матрицей ковариации (~Соя(чм т)!)1~=)(бл! — чурдр!1 ГЛ. М. СТАТНСТИЧЕСК!!Е КРИТЕРИИ яоа (будем обозначать т!й случайные величины с предел;- ным нормальным распределением). Характеристическая функция предельного нормального распределения равна ! -то н! ей ",где Г Г / Г йй а„(~)=Хай-Ха Я,=Х ,'— ~ Х Р„(,) (22) Преобразуем вектор Т1 ортогональным преобразование ! с = СЧ. ТогДа хаРактеРнстнчсскне фУнкции )й и (ч свйзаны соотношением (й(и)=)ч(С'и), и=(и!, ..., и,), где С" — преобразование, сопряженное С (см. свойство ?) из $ 43).
Если т= С'и, то и = СЕ ! =((ь ... ..., 6). Выберем С так, чтобы и,= Ч'р! (!+" +т/рс („ (23) Г а остальные ий= К сйй(! подберем так, чтобы матрица ! ! й!Р З!Рй " Ч'Лс см см ... сй„ с„! с,й ... сс! была ортогональной. Тогда в )г(и) = е оз !' квадр атич иая форма, в силу (22) и (23), равна с Г с Я-(и)=Я (С"и)=ХЯ вЂ” и';=2.и',— и~=Хи', й ! й=-! йРЕ т. е. всктор 5=ф„.. „$,) имеет независимые компоненты, причем В$! = О, ~й, ..., 5, распределены нормально с параметрами (О, 1), Из предельной теоремы и формул (20), (21) следует, что Х', = т1!!сн+ ... + Т)',"!' сходится к распределению т1!+ ... + Ч'„-'. В силу ортогональности преобразования С сумма и!й+ ...
+ й1," переходит в сумму Ц+ Ц+ ... + 5!, что и доказываст теорему (см. определение тй.распределения в $46). Полученный результат применяется следуюшнм спо. собом. Задаемся уровнем значимости а. Тогда, в силу 9 эь нвпАРАмвтэичвскив кРитеРии 209 теоремы 2, при больших и с вероятностью, приближенно равной и„выполняется неравенство где Йа(г — 1) — а-квантиль у'-распределения с (т — 1).й с1епенью свободы (см.
й 64. п. в)). Мы считаем основ. пую гипотезу принятой, если у'„-' (й„(г — 1), и отвергнутой, если выполнено обратное неравенство. Выбор точек деления гь ..., г, ~ должсн удовлетворять двум требованиям. Во-первых, вероятности рь рх, ..., р, должны достаточно хорошо отражать вцд функции распределения Р(х) (для этого т должно быть больше и р; — меньше). Во-вторых, для того чтобы можно было пользоваться предельной теоремой, пр~ и, соответственно, кч должны быть не очень маленькими (для этого г должно быть не очень большим).
Обычно на практике требуют, чтобы ар, ~ 10, ч, ) 10. Из этих противоположных требований и выбираются точки гь ..., г.-~ Другим примером нспарамстрпчсского критерия яп. ляется критерий Коллшгорова. Этот критерий основан на статистике (24) )у„= эцр ! Р„(х) — Р(х) 1, <х< где Р(х) — непрерывная функция распределения генеральной совокупности, Р,(х) — эмпирическая фупкцвя распределения, построенная по выборке (1): 1 х Р„(х)= — т ур.
Докажем, что распределение случайной величины О, инвариантно относительно Р(х). Теорема 3. Если Г(х) непрерывна, го распределение статистики 0„не зависит от Р(х). Доказательство. Докажем, что 0„при любой непрерывной Р(х) имеет такое жс распределение, как 210 ГЛ.М. СТАТИСТИЧЕСКИЕ КРИТЕРИИ и в случае, когда Р(х) задает равномерное распределение на отрезке [О, 1). Пусть $1,,, $„— независимые случайные величины и каждая из них имеет функцию распрсдсления Р(х). Предположим, что Р(а)=0, Р(Ь)=1 и 0< Р(х)< ! прп а < х < Ь, причем а и Ь могут быть и бескоиеч.
ными. Обозначим через В множество, состоящее из тет точек а < х Ь, для которых при любом е ..- 0 Р(х) < < Р(х+ е). Нетрудно видеть, что при любом 0 < д <! существует единственная точка х ен В, для которой ГГ(х)= д. Примем это х за значение обратной функции: х = Р-'(д).
Введем случайные величины Ч» — — Р-1(5А), Ь = 1.... ..., а, Они независимы, так как К1, ..., $„независимы, и равномерно распределены в (О, 1), так как события (ЧА < д) н ДА < Р-'(д)) равносильны и при л1обом 0<д<1 Р(Ч <у) =-Рй<Р-'(д))=-Р(Р-'(д))=у. Обозначим более подробно эмпирические функции распределения для выборок ~„..., е„ л 1 ч Г„(х; 31, ..., 5„)= — ~ 1!!»<х) 1.=1 ИЧ1 ° ° ° ~Чл 1 ч Р (У! Ч1 ° ° .
Ч~)= „/ 1!ЕА<Р) 1 1 Положим д = Р(х), х ее В. Тогда из равносильности событий ($1 х) и (ЧА < у) следует Р. (у! Ч 1,, Ч.) = Р. (х; $1,, $.) (20) Верхнюю грань в (24) можно брать по хе= В, поэтому, в силу (25), с вероятностью 1 В„=зцр! Р„(х; $1, ..., $„) — Р(х)1= хе з = зир (Р. (д! Ч " Ч.) — д !. З<Р<1 что нам и требовалось доказать. А. Н.
Колмогоров доказал, что при и-А-ео для любой непрерывной Р(х) имеет место следующая прсдсль. 21! злддчн иая теорема: 1(ш Р(1/и О„~х~)=К(х)= ~ ( — 1)ае аех', х>0. (26,' иэ г а== На основе предельного соотношения (26) строится не- параметрический критерий Колмогорова. Пусть й — о,- кваитиль предельного распределения (26) 1 — 7( (й„) = а.
Тогда гипотеза о том, что выборка (17) взята ит рас- пределения с функцией Р(х), принимается, если ~ггг 0„( «()г„и отвергается, если 1гггт 7)„> й,. Уровень значи- мости этого критерия равен прибзлиженно о. С той же самой предельной функцией К(х) связан критерий Слзириова. Он состоит в следуя>шем. Пусть хп ..., х„и у„..., уа — две независимые выборки, первая имеет функциго распределения Р (х), вторая— 6(х). Обозначим й„, = внр (Р„,(х; хы ..., хч,) — Рщ(х; у1, ..., у„,)). <х< Н.
В. Смирнов доказал, что если Р(х) = 6(х) и гг ( непрерывны, то при пь п, — оо, — — т, 0 < т < оо, слу/ п|ат чайная величина ту + 0,ь„, в пределе имеет тот и, + и, же закон распределения К(х), определенный рядом (26). Эта предельная теорема позволяет нам строить крите- рий по проверке гипотезы о том, что выборки хы..., хгч и уь ..., у„, взяты из одного и того же распределения. Задачи Ц Имсетгя независимая выборка хь ..., х,. По гипотезе Не все хг равпомерио распрсделеиы в 10, 2), по гипотезе все Нг равпомсрпо распредслеиы в (ц 01. Построить критерий с иаимеиывей величиной гпах(гт, р), где а и )3 — вероятиости ошибок 1-го и 2.го род».
2. Пусть хг, ..., х„— исзавискмая выборка из распределения с плотностькз Хе ", х>0. Построить оптимальный критерий прп. верки ~ппотсзы Нк: ). = Х, прп конкурирующей гипотезе Нг: й = Хг < кс с уроаисм зиачвиости оь Вычиглить мощность рр этого критерия. 3. По дзум исзависимым выборкам: хь ..., х„ пз пормальиого распределения (пь ог) и рь .. » уп; из нормального распределсиия гл. 14 стлтистмческми кр1!терии 2!2 0 1 2 3 4 б 8 7 8 9 90 1Об 112 97 108 101 93 87 103 104 пифры частота С помощью Кюкрнтерия Пирсона проверить гипотезу о том, что все дифрьт встречаются в таблипе случайных чисел равновероятно. 3а уровснь значимости принять м = 0,05. (ам от) построить с уровнем значимостгг сг оптимальный критерий проверки гипотезы Нм а~ = ат при конкурирующей гипотезе Ны а~ ( аз Параметры о~ и па с имать известпымн.
4. В таблпне случайных чисел на !000 знаков пифры О, 1, ..., 9 встрстилнсь следующее число раз: Г л а в а 15. ОЦЕНКИ ПАРАМЕТРОВ 5 ВВ. Статистические оценки и их свойства Мы будем иметь дело с независимой выборкой хь хм ..., х„ (1) из распределения Р(х), принадлежащего некоторому семейству распределений У. Пусть 6 — параметр, однозначно определяемый по каждому распределению Р пз ОО В= ~ хдР(х) семейства У. Например, или В= = ~ х'ЙР(х)и т.
п. Таким образом, О = 6(Р) — это функционал распределения Реп У. Очень часто мы будем предполагать, что само семейство У определяется одним или несколькими такими параметрами. Тогда любая Р ен У. есть функция распределения Р(х; 6) илн Р(х; Вь ..., 6,), зависящая от одного или нескольких параметров. Такое семейство распределений называется параметрическим. В любом из этих случаев задача оценки (или, как еще говорят, оценивания) параметра В состоит в нахождении такой функции 6=6(хи ..., х„) (2) от выборки (1), которая в каком-либо смысле близка к параметру О, если выборка взята из распределения Р с 6(Р) = О.
При этом предполагается, что функция (2) не зависит от значения оцениваемогопараметра О и дру. тих неизвестных параметров, от которых может зависеть Р. Вообще, любая функция вида (2) от выборки носит название статистики. Таким образом, Π— это статистика (2). Содержательность это определение приобретает только тогда, когда мы налагаем на эту стати. гл.