4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 28
Текст из файла (страница 28)
! с 1. 1" <» ..б[-, !с!,с<.]-,— < э о д (Ьз, р)=Ь<)(р(2 е (р), Таблица 3.( Р 0,05 0,1 0 0,1 5 0,20 р 090 100 !1О 1Ю 130 (3.23) Дэ (к) = 1 + а (и) Ь (к), й 3 4 Гипотеза однородности (3.24) ]Р ()„)»Ф(Д(Ье р) („), 122 в слу сае. !согда Ч =сонэ!. Полагая г)=е Р( ч', полу гаем при Я([) = Й (О 1) равенства имеет места толька в случае, когда ((к)=сопз1= ! (гак как ](к)— эта функция плотности на отрезке [О, Ц), Отсюда и нз (3.!9) следует, па для любой альтернативной плотности ((к)~! разность т(() — е а)О, поэтому за(М) в (3.22) прк М-»аа неограниченна возрастает. В силу соотношения (322) эта означает, чта ]пп йгэ(()=1, т, е.
критерий пустьсх ящнлб»» ков является состоятельным. Итак, если выполнены условия теоремы 3.4, то мощвость критерия пустых ящиков при лсобай фиксированной альтернативе стремится к 1. Однако если при изменении и к сч изменяется также альтернатива, <приближаясь» к основ. ной гипотезе ((«, то мощность критерия уже не обязательно будет сходиться к ! †э завнсйт от скорости сближения альтернативы с нулевой гипотезой. Теореьга 3.4 дает возможность ответить н на вопрос о там, с какой скоростью мохсет сближаться альтернатива с пулевой гипотезой, чтобы критерий пустых ящиков аблалал еще способпастью «реагировать» па такие отклонения ат 7(<. В данном случае альтернатнвамн явлюатся абсалкпно непрерывные распределения на [О, 1], отличающиеся ат равномерного распределения )<б (О, 1); следовательно, <близкую» альтернативу Р можно задать, например, плот.
пастью где а(л)-<.0 прн н — б-са, а Ь(к) — непрерывная функция, удовлетварякнцая ! условию ) Ь (к) бк=О. Здесь а(а) н определяет скорость сближения (в смысле а поточечной сходнмасги) альтернативной плотности ]э (к) с плотностью прн нулевой гипотезе. Счедующее угвергкденне является простым следствием теоремы 3.4.
Теорема 35. Если в соотношении (323) тыажилю а(л)=а г(«, то лри л, М- оэ. а(М- р )0 эуе д (Ье, р) = — рз(з/]' еа — ! — р, аз=)! Ьз (х) йк. Ьз „,, 2 Из этэй теоремы следует, что критерий пустых ящиков позволяет отличать -1(4 от гипотезы У( альтернативы. сближающиеся с ней со скоростью и э г(4 Более близкие альтернативы вида (3.23) (т. е, при а(а) л -»0) этот кри- терий «не отличает» (т. е. Нбэ((э) а), а для более удаленных альтернатнн (т. е, при а (и) а !" -» аа) он сохраняет свойство состоятельности (т.
е. И'э 0'э)» 1) 5. Общие симметрическяе критерии. Критерий пустых ящиков весьма прост для практического применения, однако статистика р„, включает далеко не всю информацию, содержацуюся в выборке Х=(Х„..., Х„). Очевидна, более полна статистическая информация будет использована, если рассматривать а статистику вида ~, 'с,рт где с«, сг, ..., с„— некоторые «веса», выбираемые =-а из следующего условия: соответствующий критерий должен иметь цвибель.
шую аснмптатическую мощность в классе всех симметрнческик критериев. Более подробно с теорией симметрических критериев можно ознакомиться в [8]. Отметим тодько, что в условиях теоремы 3.5 наибольшую асимптотическую мощность среди всех симметрических критериев имеет известный уже критерий Хз, опРеДелвемый статистикой Х' = — У т< — л= — Уш гти — л. КРитнчесл= у ( =н Лук г— у=! <=э кая граница для этого критерия имеет вид Г.
(и, Л) = Ю+)б 2<<!(а» Ф ( — (а)=а, а предельная мощность равна Ф (аз~l рсй — (, ). Можно сравнить, насколько уступает по мощности нритернй пустых ящиков оптимальному критерию Хз. Из (3.24) следует, что СЭ»С' <С вЂ” С вЂ” бб. СС Фб „б,ь„„„бэ „„бб„ вает ог 1 при р=О до 0 при р=со, т. е. при малых значениях параметра р простейший из симметрических критериев — критерий пустых ящиков — по мощности мала уступает оптимальному, но сравнительно трудоемкому для практической реализации критерию Хэ. В заключение приведем краткую таблкцу аначеннй функции е (р).
е(р) 0,992 0,983 0,975 0,967 0,950 0,933 0,9!? 0,900 0,884 0,867 е(р) 0851 0,834 08!8 0802 0786 0769 0,753 0,738 0,706 0675 Одной из важных прикладных задач математической статистики является задача проверки однородности статистического материала. Пусть имеются две независимые выборки Х=(Хг,..., Х„) и У=()'„..., )гт), описывающие один и тот же процесс, у]вление и т. д., но полученные в разное время или, вообще говоря, в разных условиях; требуется установить, являются лн они выборками из одного и того же распределения нли же закон распределения наблюдений от выборки к выборке менялся.
Такая задача может возникнуть„например, при контроле качества некоторой продукции, когда по контрольным выборкам из различных партий надо установить, не менялось ли ее качество от смены к сыеие или в результате изменения технологического процесса и т. д. В общем случае можно рассматривать произвольное конечное число независимых выборок.
В общем виде задачу можно сформулировать следующим образом. Пусть Х = (Х„..., Х„) — выборка из распределения Ж (й) с' некоторой (неизвестной) функцией распределения Рг(х), а т'= =(Уз, ..., У ) — выборка из распределения Ж(г]) с неизвестной функцией распределения Рз (х). Требуется проверить гипопсвзу однородггскгпгг Н~.
'гг(х)— = св(х). Рассмотрим несколько способов' построения критерия согласия для этой шиготезы. 1. Критерий однородности Смирнова. Одяич и.! критсриез проверки гипотезы однородности является куггггггсуггггг Смпргвма, который применяют в случае непрерывных распре.и лений. Зззш критерий основан на статистике 'л„=- ьцр Еы (с! — У „„(х), где с!„(х) и угг (т) — эмпирические функции распре !слюн!я, построенные гю выборкам Х и У соответственно.
Эмииргигссьзя функция распределения является оптимальной оценкой для тео. ретической функции распределения, и с увеличением объев!э выборки они сближаются, поэтому в случаях, когда справедлива гипотеза Ны функции У'г„(х) и сг (х) оценивают одну и ту же неизвестную функцию распределения. Таким образом. в этих случаях (по крайней мере при болышгх и н пг) статистика Ы„„, не должна существенно отклоняться от пуля. Отсюда следует, что если имеют место слюнкам большие значения этой сгатистики, то этот факт следуег расценивать как свидетельство против нулевой гипотезы Ны Таким образом, в данном случае разумно выбиРать кРптическУю область в виде =." гч=-(У-=.У„(гг, п)).
КРитическую границу у (и, п!) прн заданном уровне значимости а находят на основании известного при гипотезе Н, предельного при и, т- оо распределения статистики Ы„. По теореме Смирнова при бозьших п и т можно положить у,„(гг, и) —.- ! '(и+гп)у(пгг!) Х.„, где Уй'(Ъ ) =1 — и !функция Ю(У) определена в (1.В)). Действительно, в этом случае Р(п„е=-зг г гууг!) ==Р, ~,' — „— Ы, ==),я,'ууч) ==1 — Л () ч) =и. Сформулируем критерии однородности Смирнова: если обземы выборок достаточно велики, пю, выагслив по выборогны.гг данным значение у статистики ~Ф,, ириналгавт у!си!в!!не опгведгнйть гиггопгезгУ сУв в том и только пюм случае, когда г -== )У(п г гп) (пт) У., Вероятность ошибочно отвергнуть цри этом пстиннуго гипотезу приблизительно равна сс.
Отметим также, что этот критерий состоятельный (альтериативог! здесь является лгобая пара распределений (Гг, Гг) такая, что Е! (х) =ьГ,(х)). Указанное правило проверки неизменности фунйщнп распределения не записит от конкретного вида функции. Д.зя прпложенш! зто имеет важное значение, так как истинное 'распределение наблюдаемой случайной величины, как правило, бывает неизвестно, а интерес представляет вопрос о том, не изменялось ли неизвест.- ное распределение от выборки к выборке. Для применения критерия Смирнова необходимо выполнение только условия непрерывности, которое обычно вытекает из физической природы изучаемого явления н не требует специальной проверки.
2. Критерий однородности у'-'. Часто применяемым критерием является критеугигг одноуюдности у'. Его используют для проверки однородности данных, имеющих дискретную структуру, 124 т. е. когда в опытах наблюдается некоторый переменный признак, принимающий конечное число, например в, различных значений. Ио, как известно, к такой схеме можно свести любую другую модель, применяя предварительно метод группировки данных. Поэтому метод ха применим на самом деле к анализу любых данных, т. е, является в этом смысле универсальным.
Кроме того, с помощью этого метода можно анализировать одновременно любое конечное число выборок„в то время как с помощью критерия Смирнова можно сравнивать только две выборки. Итак, предположим, что осуществлено уг последовательных серий независимых наблюдений, состоящих из гг,, ..., п„наблюдений соответственно. При этом в каждом опыте наблюдается некоторый переменный признак, принимающий одно цз в различных значений (исходов). Пусть ч;, — число реализаций гзго исхода в у-и серии, так что У э!у== п!, У'=1, ..., Уг.