4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 29
Текст из файла (страница 29)
! =. ! Требуется проверить гипотезу Н, о том, что все наблюдения производились над одной и той же случайной величиной. Другими словами, если угг, — (неизвестная) вероятность появления г-го исхода в испытаниях у'-й серии (!'=1,..., з; ! =1,..., й), то гипотеза Нв означает утверждение: (рм, ..., р,!)=(рг, ..., р,), у=1, ..., й, где р =- (рг, ..., р,.) — некоторый (неизвестиый) вектор вероятностей (у!!+ +у!.~= 1) Так как Е(чо 'Нв) =-пуд„то, следуя принципу Х'-, в качестве меры отклонения опытнйх данных от их гипотетических (при гипотезе Н„) значений в даннох! случае следовало бы выбрать статистику Х;-,(р) = ~ Ъ (ч„— ггур!)гг'(пур,). (3.25) г=-! !'= ! Однако здесь уу„..., р, неизвестны, поэтому, чтобы воспользоваться данной статистикой, следует предварительно оценить неизвестные параметры. Для этого воспользуемся методом максимального правдоподобия.
Здесь функция правдоподобия (при гипотезе Нь) равна Е(р)=с! [р,.гг.=с ЦР,.', чь = л, чгу (с от параь! ! г=! метров р,- ие зависит). Применяя метод неопределенных множителей Лагранжа, получаем, что оценки максимального правдоподобия рг параметров рг таковы: угг=зг!./гг, !=1, ..., в, где и= =а!+ +па= У,ч;,— общее число наблюдений. Таким образом, получена следующая статистика критерия: ! гг у ! ь ° =!у' 1 ! гу=! Критическую область задают в виде У т„=(1)[„), а для нахождения критической гранзцы 1„применяют следующий предельный результат [13, с. 4831, аналогичный теореме 3.2: при и- оо я !х! (р! ~ з,>,* в — е !« — 1!!. З «р«га р « * ° полагать [„=у[ (-„, 1, !!!» и.
Окончательно критерий однородности у' имеет следующий вид; гипотезу однородности Н, отвергают тогда и только тогда, когда вычисленное ло фактическим данным значение 1 стал!истина (3.26) удовлетворяет неравенел!ву =- у[ „, 1, !1!» и. Вероятность ошибочно отклонить при этом истинную гйпотезу приблизительно равна а, если л достаточно велико. Эту же методику можно использовать н для проверки гипотезы о том, что л серий наблюдений произведены над одной н той же случайной величиной, имеющей распределение заданного типа, например распределение Пуассона, нормальное и т. и. В этом случае предварительно следует найти мультиномиальную оценку максимального правдоподобия О„параметров распределения при гипотезе Не (т.
е. рассматривая все данные как одну выборку с групповыми частотами ч!... Тм) и заменить в (3.25) р, =рг(9) на р;(9„). Число степеней свободы в предельном распределении )(з заменяют при этом на (з — 1) Й вЂ” г, где г — число параметров, определяющих гипотетическое распределение (размерность папаметрического вектора 9). Выделим два важных частных случая общей ситуации. Случай в= 2 соответствует испытаниям с двумя исходами А и А, а гипо' теза однородности представляет собой утверждение, что событие А имеет во всех испытаниях одну и ту же постоянную (хотя и неизвестную) вероятность реализации р.
В этом случае оценкой для р является относительяая частота появления события А во » кч всей совокупности данных; р = 1 — !) = — р чн где «гу — число пол /=! явлений события А в испытаниях )хй серии, а статистика (3.28) принимает вид » » р,л ч, лг рд лг в Для случая двух выборок ()г =2) статистика (3.28) принимает следующий внд: Х,',(р) =п»пз х +ч (чгт/пх — ч!з/пз) ° 1 в Если положить гах — — чд/(ма+ям), ш=пт/(пт+пз), то последнее выражение можно преобрззовз!гь к виду, более удобному для практических вычислений: « Х,*(р)- ' ( „'У', в!я!! — юп, . ы(! — ы) ( Описанный критерий однородности Хз является состоятельным, т.
е. с вероятностью, стремящейся к 1 при п-ьжт, он «улавливает» лгобые отклонения от нулевой гипотезы, прн которых вероятности появления исходов от серии к серии не сохраняют постоянного значения. 3. Другие крвтерпп однороднасгн для двух выборок нэ непрерывных рзс. преденевня.
Кроме двух опнсзнных крнтернев для проверки гипотезы однородности разработаны н другие методы, основанные нз различных прпнцнпзт. Прнведем краткий обзор некоторых нз ннх, прнменяемых в с.тучзе двух выборок яз непрерывных распределений. з) Критерий знаков. Простой для применения критерий однароднасти, не требующяй сложных вычнсленнй„предстзвляет собой описанный н и. 4 4 3.2 крвтеряй янеков.
Основным недостатком этого крвтерпя является «неэканамвое» нспальзовзнне ннформеаян, содержащейся в результатах нзблюденпй, поэтому его обычно рекомендуют прнменять только нз сгзднн предвзрнтехьного энэлнзз. Кроме того„этот крнтернй можно ясп«ътьзозэть лншь для выборок однвекового объема. б) Крптерай пустых блоков, Целый класс крятернев однородности можно построить, исходя нз следующих сообрзженнй. Рзссматрнм варнацнонный ряд Хл! ~Х„, «-... (Хоо выборки Х=(Хп ..., Х„).
Он порождэет естественное рззбяенве осн Ох нз янтерввлы Вг=(Ха „, Хг,1, 1=1, ..., я+ 1 (Х«= — оз, Х,я+г! — — со), которые нзэывзются зь!барочными блоками. Пусть з,=з,(л, л!) — «псла этих блоков, каждый нз которых содержит ровное элементов второй выборки Т=()'«, ..., )'м), г=о, 1, ..., т. Тогда в качестве стзтнствкн крвтерн я можно взять произвольную ля пейн ую комбннацню В!(л, т) с,з„где сэ, с„..., с! — некоторые заранее выбрэнные «весе», В честно«=а стн, прн 1=0 получаем критерий пустых блоков, статистикой которого является э! — числа блоков, не содержэщвх нн одного элементе второй ныбаркн. Основным пря !построеннн и расчете зснмптотнческого варианта этого критерия является следующее утвержденне о предельном распределении стэтнстнкн Н [19, с, 4531! если л, т-»со так, что т/л- р) О, лю Ж (к! (л, т) [ Н«) вФ" (л/(1+р), лрз/(1+р)з). Прн выполнении этнх условнй критерий пустых блоков формулнруется следующим обрезам: гиласлеэу однородности Н«отвергают тогда и только тогда, когда з,(л, т)гв — +)~'л Г„, Ф( — 1,„)=а.
1+р (1+9)'т "' Докзззво [19, с. 4541, что этот критерий является состоятельным против вльтернзткв (ЄЫ), Р«ЭЭР«, удовлетворяющнх следующему требованию: функцня Рз(Р (и)), ищ [О, Ц, пикет пронзводную л(и), отлнчную от ! нз множестве палажнтельнай вебеговой меры (еслн справедлива нулевая гипотеза Н«, то й (и) = 1, и щ [О, Ц). в)К р втер н й серва. В рвдеслучзев особыйннтереспредстэвлюоттзкне атклонення ст пулевой гипотезы Н,; Р,(х)шР«(х), когда одно распределение сдвинуто относнтельно другого, т.
е. есля„нэпрвмер, Р,(х) )Рз(х). В этом случае говорят, что случзйпэя величина Ч «стохзстнческн большею чем й (прп каждом х случзйнвя величина т) с большей вероятностью превосходят х, чем й) Простой критерий, хорошо «уззвлнвзющяй» такие отклонения, махно построить следующим образом. Объединив обе выборки Х н у в овну (Х» ..., Х„. У» .,., Ум) объема и+т в построим вариационный рнд объединенной ныборки. После этого заменим все элементы выборки Х б)квоп С, а все элементы вы- борки У вЂ букв С. В результате получим некоторую последовательность вз и букв С н т букв С. Число есех таких последовательностей равно Са, „,, н ивт)втивно ясно, что прн гипотезе Н,к (элементы обенх выборок Х н У дотьны нести себя одинакова), все возможные последовательности из Х н у раннокс- роятны. Описанные выше отклонения от нее приводят к тому, ч и«с повышен- ной верея~пастью б)дуг наблюдаться последовательности, в которых з.юмспты одного вида имеют тенденцию смещаться к какому.нибудь краю последова- тельности (в рассмотренном выше примере буквы С смеедаются к правому краю последовательности).
Одной вз статистик, с помощью катарин ь«о>кнй количественно характеризовать степень перемешивання в получаемой последо- вательности букв С и С, является число серкй )!у (п, т), составленных нз этих букв. Серией называется участок последовательности, состоящий из под- ряд идущих одинаковых букв и ограниченный с обеих сторон (или с одной стороны, сслн речь идет о концах последовательности) буквами другого вида.
Число серий будет мало, если одинаковые буквы группируются в одном месте, поэтому в данном случае следует задать критическую область в анде и „„-- = (/«:/„(л, т)) Критерий, основанный па стати««нке йт (л, ки) н заднваемын такой крнтнчесной областью, яазывается критерием герои (предложен в 1910 г. Вальдом и Вольфовитцем). Аснмптотическнй вариант этого критерии можно рассчитать нз основаннн следующего утверждения (19, с, 459]: если л, т-коэ так, что т,'л р-»0, то ., / 2лр 4прэ ! Ж(й'(и, т) ! //е) м/" ! —, ! р,,! ° Прн этна условиях критерий серий формулируется 'следиошнм образоы; гиао- лтгзу однородности //р отиергают тогда и только тогда, когда %' (и, т)» — +Т и, /„, Ф( — /а) =а. 2лр — 2р !+Р (1+Р) ' Построенный критерий является состоятельным против тех же альтернатив, что н рассмотренный в и.
6) критерий густых блоков. г) Ран гон ы е к р и терн и. Иногда исходная статистическая информа- ция может быть задана не числовыми значениями наблюдений. а отношением порядка между ними (типа «больше-меньше«). Особенно часто это имеет место в психологических исследованиях. В таких случаях наблюдение ринжируют, т.
е. упорядочивают по степени нх предпочтения Номер места, которое зани- мает наблюдение в таком упорядоченноч ряду, называют рангои соответствую- щего наблкыення. Таким образом, статистическая информация с салюта начала может быть задана рангами наблюдений, статистические методы, которые при- меняю« в таких ситуациях, называют раигоеыми методами, статистики, являв- шиеся функциямн только рангов, — рангоеыми статистиками, а критерии, освоаанные на таких статистиках, — рамковыми критериями, Ранговые методы можно ~ рименять н в тех случаях, когда заданы число- вые зна <ения к«аблюденнй, т, е.