4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 23
Текст из файла (страница 23)
Произведено й серий независимых наблюдений, результаты которых таковы: (хд, ..., хм), 1=1, ..., Й. Имеются ли основания рассматривать эти данные как результаты наблюдений над одной и той же случайной величиной, или, другими словами, можно ли с достаточной надежностью считать, что закон распределения наблюдений от серии к серии не менялсяр Если это так. то говорят, что статистические данные однородны. Пусть Рт(х) — функция (вообще говоря, неизвестная) распределения наблюдений Рй серии, 1=1,...
..., й. Тогда задача состоит в проверке гипотезы однородности На - 'Рх (х) = — ° ° . — Р* (х). Пример З.З (гштотгза независимости). В эксперименте наблюдается двумерная случайная величина $=(5ь Ят) с неизвестной функцией распределения Рт (х, 1г) и есть основания предполагать, что компоненты йт и 5з независимы. В этом случае надо проверить гипогпгзу независимости На . Рг (х, р) = Рм (х) Р~, (у), где Р1,(х) и Рт,(у) — некоторые одномерные функции распределения. 103 В общем случае можно рассматривать й-мерную случайную величину .- и проверять гипотезу независимости ее компонент.
Пример ЗА (гитяигза случайности). Результат эксперимента описывается и-мерной случайной величиной Х=-(Х„..., Х.) с неизвестной функцией распределения Гх(х), х=(х„..., х„). Можно лп рассматривать Х как случайную выборку из распределения некоторой случайной величины с (т. е. являются ли компоненты Х[ независимыми и одинаково распределенными)? В данном случае требуется проверить гипогп зу случайное[пи Н». Рх(х)=-Г.(хс)... ...Г:(х„), где Гх(х) — некоторая одномерная функция распределения. Эти примеры ие охватыва:.от ватника.о*.цих в приложениях задач проверки статистических гипотез.
В частности, бываю~ довольно часто ситуации, когда проверяемая гипотеза состоит в том, что некоторый параметр семейства распределений соответствующей совокупности, например среднее значение, дисперсия и т. п., имеет наперед заданное значение или множество значений. Так[се гипотезы называются паоамгтрическими.
Более подробно оип будут рассмотрены ниже. Рассмотрим общие методы проверки гипотез описанных выше типов. Во всех эпгх случаяк формулируется только одна гипотеза Н» и требуется проверить, согласуются ли имеющиеся статистические данные с этой гипотезой или же оии ее опровергают. Соответствующие критерии называют критериями согласия.
Введем понятие простой и сложной гипотезы. Если гипотеза Н, однозначно фиксирует распределение наблюдений, то ее называют прсют[й, в противном случае — сложной. В предыдущих примерах только гипотеза Н„: Ге(х) =[к(х) является простой, а остальные— сложные. 2. Критерии согласия н основные их характеристики. Рассмотрим общий метод построения критериев согласия. Пусть о распределении случайной величины Х=(Х,, ..., Х„), описывающей Р уезультат изучаемого эксперимента, сформулирована некоторая гипотеза Нсь Чтобы построить критерий проверки этой гипотезь, 1, в большйнстве случаев поступают следующим образом.
Пытаются найти такую статистику Т= Т(Х), характеризующую отклонение эмпирических данных от соответствующих (гипотезе Н») гипотетических значений (обычно такие статистики неотрицательны)„ распределение которой в случае справедливости Н» можно было бы определить (точно или приближенно).
В частности, если Н,— сложная гипотеза, то распределение Т(Х) должно быть одним н тем же для всех простых гипотез, составляющих Н,. Предположим, что такая статистика и ее распределение при гипотезе Н, найдены. Пусть сХ = ([ с ( = Т (х), х ен Х) — множество всех возможных значений статистики Т; определим для фиксированного заранее достаточно малого числа сс'- 0 подмножество [т,„~ .У так, чтобы вероятность осуществления события (Т(Х) ~ г~,ч) в случае справедливости гипотезы Н, (в дальнейшем для обозначения этой вероятности используется символиче- 104 (' ) = х ш: Н[)) удовлетворяла условию Р ([ (Х) ~ ~-„(Н,) - „ рки гипс[таз[[ Н со,кн ф гУющпм обР - - Н[/ > ь х — и;,Он[од„,[иаж и[ни[ Х и(т я реализа[(ин случайной [ичины и = .
(х) — гисипиетствующее значение статистики Т. Вс.[и окажюпгя, тпо гн «у»„, пю в пргдпо.южении справгдлив[ь [ ти гипап[езы Н» произлил [ ли[ илвгрояп[нвв со .мза должн р саоыпгиг и зта гипо.мза олжна бы[пь оп[згргнупи[ как противоречащая с и(ая статистичеки.ч данным. В прсчпивном случае (т. в. если [ ф-.Т ) . [ний атка[ [ г.«и ф «,„) нет агни[ зьматьгя от принятой гапон[гзы и след„-ет [пю наблюд ' г у считать, Б аписа ется нг проптвиргчатгшготгзг(или согласую .
'[, су тся с нгй). сели ( Т следующий видиной выше ситуации критерий имеет след сслп .== (х] — наблюдавшееся значение статиссики Т(Х), [ с.=ст - ш [поте а Н» отвергается; в противном случае считается, ;и> данные не противоречат гипотезе. Отметим, что факт н .г .,-= =" ' - „не яв.пяется доказательством истинности ги[нпезы Ню ои лишь свидетельствует о том, что согласие опытных ,[анных и теоретических предположений достаточно хорошее («на В описанной методике [тат[готику.
Т называют гпса [ й р, и „.смиожес[ао ее значений а[' ы — критической вбютпью для гипотезы Н» (этот термин отражает тот ф от факт, ч[о зиа-.=,„рассыатриваю[ как свидетельствующие про[ив этой гипотезы). Число а в соотношении (3.)) называют уровнем значич [гти критерия, и его можно считать вероятностью ложного отаержения гипотезы Н„когда она верна (т.
е. вероятностью ошии а). конкретных г чного решения в ситуации, когда Н» истинна). В адачах величину и выбирая»т обычно равной 0,1; 0 05; 0,0! н т. д. Итак, согласно описанной методике критерий ' д с соотаетствусощея критической области в множе [снпй тат с ссстсски 7. По своему смыслу критическая область жест ве знадолжна включать все маловероятные при тип статистики ри гипотезе Н, значения икп критерия. Обычно используют области вида сдля неотр[шательных статистик Т) нли вида (~ г'[~( ', в конк етнь .р ных задачах возможны и дрчгне варианты выбо а к и[пческой области.
Вп " об ти. пд критической области во многом определяы ора кристся цевью, для которой строится критерий. Ограничимся пока следующим общим замечанием: каждый критерий строится для [ого, чтобы определять, имеют ли место те или иные отклонения т основной гипотезы. Характер таких отклонений может быть разным, поэтому надо иметь критерии как универсального типа («улавливающие» любые отклонения от осиовн " ювной гипотезы), так и предназначенные дая выявления отклонений только о ного типа.
Т ак, часто большие и малые значения статистики Т(Х) й только определеиуказывают на разный характер отклонения от нулевой гипотезы, учаях лучше использопоэтому может оказаться, что в одних случаях л вать критерий, основанный на критической области (()(„), а в других — иа критической области (1~(„). Примеры таких ситуаций приводятся в дальнейшем. Для проверки одной и той же гипотезы Н, можно строить различные критерии согласия, основываясь на разных статистиках Т(Х), н чтобы выбрать в конкретной ситуации тот лли иной критерий, надо иметь принципы сравнения различных критериев. Идея построения таких принципов состоит в исследовании ловедения критериев при тех или иных отклонениях от основной гипотезы.
Введем понятия альтернативного распределения (альтернативной гипотезы) и мощности критерия. Любое распределение Рх=р наблюдаемой случайной величины Х, которое может оказаться истинным (т. е. допустимо в данной ситуации), но отличающееся от гипотетического (т. е. распределения при основной гипотезе Нь), называют альтернативным распределением или альтернативой. Совокупность всех альтернативных распределений называют альтернативной гипотезой н обозначают символом Но Пусть, далее, для проверяемой гипотезы Нь построен некоторый критерий с уровнем значимости и, основанный на статистике Т(Х), и пусть е~ щ — соответствующая критическая область. Величину йу(Р)=%Г(»У ий Р), представляющую собой вероятность попадания значения статистики критерия в критическую область, когда истинным распределением наблюдений является распределение Р, называют функцией мощности критерия. (Условимся записывать в дальнейшем эту вероятность в виде Р(Т(Х) еп ель»,„~Р), так что йГ(Р)=Р(Т(Х) енеТ, ~Р).) Таким образом, функция мощности — это некоторый функционал на множестве всех допустимых распределений Я.