Г.И. Ивченко, Ю.И. Медведев - Математическая статистика (1115270), страница 24
Текст из файла (страница 24)
(х) — гисипиетствующее значение статистики Т. Вс.[и окажюпгя, тпо гн «у»„, пю в пргдпо.южении справгдлив[ь [ ти гипап[езы Н» произлил [ ли[ илвгрояп[нвв со .мза должн р саоыпгиг и зта гипо.мза олжна бы[пь оп[згргнупи[ как противоречащая с и(ая статистичеки.ч данным. В прсчпивном случае (т. в. если [ ф-.Т ) . [ний атка[ [ г.«и ф «,„) нет агни[ зьматьгя от принятой гапон[гзы и след„-ет [пю наблюд ' г у считать, Б аписа ется нг проптвиргчатгшготгзг(или согласую . '[, су тся с нгй).
сели ( Т следующий видиной выше ситуации критерий имеет след сслп .== (х] — наблюдавшееся значение статиссики Т(Х), [ с.=ст - ш [поте а Н» отвергается; в противном случае считается, ;и> данные не противоречат гипотезе. Отметим, что факт н .г .,-= =" ' - „не яв.пяется доказательством истинности ги[нпезы Ню ои лишь свидетельствует о том, что согласие опытных ,[анных и теоретических предположений достаточно хорошее («на В описанной методике [тат[готику. Т называют гпса [ й р, и „.смиожес[ао ее значений а[' ы — критической вбютпью для гипотезы Н» (этот термин отражает тот ф от факт, ч[о зиа-.=,„рассыатриваю[ как свидетельствующие про[ив этой гипотезы). Число а в соотношении (3.)) называют уровнем значич [гти критерия, и его можно считать вероятностью ложного отаержения гипотезы Н„когда она верна (т.
е. вероятностью ошии а). конкретных г чного решения в ситуации, когда Н» истинна). В адачах величину и выбирая»т обычно равной 0,1; 0 05; 0,0! н т. д. Итак, согласно описанной методике критерий ' д с соотаетствусощея критической области в множе [снпй тат с ссстсски 7. По своему смыслу критическая область жест ве знадолжна включать все маловероятные при тип статистики ри гипотезе Н, значения икп критерия.
Обычно используют области вида сдля неотр[шательных статистик Т) нли вида (~ г'[~( ', в конк етнь .р ных задачах возможны и дрчгне варианты выбо а к и[пческой области. Вп " об ти. пд критической области во многом определяы ора кристся цевью, для которой строится критерий. Ограничимся пока следующим общим замечанием: каждый критерий строится для [ого, чтобы определять, имеют ли место те или иные отклонения т основной гипотезы. Характер таких отклонений может быть разным, поэтому надо иметь критерии как универсального типа («улавливающие» любые отклонения от осиовн " ювной гипотезы), так и предназначенные дая выявления отклонений только о ного типа.
Т ак, часто большие и малые значения статистики Т(Х) й только определеиуказывают на разный характер отклонения от нулевой гипотезы, учаях лучше использопоэтому может оказаться, что в одних случаях л вать критерий, основанный на критической области (()(„), а в других — иа критической области (1~(„). Примеры таких ситуаций приводятся в дальнейшем. Для проверки одной и той же гипотезы Н, можно строить различные критерии согласия, основываясь на разных статистиках Т(Х), н чтобы выбрать в конкретной ситуации тот лли иной критерий, надо иметь принципы сравнения различных критериев.
Идея построения таких принципов состоит в исследовании ловедения критериев при тех или иных отклонениях от основной гипотезы. Введем понятия альтернативного распределения (альтернативной гипотезы) и мощности критерия. Любое распределение Рх=р наблюдаемой случайной величины Х, которое может оказаться истинным (т. е. допустимо в данной ситуации), но отличающееся от гипотетического (т. е. распределения при основной гипотезе Нь), называют альтернативным распределением или альтернативой. Совокупность всех альтернативных распределений называют альтернативной гипотезой н обозначают символом Но Пусть, далее, для проверяемой гипотезы Нь построен некоторый критерий с уровнем значимости и, основанный на статистике Т(Х), и пусть е~ щ — соответствующая критическая область.
Величину йу(Р)=%Г(»У ий Р), представляющую собой вероятность попадания значения статистики критерия в критическую область, когда истинным распределением наблюдений является распределение Р, называют функцией мощности критерия. (Условимся записывать в дальнейшем эту вероятность в виде Р(Т(Х) еп ель»,„~Р), так что йГ(Р)=Р(Т(Х) енеТ, ~Р).) Таким образом, функция мощности — это некоторый функционал на множестве всех допустимых распределений Я. Для распределений Р, составляющих нулевую гипотезу (условимся этот факт записывать как Реп Нь), значения функции мощности удовлетворяют по построению критерия условию (ЗЛ); перепишем это условие в новых терминах в виде (Р (Р) ( а, чР ев Н„.
(3.2) Если Р~ Нм то значение У'(Р) называют мощностью критерия при альтернативе Р. Функция мощности играет в теории проверки гипотез фундаментальную роль. Она полностью характеризует критерий, так как показывает, насколько хорошо критерий соответствует своему основному назначению — «улавливать» возможные отклонения от основной гипотезы. В терминах функции %'(Р) можно сказать, что критерий тем лучше (»тем мощнее»), чем больше его мощность при альтернативах. Действительно, если наблюдавшееся значение ((х) попадает в критическую область, то нулевую гипотезу отклоняют, и если истинной действительно является некоторая альтернатива (нулевая гипотеза не верна), то тем самым принимают правильное решение.
Следовательно, значение (Р(Р) при Р ~ Н» характеризует вероятность принятия правильного решения в ситуации, когда нулевая гипотеза ложна Желательным свойство и(енности„кото ое озн йством критерия является свойство несмерое означает, что одновременно с условием (3.2) должно выполняться условие %'(Р) )а, ЧР е= Н,.
(3,3) Другими словами, несмещенность критерия озн ачает, что вероят- ность отвергнуть нулевую гипотезу, когда она истинна, не и еа, и в то же время если вышает заданного уровня значимости а, гипотеза Нь ложна, то она отвергается с ве роятностью, оль, б. В ычисление функции мощности критерия — т р †трудн задача, д ого требуется знать распределение статистики кри- терия не только при нулевой гипотезе, но н прн альтернативах. оэтому функцию %'(Р) удается найти далеко не во всех случаях. В заключение отметим, что важным показателем ем каждого крия трудоемкость практической реализации соответ- ствующего алгоритма. На практике, когда требуется быстро по- лучить ответ, предпочтение нередко отдается просто реализуемому критерию, даже если он не является оптимальным в тео е и смысле.
П о емонст и оретическом р д трируем общую методику построения критериев согласия на и име а гипотез. р . р х решения задач проверки описанных выш е 4 3,2. Проверка гипотезы о виде распределения у — ( „..., Х„) — выборка из распре- П сть Х=гХ, ...
ия ($) с неизвестной функцией распределения Р (х), о которой выдвинута простая гипотеза Н„: Р,'х) = Р х . известными к иге иями п ритериями проверки этой гипотезы являются критерий Колмогорова и критерий х». чаях, когда ф нк ия Р Е Критерий согласия Колмогорова. Его применяют в тех слуляется величина фу ция (х) непрерывна. Статистикой критерия яв- (ЗА) У;= У,(Х)= зпр ! Р„(х) — Р(х)1, — тих« представлякяцая собой максимальное отк лонение эмпирической функции распределения Р„(х) от гилотетнчес ой ~ к й функции распре- Р(х). ри каждом х величина Р (х) является оптималь- ной оценкой для Р(х) (см.
замечание к теореме (2.2)1 1 и с увели- поэтому, по к айней м ъема выборки и происходит сближение (х) Р р . ере прн больших и., в тех случаях, когда не „х с (х), гипотеза Нь истинна, значение 'В не критерия, основанного иа ста ться от нуля. сюда следует, что критическую облает статистике Ы„, следует задавать в виде ть »а= ~ ~~а) Ос енностью статистики Я' являетс я то, что ее распределерн гипотезе Н, не зависит от вида функции Р(х).
Действи- тельно, полагая в формуле (3.4) к = г-! (и), 0 .= и =--.. 1, где Е-' (и)— функция, обратная к Е(х), получаем 'р„=- гцр нб»(Е '(и)) — и). с ° =.! ' Перейдем к новым случайным величинам, используя формулу (!',==Е(Х), !'=-1, ..., и;.пусть (/,1,== ...=.--. (!,ю — пх зариаццоипый ряд. Функция г" (х) монотонна, поэтому У,в!»=Е(Л „,], А:..: -= 1, ..., н, и неравенства Е-1(и) и» Хч эквивалентны перавецсггап и =--(/,г!.
Но тогда из представления (1.5) имеем » Е»(Г-'(и)) = - гг' е(г"-!(и) — Х,„!)= — гг' е(и — Бои)=Ф„(и). г =.! ч =-! Независимо от вида функции Г(х) (если точько Е(г) непрерывна) Ж(Н1) =.Н(0, !) и Ф»(и) — эмпирическая функция распределения для выборки из равномерного Л1(О, 1) распределения. Таким образом, статистика гЗ» совпадает с зцр !Ф„(и) — и! и. следоаач(н(! тельно, ее распределение не зависит от Е(х) (если справедлива гипотеза Нч). Этот факт имеет принципиальное значение, так как тем самым достаточно вычислить и протабулировать распределение %, только один раз, а именно для выборки из равномерного Н(0„1) распределения, и использовать ее для проверки гипотезы относительно произвольной непрерывной функции распредеЛения г' (х). Вторым замечательным фактом является то, что распределение статистики Ы„при достаточно больших и (уже при н-~20) практически от и ие зависит и имеет указанный вид (1.8).