Б.Л. ван дер Варден Математическая статистика (1960) (1186203), страница 57
Текст из файла (страница 57)
Так как д 59. Общие принципн. Наиболее нощнне крин~ерин 311 Отсюда, в силу (б). получаем Р' )ли Р'О + ) о/дХ. в Так как В не пересекается с Р', то для всех точек Х множества В справедливо неравенство д < о~, поэтому Р Р=РВ+ ~ддХ=Р В+Р,В=Р И', в Таким образом, область )Г является решением нашей экстремальной задачи. Если функция ! — 6(1) не принимает значения р (т. е. 1— — С(Ф) совершает скачок от значения < р к значению ) р), то Р строится следующим образом: сначала берут всю область д) РГ' и затем добавляют к ней такую часть множества д = о/, чтобы общая вероятность РР" равнялась р.
В остальном эта часть может быть выбрана произвольно. Ноказательство останется тем же самым. Этот случай едва ли встречается в приложениях, и в дальнейшем мы его рассматривать не будем. Плотность вероятности 1(Х) называется функцией правдоподобия гипотезы Н, и точно так же д(Х) называется функцией правдоподобия гипотезы Н'. Поэтому отношение (2) называют отношением правдоподобия. Только что найденный критерий, наиболее чувствительный к альтернативе Н', можно сформулировать так: Гипотезу Н следует отвергнуть тогда, когда отношение правдоподобия (2) будет не меныие о.
При злюм критическое значение о определяется таким образом, чтобы вероятность сшибки первого рода равнялась б, т. е. Р(Н ~ о) = ф. Этот критерий называется критерием отношения правдоподобия. Он является наиболее мощным относительно гипотезы Н', н поэтому его целесообразно применять во всех тех случаях, когда имеется большая уверенность, что гипотеза Н' может быть верна.
В. СЛУЧАЙ ДИСКРЕТНОГО РАСПРЕДЕЛЕНИЯ Если пространство Ж состоит из конечного нли счетного количества дискретных точек Х, причем вероятность, соответствующая любому точечному множеству, равна сумме вероятностей для отдельных точек, то можно действовать точно так же. как мы действовали в непрерывном случае. Вместо плотностей вероятности 1(Х) и д(Х) здесь появляются вероятности РХ и Р' Х, соответствующие отдельным точкам. Эти вероятности мы снова обозначим Г(Х) и д(Х). 312 Гт Хг.
Проверка гиаотег с аоможью статистические критериев Если, в случае справедливости гипотезы Н, некоторые точки пространства Ж имеют нулевые вероятности, то эти точки всегда можно присоединить к критической области )е. В остальных точках Д(Х) ф О, следовательно, можно построить случайную величину р(Х) Р'Х У= — — = —. )(Х) РХ ' Предположим сначала, что 1 — б принадлежит множеству значений функции распределения Сс(о) случайной величины У, ипымн словами, найдется такое н, что Р(д - Ф =1д. Тогда, как и выше, в качестве е' можно взять область, определяемую неравенством д- ог с очевидной заменой интегрирования суммированием.
Пусть И" — любая другая область, удовлетворяющая условию Р(1т ) ~ р, и пусть Ю вЂ” пересечение )г и йг. Если е'=ее+А, ве =Я+В, то, как и в непрерывном случае, Р(А) ~ Р(В) или ~ч', ~(Х) т* ~ ~(Х). В А имеет место неравенство д- р~, а в  — противоположное неравенство д ( н~, поэтому Р' е' = Р'Л -1- Р'А = Р'В +- ~~'," д(Х) ~ Р'Х> + ~ Р/(Х) ~ А А Р',О + ~ ит(Х) — Р',О + ~'д(Х) = Р' Ю+ Р' В = Р'Ят. В В Таким образом, область й является решением экстремальной задачи, сформулированной выше.
Если функция 1 — О(н) не принимает значения ф, а совершает скачок от значения (ф к значению > )э, то для построения Р сначала берут всю область д> 4 и, если это возможно, добавляют к ней столько точек Х, удовлетворяющих условию д = 4, чтобы общая вероятность Р(е') равнялась р. Доказательство осуществляется точно так же, как и в непрерывном случае. Если невозможно подобрать такие точки Х, для которых Р(1е) =)», то к множеству д> р~ добавляют столько точек Х, удовлетворяющих условию д = и~, чтобы вероятность Р(ее) была по возможности близка к б (но не превосходила р).
Пусть, например, Р Г = р — г. Если к Р прибавить еще одну точку Х. удовлетворяющую условию д(Х) = н/(Х), то вероятность ошибки й 59, Общие принципа. Наиболее мои«ные критерии з«з первого рода увеличится: Р(гг + Х) =,6+ 6, т. е. областьр + Х вЂ” слишком велика. Следовательно, точку Х нужно расщепить на две точки Х, и Х, и приписать им вероятности Р Х, = и и Р Х, = 6. Затем точку Х, следует включить в область )г. Для осуществления этого расщепления применяют следующий искусственный прием, аналогичный азартной игре с вероятностью выигрыша Если в результате эксперимента получена точка Х, подлежащая расщеплению, то производится упомянутая выше «игра», причем в случае «выигрыша» гипотеза Н отвергается, а в случае «проигрыша» не отвергается.
Конечно, «игра» должна производиться независимо от результата опыта. Докажем, что такой критерий будет являться решением нашей экстремальной задачи. Точке Х соответствует вероятность а + Б. Событие Х, осуществляется тогда и только тогда, когда наступает событие Х и одновременно осуществляется «выигрыш». Следовательно, вероятность события Х, равна (а + б) р = и. Поэтому является вероятностью события тг + Х„т. е. и' + Х, представляет собой решение экстремальной задачи. Указанная игра совсем не связана с выяснением вопроса о справедливости или ложности гипотезы Н.
Поэтому, практически, едва ли следует пользоваться такой игрой, а нужно в качестве критической области просто выбирать множество У (без Х,). И хотя в этом случае вероятность ошибки второго рода несколько возрастет, зато, однако, уменьшится вероятность ошибки первого рода, а именно она станет равной ф — а (ранее она равнялась )э). Если в качестве допустимой вероятности ошибки первого рода вместо ф принять Н вЂ” и, то $' будет решением новой экстремальной задачи, т. е. критерий, соответствующий критической области и', будет наиболее мощным с «уровнем значимости»' ф — в.
Г, ПРИМЕРЫ Пример 42. Пусть Н вЂ” пространство переменных кт,..., ко и пусть, согласно гипотезе Н, случайные величины з„..., анне»анисимы и одинаково нормально распределены с нулевым средним значением и единичной диспер. ' Уровень значимости критерия равен вероятности ошибки первого рола, т. е. этот уровень совпадает с вероятностью отвергнуть гипотезу Н, когда она верна.
Критерии проверки гипотез иногда также называют иритериями значимости. — Прим. пер««. 314 (г. Х1. Проверка гипотез с помощью статистических «ритгриев сией. Тогда совместная плотность вероятности булет задаваться формулой л 1 — — — (т к! ж... - х'„( )(Х) = (2л) Я е Палее, пусть, согласно конкурирующей гипотезе Н', случайные величины х„..., х„нредполагаются независимыми н одинаково нормально распределенными со срелним значением а ) 0 и единичной дисперсией: л 1 — — - . ((г, — ан, ....
(г„— 'а!'1 д(Х) = (2л) е (а ) О). Отношение правдоподобия равно 1 д аг'» — --ла' И= — =е Г представляет собой монотонно возрастающую функцию" от аргумента 1 х= — ч х. и Таким образом, гипотезу Н следует отвергнуть тогда, когда выборочное среднее х превосходит некоторое критическое значение с, Это критическое значение с определяется так, чтобы, в случае справедливости гипотезы Н, вероятность события х ) с равнялась р. Согласно гипотезе Н, среднее х распределено нормально с нулевым математическим ожиданием идисперснсй !)п. Поэтому (6) где йт — функция, обратная функции нормального распределения Ф. В нашем случае и =- 1, однако формула (б) справедлива при любом х ~ О.
Критерий, полученный в этом прнмсре, замечателен тси, что он не зависит от а, если только а является положительным. Следовательно, односторонний критерий, отвергающий все значения х ~ с, является равномерно наиболее мощным относительно всех гипотез Н' с а ) О. Если бы мы в качестве конкурирующей гипотезы Н' рассмотрели нормальное распределение с отряцательиым а, то нужно бы было отвергнуть все значения х ( — с.
Пример 43. Пусть некоторое событие, согласно гипотезе Н, имеет вероятность р и пусть, согласно альтернативной гипотезе Н', оно имеет ббльшую вероятность р'. Предположим, что в л независимых опытах это событие осущестннлось х раз.
При каких х гипотезу Н нужно отвергнуть? Согласно гипотезе Н, вероятность х-кратного осуществления события равна г(х) — ~ ~ рх (1 р)л — г (х) Согласно гипотезе Н', эта вероятность равна д(х) = ( )р (1 — р)" Е 60. Сложные ги»отвзы 31б Отношение правдоподобия задается формулой Так как и является возрастающей функцией от х, то мы должны отвергнуть значения х > ь.
Прн этом граница ь определяется таким образом, чтобы сумма вероятностей, соответствующих отброшенным значениям х, была наибольшей н не превосходила )Зг (.,) (. ) я / я ~ргэг у» — с — ь+ ~ рььь у» — г — ь 1 1. у» )) (7) с+1~ (в+ э) Левая часть неравенства (7) является возрастающей функцией от р, чак как ее производная ,, „)~ ° 1рг... (с+ 1) н интервале 0(р.С! всегда положительна. Леван часть (7) прн р == О равна нулю н прн р = 1 равна елнннце, поэтому существует одно н только одно значение ргь прн котором левая часть (7) в точности равна )З.
Лля р т рл неравенство (7) выполняется, а для р > рг ве выполняется. Слвдовотельно, этим критерием можно вос»ользоваться длл проверни твк ги»отвз О, для которых р карр Конкурирующей ги»отезой Н' в этом случае является р >рр Если х > с, то гипотезы р тра отвергаются, а р >рл не отвергаются. Граница рл в точности совпадает с односторонней доверительной границей для р, по Клопперу н Пирсону ($7). Таким образом, ранее изложенная теория довернтельных границ подчнняегся общим принципам проверки стаьнстнческнх гнпотез, $ 60. Сложные гипотезы Простой гсиготезой называется такая гипотеза, которая каждому событию из пространства Ю ставит в соответствие определенную вероятность. Если же верояттюстн зависят, кроме того, еще и от параметров, то мь! имеем дело со сложнои гипотезой.