Учебник_Бочаров_Печинкин (846435), страница 45
Текст из файла (страница 45)
Критерий называется неемеиченнььи, если его уровень значимости ни в коем случае не превосходит мощности, т.е. В(Г(ш)) > ао для любых Р(г) Е У~ (невыполнение требования несмещенности ведет к парадоксальной ситуации: в некоторых случаях мы будем чаще браковать партии годных изделий, чем негодных). Критерий, имеющий при любом г (ш) е .г1 наибольшую мощность среди всех несмещенных критериев размера ао, носит название равномерно наиболее мощного несмещенного критерия размера оо.
Естественно, равномерно наиболее мощный критерий является также равномерно наиболее могцным несмещенным, что вытекает из сравнения его с тривиальным рандомизированным критерием (о понятии рандомизированного критерия см. ниже), который независимо от выборки Хн..., Х„ предписывает случайным образом с вероятностью оо принять конкурирующую гипотезу Ны очевидно, и мощность, и уровень значимости такого критерия тождественно равны гчо. Наконец, еще один класс критериев представляют так называемые инвариантные критерии. Критерий называется инвариантным относительно группы преобразований С выборки Хм..., Х„, если он не зависит от преобразований из этой группы.
В частности, от любых критериев, проверяющих гипотезы о теоретической функции распределения Г(ш), разумно потребовать инвариантность относительно всех перестановок элементов выборки Хы,..,Х„, иначе сам критерий зависел бы от того, в каком порядке проводились наблюдения. Обычно группа преобразований С естественным образом определяется рассматриваемыми гипотезами Но и Ны и поэтому говорят просто об инвариантных критериях. Критерий, имеющий при заданном размере оо наибольшую мощность среди всех инвариантных критериев, называется равномерно наиболее мощным инвариантным критериелч.
Поскольку понятие инвариантного критерия является сложным, мы в дальнейшем в основном тексте не будем его использовать, отсылая читателя к специальной литературе (например, (11, !2)), хотя это понятие и прояснило бы смысл построения некоторых критериев. В общем случае, когда не существует ни равномерно наиболее мощного, ни даже равномерно наиболее мощного несмещенного или равномерно наиболее мощного инвариантного критерия, критерии обычно строят, опираясь на интуитивные соображения разумности. К таким соображениям относятся: простота и наглядность критерия, независимость уровня значимости критерия от вида теоретической функции распределения, асимптотическая эффективность критерия и т.д.
Как правило, критерии строят, основываясь на статистике критерия. Пусть Я = Н(Хь...,Хн) произвольная (одномерная) статистика. Тогда неравенство Н > С определяет критерий, критическая область которого И'ч состоит из всех точек (лы ...,л„) и-мерного пространства Н", для которых Я(хь..., лп) > С. 2!2 Гл.
3. Проверка статистических гипотез Заставляя критическое значение пробегать все числа от -оо до ос, получим семейство критериев, имеющих различные уровни значимости и мощности. Теперь, если, например, мы хотим получить критерий заданного размера ао, то должны выбрать такое значение С, которое давало бы нам критерий требуемого размера его. Обычно критерии строят таким образом, чтобы статистика Ь' при условии справедливости основной гипотезы Но имела (хотя бы асимптотически при п — ~ оо) одно из распределений, описанных в параграфе 4 гл.!. Тогда критическое значение С определяется как (! — ао)-квантиль соответствующего распределения. Разумеется, как уже говорилось ранее, статистика Н должна по возможности обеспечивать меньший уровень значимости и большую мощность построенного на ее основе критерия.
В заключение этого параграфа скажем несколько слов о рандомизированных критериях, Рандомизированные критерии возникают (обычно в случае дискретной наблюдаемой случайной величины Х) тогда, когда критерий, определяемый неравенством Н(Хы...,Х„) ) С, имеет размер больше требуемого, а неравенством Я(ХП...,Хп) ) С вЂ” уже меньше требуемого. В этом случае наряду с критической И', и допустимой И' областями вводят область рандомизации И'„; при попадании выборки Хн ...,Хп в область И'„ производят дополнительное испытание типа подбрасывания несимметричной монеты и по его исходу принимают либо основную гипотезу Но, либо конкурирующую Нн Здесь в основном тексте мы не будем рассматривать рандомизированные критерии.
2. Простые гипотезы Изучение статистических критериев начнем со случая двух простых гипотез. Пусть выборка Хы ...,Х„ произведена из генеральной совокупности с теоретической функцией распределения Г(х), относительно которой имеются две простые гипотезы: основная Но. Г1х) = Го1х) и конкурирующая Нп Г(х) =- Г1(х), где Го(х) и Г~(х) — известные функции распределения. Поскольку гипотезы Но и Н1 простые, уровень значимости и мощность каждого критерия для проверки этих гипотез будут представлять собой два числа: сг и д.
Оказывается, в данном случае существует наиболее мощный критерий (при двух простых гипотезах вместо «равномерно наиболее мощный критерий» говорят просто «наиболее мощный критерий>), т. е. критерий, имеющий при заданном уровне значимости о наибольшую мощность гй Этот критерий называется критерием отношения правдоподобия и описывается следуюгцим образом. 213 2.
Простые гипотезы Введем статистику Тп (Хы, Х„) Л(Х! Хп) где Т,о(ХП...,Х„') = Ро(Х~)" Ро(Хь) в случае дискретной наблюдаемой величины Х и Т.о(ХП..., Х ) = ро(Х~ ) " ро(Х ) в случае непрерывной Х представляет собой функцию правдоподобия при условии справедливости гипотезы Но, а Е,(ХП...,Хп) = Р,(Х,) Р,(Х„) в дискретном случае и Ь|(ХП...,Х„) = Тн(Х~)" р~(Х„) в непрерывном — ту же самую функцию правдоподобия, но при условии справедливости гипотезы Ни Статистика Л носит название отношения правдоподобия и является отношением вероятностей (или плотностей распределения) получить выборку Хы ...,Х„ при условиях справедливости гипотез Н~ и Но. Естественно предположить (и это подтверждается леммой Неймана — Пирсона, которую мы докажем ниже), что чем больше отношение правдоподобия, тем большее предпочтение мы должны оказать гипотезе Ни Таким образом, критическая область И; критерия отношения правдоподобия состоит из всех тех точек (хы,,ш„), для которых Л(шы..., т,„) больше критического значения С.
Критерий отношения правдоподобия подобен рачительной хозяйке, которая всегда на имеющиеся деньги старается купить как можно больше товаров. Теорема 1 (лемма Неймана-Пирсона). Среди всех критериев заданного уровня значимости о, проверяющих две простые гипотезы Но н Ны критерий отношения правдоподобия является наиболее мощным. Дока з а тел ь ство. Пусть критерий отношения правдоподобия уровня значимости о для проверки Нь и Н~ задается критической областью Иг,.
Рассмотрим любой другой критерий того же уровня значимости для проверки тех же гипотез и обозначим через Иг,' его критическую область. Тогда при попадании выборки Хп..., Х„в область И = Иг. 'т И:,' мы должны принять гипотезу Н~ по критерию отношения правдоподобия, но отвергнуть в соответствии со вторым критерием, а при попадании в область Г = И", т Иг, — наоборот, отвергнуть по критерию отношения правдоподобия, но принять в соответствии со вторым критерием Рис 1 (рис. 1).
Тогда, поскольку оба критерия имеют одинаковый уровень значимости, 214 Гл. 3. Проверка сгпашисгпилеских гипотез то вероятности попадания выборки Хп,,., Х„ в области И и )с' при условии справедливости основной гипотезы Но равны, т.е. Р((ХП ..., Х„ ) Е 1' ~ Но) = ) ...) Ро(х| ) ...
ро(х„) дх1 ... с(тч = =Р((хп,Х-)~)'!Но)=1 Гзю(х1) в(х-)(х (х-=' (Н Далее, мощность 13 критерия отношения правдоподобия задается как суммарная вероятность попадания выборки в пересечение областей Ис, и И", и область И при условии справедливости конкурирующей гипотезы Н~ Д = Р((Хп , Х„) Е И', гз И", Н| ) ч- ) . .) р~(х1 ) .. Р~(х„) с(х1 ... г!х„. (2) Аналогично определяется мощность второго критерия и = Р((Хи ., Х) В Иссо И", ! Н~ ) + ~ . ( Р1 (х~) . Р1 (х) г!х1 .. с(х . (3) Вспоминая теперь, что по построению критерия отношения правдоподобия отношение правдоподобия р,(х,)...
р,(х.) Л о(Х,),,р„(х ) в области И больше С, а в области Г не превосходит С, получаем из (1) — (3): В > Р(Хы, Х„В Ис, г! Ис,' ( Н1 ) + Су > Д. Значит, мощность второго критерия не болыпе мощности критерия отношения правдоподобия. Замечание 1 к теореме 1. Нетрудно видеть, что мощности критерия отношения правдоподобия и второго критерия совпадают тогда и только тогда, когда г = О, т е вероятности попадания в области 1с и Ъ' при условии справедливости как основной, так и конкурирующей гипотез равны нулю. Поэтому критерий отношения правдоподобия единственен (с точностью до множества, вероятность попадания в которое равна нулю). Замечание 2 к теореме 1 Мы рассмотрели критерий отношения правдоподобия, критическая область которого задается неравенством Л > С. Аналогично можно было бы ввести критерий отношения правдоподобия с критической областью Л > С, имеющий то же самое свойство оптимальности.
Пусть нам теперь нужно построить наиболее мощный критерий заданного уровня значимости о. Может случиться так, что, определив критическое значение С, мы придем к следующей ситуации критерий, задаваемый неравенством Л > С, будет иметь уровень значимости с»' меньше о (о' ( и), а задаваемый неравенством Л > С вЂ” уровень значимости ол уже больше о (ол > о). Возможный способ устранить возникшее затруднение — добавить к критической области И~м задаваемой неравенством Л > С, некоторую «лишнюю» подобласть И'» области И'р, определяемой равенством Л = С, с таким расчетом, чтобы вероятность попадания в И', при справедливой Но равнялась о — о'.
Нетрудно видеть, что если это удастся сделать, то построенный критерий будет наиболее мощным критерием уровня значимости сг. Но, с одной стороны, подобласть И'„ вообще говоря, можно выбрать не единственным способом, поэтому могут появляться различные наиболее мош- 2!5 2. Простьсе гипотезы ные критерии, отличающиеся друг от друга только при попадании в область И'р.















