М.В. Козлов, А.В. Прохоров - Введение в математическую статистику (1115302), страница 39
Текст из файла (страница 39)
4. Блнзкне гипотезы. Хотя в рассмотренных выше примерах были найдены равно. мерно наиболее мощные критерии прн сложных альтернативах, существования таких критериев в общем случае ожидать не прп. ходится. Имеются различные варианты других постановок оптимиэацнонных задач в теории проверки статцстическпх гипотез. Здесь мы остановимся на крнтернях, которые будут в определенном смысле равномерно напбо:!ее мощными по отношению к «бл!!зк!!м» гппотеэам Нь!. Оев(Оь 6»+б), б- О, либо Н-! ! ОЕ ~(О,— Ь, О.), б- О.
Для повторной выборки наиболее мощный'крптернй для гипотезы 0=-0» иротнв простой альтернативы 6»+ б, Ь>0, запншем в виде 222 16о» ~„.1„(» . Ео+Ы )й(а~ цо„в,) =(хо 1(Х 1 Оо+6) 1(хо1 Оо) ) й ). Предполагая функцию правдоподобия дифференцируемой по 6, имеем при 6-~0 1(х„; Оо+ 6) — 1(х„; 9 ) =- ( "' ео) 6+ о(6) = и = ча« 'Одб+о(6) ов о 3 Если, к примеру, вторая производная го О логарифмической функции правдоподобИя 1(х;; 6) ограничена по хь то остаточный член в (29) мал равномерно по х, и область Фуи> при малых 6 будет близка к области 97=(хо. д1(хл, Оо)/дО>й), (30) где выбор й определяет размер критерия ЯГ. Будем называть критерий 97 локально наиболее мощным по отношению к близким альтернативам 6>Оо.
Для повторной выборки из распределения й/(р, 1) имеем д/(х~, .ро)/ди=х~ — ро, и критическая область (30) принимает вид %'=(х„: х> ро+й), что совпадает с равномерно наиболее мощным критерием против сложной односторонней альтернативы 6>9,. ° (Ч1) Рассмотрим повторную выборку из распределения Коши с параметром сдвига /(х; 9) =(и(!+ (х — 9)'))-'. д1(хи Оо)/д9=2(х~ — Оо)/(1+ (хю-йо)о).
Имеем так что статистика локально наиболее мощного критерия имеет вид о 2~ (х; — 9)/(1+(х,— 6) ). йй 1 ! 223 Чтобы воспользоваться критерием (30), необходимо уметь вычислять его размер. Это можно сделать приближенно, используя центральную предельную теорему. В условиях регулярности, прн Ь.
Сложные гипотезы. Предположим, что н нулевая гипотеза, и альтернатива Но ' ее=Во, Нь ' Оеп9~ ° — сложные, т. е. параметрические множества сто н 8~ состоят бо. лее чем из одного элемента. Одна нз возможностей строить критерии в этом случае основана иа статистике Т1 (х) = зцр Ь(х; 6)/ зир Ь(х; 6). ВЕ 9~ В бр (32) Полагая, что оба супремума в (32) достигаются, можно сказать, что по выборке х строятся оценки максимума правдоподобия Е,(х) в,(х): Ь(х; 9,(х))- — — гпах Е(х; 9), Е=О, 1, Вевв, и затем сравниваются правдоподобия выборки х при этих самых «правдоподобных» значениях параметра 6 прн гипотезах Н„и Н,, как это делается в задаче проверки простой гипотезы против простой альтернативы. Критерий Ит~о=(х: Т1 (х) >й) называют, как и в случае простой гипотезы, критерием отношения правдоподобий, Употребляется и другой вариант критерия отно- шения правдоподобий, основанный на статистике Т, (х) =- зир Е.
(х; 6)/ зир Е (х; 6), тт = 8,116,. (ЗЗ) Вййв виет зпр Ь(х; 6)=шах(зпр Е(х; В), зпр Ь(х; 6)), в=в Веер Вше~ Т,(х) 1пах(1, Т,(х)), Так как то которых была введена информация по Фишеру (см. подробнее п. 1 $19), имеем йв,(а/(х,; е)/99) =о, о,(а/(х,; 9),вв) =/,,(в), и нормальное приближение дает и Ра 1х: )' д/(хб Оэ)/дв > ~п/л, (Оэ) «~ — а(М (О, 1))1 ив 1 — и. (31) 1 ! Нормальное приближение (31) практически бывает достаточным уже при умеренных и, хотя следует иметь в виду, что чем меньше а, тем погрешность в (3!) больше. так что критерий 57!з! (х: Т,(х) >й) (34) при л л1 совпадает с ку!!!. (Ъ'И) Рассмотрим линейную модель в канонической форме с нормальными наблюдениями: Безусловный максимум логарифмической функции правдоподобия по ф достигается, очевидно, при !р!=и!, !=1, ..., г.
Днфференцн- руя (35) по ат при ф!=ф! и приравнивая производные нулю, на- ходим л л ач О=д1(н; ф, а)/да' — — — — 1 ~' из), 2ал 2Ф ~ !) ! г+! откуда л ил се= — ~ ит. !' ь +! Отметим, кстати, что о. м. п. ф совпадают с наилучшими лниейнымн иесмещениыми оценками из $10, а оценка а' отличается множителем. Проводя аналогичные вычисления в предположении, что верна гипотеза Н» т. е. полагая в (35) ф! ...=!р. л О, находим 1 1=г — й, ..., г, аз= — ~~' ит.
л !-г-л+» тр! -ис, Таким образом, л !.(и; ф, а)=( — ' ~~)~ и'!) ' ехр( — л,'2), ~ л ! л+! л Ь(н; ф, а) = ~ — ~~)~ и,"-) ехр( — л/2), г-л+ ! 225 У~' (и) ==(2па') ~ехр ~ Г,'у,(и — ф!)'+ ~~) и~~) ! г+! где Ф=И!ь ", Ф,), н=(иь ., и,).
Проверим линейную гипотезу Н,: !)т! =... =$, '=0 против альтернативы Н,: !)! — ... — 'ф; "> ) 0 с помощью критерия (34). Имеем л 1(и; ф, а) = — — 1п(2па') — — ~ ~„(и! — ф!)'-!- >„и'). (35) л 2 ! ! ге! и статистика Т, нз (ЗЗ) принимает вид ч л Т,(п) =( ~~)~ ~и";.~ ~~~ и',) = (1+ — Р(н)), (36) ! г+! ! г-4+! где Е(и) — статистика г-критерия из $ !3.
Из (36) вытекает, что тз(н) и г(н) задают один н тот же критерий. этот же вывод, очевидно, справедлив в любой параметризацин линейной модели. й 22. ПОСЛЕДОВАТЕЛЬНЫИ КРИТЕРИИ ОТНОШЕНИЯ ПРАВДОПОДОБИИ 1. Метод последовательного статистического анализа. Мы будем рассматривать схему повторного выбора и задачу о проверке простой гипотезы Н,: Р= Р, против простой альтернативы Н,: Р= Рь но в отличие от предыдущего допустим, что число наблюдений заранее не фиксировано, а может зависеть от результатов уже проведенных испытаний. Определим статистическую модель, отвечающую такому опыту. Пусть (В", М„, Р'"!) — последовательность вероятностных моделей (а=1, 2, ...).
Предположим, что последовательность мер Р!"!, и 1, 2, ..., согласована в следующем сх<ысле: для любого В.яЯ.: Р!">(В ) =Рм+'>((хь ..., х,+!) ! (ль ..., х„)ееВ„), (1) что по существу означает, что мера Рм+!> в Я,+!, суженная на Я„, совпадает с Р!"!, т.
е. последовательность (В", Я, Р''1. и = =1, 2, ..., описывает неограниченно продолжающийся вероятностный зксперимеит. Пусть Ж=(х=(х!, хз, ...): к!а=В!!!, !=1, 2....)— множество всех бесконечных последовательностей действительных чисел. Примем обозначе!шс [х]„=(х!, ..., х„) для конечного отрезка последовательности х и [В].=([х].: хееВ), ВыМ.
Введем минимальную систему Я подмножеств лп, содержащую все множества вида В=(х: [х] ееВ,), где В,яЯ„, и=1, 2, ..., замкнутую относительно перехода к дополнению и образования счетного объединения. Известная теорема Колмогорова утверждает, что прн условии (1) может быть определена единственным образом мера Р на Я, такая, что для любого В,ееМ„: Р(х: [х]„яВ,) =Р!">(В,) (2) (см. [16, 16]). Равенство (2) означает, что Р-вероятность любого события, связанного с результатом только первых л испытаний, совпадает с вероятностью соответствующего события в модели (В", М„, Р!"!). Определенная так вероятностная модель (У.
Я. Р) соответствует опыту, состоящему из бесконечной последовательности, вообще говоря„зависимых испытаний. 226 В случае, когда на каждом (1«', Я») задано семейство -срспт. постных мер (Рв', Ве=-Е) и каждая последовательность р~в"', л=1, 2, ..., удовлетворяет условию согласованности (!), на измеримом пространстве (Ф, Я) определено, в соответствии с теоремой Колмогорова, семейство вероятностных мер (РВ,Вен Е). Статистическая модель (Х,Ю,(Рв,В~Е)) отвечает опыту с бесконечным числом испытаний и неизвестным вероятностным распределением, принадлежащим семейству (РВ,В ~ Е). При такой постановке интерес представляют такие статистические процедуры, которые основываются на конечных отрезках [х[„результатов наблюдений. Введем статистику Ф(х) с натуральными значениями, которая будет служить «моментом прекращения» наблюдений, так что статистические выводы будут функцией от [х)щм .
Не всякая статистика й1(х) годится в качестве такого рода момента, так как естественно, чтобы решение о прекращении испытаний было основано лишь иа результатах уже проведенных испытаний. Статистику У(х) с натуральными значениями назовем моментом остановки, если Ф(х) а=э.)у(у) л для любого у: [у[«[х[ . (3) Можно сказать, что свойство (3) статистики У(х) означает, что решение о прекращении наблюдений не предяосхищает будущее. Последовательный статистический анализ включает в себя любую статистическую процедуру, зависящую от хиЯ лишь через [х[л<хь где Ф(х) — некоторый момент остановки. Рассмотрим наиболее важную для приложений модель повторных независимых испытаний, так что РВ(х: х» еоВа1, ...,х„ен Вко) = П Рв(х:хс а Вго) 4 $ для любых л, ВЮ~Яь 1=1, ..., л, и' РВ(х:х~епВю) не зависит от 1 при любом ВяЯь х (хь хм ...).
Ниже нам потребуются мо. менты остановки специального вида. Пусть И (х) — некоторая Япизмернмая функция и 5,(х) =й(х~)+...+Й(х ), х=(хь, х„, ...), л=1, 2, .... (4) Введем момент 1У(х) первого достижения последовательностью (4) интервала (а, +оо): Ж (х) =л с=о 5~(х) ~ (а, + оо), 1= 1, ..., л — 1, 5,(х) еи (а, + оо). (Ь) Очевидно, что соотношения (4), (Ь) задают момент остановки. Покажем, что если рв=Мвй(Х,)>о, В Е, 227 то сл. в. У(Х) конечна с РВ-вероятностью единица: Рв(Н(Х)< )=-), 8аЕ.
(е) Воспользовавшись усиленным законом больших чнсеч, имеем е( () рв) . () 1 я Из (7) вытекает, что при Рв-почти всех х найдется номер пв =.яп(х), начиная с которого 5„(х) ) прф2, и, следовательно, момент остановки ЛГ(х), определенный в (5), удовлетворяет требованию (6). Если РВ.= тео. то, как известно, л-'5„(х~- +ос на множестве Рв-вероятности единица и момент У(х) также является конечным. 2. Последовательный критерий отношения правдоподобий. Рассмотрим модель повторных (неограниченно проз лжающихся) независимых испытаний. Введем отношение правдоподобий й„(х) =.Ц [к).; 8,)/С.([х).; 8,) (8) для отрезка наблюдений длины и, х=(хь хь ...), [х].= = (хь хь ..., х,).
Мы видели, что для любого фиксированного а критерий, основанный на статистике (8), максимнзирует мощность прп простых гипотезе и альтернативе — Не. 8=8м Н~ . 8 8ь В критическую обласТь входят все выборки, для которых отно. шение (8) превосходит заданное число: ([х) „: Я„(х) >А). (9) Наглядный смысл неравенства (9) состоит в том, что правдоподобие параметра 8~ прн выборке [х), в А раэ больше правдоподобия 8м и потому неравенство (9) следует рассматривать как опровержение нулевой гипотезы. Число А выбирают для обеспечения заданного уровня значимости: а=Рв,(х: Я„(х) ) А), так что в зависимости от а граница А может оказаться н меньше Е Это означает, что для некоторых точек х отношение (9) меньше единицы, но мы интерпретируем их в пользу гипотезы Н,.
Такое обстоятельство, конечно, является не очень приятным, но для него есть оправдание. Нулевая н альтернативная гипотезы входят в постановку задачи несимметрично: нулевая гипотеза проверяется, альтернативная гипотеза рассматривается как направление возможного отклонения от Нь Поэтому и вероятности первого и второго рода не равнозначны для экспериментатора: вероятность ошибки первого рода а устанавливается заранее, что гарантирует ее определенный уровень, удовлетворяющий исследователя, а 228 вероятность ошибки второго рода мииимизируется за счет выбора критерия.