Г.И. Ивченко, Ю.И. Медведев - Математическая статистика (1115270), страница 26
Текст из файла (страница 26)
Исследуя асимптотические свойства критериев (т. е. поведение г! уикций мощности при л -~ ж), прежде всего рассматривают вопрос, является лн критерий состоятельным. По определению, критерий называют согпзэлупгльууьыу, если при у!-~от! )зт, (Р)- 1, 'чг я Н,. Состоятельносгь критерия означает, что с ростом числа иабчюдеипй он позволяет с вероятносгью, близкой к 1, «улавлпваты любые отклонения от основной гипотезы. В частности, состоятельный критерий является асимптотическп несмещенным !см.
(3.3)1. В рассма~риваемом случае справедливо следующее утверждение. Теорема 3.2. Длл любого вглупоРа роро при и- оо функция мощности )р „(р) стремится к 1, ль е. кРгпперий уз лвлнвтя впвпзояпувльпьуч. С) Вычислим среднее и дисперсию статистики Х„т прн гипотезе р. Для этого перепишем формулу (3.5) в виде Л и Х~ = 5,' (р/ — пру)ту(лр))+2,У, (ру — пру)(р, — Ру)!Ру'+ у=! у —.. ! +п ~д (Р; — Ру)/~Рт"-. у= ! Так как Е (ч/!р) = пРу, Е !(ру — лр) ) р1 = ау(ру ! р) =пР/(1 — Ру), то и Е (Хй! ), ~з ( т)зу с ! ~~ (1 )/ (3.7) Отсюда, в частности, имеем Е(Х„'1ро)=Л/ — 1.
Этот точный результат согласуется с асимптотическим результатом теорехзы 3.1, поскольку среднее предельного распределения у'(ЛУ вЂ” 1) равно ЛУ вЂ” 1 (сз!. (1.29)1. Приведем без доказательства формулу дукпсрсии: 0 (Х'',' р) = 4 „(/7«т — /7«с!) + и — ! 1 -1-2: (3/тт — 2/7«,//ы — )тт1~)+ -„(/7~« — /7! ) (3.8) где /7з, = ~,' р„/Р," Отметим частные случая этой формулы. Если у=! все р/ =рп т. е. дисперсия вычисляется при нулевой гипотезе, то /7«,= ~; (Р,')з-з и, в час!ности, /газ=Я . =Л', /7«т=/7з ь=-1, Рттз= у= ! и = ~,' 1/р;". В этом случае из формулы (3.8) имеем у — -- ! о!зт!а!=туз — !уьт(~ !ур,"— а — тает~. у= ! !!3 (3.10) 114 Отсюда, в частности, следует, что Вш 0(Х'„)рь)=2(М вЂ” 1), что л ш также согласуется с теоремой 3.1.
П сть теп ь у теперь р — любой вектор вероятностей, удовлетворякхций условию р~рь, Тогда) (рх — р,")'1р,')О и из формул (3.7) — (3.3) /=! ги следует, что при и- со среднее и дисперсия статистик Х* потезе р имеют порядок роста и. Отсюда на основании не а- венства Чебышева имеем овании нера- 1 — )(Г„(Р) = Р (Ха ( )1! -сс, и- ! ~ Р) = Р (Е (Хь ~ Р) — Хь ~ Е (Хй / )— — )(! а.н !/Р)~Р(/Е(Хл~р) — Хл~=- ~Е(Х~)Р) — )91 и,н-$)Р)~~ О(Х„*,рДЕ(Х~~р) — )(!,, ~,~'=ОЯ. ° 3.
Критерий согласия хи-квадрат для сложной гипотезы. Метод группировки наблюдений с последующим примением крите сог ас л ия )( применим и в более сложной ситуации, когда т ебт рия ется п ове роверить гипотезу о принадлежности неизвестной функции распределения наблюдаемой в опыте случайной величины 9 задан- ному семейству функций распределения. В общем виде задача формулируется так. Пусть,T=(г(хц 9), 6 еи 8» — заданное пара'- метрическое семейство функций распределения (параметр 9 может быть как скалярным, так и векторным) и Х=(Х„..., Х,„)— выборка из распределения Ж($) с неизвестной функцией распре- деления.
Требуется проверить гипотезу Нь! 2'(6) ~ г . Таким образом, в данном случае речь идет о проверке сложной гипотезы. Пусть исходные данные сгруппированы и ч=(чь ..., чн)— соответствующий вектор частот попадания наблюдений в интервалы группировки. Составим статистику, аналогичную (3.5). В данном гипотезе Н случае вероятности попадания в интервалы группировки при по езе Нь уже не будут заданы однозначно, а представляют собой некоторые функции от параметра 9: рт (9) = Р ($ ен Жу,' Нь) = ~ бУ (х; 6), 1 =- 1, „М, в!. поэтому статистика Х„' имеет вид ХД =Хй(8) = ~~', (чу — пр, (8))'l[н)61(6)1. (3.9) ! — ! Эта статистика зависит от неизвестного параметра; следовательно, непосредственно использовать ее для построения критерия пока нельзя — требуется предварительно исключить в (3.9) иеопреде.
леииость, связаину!о с неизвестным параметром 6. Для этого поступают следующим образом: заменяют 6 некоторой оценкой 6,, =9„(Х) и получают, таким образом, статистику Х'„= Х' (9„) = ~ч' (ч! — ир (В„))Цнрг (О,)). !'=- 1 Эта статистика уже представляет собой функцию только от выбо* рочных данных; следовательно, ее значение можно однозначно вычислить для каждой заданной реализации выборки Х.
Если бы распределение статистики Х", при гипотезе Н, можно было найти (хотя бы приближенно) и при этом распределение не зависело бы от конкретных функций г" (х; 6)„составляющих гипотезу М„, то, основываясь на Х„', можно было бы построить критерий согласия для гипотезы Й,. В данном случае величины рт(9„) уже не постоянные, а представляют собой функции от выборки (случайные величины). Поэтому теорема 3.! к статистике Х„' неприменима. Более того, следует ожидать, что распределение этой статистики (даже если оно существует) будет, вообще говоря, зависеть от способа построения оценки 0».
Проблема нахождения предельного (при п оо) распределения для Х„' при этих усложненных условиях впервые была рассмотрена Р, Фишером (1924 г.), который показал, что существуют методы оценивания параметра 9, при которых предельное распределение имеет простой вид, а именно является распределением хи-квадрат с числом степеней свободы М вЂ” 1 — г, где г— размерность оцениваемого параметра 9.
Одним из таких методов оцениваиия является описанный в;и, 292.5 метод максимального правдоподобия, основанный на частотах ч„..., чн, т. е. когда в качестве В„в формуле (3.10) используют мультиномиальную оценку максимального правдоподобия. Теорема 3.3. Пусть функции р)(В), 1=1, ..., М, 9=(8„..., 6„), г(М вЂ” 1, удовлев!воряют следующим условиям: н а) 5', рг (В) = 1, )г 9 я (!); ! — -- ! б) рг(9) ~с)0, 1=1„..., М, и существуют непрерывныг лроизводныс — и др)(6) д2рл гь) , й, 1 = 1, ..., г; дэ» дьь дь! ' в) матрица ~~ "г ,') размера М)г;г имеет ранг г для всех 6~9.
Тогда если 8„=9„— мультиномиальнал оценка максимального правдоподобия для пара.ветра 0 и Хй=Х,',(6„), то при п- ~о Я (ХД ! Нь) Кь (М вЂ” — 1), (3.11) Доказательство этой теоремы можно найти в 113, с. 462 †47. Приведем схему использования критерия согласия у'. Пусть в опыте наблюдается одно из М несовместных событий А„,, Ан н о вероятностях р!, ..., рн появления этих событий выдвинута гипотеза Нь. р!=-р!(О), 1=1, ..., М, где 0=(9„..., 9,) еиВ— некоторому невырожденному интервалу в гг, и функции р~(0) удовлетворяют условиям теоремы 3.3 (если в опыте наблюдается случайная величина $ непрерывного типа, то, как уже было отмечено, задачу сводят к такой дискретной схеме, предварительно группируя данные по М интервалам 9!, ..., он и рассматривая 1!5 в качестве А, события -,'ь ен Жг]).
Пусть произведено п.=50 опытов и наблюдавшиеся частоты й„..., йм сабы и!й удовлетворяют условиям !!,==5, /=.=1, ..., ь', Определим значение оценки 0»п решая относительно 0 уравн=нпя Ъ» й, Лр/ 161 — — =-О, г<=-1, ..., г. (3.12) !,= ! Вычислим Р;=-р,(6„), )=1, ..., Л/, н найдем значение статистики Х;,' по формуле Х„« = У (/ту — поу)з/(пРг). Пусть задан уровень / — ! значимости а. Определим по таблицам распределения уз(Л/— — г — 1) значение (1 — <х)-квантпли т! — ю и —,— ! и сравним с пим найденное значение Х .
Если Х»э.у,' „ /„, ), то гипотезу Н, отвергают; в противном случае можно только сказать, что гипотеза Н, не противоречит результатам испытаний. Изложенная теория гарантирует, что используя это правило, можно ошибочно отклонить гипотезу Нч, когда она истинна, с вероятностью, приближенно равной а. Замечание. Если данные предварительна группируются, та оценивать пзранетр 6 мажна и да группировки наблюдений, например мвкснмизнруя па 6 функцн/а прввдападабин ь (Х; 6) =)(Х(( 6!... !(Х„; 6). В зтам случае аценка максимвльнага прввдапалабия пврвметрз 6 «использует» сами наблюдении Х, а не частоты интервялав Ж>, ..., и . Можно была бы ежила(тч чта такай ьмтад аценивзнвя далжен приводить к более тачныч выводам; креме того, обычную сценку максимального прандападабия часто нвхаднть гораздо праще, чем решать свстему уравнений 13.12].
Од/(зка, кзк паназвлн Чернов и Леман 11964 г.), при такам методе аценивзния предельнае саатнашенне (3.111, вообще говоря, уже не имеет места, в поэтому асимпта/ические результаты не будут иметь такую простую форму [211. Пример 3.8. (пуассоновскал модель, крилмрий у'для нее). Пусть производится и независимых наблюдений над неотрицательной целочисленной случайной величиной е.
Требуется проверить гипотезу Нв! .2 (с) ен П (6). Положим б;=!) — 1), )=1, ..., Л/' — 1, бд =('т' — 1, Л7, ...). Тогда Р,(6)=!'(! — 1; 6), 1=1, ..., Л' — 1, Рк(6)=,'у", )(й; 6), А=Я вЂ” ! где,/(л; 6) =е-вбей!, Ф:~0. Найдем оценку 6.. В данном случае неизвестный параметр только один, поэтому система (3.12) сводится к уравнению т, ( — — !)1/у>!+!гн У / - — 11)(й; 6) У !(й; 6)=0. /=.а ' й=н — ! а=к ! Отсюда 1 т а ао ОЪ а=„'-) у /а,, -аа; Ъ а/(а: а) ~ /(Ь аф /=а в=н -! в=я-! 116 Первый член в скобках равен сумме всех х, таких, что х,-.:. Л' — 2, а последний член приближенно равен сумме всех л/, которве болыне или равны Л' — 1 (х„..., х, — наблюдавшиеся значения 9).
Таким образом, оценкой 6, для 6 может служить среднее арифме- тическое выборочных значений: 6„== х, (Напсмним, что обычная оценка максвмальпого правдоподобия для параметра 6 пуассонов- ского распределения точно равна х.) Теперь находим е — хх/ь!/(! — 1)! При 1'=1, ..., Л/ — 1, С ха и/ — е — 'х при 1, Л/ ы А н-! н гипотеза На отвергается тогда и только тогда, когда (1!, — пр>)',/(пР/) .":-. у1, и /.: 4. Критерий квантилей.