4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 26
Текст из файла (страница 26)
(3.9) ! — ! Эта статистика зависит от неизвестного параметра; следовательно, непосредственно использовать ее для построения критерия пока нельзя — требуется предварительно исключить в (3.9) иеопреде. леииость, связаину!о с неизвестным параметром 6. Для этого поступают следующим образом: заменяют 6 некоторой оценкой 6,, =9„(Х) и получают, таким образом, статистику Х'„= Х' (9„) = ~ч' (ч! — ир (В„))Цнрг (О,)). !'=- 1 Эта статистика уже представляет собой функцию только от выбо* рочных данных; следовательно, ее значение можно однозначно вычислить для каждой заданной реализации выборки Х. Если бы распределение статистики Х", при гипотезе Н, можно было найти (хотя бы приближенно) и при этом распределение не зависело бы от конкретных функций г" (х; 6)„составляющих гипотезу М„, то, основываясь на Х„', можно было бы построить критерий согласия для гипотезы Й,. В данном случае величины рт(9„) уже не постоянные, а представляют собой функции от выборки (случайные величины).
Поэтому теорема 3.! к статистике Х„' неприменима. Более того, следует ожидать, что распределение этой статистики (даже если оно существует) будет, вообще говоря, зависеть от способа построения оценки 0». Проблема нахождения предельного (при п оо) распределения для Х„' при этих усложненных условиях впервые была рассмотрена Р, Фишером (1924 г.), который показал, что существуют методы оценивания параметра 9, при которых предельное распределение имеет простой вид, а именно является распределением хи-квадрат с числом степеней свободы М вЂ” 1 — г, где г— размерность оцениваемого параметра 9.
Одним из таких методов оцениваиия является описанный в;и, 292.5 метод максимального правдоподобия, основанный на частотах ч„..., чн, т. е. когда в качестве В„в формуле (3.10) используют мультиномиальную оценку максимального правдоподобия. Теорема 3.3. Пусть функции р)(В), 1=1, ..., М, 9=(8„..., 6„), г(М вЂ” 1, удовлев!воряют следующим условиям: н а) 5', рг (В) = 1, )г 9 я (!); ! — -- ! б) рг(9) ~с)0, 1=1„..., М, и существуют непрерывныг лроизводныс — и др)(6) д2рл гь) , й, 1 = 1, ..., г; дэ» дьь дь! ' в) матрица ~~ "г ,') размера М)г;г имеет ранг г для всех 6~9.
Тогда если 8„=9„— мультиномиальнал оценка максимального правдоподобия для пара.ветра 0 и Хй=Х,',(6„), то при п- ~о Я (ХД ! Нь) Кь (М вЂ” — 1), (3.11) Доказательство этой теоремы можно найти в 113, с. 462 †47. Приведем схему использования критерия согласия у'. Пусть в опыте наблюдается одно из М несовместных событий А„,, Ан н о вероятностях р!, ..., рн появления этих событий выдвинута гипотеза Нь.
р!=-р!(О), 1=1, ..., М, где 0=(9„..., 9,) еиВ— некоторому невырожденному интервалу в гг, и функции р~(0) удовлетворяют условиям теоремы 3.3 (если в опыте наблюдается случайная величина $ непрерывного типа, то, как уже было отмечено, задачу сводят к такой дискретной схеме, предварительно группируя данные по М интервалам 9!, ..., он и рассматривая 1!5 в качестве А, события -,'ь ен Жг]). Пусть произведено п.=50 опытов и наблюдавшиеся частоты й„..., йм сабы и!й удовлетворяют условиям !!,==5, /=.=1, ..., ь', Определим значение оценки 0»п решая относительно 0 уравн=нпя Ъ» й, Лр/ 161 — — =-О, г<=-1, ..., г. (3.12) !,= ! Вычислим Р;=-р,(6„), )=1, ..., Л/, н найдем значение статистики Х;,' по формуле Х„« = У (/ту — поу)з/(пРг).
Пусть задан уровень / — ! значимости а. Определим по таблицам распределения уз(Л/— — г — 1) значение (1 — <х)-квантпли т! — ю и —,— ! и сравним с пим найденное значение Х . Если Х»э.у,' „ /„, ), то гипотезу Н, отвергают; в противном случае можно только сказать, что гипотеза Н, не противоречит результатам испытаний. Изложенная теория гарантирует, что используя это правило, можно ошибочно отклонить гипотезу Нч, когда она истинна, с вероятностью, приближенно равной а. Замечание. Если данные предварительна группируются, та оценивать пзранетр 6 мажна и да группировки наблюдений, например мвкснмизнруя па 6 функцн/а прввдападабин ь (Х; 6) =)(Х(( 6!... !(Х„; 6). В зтам случае аценка максимвльнага прввдапалабия пврвметрз 6 «использует» сами наблюдении Х, а не частоты интервялав Ж>, ..., и .
Можно была бы ежила(тч чта такай ьмтад аценивзнвя далжен приводить к более тачныч выводам; креме того, обычную сценку максимального прандападабия часто нвхаднть гораздо праще, чем решать свстему уравнений 13.12]. Од/(зка, кзк паназвлн Чернов и Леман 11964 г.), при такам методе аценивзния предельнае саатнашенне (3.111, вообще говоря, уже не имеет места, в поэтому асимпта/ические результаты не будут иметь такую простую форму [211.
Пример 3.8. (пуассоновскал модель, крилмрий у'для нее). Пусть производится и независимых наблюдений над неотрицательной целочисленной случайной величиной е. Требуется проверить гипотезу Нв! .2 (с) ен П (6). Положим б;=!) — 1), )=1, ..., Л/' — 1, бд =('т' — 1, Л7, ...).
Тогда Р,(6)=!'(! — 1; 6), 1=1, ..., Л' — 1, Рк(6)=,'у", )(й; 6), А=Я вЂ” ! где,/(л; 6) =е-вбей!, Ф:~0. Найдем оценку 6.. В данном случае неизвестный параметр только один, поэтому система (3.12) сводится к уравнению т, ( — — !)1/у>!+!гн У / - — 11)(й; 6) У !(й; 6)=0. /=.а ' й=н — ! а=к ! Отсюда 1 т а ао ОЪ а=„'-) у /а,, -аа; Ъ а/(а: а) ~ /(Ь аф /=а в=н -! в=я-! 116 Первый член в скобках равен сумме всех х, таких, что х,-.:.
Л' — 2, а последний член приближенно равен сумме всех л/, которве болыне или равны Л' — 1 (х„..., х, — наблюдавшиеся значения 9). Таким образом, оценкой 6, для 6 может служить среднее арифме- тическое выборочных значений: 6„== х, (Напсмним, что обычная оценка максвмальпого правдоподобия для параметра 6 пуассонов- ского распределения точно равна х.) Теперь находим е — хх/ь!/(! — 1)! При 1'=1, ..., Л/ — 1, С ха и/ — е — 'х при 1, Л/ ы А н-! н гипотеза На отвергается тогда и только тогда, когда (1!, — пр>)',/(пР/) .":-.
у1, и /.: 4. Критерий квантилей. Метод уе можно применять для псстроения критериев согласия и в задачах другого типа. Рассмотрим задачу проверки описанной в примере 3.1 гипотезы Нв о том, что неизвесгное распределение л (с) имеет некоторое количество заданных квантилей. Пусть выборка Х = (Ха, ..., Х,) извлечена из непрерывного на )<а распределения Ж ($), о котором выдвинута гипотеза Н,: Рь(ею) =- Р,, 1=-1, ..., Л' — 1, где — сс(~,(...(~н,(оо и 0(р!(... = Рн,(1 — заданные числа.
Гипотеза Н, сложная и включает все непрерывные распределения с указанными квантилями. Построим критерий проверки этой гипотезы. Положим б> =- (с -ь с/1, ) = 1,, Л', Ьз =- — о, Ьд =- оэ, и пУсть т/ — числ<> вйборочныххн точек Хь принадлежащих интервалу Рц/. Таким образозл, имеем схему группировки данных с естественньп!и (т. е. порождаемь!ми самой проверяемой гипотезой) интереаламн.
Тогда Ж(е=-(е!, ", тн);Не)=М(/!; р'--(Р( " рн)), где Р";=. Рт — р; „) == 1, ..., Л', Р,=О, Рк=-1, и гипотеза Нч эквивалентна утверждению, что кероятности исходов в настроенно '( полгномиальной схеме Равны заданным числам Р",, ..., Рн. Следовательно, для проверки э!ой гипотезы можно применить описаннып в и. 2 критерий согласия Хт, который основан па статистике(3.5). Этст критерий в данном случае называют крин/ериед< квантилвй. При Л/=2 н р,=0,5 соответствующий критерий называют критерпсл! знаков. В этом случае гипотеза Нв — это гипотеза о том, что выборка Х извлечена из распределения ХЯ) с медианой ",, а статистика (3.5) сводится к статистике (4(п) (е! — и/2)з.
где е,— число компонент вектора Х, значения которых лежат в интервале ( — сю, с!), или, что то !ке самое, число отрицательных разностей 117 На практике критерий знаков чаще всего применяют в следующей' ситуации. Пусть ((Х„)г,), ..., (Х„„)г„)) — выборка из двумерного распределения о ($= ($1, 5з)). Требуется проверять гипотезу На о том, что компоненты й! и $з независимы н одинаково распределены, т. е. что гй(х, у) =г (х)г" (у), гдето(х) — некоторая одномерная функция распределения.
Для проверки этой гипотезы поступают следующим образом: составляют разности Л! = Хг — )'г, г = (, ..., п. Тогда если гипотеза Н, верна, то Р(4«(0) = = Р(Л!.п.0) =!/2 н исходная гипотеза сводится к утверждению, что выборка (2„..., л„) извлечена из распределения, медиана которого равна О. В этом случае статистика и! есть число отрицательных величин среди 7„..., 2, и по теореме 3.) при а-«оэ :ь (4(п! — п/2)'/п(НО)-«Х' (1), что позволяет рассчитать соответствующую критическую границу в критерии согласия Х'. 5 3.3. Симметрические критерии в схеме группировки с растущим числом интервалов. Критерий пустых ящиков 1.