4. Математическая статистика. Ивченко_ Медведев (1984) (1186157), страница 24
Текст из файла (страница 24)
Для распределений Р, составляющих нулевую гипотезу (условимся этот факт записывать как Реп Нь), значения функции мощности удовлетворяют по построению критерия условию (ЗЛ); перепишем это условие в новых терминах в виде (Р (Р) ( а, чР ев Н„. (3.2) Если Р~ Нм то значение У'(Р) называют мощностью критерия при альтернативе Р. Функция мощности играет в теории проверки гипотез фундаментальную роль. Она полностью характеризует критерий, так как показывает, насколько хорошо критерий соответствует своему основному назначению — «улавливать» возможные отклонения от основной гипотезы. В терминах функции %'(Р) можно сказать, что критерий тем лучше (»тем мощнее»), чем больше его мощность при альтернативах.
Действительно, если наблюдавшееся значение ((х) попадает в критическую область, то нулевую гипотезу отклоняют, и если истинной действительно является некоторая альтернатива (нулевая гипотеза не верна), то тем самым принимают правильное решение. Следовательно, значение (Р(Р) при Р ~ Н» характеризует вероятность принятия правильного решения в ситуации, когда нулевая гипотеза ложна Желательным свойство и(енности„кото ое озн йством критерия является свойство несмерое означает, что одновременно с условием (3.2) должно выполняться условие %'(Р) )а, ЧР е= Н,.
(3,3) Другими словами, несмещенность критерия озн ачает, что вероят- ность отвергнуть нулевую гипотезу, когда она истинна, не и еа, и в то же время если вышает заданного уровня значимости а, гипотеза Нь ложна, то она отвергается с ве роятностью, оль, б. В ычисление функции мощности критерия — т р †трудн задача, д ого требуется знать распределение статистики кри- терия не только при нулевой гипотезе, но н прн альтернативах.
оэтому функцию %'(Р) удается найти далеко не во всех случаях. В заключение отметим, что важным показателем ем каждого крия трудоемкость практической реализации соответ- ствующего алгоритма. На практике, когда требуется быстро по- лучить ответ, предпочтение нередко отдается просто реализуемому критерию, даже если он не является оптимальным в тео е и смысле. П о емонст и оретическом р д трируем общую методику построения критериев согласия на и име а гипотез. р .
р х решения задач проверки описанных выш е 4 3,2. Проверка гипотезы о виде распределения у — ( „..., Х„) — выборка из распре- П сть Х=гХ, ... ия ($) с неизвестной функцией распределения Р (х), о которой выдвинута простая гипотеза Н„: Р,'х) = Р х . известными к иге иями п ритериями проверки этой гипотезы являются критерий Колмогорова и критерий х».
чаях, когда ф нк ия Р Е Критерий согласия Колмогорова. Его применяют в тех слуляется величина фу ция (х) непрерывна. Статистикой критерия яв- (ЗА) У;= У,(Х)= зпр ! Р„(х) — Р(х)1, — тих« представлякяцая собой максимальное отк лонение эмпирической функции распределения Р„(х) от гилотетнчес ой ~ к й функции распре- Р(х). ри каждом х величина Р (х) является оптималь- ной оценкой для Р(х) (см. замечание к теореме (2.2)1 1 и с увели- поэтому, по к айней м ъема выборки и происходит сближение (х) Р р . ере прн больших и., в тех случаях, когда не „х с (х), гипотеза Нь истинна, значение 'В не критерия, основанного иа ста ться от нуля. сюда следует, что критическую облает статистике Ы„, следует задавать в виде ть »а= ~ ~~а) Ос енностью статистики Я' являетс я то, что ее распределерн гипотезе Н, не зависит от вида функции Р(х). Действи- тельно, полагая в формуле (3.4) к = г-! (и), 0 .= и =--..
1, где Е-' (и)— функция, обратная к Е(х), получаем 'р„=- гцр нб»(Е '(и)) — и). с ° =.! ' Перейдем к новым случайным величинам, используя формулу (!',==Е(Х), !'=-1, ..., и;.пусть (/,1,== ...=.--. (!,ю — пх зариаццоипый ряд. Функция г" (х) монотонна, поэтому У,в!»=Е(Л „,], А:..: -= 1, ..., н, и неравенства Е-1(и) и» Хч эквивалентны перавецсггап и =--(/,г!.
Но тогда из представления (1.5) имеем » Е»(Г-'(и)) = - гг' е(г"-!(и) — Х,„!)= — гг' е(и — Бои)=Ф„(и). г =.! ч =-! Независимо от вида функции Г(х) (если точько Е(г) непрерывна) Ж(Н1) =.Н(0, !) и Ф»(и) — эмпирическая функция распределения для выборки из равномерного Л1(О, 1) распределения.
Таким образом, статистика гЗ» совпадает с зцр !Ф„(и) — и! и. следоаач(н(! тельно, ее распределение не зависит от Е(х) (если справедлива гипотеза Нч). Этот факт имеет принципиальное значение, так как тем самым достаточно вычислить и протабулировать распределение %, только один раз, а именно для выборки из равномерного Н(0„1) распределения, и использовать ее для проверки гипотезы относительно произвольной непрерывной функции распредеЛения г' (х).
Вторым замечательным фактом является то, что распределение статистики Ы„при достаточно больших и (уже при н-~20) практически от и ие зависит и имеет указанный вид (1.8). Отсюда следует, что при и~20 критическую границу ! =1 (а) можно полагать равной ) ))~п, где К(Л,) =1 — а (функция К(Г) определена в (!.8ф Действительно, в этом случае Р (Я~„~ -7-,.„! Н,) = Р () п.ю. ~)„! Н,) = 1 — К ().ч) = а. Тач, 7 ="1,3581 при !х=0,05 н Х =1,6276 при а=0,01. Таким образом, при заданном уровне значим!эти а часло ).ч определяют из соотношения К(Л») =-! — и и в этом случае правило проверки гипотезы Н, имеет (при и .20) следующий внд: если наблюдав!несся значение С =.'У„(х) сглатистики (3.4) удсвлепморяет неравенству )1 п 1~)-, то гипотезу Нч отвергают; в противном случае делают вывод, что статистические данные не противоргч!ат гипотезе.
Следуя этому правилу, можно ошпбочно отклонить гипотезу Нм когда она верна, с вероятностью, приблизительно равной а. Это правило называется критерием согласия Колмогорова. Для небольших значений и точное распределение Яг„также прогиб) лировано и для расчета точных значений критической границы Г„[10, с. 6111 можно воспользоваться соответствующими таблицами. 2. Критерий согласия хи-квадрат К. Пирсона. На практике вычисление статистики „— трудоемкая задача, поэтому часто применяют другой критерий, называемый критерием 2'.
Его можно использовать для любых распределений, в том числе и многомерных. Чтобы воспользоваться этим критерием, выборочные данные предварктельно группируют, как это описано в п. 2 $ 2.5, т. е. переходят к частотному представлению исходных данных. Пусть ч! =- (ч„..., чн) — вектоР частот попаданиа выбоРочиых точек в соответствующие интервалы группировки Ь„..., Ем (ч,+... . +чн — — и) и рч=(р,', ..., р."ч), где р,"=Р(,' е-=Ф, (Нч), 1=-1, ...
..., Л!. В этом случае е (ч, Н,)=М(н; р') и гйпотеза Н, сводится к гипотезе о тоы, что вероятности полиномнальиого распределения построенного вектора частот т имеют заданные значения рь ) = 1, ..., Н. В качестве статистики, характеризующей отклонение выборочных данных (т. е. частот »,) от соответствующг!х гипотетических значений (в данном случае от средних Е (су!!Н,) =ар",), принимают величину н н Х»= Х»(ч) = ~г (т! !!Р)) ) (цр1!) = „~~ т) ) (пр1) — и, (3 5) г=! П Используя формулу н! а'+" +а')" = .Х г !л:а ! а", ...а"„и яг а,+...ч вн=» (здесь суммирование производится по всем' целым неотрицатель- ным значениям (Л„..., Лн), удовлетворяющим условию Л,+...
...+йн=п), получаем, что характеристическая функция вектора ч=(ч„..., чн) при гипотезе Нч имеет вид Ее"" =(реи +... + рчеин)", 1 = (г!, ..., 1,). Введем нормированный вектор т* = (ч",, ..., тй), = (ч,— пр";)~)~п, 1=1, ..., Л!. Имеем где М %,111-Е '"- '»'" (11-» р!! "! ' — 1!) . !=1 а критическую область задают в виде сг 1,= г!Г~! ). Точное распределение Ж(Х»'! Н,) неудобно для вычисления (при заданном уровне значимости) критическая границы Г„, но для болыпих объемов выборок и статистика Х„' имеет при гипотезе Н, простое предельное распределение, не зависящее от гипотезы (т.
е. от чисел р,"). Справедливо следующее утверждение. 1 Теорема 3.1. Если 0<р,"(1, 1'=1... М, то нри п-»оо 'ю (Х» ! Но) ! К (Л1 1). Логарифл!ируя это соотношение и применяя формулу 1п(1+в) = е — г»/2+0(е»), е- О, получаем, что при и — ».с»» и ~1( «с(оа к 1п<р,(1) = — !"7 и 1'р'+ и ~~~~~ р,'(а/'"" — 1/— /=! — У р"Р+ — ~ У рд/) +О/' —.'! = — — 1'Х1+О/ — '1, 1=1 1=1 1 р1(1 — р,') прн /=й, где Х=)о/»11' и и/»=»( 3, „.
Отсюда следует, ~ — р»р» прн /чь/г. что предел характеристической функции вектора ч' есть ехр ( — (1/2) 1'Е1) — характеристическая функция нормального за- кона е:Ф" (О, Х). По теореме непрерывности для характеристиче- ских функций отсюда имеем Х(т" 1Н»)-» « / (О„Х) при и — »-оа. Матрица вторых моментов Х предельного распределения вырож- дена. (Это является следствием того, что компоненты вектора т* ю» «~г Г«».) г р~ 1 (У вЂ” 1)-га порядка матрицы Х(У вЂ” 1)=/а/»11 уже отличен от нуля. Таким образом, предельное распределение подвектора ч» (У вЂ” л).я» (т1,, ч~~ !) является уже йевырожденным нормайь- ным законом «р'(О, Х(У вЂ” 1)). Отсюда по теореме 1,9 следует, чта прн и-1-со ® =~ (У вЂ” 1)Е "(У вЂ” 1)т (У вЂ” 1)!Н«)-'Х~(У вЂ” 1).
(3,6) С другой стороны, из формулы (3,5) имеем И-1 х„= ~ —,(,))»= ~,(,/)»+, (,,;+.,+,7,,) 1=! /=! ч* (У вЂ” 1) Ат«(У вЂ” 1), » ! ( 1/р)+1/рм при /=й, где А = 1а/» ), и а/» = ~, . Непосредственной ~ 1/рм при /Фй. проверкой убеждаемся, чта АХ(У вЂ” 1)=Е(У вЂ” 1) А=Ем-ь т.