XVII Математическая статистика (1081432), страница 25
Текст из файла (страница 25)
уровне значилюсти о, если Р(г„) > Р1 где Р1 — квантиль уровня 1 — о распределения случайной величины Р(Х„) при условии истинности основной гипотезы Но. Если же Р(г„) < Р1 то делается вывод о непротиворечивости (согласии) статисти- ческих данных гипотезе Но. 'А.Н. Колмогоров (1903-1987) — крупнейший советский математик, один иэ соэдвтелей теории вероятностей. основана на статистике Р(Х„), реализации Р(г„) которой определяют по формуле ИЛЬ Критерии согласил.
Простая гипотеза 209 Разобраться в сути этого формального определения можно при помощи следующего нестрогого рассуждения. Согласно теореме 1.1, случайная величина Г[(;Хк) — Го((), где Г((;д„)— выборочная у(уннцил раснределениц для любого ~ в случае истинности основной гипотезы Не стремится к нулю при и -+ оо, а в случае истинности альтернативной гипотезы Н( — к величине Г(е) — Ге(1), которая для некоторых значений ~ может быть отлична от нуля. Поэтому при и-+ со случайная величина Р(Х„) стремится к неслучайной величине апр[Г(Ф) — Ге(()~, ко( торая в случае истинности основной гипотезы Но равна нулю, а в случае истинности альтернативной гипотезы Н( является положительной величиной.
Следовательно, если для сп(атистическит данныя, представленных выборной я"„, случайная величина Р(Х„) приняла „достаточно большое" значение, то гипотезу Не естественно отклонить в пользу гипотезы Н(, а если Р(Х„) приняла значение, „близкое к нулю", то гипотезу Не следует принять. Оказывается, что при истинности основной гипотезы Не распределение случайной величины Р(Х„) не зависит от Ге(8) (хотя зависит от обьел(а выборки и), что чрезвычайно важно для вычисления квантилей случайной величины Р(Х„), поскольку не нужно составлять отдельные таблицы значений функции распределения статистики Р(Х„) для каждой функции 'Го((), а можно обойтись всего лишь одной таблицей. Это свойство вытекает из приводимой без доказательства следую(цей теоремы'.
Теорема 5.1. Пусть В(1,Х„) — выборочная функция распределения, построенная по случайной выборке Х„объема и из генеральной совокупности с равномерным законом распределения на отрезке [0,11. Тогда при истинности Не функция распределения случайной величины Р(Х„) совпадает с функ- *Сна Ивченко Г.И., Медеедеа Ю.И. 210 а. ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ цией распределения случайной величины явр ~Л(1,Х„) — Г).
ф~ о<г<г Из теоремы 5.1 следует, что для проверки гипотезы о виде распределения достаточно составить таблицы значений функции распределения статистики Р(Х„) только для случайной выборки Х„из генеральной сонокупности Х с равномерным законом распределения. Для и < 100 такие таблицы существуют". При больших и для вычисления квантилей Рг уровня 1 — о следует использовать приближенную формулу, которая основана на доказанном А.Н. Колмогоровым предельном соот- ношении 1пп Р(ъ~иР(Х„) < г~ = К(1), 1 > О, где К(ь) Ч~~ ( 1)в -2ХаР (5.4) Это соотношение справедливо при истинности основной гипо- тезы Но. Из него следует, что если и достаточно велико, то ь!-а Р1 -в где величина 11 „определяется уравнением К(гг ) = 1 — о.
г1 1 — 11 Р(х„) = шах ~ — — Ро(х(г1), Ео(х(г)) — — ~, (5.5) 1<г<в и и *См.: Большев Л.Н., Смиривв Н.Б. "См. там ме. Подробные таблицы значений функции К(1) приведены в литературе*'. Как показывает практика, приближением с по. мощью функции К(1) можно пользоваться уже при и > 20. Для вычисления значений Р(х„) статистики Р(Х„) удобна формула 211 о. Ь Критерии еогяеояя. Простои гипотеза которую можно также записать в виде О(х„) = птах (~Ее(х01) — — ~+ — ). Здесь х01, т = 1, и, — члены еариаиионнаго ряда, построенного по выборке хт, ..., х„. Пример 5.1. Для выборки хта объема 10 с элементами — 0,29; 1,09; 1,06; -0,91; -0,12; -1,20; 0,16; 1,22; -1,15; 1,29 1 Г ге(т) = — / е з ~Ь.
ч/2~г В качестве альтернативной возьмем гипотезу (5.2). Вариационный ряд х(0, ..., хре) выборки хте будет иметь вид -1,20; -1,15; -0,91; -0,29; -0,12; 0,16; 1,06; 1,09; 1,22; 1,29. Значения функции распределения ге(т) в этих точках равны 0,115; 0,125; 0,181; 0,386; 0,452; 0,564; 0,855; 0,862; 0,899; 0,901. Вычисляем значения функции — ' — Ее(х(0) при г = 1, 10 и в = 10: — 0,015; 0,036; 0,075; -0,155; 0,119; — 0,062; 0,014; 0,048; 0,001; 0,099, на уровне значимости о = 0,1 пронерим гипотезу Не о том, что эта выборка является реализацией случайной выборки Х„из генеральной совокупности Х, имеющей стандартное нормальное распределение. Это распределение, согласно (5.1), имеет функцию распределения 212 Л.
ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ В вЂ” 1 и значения Ге(х10) — — при тех же 4 и и: -0,019; 0,086; 0,052; 0,162; 0,089; 0,001. 0,115; 0,025; 0,064; 0,255; Наибольшим из этих чисел будет 0,255. Значит, В(ЕПо1) = = 0,255. По таблице квантилей статистики" Р(Х„) для и = 10 и о = 0,1 находим Вз ~ — Вез = 0,369, Так кзк В(я1о) ( Во,я, то оснований отклонить гипотезу Но нет. 2 1 1 2$ — 1 2 (Х„) = —, + -',1 '(К,(Х,0) - — ), (5.6) юи1 где Х10, 1= 1, и, — элементы вариационного ряда случайной выборки Хз, ..., Х„. Основная гипотеза (5.1) отклоняется в пользу альтернативной гипотезы (5.2) на уровне значимости а, если 2(я )~ 2 где ыз — квантиль уровня 1 — о распределения статистики мз(Х„) при условии истинности гипотезы Не.
Так же как и для критерия Колмогорова, можно доказать, что распределение статистики ыз(Х„) при истинности основной См.: Бооьеиеа ХН., Смирное Н.В. Критерий шз. Из равенства (5.3), задающего статистику Р(Х„), следует, что критерий Колмогорова „хорошо различает" функции распределения Г(1) и Ге($), отличающиеся друг от друга достаточно сильно пусть даже на небольшом интервале. Если же число япр ~Г(Ф) — Го(Ф) ~ невелико, но Г(1) ф Ге(1) на дою статочно большом промежутке, то можно показать, что для проверки гипотезы (5.1) при альтернативе (5.2) целесообразно использовать так называемый мрвпзервй соз (омега-квадрат), использующий статистику 218 Б.Ь Критерии согласия.
Простая гипоееэа гипотезы Не не зависит от го. Для малых и существуют таблицы* квантилей статистики 1оз(Х„). При больших и нужно пользоваться предельным распределением статистики яи з(Хо), для которого также составлены таблицы. Пример 5.2. Вернемся к задаче, рассмотренной в примере 5.1, но для ее решения используем критерий ь1з. С помощью формулы (5.6) найдем значение соя(х1о) статистики 1оз(Х„), используя значения го(х(0), я = 1, 10, вычисленные в примере 5.1: ы (х1о) = + — ~0>065~+0,125~+0,169~+0,064 +0,098 + 1 11 +0,086 +0,105 +0,012 +0,061 +0,149 ) ю 0,0114.
По таблицам распределения статистики ыз(Х„) для о = 10 находим ы1- — — 1оо,ев ы 0,046. з г Так как со~(х1о) < ыоз 95 то гипотеза Но на УРовне значимости а= 0,05 не отклоняется. с ',1 ря=1. еяя1 Р (Х = иД = ры й = 1, г, Допустим, что в выборке х„= (х1, тилось оа(х„) раз, й = 1, г. Отметим, ..., х„) число иь встрес что 2'пь(х„) = и, т.е. Ии1 'Сил Больяоее Л.Н,, Сиириоо Н.В. Критерий согласии Хз. При анализе критериев Колмогорова и ыз предполагалось, что Хо — случайная выборка объема и из генеральной совокупности непрерывной случайной величины Х.
Пусть теперь наблюдается дискретная случайная величина Х, принимающая г различных значений и1, ..., п„с положительными вероятностями р1, ..., р„: 214 5. ПРОВЕРКА НЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ случайные величины ё1(Х ), ..., и (Х„) зависимы. При этих условиях спранедлина следующая теорема'. Теорема 5.2 (теорема Пирсона). Распределение случайной величины — (ол(Х„) — Р ) я=1 при и-+ оо слабо сходится к Хз-распределению с г — 1 степенями свободы. ф Этой теоремой можно воспользоваться для проверки оросгноб еиаогнезы (5.7) Но: Р1 =Р1о, "° Рт =РЮ, где рщ, ..., Р„е — известные величины, против альтернативной гипотезы Нь.
"существуют такие й, что рь ф рле, й = 1, г. (5.8) Если истинной является гипотеза Не, то по теореме 5.2 прн п -+ оо распределение случайной нелнчины з(Х ) =Е( "( ") Ре) =ИЕ 1 " / (59) орле „Рье стремится к распределению Хз с г — 1 степенями свободы. Если основная гипотеза Не не является истинной, то в зтом случае по закону больших чисел при и -+ оо пь(Х„) -Фрь, й= 1, г.
*Доказательство теоремы сы:. Крамер Г. 215 Л.Ь Критерии согласив. Простав гиоотеэв Поэтому при п -+ оо пь(Х„) ~пь(Х„) — Рьо = ~ Риь + (Рь Рье) ~ Рь Рье- Следовательно, если Рв — Рье ф 0 для некоторых й = 1, г, то статистика Хз(Х„) принимает большие значения, чем в случае истинности основной гипотезы Не.
Таким образом, становится естественным следующее определение кривпери.я соеласи.в Хз (хи-квадрат). Этот критерий при больших и иа уровне значимости а отклоняет гипотезу Не в пользу альтернативной гипотезы Нм если Х~(я„) > Х1 ( — 1), где Хз1 (г — 1) — квантиль уровня 1 — а Хз-распределения с г — 1 степенями свободы, а Хз(х„) — реализация случайной величины (5.9). Если же Х (яо) св Х1- (' 1)1 то делается вывод о том, что гипотеза Но не противоречит статистическим данным и ее следует принять.