XVII Математическая статистика (1081432), страница 26
Текст из файла (страница 26)
В отличие от критериев Колмогорова и ыз критерием Хз при небольших объемах выборки и пользоваться нельзя. Более того, для удовлетворительиой аппроксимации распределения случайной величины Хз(Х„) распределением Х~ необходимо, чтобы не только и было велико, но и все величины прь, й = 1, г, также были немалыми. На практике при небольших г необходимо, чтобы выполнялись условия ирь > 10, й = 1, г, а если г велико (г > 20), достаточно, чтобы было прь > 5, Й = 1, г. Поскольку теорема Пирсона носит асимптотический характер, то критаеРиа Хз является асимптаотически непараметприческим.
Критерий Хз можно использовать и тогда, когда случайная величина Х непрерывна или дискретна, но принимает счетное множество значений с положительными вероятностями. 216 л. ПРОВеРкА иепАРАметРических ГипОтез В этом случае множество М возможных значений Х разбивают на г непересекающихся подмножеств Мл, 1=1,г, таким образом, чтобы вероятность рю Й = 1, г, попадания случайной величины Х в й-е подмножество Мл удовлетворяла условию прь > 5 или нрь > 10, Й= 1, г.
Если Х вЂ” непрерывная случайная величина, то в качестве Мя, Й = 1, г, обычно берут множества вида ( о" ~гл1)1 (ем ля)~ ° ~ 1~ь-за-1)~ (лг язоо)з где л1 < ля « ... л„ы ля 6 К, Й = 1, г-1. Определим дискретную случайную величину Х', принимающуюзначение й тогда и только тогда, когда ХЕ Мя, й=1,г. В этом случае исходная задача проверки статистических гипотез сводится к проверке основной гипотезы (5.7) при альтернативной гипотезе (5.8), где в случае непрерывности случайной величины Х ряо ого(~) ро(1) ~1~ вероятность попадания случайной величины Х в множество Мя в предположении, что функция распределения случайной величины Х есть го(~), а плотность — ро(1). Если Х— дискретная случайная величина, имеющая счетное множество возможныхзначений Ям ля, ...
и Р(Х= л )=ду >0,1=1,2, ..., то вместо проверки гипотезы Но. ду = д1о, я = 1, 2, ..., где дуо, у = 1,2, ..., — известные числа, при альтернативной гипотезе Н1. 'существуют такие у, что д ф. д.о, у = 1, 2, ..., 217 5.д. Критерии согласии. Пдоостаа гипотеза проверяют гипотезу (5.7) при альтернативной гипотезе (5.8), где вероятности рло, Й = 1, г, вычисляют по формулам рьози ~~~ 5о к=1 г. з> ЕМз Пример 5.3. Среди элементов выборки Удооо дискретной случайной величины Х значение 0 встретилось 343 раза, значение 1 — 372 раза, значение 2 — 201 раз, значение 3 — 68 раз, а значения, ббльшие или равные 4, встретились 16 рзз.
Проверим на уровне значимости о = 0,05 гипотезу Но о том, что наблюдаемая случайная величина имеет распределение Пуассона с параметром А=1, т.е. л" Р(Х=й)= — е ~, 1=0,1,2, Предполагая истинность основной гипотезы Но, находим род = Р (Х = О) = 0,368, роз = Р (Х = 2) = 0,184, роя = Р (Х > 4) = 0,019. роз — — Р (Х = Ц = 0,368, род = Р (Х = 3) = 0,061, Заменим случайную величину Х, принимающую бесконечное число значений, случайной величиной Х', принимающей Далее для выборки х„находят число оь(Уо) ее элементов, принадлежащих множеству Мь, й = 1, г.
Затем, подставляя Уо вместо Хо в фоРмУлУ (5.9)> опРеДелают Реализацию Хз(Ы„) слУ- чайной величины Хз(Хо). Гипотеза Но отклоняется в пользу гипотезы Нд, если Хз(Уо) > Хд (г — 1) и принимается в противном случае. Недостатком использования критерия Хз для случайных величин, принимающих бесконечное множество значений, является некоторая потеря информации при переходе от Х к случайной величине Х' с конечным числом значеняй. 218 а НРОВеРкА непАРАметРических ГипОтез только пять различных значений О, 1, 2, 3 и 4 с положительными вероятностями рщ —— 0,368, рге —— 0,368, рзе — — 0,184, р4е — — 0,061 и ряо = 0,019 соответстненно. По формуле (5.9) для г = 5, и = 1000 получаем (343 — 0,368. 1000)г (372 — 0,368.
1000)г 0,368 1000 0,368. 1000 + + + 201 0 184.1000)г (68 0~061.1000)г (16 0 019.1000)г 0,019. 1000 0,184-1000 0,061. 1000 = 1,6984+ 0,043+ 1,5706+ 0,8033+ 0,4737 = 4,58. По таблице квантелей Хг-распределения (см. табл. П.3) находим Хвгяя(4) — 9,49. Так как 4,58 < 9,49, то гипотеза Нв пРинимается. 5.2. Критерии согласия. Сложная гипотеза Критерии Колмогорова и юг для сложной гипотезы. Задача проверки простой гипотезы о виде закона распределения случайной величины Х на практике встречается довольно редко. Гораздо чаще бывает необходимо проверить по случайной выборке Х„из еенеральной совокупности Х сложную гипотезу о принадлежности функции распределения Г(Ф) случайной величины Х заданному параметрическому множеству распределений (Г(1;В), В е Щ, сг С К~: Но. 'Г(г) = Ро~~;В), В е 9.
Кажется естественным сначала каким-то образом построить оценку В(Х„) параметра В, а затем применить критерии Колмогорова и ыг для пронеркн еипотезы Но г (г) — гоЯ В(зн)) > где В(х„) — значение оценки В(Х„) по данным выборки У„. К сожалению, при таком подходе эти критерии уже не будут о.2. Критерии согласил. Сложиав гипотеза 219 иепараметричесхими — при гипотезе Но распределение моди- фицированных сгпатистпих В(Х„) и мз(Х„), где Ь(т„) = епр~Р'„($) — Го(Ф;д(У„))), 1 1 - 21 — 1з (гн) з + ~~~ (рО(г(«1«д(ин)) ) « «ю1 вообще говоря, зависит от го и от метода нахождения оценки д(Х„), что требует составления большого количества таблиц распределений.
Однако если д(Х„) — оиенхи максимального правдоподобия параметра д, а элементы Г(е;д) параметрического множества (г'(8;д), д е Щ функций распределений получаются при помаши преобразования сдвига и масштаба какого-нибудь одного своего представителя Г(е; до), т.е. то для критериев Колмогорова и ыз достаточно иметь только одну таблицу для каждого семейства. К таким семействам относятся все важные типы распределений, и, в частности, нормальное. Более того, при небольшой модификации статистик 0(Хн) и мз(Хн) их распределение при и ) 5 практически перестает зависеть" от п.
Критерий уз для сложной гипотезы. Пусть функция распределения дискретной случайной величины Х, принимающей конечное множество значений им ..., и„, зависит от И-мерного вектора параметров д. Тогда вероятность рь того, что Х примет возможное значение иы зависит от д, т.е. рь = рь(д), й = 1, г. А так как вероятности р1(д), ..., р„(д) полностью определяют функцию распределения случайной величины 'Сил Тюрин Ю.Н., Макаров А.А.
220 а ПРОВЕРКА ПЕПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ Х, то в рассматриваемом случае основная еипоп~езе принимает следующий вид: Не. РгХ=иь=рЩ, 1=1,г, дбОС1ь". Эту сложную гипотезу можно проверить при помощи модификации критерия Хз Пирсона. Пусть а(У„) — значение оценки д(Х„) максимального правдоподобия для д, а тц,(я"„] — количество злементов выборки я„, равных иь, й = 1, г, Оценку О(Х„) получают в результате минимизации логарифма функции правдоподобия г 1(Х;д) = „, „, Пру" М"1(Р), Еп*(Х ) = /с=1 как (см. (3.2)) решение системы уравнений пь(Х„) дрь(д) „~ рь(е) дд1 Можно показать', что при некоторых предположениях о гладкости функций рь(б), й = 1, г, распределение случайной величины при и-+ со (п; (Х„) — пр; (д(Х„))) Х (Х)=у, пр;(д(Х„)) слабо сходится к случайной величине, имеющей Хз-распределение с г — И вЂ” 1 степенями свободы.
Если Х вЂ” непрерывная случайная величина с функцией распределения г (1), то, разбивая множество возможных значения Х на конечное число непересекающихся подмножеств и переходя к дискретной случайной величине Х', можно проверить сложную гипотезу Не. 'Р(1) Е (Г(Ф; В), д б О С К ). 'Сма Крамер Г.
я.г.кр р . с 221 Двухвыборочная задача. Критерий Смирнова. Пусть Х =(Хм ..., Х ) нУ„=(Ум ..., У„) — случайные выборкннз генеральных совокупностей Х н У с функциями распределения г'(е) н С(е) соответственно. Рассмотрим задачу проверки сложной гяпотезы (5ЛО) Но: Г(1) = б(1), 1 б 1й, против альтнернашивной гиноенезм Нь. Г(е) ф ся($) для некоторых Ф б К. (5Л1) Для непрерывных случайных величин Х н У гипотезу Но против альтернативной гипотезы Н1 можно проверить, воспользовавшись статистикой О(11, У„), реализация которой определяется формулой В(х,у„) =впр~Г (г) -С„(Ф)~, (5Л2) где Г (е) н С„(Ф) — зленирические функции раснредглениц построенные по реализациям х н у„случайных выборок Х,„н У„соответственно. Если нстннной является основная гипотеза Но, то, согласно закону больших чисел, для любого 1 б И 'См:.
Крамер Г. Необходимо только помнить, что оценку максимального правдоподобня В(Х„) следует строить не по наблюдениям Хм ..., Х„случайной величины Х, а по значениям частот п|(х'„), ..., п„(х'„) случайной велнчнны Х', что, как правнло, гораздо труднее. Построение такой оценки для наиболее распространенных параметрических семейств распределеннй (нормального, экспоненцнального, пуассоновского н т.д.) можно найти в специальной литературе'.