А.Н. Бородин - Элементарный курс теории вероятностей и математической статистики (DJVU) (1115320), страница 25
Текст из файла (страница 25)
е. справедлива гипотеза Нз, или заключить, что г"(х) не совпадает с го(х), т. е. справедлива гипотеза Н1. Поскольку наблюдения случайны, то абсолютно достоверно такие утверждения сделать нельзя. Прн любом естественном подходе есть положительные вероятности того, что мы примем гипотезу Не, когда она на самом деле не верна, илн, что мы примем гипотезу Н1, когда она не является верной.
Пусть а — некоторое наперед заданное малое положительное число. Мы хотим указать такое правило (критерий), которое бы по наблюдениям выборки Х1,Хз, „Х„отвергало гипотезу Но при условии, что она МАТЕМАТИЧЕСКАЯ СТАТИСТИКА на самом деле верна, с вероятностью а или близкой к а для больших и. При этом правило следует выбирать таким, чтобы вероятность принять гипотезу Но при условии, что верна гипотеза Ни была бы как можно меньшей. Определение 1. Вероятность а отвергнуть гипотезу Не при условии, что она верна, называется вероятностью ошибки первого рода. Вероятность ошибки первого рода также называют уровнем значимости критерия. Определение 2. Вероятность принять гипотезу Но, при условии, что верна гипотеза Ны называется вероятностью ошибки второго рода.
Вероятность ошибки второго рода будем обозначать,9. Посольку при фиксированном объеме выборки вероятности этих ошибок одновременно сделать достаточно малыми нельзя, то а задают заранее, а 11 при уже выбранном а стараются сделать как можно меныпе. Пусть Р„(х) — эмпирическая функция распределения, построенная по выборке Х, т. е. Р'„(х) = — ~ ~" 1 31 „,1(Х~). Положим В„(Х) = ~/в п1ах )Е„(х) — го(х)~. зе(-оо,оо) Поскольку Р'„(х) при больших и является хорошей оценкой г'(х) — истинной функции распределения случайной величины Х, то функция О„(Х) является мерой различия между истинной функцией распределения Р(х) и предполагаемой го(х). Функция 0„(Х) называется статистикой Колмогорова.
Согласно теореме Колмогорова (з 18), если г'(х) = го(х), т. е. при условии, что верна гипотеза Не, справедливо РЯ„(Х) < х) ш УС(з), где )С(г) — функция распределения Колмогорова. Лля функции Цх) есть таблицы и по заданному малому числу а можно выбрать г1 так, чтобы А.(г1 е) = 1 — а (х1 е является квэнтилью порядка 1 — а функции распределения )С(з)), Определим следующее правило, которое называется критерием согласия Колмогорова: если О„(Х) < х1 е, то принимаем гипотезу Не, т.
е. считаем, что г' = Го, а если 23. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 173 1)п(Х) ) х1 и, то принимаем гипотезу Н1, т. е, считаем, что г' )Е го. При тавом правиле вероятность отвергнуть гипотезу Но, при условии, что она верна, есть Р(Рп(Х) ) х1 и)» и согласно теореме Колмогорова Р(Рп(Х) ~~ хд а) = 1 — Р(0п(Х) < х1-а) А1 1 — У (х1 и) = й. Таким образом, первое требование выполнено: вероятность ошибки первого рода для данного правила при больших п приблизительно равна а.
Предположим теперь,что г"3Его» т. е. верна гипотеза Н1. Тогда в силу того, что 1»'„(х) -» г"(х) равномерно по х Е (-оо» оо) (теорема 1 3 18), имеем шах )гп(х) — Го(х)( -+ шах Щх) — го(х)~ ) О. пе(-по,о») и»'» по(-0»,0») Поэтому В„(Х) -+ со, и, следовательно, для любой константы с Р(Р„(Х) < с) — О, ВОЗЬМЕМ В КаЧЕСтВЕ С ВЕЛИЧИНУ Хд и. ТОГда ИМЕЕМ ,В = Р(0п(Х) < хд-~) -~ О При Г 3Е гц, величина,О равна вероятности принять гипотезу Но при условии, что верна гипотеза Н1, т. е.
ф — вероятность ошибви второго рода. При больших в величина ,9 становится все меньше и меньше. Тем самым выполнено и второе требование о том, что величина б должна быть как можно меньшей при выбранном а. Перейдем к изложению другого подхода, при котором по- иному ставится н решается вопрос о равенстве функвмй распределения. Пусть нас интересует не вся фунвшоя распределения, а лишь ее приращения на некоторых выделенных интервалах, При этом вопрос о совпадении функции распределения с наперед заданной функцией заменяется, естественно,на вопрос о совпадении приращений функции распределения с соответствующими приращениями заранее выделенной функции.
Заметим, что для дискретных распределений в качестве выделенных интервалов можно взять интервалы постоянства функвии распределения. Тогда приращения функции распределения на них полностью характеризуют закон МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 17Я распределения. В етом случае задача становится аналогичной предыдущей, однако метод решения будет принципиально отличным. 2. Критерий согласия Пирсона(хи-квадрат критерий). Предположим, что вещественная прямая разбита на г непересекающихся интервалов Ьц! = 1,2,..., г, т.
е. Я Ь| = = ( — оо,со), Ь; П Ь! — — Э. ~ас интересует не вся функция распределения Р(з) случайной величины Х, а только набор вероятностей р~ = Р(Х Е Ь|), ! = 1,2,...,7. Задача состоит в следующем. Пусть задан набор вероятностей р~ ° ! = 1>2,..., г, таких, что ~ ~ 1р,' = 1. Обычно р~ — — Р(Х' Е Ь~), где Х' — случайная величина с каким-нибудь известным распределением.
Мы хотим знать, совпадают ли вероятности рп отвечающие наблюдениям выборки Хи Хз,..., Х„, с вероятностями р~ или нет. Обозначим символом Но гипотезу о том, что р~ = р~ при всех ! = 1, 2,..., г. Символом Н1 обозначим противоположную гипотезу о том, что р~ ф р~ хотя бы для одного !. Пусть ХиХз,...,Х„- выборка, отвечающая случайной величине Х. Определим правило, по которому мы будем принимать или отвергать гипотезу Но.
Обозначим через И = = ) ! Йа,(Х!) число тех наблюдений Х1, которые принадлежат интервалу Ь~. Поскольку Е(яя,(Х!)) = Р(Х! Е Ь|) = = р~, то по закону болыпих чисел — - р~ по вероятности. И Поетому — является хорошей оценкой для рь Положим и а Функцию сЪ„(Х) называют статистикой Пирсона или етз~- тистизкзй Хз (хи-квадрат) с г — 1 степенью свободы. То, что мера различия между истинными вероятностями р~ и предполагаемыми р~ имеет именно такой вид, продиктовано желанием иметь хорошее предельное распределение для величины Ь„(Х). Справедлив следующий результат, который приводится без доказательства.
23. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 225 Теорема (Пирсона). Пусть рь = рь при всех1= 1,2,...,г, т. е. вмполнена гипотега На. Тогда справедливо слсдувщее соотношение авр )Р(г3„(Х) < г) — Р„ь(г)~ - 0 «е(е,а«) при и -+ со, где Р, ь(г) — так наэмваемое распределение Пирсона с г — 1 стспеньв свободм. Ялх любого целого неотрицательного й распределение Рь(х) опрсдглягтсв плотностьв хЫь-2)/ге- 12 п их >О е, прае >О, (О, при х < О, где Г(1) = 1' х' ье Йх — гамма функцгая. о При целых и для гамма-функции выполняются равенства Г(я+1) = п), Г(п+ -) = 1 3 ° 5 (2п — 3)(2п — 1)~г«т2 ".
2 Лля распределения Пирсона существуют таблицы. По заданному значению а можно определить такое число гь (квантиль порядка 1 — о),что Р„ ь(гь о) = 1 — е. Определим следующее правило, которое называется критерием согласия Пирсона или критерием хн-ква,щьать если Ь„(Х) < гь, то принимаем гипотезу Не, т. е. считаем, что рь = рьь для всех 1= 1,2,...,г, если Ь„(Х) ) гь то принимаем гипотезу Ны т.
е. считаем, что рь ф рьь при некотором 1. При таком правиле вероятность отвергнуть гипогезу Не при условии, что она верна, равна Р(Ь„(Х) ) гь ), и согласно теореме Пирсона Р(Ь„(Х) >~ гь ~) =1 — Р(Ь„(Х) < г, ) ге 1 — Р,,(г, ) = о. Таким образом, вероятность ошибки первого рода приблизительно равна о. Предположим теперь, что рь уа рьь для какого-нибудь 1, т. е. предположим, что верна гипотеза Нь.
Тогда, поскольку в силу закона больших чисел — - рм име«а ем (и — Рт)' („, — рт)г > О, МАТЕМАТИЧЕСКАЯ СТАТИСТИКА "1 та и, следовательно, в и З ,( Р~) р~ о Тем самым, при выполнении гипотезы Н| имеет место соот- ношение Ь„(Х) — оо. Поэтому Р(Ь„(Х) < г1 ~) - 0 при и- оо. Положим 8 = Р(Ь„(Х) < з1 ) — вероятность принять гипотезу Но при условии, что верна гипотеза Н1 . Тогда с ростом в вероятность ф стремится к нулю. В результате оба требования, предъявляемые к критериям согласия, выполнены. Задача 1. Через равные промежутки времени в препарате регистрируется число микробов, попавших в поле зрения микроскопа. В результате наблюдений получены следующие данные: 0 1 2 3 4 5 6 7 И 112 168 130 68 32 5 1 1 В первой строке приведено число микробов, а во второй строке — число моментов времени, соответствующих наблюдению ровно )микробов.
Проверить, используя критерий хи-квадрат, что с вероятностью ошибки первого рода а = 0.05 число микробов, попадающих в поле зрения микроскопа в любой момент регистрации, распределено по закону Пуассона с математическим ожиданием Л = 1.5. Решение. Пусть Х. — неотрицательная случайная величина, равная числу микробов, регистрируемых за т'-й промежуток времени. Считаем величины Х3,у = 1,2,..., п, независимыми и одинаково распределенными. Общий объем выборки равен в = Я~ о И = 517.