Учебник_Бочаров_Печинкин (846435), страница 51
Текст из файла (страница 51)
Проверка сгпамасгпипеских гипоаез деления статистики критерия Колмогорова) и прн увеличении объема выборки сходится к гсз-распределению. Поэтому уровень значимости критерия сх определяется по критическому значению С приближенной формулой се = 1 — А(С), где А(х) — функция шз-распределения (1, табл. 6.4а]. Если же задан уровень значимости о критерия, то критическое значение С практически совпадает с (1 — о)-квантилью и1 аг -распределения. з Практическая реализация критерия гсз происходит в той же последовательности, что и критерия Колмогорова: сначала по выборке Хн ...,Х„ определяется вариационный ряд Х,*,...,Х„', затем находятся Ро(Х,*) и вычисляется значение статистики агз н, наконец.
полученное значение ага сравнивается с критическим значением С и либо принимается, либо отвергается гипотеза Но. В литературе иногда критериями ге~ называют целое семейство критериев, основанных на интегральных расстояниях с различными весовыми функциями. Критерий Х~ (Пирсона). Критерий Хз является аналогом критерия ага для дискретной наблюдаемой величины Х, хотя и применяется как в дискретном, так и в непрерывном случае. Начнем с дискретного случая. Пусть наблюдаемая случайная величина Х может принимать только значения (Ьы...,Ьд) с неизвестными вероятностями дм..., дъ.
Основная гипотеза Но выделяет среди всех распределений случайных величин, принимающих значения (Ьм..., Ьъ), одно фиксированное распределение, для которого значения вероятностей дг известны и равны Рь Обозначим через иг (1 = 1,..., Т,) число тех элементов выборки Хн ...,Х„, которые приняли значение Ьь Поскольку в силу закона больших чисел наблюденная частота д~' — — и~(п с ростом объема выборки п стремится к вероятности дь мы должны признать гипотезу Но справедливой, если все д! мало отличаются от Рь Введем теперь статистику Х = Х (Х,,..., Х„) = ~- г (ю — пН) С одной стороны, эта статистика является мерой равномерной близости всех д; к Рн с другой стороны, как говорилось в параграфе 4 гл. 1, она асимптотически при п --г сю независимо от гипотетических вероятностей Р! имеет Хз-распределение с Л вЂ” 1 степенями свободы.
Таким образом, критерий Х~ предписывает принять гипотезу Но, если Х~ ( С, н отвергнуть, если Х~ > С, где С вЂ” критическое значение критерия. Из сказанного выше следует, что при заданном С уровень значимости се критерия Хв определяется приближенной формулой сг = 1 — Н(С), 24! оц Критерии согласия где н(х) — функция эгз-распределения с л — 1 степенями свободы (1, табл. 2.!а). Наоборот, если задан уровень значимости о, то критическое значение С примерно совпадает с (1 — а)-квантилью 61 Кз-распределения (1, табл. 2.2а]. При практической реализации критерия Ха нужно следить за тем, чтобы объем выборки был велик, иначе неправомочна аппроксимация Кз-распределением распределения статистики К~. Обычно считается, что достаточным условием для этого является выполнение неравенств и~ > 5 при всех 1; в противном случае маловероятные значения 1л объединяются в одно или присоединяются к другим значениям, причем объединенному значению приписывается суммарная вероятность (разумеется, уменьшается число степеней свободы при определении уровня значимости или критического значения С).
Следует отметить, что при п — оо критерий эсз асимптотически совпадает с параметрическим критерием для проверки основной гипотезы Но. 8 = Р (8 = (ды...,дь), Р = (Ры...,Рв)) против сложной конкурирующей гипотезы Н~. .8 ф Р, построенным по методу отношения правдоподобия, хотя эти критерии и основаны на совершенно различных идеях. В общем случае (не обязательно дискретной наблюдаемой величины Х) поступают следующим образом.
Сначала всю прямую разбивают на Ь непересекающихся интервалов (-оо,4), (аыдз),..., !дл нос). Затем определяют гипотетические вероятности Р~ =- Го(4) — Го(сй 1) попадания в интервал !и! н4) и числа и! элементов выборки, попавших в эти интервалы. Наконец, вычисляют значение статистики и сравнивают его с критическим значением С. Как и в дискретном случае, маловероятные интервалы объединяют. Разумеется, для того чтобы улучшить качество критерия КЯ (увеличить его мощность), необходимо уменьшать интервалы разбиения, однако этому препятствует ограничение на числа попавших в каждый интервал наблюдений.
При применении критерия Кз удобно пользоваться полигоном частот или гистограммой (см. параграф 3 гл. 1). Часто требуется проверить не совпадение теоретической функции распределения Г(х) с известной функцией распределения Го(х), а принадлежность Г(х) заданнолу паралетрическолу селейству Г(х;8) = Г(х;дн.,,, дь) функций распределения, зависящему от Й-мерного неизвестного параметра 8 = (ды..., ди), т.
е. разделить сложные непараметрнческие гипотезы Но. Г(х) Е (Г(х; 8)) и Н~ .- Г(х) ф )Г(х;8)). Для того чтобы воспользоваться вышеописанными критериями, нужно из семейства Г(х; 8) выделить ту функцию распределения Го(о;) =- Г(х; 8о), с которой уже и будет производиться сравнение эмпирической функции распределения Г(х) выборки Хы ...,Хи. 242 Гл. 3. Проверка сщащис>пи геских гипоаез Поэтому сначала, предполагая, что верна основная гипотеза Но, находят оценку 0* = (д*,, , д*) неизвестного векторного параметра 8, а затем, полагая 8о = 8; с помощью выбранного критерия согласия проверяют простую основную гипотезу Но.
'Е(з) = Ро(х) = с'(ха 0') против сложной конкурирующей гипотезы Н>, с'(х) ф нб(х) =. Е(хй8*). Ясно, что в качестве оценки 8" лучше всего брать такое значение параметра 8, которое доставляло бы минимальное значение статистике соответствующего критерия (см. параграф 5 гл. 2). Однако эти естественные оценки, как правило, весьма сложны в вычислительном плане, и поэтому обычно пользуются более простыми оценками (полученными методами моментов или максимального правдоподобия). Скажем еше несколько слов об уровне значимости критериев согласия при проверке сложной гипотезы Но.
с'(х) Е (с (х;О)). Вообще говоря, даже асимптотически при п, — оо уровень значимости критерия будет зависеть и от семейства е (х; 8), и от выбранной оценки 8*, и даже от истинного значения неизвестного параметра О. Обычно на практике для критериев Колмогорова и и> считают уровень значимости таким же, как и в случае простой гипотезы Но. При использовании достаточно «хороших» оценок (например, оценки максимального правдоподобия) истинный уровень значимости, как правило, будет даже меньше подсчитанного таким образом. Что касается критерия Хз, то для него при определении уровня значимости просто уменьшают число степеней свободы Х2-распределения на число неизвестных параметров )ъ Здесь мы делаем обратную ошибку: объявляем уровень значимости меньшим, чем он есть на самом деле, правда, обычно несущественно.
Отметим, что в последнее вре»т в специальной литературе появились работы, в которых выводятся асимптотические разложения уровней значимости (и латке мощностей прн «близких» гипг>тезах) критериев по степеням 1)„>п,, причем для некоторых критериев и типов распределений вычисляются также значения первых коэффициентов этих разложений. Пример 7 Проверим с помощью критерия Колмогорова гипотезу Но о том, что проекция Х вектора скорости молекулы водорода на ось координат (см, пример 1 из гл. 1) распределена по нормальному закону. Проверку произведем для уровня значимости о .= 0,05. Параметры нормального закона не заданы, значит, мы имеем дело со сложной гипотезой Но и сначала должны оценить среднее д~ н дисперсию д>.
Поскольку мы будем пользоваться критерием Колмогорова, хотелось бы оценки д*, н д; неизвестных параметров д> и д. выбрать таким образом, чтобы онн доставляли минимальное значение статистики критерия Колмогорова 2« — ! 11 р — —,,>и пгвх Ф(Х,*; д>, дг)— 2п 2п> где Х,*,..., Х,* — варнацнонный ряд выбоокн Хн.,,, Хп, приведенный в табл 3 гл. 1, а Ф(х, тш гте) = Ф((х — та))о ) — функция распределения нормального закона с параметрами п>,о. Однако искать минимум р как функции от д~ и д> — весьма сложная в вычислительном плане задача, так как Ф(х) даже не выражается в элементарных функциях. Поэтому в качестве оценок д*, и д.,* используем оценки максимального 5. Критерии согласия 243 правдоподобия д*, =- пт* =- 0,082 и д,* =- аз* =- 1,34 (см.
примеры 8 из гл. 1 и 15 из гл. 2). Теперь с помошью критерия Колмогорова будем проверять простую гипотезу Ня . Р(с) = Ро(м) = Ф(сид*,,д~) = Ф(оп0082,1,34). Вычислив сначала !';* =- (Х,* — д,*)/,уд,* и воспользовавшись равенством Ф(Х;;д;, дз) = ФНХ," — д;)г!хгдз ), последовательно находим затем значения Ф(!', ) (1, с. 112 — 1!7), Г,* = (21 — 1)Г(2п) и Я, = /Ф(У,*) — Р,* (табл.
2). Наконец, определяя значение статистики критерия Колмогорова р = тггп ( !пах !Ф(Х,*,д!,дз) — + — ( = О 07т750 = 0 49 г!< к. ! ' ' ' 2п яп! (максимальное значение Я, равно 0,06) и сравнивая его с 0,95-квантилью распределения Колмогорова кодз = 1,36 ((1), с. 346), видим, что р ( йоэз. Значит, мы должны принять гипотезу Но и считать распределение проекции вектора скорости молекулы водорода нормальным. С! Пример 8. Проверим ту же гипотезу Но о нормальности проекции вектора скорости молекулы водорода с тем же уровнем значимости о = 0,05.
но теперь для проверки Но воспользуемся критерием и!( Поскольку и в этом случае мы будем пользоваться оценками максимального правдоподобия неизвестных среднего д! и дисперсии дз нормального закона, то все этапы вычислений, вплоть до нахождения Я„ для критериев Колмогорова и шз полностью совпадают. Остается только определить значение статистики шз (см табл 2). и! = 2 Я, -~- = 0,01 -1- 0,04 -1- ... -1- 0,01 -1- = 0,05 12п ' ' ' 600 и сравнить найденное значение ш = 0,05 с 0,95-квантилью и! -распределения д 3 аоаз = 0,46 (1, с. 348).
Таким образом, критерий сиз также подтверждает справедливость гипотезы Но. С! Пример 9. Воспользовавшись выборкой из примера 2 гл. 1, проверим с уровнем значимости о = 0,1 гипотезу Но о том, что число Х регистрируемых ежесекундно счетчиком Гейгера частиц имеет распределение Пуассона Случайная величина Х, распределенная по закону Пуассона, принимает значения ! = О, 1, с вероятностями 1'! =Р(1;д) =Р(Х =1)д) = — е д' е 11 где д — математическое ожидание Л (см часть 1, гл.















