Учебник_Бочаров_Печинкин (846435), страница 54
Текст из файла (страница 54)
При заданном уровне значимости (РазмеРе) о обычно длЯ симметРии полагают С! =- Р 72 и Сз = р! 7щ где р, — о-квантиль статистики р*, построенной по выборке объема п при условии справедливости гипотезы Но. Значения ра для некоторых п и о можно найти в табл. 4.7а из [1). Следуюший критерий согласия основан на выборочном коэффициенте асимметрии а*=- ..ч~ (Х,— т*) . Поскольку нормальный закон имеет симметричную относительно среднего т плотность распределения, то при условии справедливости гипотезы Но плотность распределения выборочного коэффициента асимметрии симметрична относительно нуля, и, значит, естественно использовать критерий, инвариантный относительно замены знака а* на противоположный. Кроме того, при условии справедливости гипотезы Но распределение выборочного коэффициента асимметрии зависит только 2.
Критерии согласия 255 от объема выборки п, и не зависит от т и вз. Сравнивая выборочный коэффициент асимметрии а* с нулем, получаем с учетом вышесказанного следующий критерий: принимаем гипотезу Но, если — С < а' < С, где при уровне значимости (размере) сх нужно положить С = а! 1з, а а — сх-квантиль статистики а* при условии, что выборка объема и произведена из нормальной генеральной совокупности. Значения аи для некоторых п и сх приведены в табл. 4.7б из [1].
Еще один критерий согласия проверяет близость выборочного эксцесса Л , ~ '(Х, — т*) п(о~ ) к теоретическому эксцессу 7 = М(Х вЂ” МХ)4,С(1)Х)з, равному 3 для нормального закона. По-прежнему, критерий уровня значимости о пРедписывает пРинЯть Но, если 9 1з < 9* < 7! 1з, где "; а-кван- тиль статистики 7*, построенной по нормальной выборке объема п. Значения э для некоторых п и сх содержатся в табл. 4.7в из (1).
Наконец, последний приводимый здесь критерий согласия основан на минимальном и максимальном значениях элементов выборки (крайних членах вариационного ряда). Часто этот критерий называют критерием исключения резко выделяющихся наблюдений, поскольку он обычно применяется, когда в выборке наряду с элементами нормальной генеральной совокупности присутствуют отдельные «засоряющие» элементы, не принадлежащие этой генеральной совокупности, и их необходимо исключить по результатам анализа выборки.
Критерий основан на том, что плотность нормального распределения весьма быстро стремится к нулю при удалении от среднего. Следовательно, наличие очень больших или очень маленьких значений наблюдений в выборке говорит о том, что эта выборка не может принадлежать нормальной генеральной совокупности. Статистика критерия имеет вид х* = гпвх )Х, — т*).
ххьз 1<г<а Гипотеза Но принимается с уровнем значимости а, если х' < щ!, где х — ы-квантиль статистики щ* при условии нормальности выборки; значения х для некоторых п и ы приведены в табл. 4.8в из (1). Пример !. В примерах 7, 8 и !Огл 3 мы уже проверяли гипотезу Но о нормальности проекции Х вектора скорости молекулы водорода (выборка Хп, Хоо приведена в табл. 2 гл 1).
Вновь вернемся к этой гипотезе и проверим ее при уровне значимости а = 0,02 с помощью описанных выше критериев Вычисления дают следующие значения соответствующих статистик (значения т н з' найдены в примере 8 гл.1), р* = 0,79, а* = 0,57, 7 = 3,14, х* = 2,90. Сравнивая этн значения с критическими значениями ролл = 0,7291, родо = 0,8648, аою = 0,787 ((1, с. 258); значения рою и пооо взяты для объема выборки и = 51 как ближайшего к 50), уоы = 1,95, эооо = 4,92 (там же, с. 259), ходо = 3,370 (там же, с. 262), убеждаемся, что и проверка по этим четырем критериям подтверждает гипотезу Но. сз 256 Гл. 4.
Некоторые задачи, связанные с нормальными еыборками Предостережение. Итак, гипотезу о нормальности проекции вектора скорости молекулы водорода мы проверили с помощью семи (!) критериев. Собственно говоря, мы действовали как сверхосторожный исследователь, придерживающийся принципа «семь раз отмерь, один раз отрежь». Такой исследователь, испытав все известные ему критерии (допустим для определенности, что их к), принимает основную гипотезу Нь только тогда, когда все оии дают положительный результат, или, по сути дела, использует некий «обобщенный» критерий. Предполагая, что уровни значимости отдельных критериев равны оы..., аю вычислим уровень значимости о «обобщенного» критерия.
Если статистики отдельных критериев независимы, то по формуле умножения вероятностей а = ! — (! — сп) (! — «чь). В том случае, когда статистики зависимы, общий уровень значимости может достигать даже величины сп Ч- .. Ч- аь. Это нужно учитывать при использовании «обобщенного» критерия и задавать для каждого отдельного критерия уровень значимости, меньший, чем при использовании только одного критерия Разумеется, это предостережение относится не только к критериям проверки выборки иа нормальность, ио и к критериям, проверяющим любую статистическую гипотезу У читателя, ознакомившегося с материалами настоящего параграфа, может возникнуть естественное желание использовать подобного вида критерии согласия, основанные на простейших статистиках типа выборочных моментов, для проверки гипотез о принадлежности теоретической функции распределения другим параметрическим семействам, например, семейству гамма-распределений.
Следует сразу же предупредить читателя о возможных трудностях, которые могут встретиться на этом пути. Во-первых, для большинства семейств распределения простейших статистик зависят от истинных значений неизвестных параметров, что делает невозможным построение универсальных для всего семейства критических областей. Во-вторых, хотя мы и говорим о «простейших» статистиках, нахождение их распределений представляет собой, как правило, весьма сложную в вычислительном плане задачу. Наконец, для физического обоснования принадлежности теоретического распределения определенному семейству исследователю обычно приходится затратить такие усилия, что экономия на статистической проверке правильности выбранной модели и использование маломощных критериев просто бессмысленны. 3. Критерии равенства дисперсий В моделях, исследуемых в дальнейшем в этой главе, предполагается, что имеется несколько нормальных выборок с возможно различными средними, но одинаковыми дисперсиями.
Естественно, факт равенства дисперсий необходимо обосноват~. Для этой цели обычно используют критерии Бартлетта, Кокрена и Фишера. 3. Критерии равенства дисперсий 257 Итак, пусть имеется та независимых выборок ХП,...,Х„н, Хео ! . Хто объемов и!,...,п, произведенных из различных нормальных генеральных совокупностей с неизвестными средними т!,..., чи и также неизвестными дисперсиями о, ...,ет . Основная гипотеза Но состо- З 2 ит в том, что дисперсии во всех генеральных совокупностях равны: о.! = ... = сг~; естественно, конкурирующая гипотеза Н!! некоторые дисперсии могут быть различными Статистика критерия Бартлетта задается выражением Ь = 2ч'1п ( — 2 (и, — 1) в,'2( — '2 (и, — 1) 1пв,', е=! где в = 2 (Хм — еле), гп, = — 2 Х,2 1 "' .з . ! п,— 1 ' ' и, е=! ~=! т Дг=~ (,,— 1), (смысл введения статистики Ь заключается в том, что она позволяет привести задачу проверки гипотезы о равенстве дисперсий нормальных выборок к задаче проверки гипотезы о равенстве средних приближенно нормальных выборок; для строго нормальных выборок эта задача будет решена в параграфе 7).
Если гипотеза Но верна и все п, > 6, то отно- шение В=Ь 1+ 2* и 2* Е* в! -'; ... -1-.в,„ 9 П.П. Бочаров, А В. Починкин распределено приближенно по закону Кз с ьв — 1 степенями свободы. Поэтому критерий Бартлетта, имеющий уровень значимости (размер), примерно равный о, предписывает принять гипотезу Но, если В < Ц , и отклонить в противном случае. Здесь, как обычно, через обозначена о-квантиль Кз-распределения с ьи — 1 степенями свободы (см.
(1, табл. 2.2а]). Уточнение критерия Бартлетта на случай, когда хотя бы одно из пч может быть меньше б, можно найти в (1). Там же содержатся таблицы (табл. 4.3), необходимые для использования уточненного критерия. Если все выборки имеют одинаковый объем (и! = ... = п = и), то для проверки гипотезы Но против гипотезы Н! можно воспользоваться, вообще говоря, менее мощным, но зато более простым критерием Кокрена. Статистика критерия Кокрена задается формулой 258 Гл. 4.
Некоторые задачи, связанные с нормальными выборками где з2;„= шах зз . Критерий Кокрена предписывает принять Но 1<з<т с уровнем значимости ои если С < С , где С сг-квантиль распределения статистики С при условии справедливости основной гипотезы Но, приближенные значения С„ для некоторых сг, тп и и = и — 1 приведены в [1, табл. 4.3б). Наконец, если гв = 2 (п| и п2 могут быть различными), то для проверки гипотезы Но о равенстве дисперсий двух выборок лучше всего использовать критерий Фишера. Статистика критерия Фишера определяется формулой 2* Зз зг = —, з) где з, и ж" — выборочные дисперсии первой и второй выборок. 22 2 ! '2 ае Поскольку при условии справедливости Но статистики (п1 — 1),з," и (п2 — 1)з22* с точностью до одного и того же сомножителя о.з = сгз = = ц~ имеют Х2-распределения с гн — 1 и п2 — 1 степенями свободы, то статистика тг имеет Г-распределение с параметрами пз — 1 и п1 — 1.














