Гмурман - Теория вероятностей и математическая статистика (969547), страница 57
Текст из файла (страница 57)
Так как бааз ( б„з — иет оснований отвергнуть нулевую гипотезу об однородности дисперсий. Другими словами, исправленные выборочные дисперсии различаются незначимо. б) Поскольку пулевая гипотеза справедлива, в качестве оценки генеральной дисперсии примем среднюю арифметическую исправленных дисперсий: аз = (0,26+ 0,36 + 0,40+ 0,42)!4 = 0,36. й 22.
Проверка гипотезы о значимости выборочного коэффициента корреляции Пусть двумерная генеральная совокупность (Х, У) распределена нормально. Из этой совокупности извлечена выборка объема л и по ней найден выборочный коэффициент корреляции гю который оказался отличным от нуля. Так как выборка отобрана случайно, то еще нельзя заключить, что коэффициент корреляции генеральной совокупности г, также отличен от нуля. В конечном счете нас интересует именно этот коэффициент, поэтому возникает необходимость при заданном уровне значимости сс проверить нулевую гипотезу Нз:г„=О о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе Н,:г,=О.
Если нулевая гипотеза отвергается, то это означает, что выборочный коэффициент корреляции значимо отличается от нуля (кратко говоря„значим), а Х и Г коррелированы, т. е. связаны линейной зависимостью. Если нулевая гипотеза будет принята, то выборочный коэффициент корреляции незначим, а Х и У некоррелированы, т. е.
не связаны линейной зависимостью. 327 В качестве критерия проверки нулевой гипотезы примем случайную величину Т = г,Уп — 2/)/! — гэ. Величина Т при справедливости нулевой гипотезы имеет распределение Стьюдента с я=и — 2 степенями свободы. Поскольку конкурирующая гипотеза имеет вид г,э~0, критическая область — двусторонняя; она строится так же, как в $ 12 (первый случай).
Обозначим значение критерия, вычисленное по данным наблюдений, через Т„,э, и сформулируем правило проверки нулевой гипотезы. Правило. Для того чтобы при заданном уровне значимости сх проверить нулевую гипотезу Н,:г, =0 о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе Н,:г, ~0, надо вычислить наблюдаемое значение критерия: Ткэээ — гэУп — 2/1~ ! — гв и по таблице критических точек распределения Стьюдеита, по заданному уровню значимости н числу степеней свободы й=л — 2 найти критическую точку у„э(а; й) для двусторонней критической области.
Если ~ Тьээ„'! < г„э — нет оснований отвергнуть нулевую гипотезу. Если ~ Т„,а,'! > г„э — нулевую гипотезу отвергают. Пример. По выборке объема п=122, извлеченной нз нормальной дяумериой совокупности, найден выборочный коэффициент корреляции та=0,4. При уровйе значимости 0,05 проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе И,:т„~ О. Решен не. Найдем наблюдаемое значение критерия: Тээзэ = сэф и — 2ДI ! т~~ =0,4~I 122 †/~/ 1 — 0,4 =4,78. По условию, конкурирующая гипотеза имеет вид тт Ф О, поэтому критическая область — двусторонняя.
По уровню значимости 0,05 и числу степеней свободы й =!22 — 2=120 находим по таблице приложения б для двусторонней критической области критическую точку 1„р(0,05; 120) =1,98. Поскольку Тээээ > ткр нулевую гипотезу отвергаем. Другимн словами, выборочйый коэффициент корреляции значимо отличается от нуля, т. е. Х н У коррелнрованы, 328 % 23. Проверка гипотезы о нормальном распределении генеральной совокупности, Критерий согласия Пирсона В предыдущих параграфах закон распределения генеральной совокупности предполагается известным. Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его А), то проверяют нулевую гипотезу: генеральная совокупность распределена по закону А.
Проверка гипотезы о предполагаемом законе неизвестного распределения производится так же, как и проверка гипотезы о параметрах распределения, т. е. при помощи специально подобранной случайной величины— критерия согласия. Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Имеется несколько критериев согласия: Х' (ххи квадратз) К.
Пирсона, Колмогорова, Смирнова и др. Ограничимся описанием применения критерия Пирсона и проверке гипотезы о нормальном распределении генеральной совокупности (критерий аналогично применяется и для других распределений, в этом состоит его достоинство). С этой целью будем сравнивать эмпирическйе (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты. Обычно эмпирические и теоретические частоты различаются. Например (см. гл.
ХЧ11, $ 7): эмп. частоты .....6 13 38 74 106 86 30 10 4 теорет. частоты...3 14 42 82 99 76 37 11 2 Случайно ли расхождение частот? Возможно, что расхождение случайно (незначимо) и объясняется либо малым числом наблюдений, либо способом их группировки, либо другими причинами. Возможно, что расхождение частот неслучайно (значимо) и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности. Критерий Пирсона отвечает на поставленный выше вопрос. Правда, как и любой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений. Итак, пусть по выборке объема и получено эмпирическое распределение: варианты......х; х, х, ...
х« эмп. частоты... л„п, и« ... и« Допустим, что в предположении нормального распределения генеральной совокупности вычислены теоретические частоты и; (например, так, как в следующем параграфе). При уровне значимости а требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально. В качестве критерия проверки нулевой гипотезы примем случайную величину )(' =-,'~ Е(и, — пс) «~пс (') Эта величина случайная, так как в различных опытах она принимает различные, заранее не известные значения, Ясно, что чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия (»), и, следовательно, он в известной степени характеризует близость эмпирического и теоретического распределений. Заметим, что возведением в квадрат разностей частот устраняют возможность взаимного погашения положительных и отрицательных разностей.
Делением на п~ достигают уменьшения каждого из слагаемых; в противном случае сумма была бы настолько велика, что приводила бы к отклонению нулевой гипотезы даже и тогда, когда она справедлива. Разумеется, приведенные соображения не являются обоснованием выбранного критерия, а лишь пояснением. Доказано, что при п — оо закон распределения случайной величины (») независимо от того, какому закону распределения подчинена генеральная совокупность, стремится к закону распределения )(* с й степенями свободы. Поэтому случайная величина («) обозначена через д', а сам критерий называют критерием согласия «хи квадрат».
Число степеней свободы находят по равенству й= = з — 1 — г, где з — число групп (частичных интервалов) выборки; г — число параметров предполагаемого распределения, которые оценены по данным выборки. В частности, если предполагаемое распределение — нормальное, то оценивают два параметра (математическое ззо ожидание и среднее квадратическое отклонение), поэтому г = 2 и число степеней свободы й =3 — 1 — г =а в 1 — 2 = = 3 — 3. Если, например, предполагают, что генеральная совокупность распределена по закону Пуассона, то оценивают один параметр 1», поэтому г =1 и й=а — 2. Поскольку односторонний критерий более «жестко» отвергает нулевую гипотезу, чем двусторонний, построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости оп Р [Хз > )(„'р (а; ЙЦ = а.
Таким образом, правосторонняя критическая область определяется неравенством Хз > у„', (а; я), а область принатиа нУлевой гипотезы — неРавенством Уз ( Х'„р(а; Й). Обозначим значение критерия, вычисленное по данным наблюдений, через уз,а, и сформулируем правило проверки нулевой гипотезы. Правило. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу Н, генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия: Х'„, = Х (П! — П')з!П, (") и по таблице критических точек распределения Хз, по заданному уровню значимости а и числу степеней свободы й=з — 3 найти критическую точку у»р(а; й).
Если )(з„~„( Х'„р — нет оснований отвеРг~Уть нУлевУю гипотезу. Если Хз„,ел > Х'„р — нУлевУю гипотезУ отвеРгают. 3 а и е ч а н не 1. Объем выборки должен быть достаточно велик, во всяком случае,не менее БО. Каждая группа должна содержать не менее 5 — 8 вариант; иалочисленные группы следует объединять в одну, суммируя частоты. За не чан не 2. Поскольку возиожны ошибки первого н второго рода, в особенности если согласование теоретических и эипнических частот «слишкои хорошее», следует проявлять осторожность. априиер, нежно повторить опыт, увеличить число наблюдений, воспользоваться другими критериями, построить график распределения, вычислить аспииетрию и эксцесс (си.