Ю.Н. Тюрин, А.А. Макаров - Анализ данных на компьютере (1115311), страница 36
Текст из файла (страница 36)
п. 2.6.2). Таблицы для дробного числа176степеней свободы составлять не принято. Для нахождения квантилей указан"ного выше распределения приходится пользоваться приближенными методами.Их описание дано, например, в [19].Критерий Фишера. Кратко остановимся на вопросе проверкигипотезы о равенстве дисперсий двух нормальных выборок.Рассмотрим отношение оценок дисперсий первой и второй выборкиs21 и s22F =s21,s22называемое дисперсионным отношением Фишера, или просто статисти"кой Фишера. В случае справедливости нулевой гипотезы о равенстведисперсий нормальных выборок величина F имеет F "распределение счислом степеней свободы (n − 1, m − 1), где n и m — объемы первой ивторой выборок, соответственно.
При нарушении нулевой гипотезы ве"личина F имеет тенденцию к увеличению (уменьшению) в зависимостиот того, больше или меньше единицы значение величины σ22 /σ12 .Критерий проверки нулевой гипотезы при заданном уровне значи"мости α против двусторонних альтернатив σ12 = σ22 сводится к следую"щему: принять гипотезу, еслиFα/2, n−1, m−1 F F1−α/2, n−1, m−1 ;в противном случае отвергнуть гипотезу. Здесь Fα/2, n−1, m−1 — этоквантиль F "распределения уровня α/2 с (n − 1, m − 1) числом степенейсвободы.Другое правило проверки гипотезы основывается на использованииσ2доверительного интервала для σ12 . Если единица (значение отношения2σ12 /σ22 при гипотезе) принадлежит доверительному интервалу длягипотеза принимается.
В противном случае она отвергается.σ12,σ22то5.4.3. … ……В пункте 3.6 мы подробно описали, что такое парные данные и како"во их обычное экспериментальное происхождение. Там же мы рассмо"трели два непараметрических статистических критерия для проверкигипотезы об отсутствии закономерного различия между наблюдениямив паре (иначе говоря — гипотезы об отсутствии эффекта обработки).Типичный пример того, как могут возникать парные данные, дают опы"ты, в которых наблюдения над объектами (т.е. измерения определеннойхарактеристики) производят дважды: до и после воздействия.177Пусть xi и yi — результаты этих измерений для объекта номерi, i = 1, . .
. , n, где n — численность экспериментальной группы (чи"сло объектов). Как обычно, все наблюдения мы считаем случайнымивеличинами (реализациями случайных величин) и предполагаем, чтометодика эксперимента обеспечивает их независимость для разных объ"ектов. Но наблюдения, входящие в одну пару, мы не можем считатьнезависимыми, поскольку они относятся к одному и тому же объекту.Эти два наблюдения отражают свойства общего для них индивидуаль"ного объекта, и потому могут быть зависимы друг от друга.
Напомнимобозначения, введенные для парных данных в пункте 3.6.Данные — совокупность пар случайных величин (x1 , y1 ), . . . ,(xn , yn ), где n — объем совокупности (число пар). Обозначимzi = yi − xi , i = 1, . . . , n.Допущения (частично повторяют допущения пункта 3.6, а частичноих усиливают).1. Все zi , i = 1, . . . , n — взаимно независимы.2. Предположим, что zi можно представить в виде:zi = θ + ei ,где e1 , . . .
, en — независимые случайные величины, θ – неизвестная по"стоянная (неслучайная) величина (означающая результат воздействия,эффект обработки). Иначе говоря, мы принимаем аддитивную модельдля отражения результатов воздействия.3. Случайные величины e1 , . . . , en распределены по нормальному за"кону N (0, σ 2 ), где дисперсия σ 2 обычно неизвестна. Это предположениедополняет и усиливает перечень свойств случайных величин e1 , . . .
, en ,принятый в пункте 3.6.2.Приняв эти допущения, мы свели задачу о парных данных к задачеоб одной нормальной выборке, уже рассмотренной в пункте 5.4.1.В отношении неизвестного θ возможны два вопроса: проверка гипо"тезы о θ и оценивание θ. Анализ обычно начинают с проверки гипотезыH : θ = 0 (или θ = θ0 , где θ0 задано). Если гипотеза оказывается от"вергнутой (несовместимой с наблюдениями), обращаются к оцениваниюнеизвестного θ.
Обе эти задачи мы уже обсуждали в пункте 5.4.1 ободной нормальной выборке, так что нет нужды повторяться.Пример (продолжение примера из пункта 3.6). Проиллюстрируемописанный метод на примере сравнения времени реакции на звук и насвет, рассмотренном в пункте 3.3.2, сопоставим полученные результатыс теми, которые мы имели при применении к этим данным критериязнаков и критерия знаковых рангов Уилкоксона.178В табл. 3.6 приведены значения выборки: z1 = −42, z2 = 90,z3 = −36, z4 = −30, z5 = −12, z6 = 8, z7 = −52, z8 = −20, z9 = −45,z10 = −35, z11 = −19, z12 = −23, z13 = −10, z14 = −7, z15 = −0, z16 = 7,z17 = −19.
Прежде всего проверим, насколько эти данные согласуютсяс нормальным законом распределения, используя для этого описанныйвыше глазомерный критерий. Как видно из рис. 5.3, точки скачковэмпирической функции распределения Fn (·), изображенные в соответ"ствующих координатах, в общем, группируются около прямой линии.Исключение составляет наблюдение z2 = 90.
Оно далеко отстоит отосновного массива и воспринимается как «выброс». Возможно, что про"изошла какая"то ошибка в самом эксперименте либо при регистрации —передаче его результата. Это число следовало бы проверить.Если такой возможности нет и нам приходится действовать чистостатистическими средствами, то выявленный выброс z2 = 90 из даль"нейшего анализа следует исключить. Этот путь мы подробно рассмо"трим ниже. А сейчас обработаем исходную выборку как гауссовскую.(Сделав вид, что мы либо не проводили проверки на нормальность, либоничего не заметили.)Рис.
5.3. Эмпирическая функция распределения на нормальной вероятностной бумагеПроверим гипотезу H : θ = 0 против альтернативы θ < 0. Заметим,что в данной ситуации целесообразно рассмотреть именно односторон"нюю альтернативу, так как данные определенно говорят о том, чтозначение θ может быть отрицательным. Вычисления дают: z = −14.4,s2 = 1033.7.6, s = 32.15.Для проверки гипотезы H : θ = 0 составляем отношение Стьюдента:z − θ√14.4 √t=n=−17 = −1.846.s32.15При справедливости гипотезы статистика t подчиняется распределениюСтьюдента с 16 степенями свободы.179Вычислим минимальный уровень значимости, при котором можетбыть отвергнута гипотеза H. По определению, он равен P (t < tнабл.
),так как мы рассматриваем одностороннюю альтернативу θ < 0. Вос"пользовавшись таблицами распределения Стьюдента с 16 степенямисвободы, находим, что наименьший уровень значимости, на которомможет быть отвергнута гипотеза H : θ = 0 против альтернативы θ < 0,приблизительно равен 0.04.Обсуждение.
Вспомним, что в той же задаче наименьший уровень значи"мости для критерия знаков оказался равен приблизительно 0.01, то есть былсущественно меньше. На первый взгляд, это вызывает удивление. Ведь при"меняя критерий, опирающийся на известное распределение выборки (в данномслучае нормальное), мы должны были бы получить более сильный результат,чем с помощью непараметрического критерия, использующего меньше сведе"ний о выборке. Однако, как оказалось, предположение о нормальном законераспределения только уменьшило нашу уверенность в вопросе принятия илиотвержения гипотезы.Дело здесь в следующем.
Обратим внимание на то, что основной вклад ввеличину выборочной дисперсии s2 вносит всего одно наблюдение z2 = 90. Этозначение и раньше вызывало у нас подозрения. Возможно, что оно порожденоошибкой при регистрации данных. Возможно, что этот испытуемый по своимданным резко отличается от всех остальных. Если мы исключим это наблюдениеиз нашей выборки и заново проведем расчеты, величины z и s изменяетсяследующим образом:22 √z −22,s2 331.6,s 18.2,t−16 −4.835.18.2Воспользовавшись таблицами распределения Стьюдента с 15 степенямисвободы, получаем, что наименьший уровень значимости в этом случае менее0.0005, т.е.
данный метод позволяет с гораздо большей уверенностью сделать вы"вод об имеющемся различии исследуемых характеристик, чем критерий знаков.Процедура с исключением подозрительных наблюдений называется отбраковкой грубых наблюдений. Критерии, используемые для подобной процедуры,можно найти в [19], [77], [86].
Необходимость отбраковки вызвана тем, чтотрадиционные оценки параметров нормального распределения чувствительны кгрубым ошибкам, даже если таких ошибок немного в выборке. При использова"нии непараметрических методов в отбраковке грубых наблюдений, как правило,нет необходимости.Из приведенного сравнения двух критериев можно сделать вывод отом, что у каждого из них есть свои достоинства и недостатки, поэтомуприменение их должно основываться на анализе конкретной ситуации.В дальнейшем мы не раз будем обращать внимание на сравнение разныхстатистических методов и правил, направленных к общей цели.
Но ужесейчас можно сделать общий вывод: чем меньше предположений, темнадежнее статистический вывод (тем надежнее он защищен от ошибокисследователя).1805.5. :…ƒ …… STADIA SPSSПример 5.2к. Проведем анализ однородности двух нормальныхвыборок для данных о росте девушек и юношей. Проверим гипотезу оравенстве их средних значений и дисперсий.Процедуры работы с нормальными выборками входят практическиво все статистические пакеты.
Кроме разделов пакетов, непосредствен"но относящихся к этому вопросу, они могут составлять часть разделовописательных методов статистики, дисперсионного и регрессионногоанализа, критериев согласия и др. Ниже на примерах будут рассмо"трены некоторые из основных процедур анализа нормальных выборок.Процедуры проверки нормальности распределения выборки (критериисогласия) обсуждаются в гл. 10. Построение графика на нормальнойвероятностной бумаге в пакете SPSS рассмотрено в п. 13.2.2, где этапроцедура используется для проверки нормальности остатков в задачелинейной регрессии.5.5.1. STADIAÄàííûå для этого примера были получены авторами во время чте"ния курса статистических методов студентам факультета психологииМГУ им. М.В.Ломоносова.
Нами были собраны сведения о росте деву"шек и юношей одного из курсов. Выборка, относящаяся к девушкам,более многочисленна, ее размер оказался равным n = 53. Объем выбор"ки ростов юношей оказался m = 20. Полученные данные представленыв двух таблицах в порядке их регистрации.Таблица 5.1165164163166164164162170158166178167168173166159162164165158Рост девушек, см166 167 154160 164 157163 168 161164 161 163165152164163164175173165172 167 164 157165 174 163 155161 161 160 164170Таблица 5.2Пример 5.1к.