Популярные услуги

Сравнение двух выборок

2021-03-09СтудИзба

7. Сравнение двух выборок

7.1.  Сравнение двух средних  независимых выборок

(критерий Стьюдента)

Часто в процессе проведения испытаний  необходимо сравнить результаты двух независимых выборок с тем, чтобы оценить достоверность разности  Х1 – Х2. Если эта разность недостаточно значима, то средние Х1 и Х2 могут относиться к одной и той же генеральной совокупности. Если же эта разность достаточно значима, то средние Х1 и Х2 относятся к разным генеральным совокупностям или к одной совокупности, но при измерении величин Х1 и Х2 имеется достаточная разница в методах их определения.

При большом числе испытаний n>30 и m>30 критерий достоверности определяется по формуле:

                                                  (47)

где S1, S2среднее квадратическое отклонение в первой и второй выборке;

Рекомендуемые материалы

n, m – число значений в первой и второй выборке.

Полученное значение сравнивают с табличными  значениями критерия Стьюдента.

При малом числе испытаний n+m<60

                        (48)

При числе испытаний n=m<30

                        (49)

где σ1, σ2среднее квадратическое отклонение в первой и второй выборке.

При использовании формулы (48) находят значение

                                       k = n + m -2                                                         (50)

и по таблице 13 для найденной величины k и при вероятности 95% определяют табличное значение t.

При использовании формулы (49) находят значение

                                       k = 2  .(n - 1)                                                        (51)

и по таблице 13 для найденной величины k и при вероятности 95% определяют табличное значение t.

Если  tр > t, то разность средних  Ха –Хв при нормальном распределении достоверна более чем на 95%. Если  tр < t , то разность средних не считается достаточно достоверной.

Таблица 13

    k

    t

   k

     t

   k

    t

   k

    t

    1

12,78

  10

  2,23

  19

  2,09

  28

  2,05

    2

  4,30

  11

  2,20

  20

  2,09

  29

  2,05

    3

  3,18

  12

  2,18

  21

  2,08

  30

  2,04

    4

  2,78

  13

  2,16

  22

  2,07

  40

  2,02

    5

  2,57

  14

  2,14

  23

  2,07

  60

  2,00

    6

  2,45

  15

  2,13

  24

  2,06

 120

  1,98

    7

  2,37

  16

  2,12

  25

  2,06

   ¥

  1,96

    8

  2,30

  17

  2,11

  26

  2,06

    -

     -

    9

  2,26

  18

  2,10

  27

  2,05

    -

     -

В программе Excel применяется функция ТТЕСТ (рис. 25). Она возвращает вероятность, соответствующую критерию Стьюдента. Функция ТТЕСТ используется, чтобы определить, насколько вероятно, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же среднее.

Рис. 25. Функция ТТЕСТ

ТТЕСТ(массив1;массив2;хвосты;тип)

Массив1 — первое множество данных.

Массив2 — второе множество данных.

Хвосты — число хвостов распределения. Если хвосты = 1, то функция ТТЕСТ использует одностороннее распределение. Если хвосты = 2, то функция ТТЕСТ использует двустороннее распределение.

Тип — вид исполняемого t-теста.

Тип

Выполняемый тест

1

Парный

2

Двухвыборочный с равными дисперсиями (гомоскедастический)

3

Двухвыборочный с неравными дисперсиями (гетероскедастический)

Если массив1 и массив2 имеют различное число точек данных, а тип = 1 (парный), то функция ТТЕСТ возвращает значение ошибки #Н/Д.

Аргументы хвосты и тип усекаются до целых.

Если хвосты или тип не является числом, то функция ТТЕСТ возвращает значение ошибки #ЗНАЧ!.

Если хвосты имеет значение, отличное от 1 и 2, то функция ТТЕСТ возвращает значение ошибки #ЧИСЛО!.

TTEСT использует данные массива1 и массива2 для вычисления неотрицательной t-статистики. Если хвосты = 1, TTEСT возвращает вероятность более высокого значения t-статистики, исходя из предположения, что массив1 и массив2 являются выборками, принадлежащими одной и той же генеральной совокупности. Значение, возвращаемое функцией TTEСT в случае, когда хвосты = 2, является двусторонним значением, возвращаемым, когда хвосты = 1 и представляет собой вероятность более высокого абсолютного значения t-статистики, исходя из предположения, что массив1 и массив2 являются выборками, принадлежащими одной и той же генеральной совокупности.

В надстройке АНАЛИЗ ДАННЫХ представлено несколько типов теста для сравнения выборочных средних (рис. 26).

Рис. 26. Пакет анализа

Двухвыборочный t-тест проверяет равенство средних значений генеральной совокупности по каждой выборке. Эти три средства допускают следующие условия: равные дисперсии генерального распределения, дисперсии генеральной совокупности не равны, а также представление двух выборок до и после наблюдения по одному и тому же субъекту.

Для всех трех средств, перечисленных ниже, значение t-статистики t вычисляется и отображается как "t-статистика" в выводимой таблице. В зависимости от данных, это значение t может быть отрицательным или неотрицательным. Если предположить, что средние генеральной совокупности равны, при t < 0 “P(T <= t) одностороннее” дает вероятность того, что наблюдаемое значение t-статистики будет более отрицательным, чем t. При t >=0 “P(T <= t) одностороннее” делает возможным наблюдение значения t-статистики, которое будет более положительным чем t. “t критическое одностороннее” выдает пороговое значение, так что вероятность наблюдения значения t-статистики большего или равного “t критическое одностороннее” равно Alpha.

“P(T <= t) двустороннее” дает вероятность наблюдения значения t-статистики по абсолютному значению большего чем t. “P критическое двустороннее” выдает пороговое значение, так что значение вероятности наблюдения значения t- статистики по абсолютному значению большего “P критическое двустороннее” равно Alpha.

Двухвыборочный t-тест с одинаковыми дисперсиями. Двухвыборочный t-тест Стьюдента служит для проверки гипотезы о равенстве средних для двух выборок. Эта форма t-теста предполагает совпадение значений дисперсии генеральных совокупностей и обычно называется гомоскедастическим t-тестом.

Элементы диалогового окна «Двухвыборочный t-тест с одинаковыми дисперсиями» приведены на рис. 27.

Рис. 27. Двухвыборочный t-тест с одинаковыми дисперсиями

Интервал переменной 1. Дается ссылка на первый диапазон анализируемых данных. Диапазон должен состоять из одного столбца или одной строки.

Интервал переменной 2. Дается ссылка на второй диапазон анализируемых данных. Диапазон должен состоять из одного столбца или одной строки.

Гипотетическая средняя разность. Вводится число, равное предполагаемой разности средних. Значение 0 (нуль) указывает, что средние принимаются равными.

Заголовки. Если первая строка или первый столбец входного интервала содержит заголовки, то устанавливается флажок. Флажок снимается, если заголовки отсутствуют; в этом случае подходящие названия для данных выходного диапазона будут созданы автоматически.

Альфа. Вводится уровень надежности для теста. Его значение должно находиться в диапазоне 0...1. Уровень альфа связан с вероятностью возникновения ошибки типа I (опровержение верной гипотезы).

Выходной диапазон. Вводится ссылка на левую верхнюю ячейку выходного диапазона. Размер выходного диапазона будет определен автоматически, и на экран будет выведено сообщение в случае возможного наложения выходного диапазона на исходные данные.

Новый лист. Устанавливается переключатель таким образом, чтобы открыть новый лист в книге и вставить результаты анализа, начиная с ячейки A1. Если в этом есть необходимость, введите имя нового листа в поле, расположенном напротив соответствующего положения переключателя.

Новая книга. Устанавливается переключатель таким образом, чтобы открыть новую книгу и вставить результаты анализа в ячейку A1 на первом листе в этой книге.

Результаты расчетов выводятся в виде таблицы (табл. 14).

Таблица 14

Заголовок

Объяснение

Среднее

Средние значения первой и второй выборки

Дисперсия

Дисперсии первой и второй выборки

Наблюдения

Число значений в первой и второй выборке (n и m)

Объединенная дисперсия

Выборочная дисперсия , вычисленная по объединенным данным обеих выборок

Гипотетическая разность средних

Гипотетическая разность средних

df

Число степеней свободы статистики Т ()

t - статистика

Расчетное значение t, найденное по формуле (50)

P(Tt) одностороннее

Значимость α. В случае а) , в случае б) , где t – расчетное значение статистики Т; Тn+m-2 – случайная величина, имеющая распределение Стьюдента с (n+m-2) степенями свободы

t критическое одностороннее

Критическое значение t (α; n+m-2) порядка α распределения Стьюдента с (n+m-2) степенями свободы

P(T≤t) двухстороннее

Значимость  (случай в))

t критическое двухстороннее

Критическое значение t (α/2; n+m-2) порядка α/2 распределения Стьюдента с (n+m-2) степенями свободы

Двухвыборочный t-тест с разными дисперсиями. Двухвыборочный t-тест Стьюдента (рис. 28) используется для проверки гипотезы о равенстве средних для двух выборок данных из разных генеральных совокупностей. Эта форма t-теста предполагает несовпадение дисперсий генеральных совокупностей и обычно называется гетероскедастическим t-тестом. Если тестируется одна и та же генеральная совокупность, используется парный тест.

Рис. 28. Двухвыборочный t-тест с разными дисперсиями

Для определения тестовой величины t используется следующая формула.

                                        (52)

где δ - гипотетическая разность средних; .

Так как результат вычисления обычно не бывает целым числом, значение df округляется до целого для получения порогового значения из t-таблицы. Функция Excel ТТЕСТ по возможности использует вычисленные значения без округления для вычисления значения ТТЕСТ с нецелым значением df. Из-за разницы подходов к определению степеней свободы, результаты функций ТТЕСТ и t-тест будут различаться в случае с разными дисперсиями. Следующая формула используется для вычисления степени свободы df.

                                                 (53)

Элементы диалогового окна «Двухвыборочный t-тест с различными дисперсиями» совпадают с элементами диалогового окна «Двухвыборочный t-тест с одинаковыми дисперсиями»

Парный двухвыборочный t-тест для средних. Парный двухвыборочный t-тест Стьюдента (рис. 29) используется для проверки гипотезы о различии средних для двух выборок данных. В нем не предполагается равенство дисперсий генеральных совокупностей, из которых выбраны данные. Парный тест используется, когда имеется естественная парность наблюдений в выборках, например, когда генеральная совокупность тестируется дважды — до и после эксперимента.

Рис. 29. Парный двухвыборочный t-тест для средних

Одним из результатов теста является совокупная дисперсия (совокупная мера распределения данных вокруг среднего значения), вычисляемая по следующей формуле.

                                        (54)

Элементы диалогового окна «Парный двухвыборочный t-тест для средних» совпадают с элементами диалогового окна «Двухвыборочный t-тест с одинаковыми дисперсиями».

7.2.  Сравнение двух дисперсий  независимых выборок

(критерий Фишера)

Для сравнения дисперсий двух выборок применяется критерий Фишера. Он определяется по следующей формуле

                                            (55)

где  - наибольшая дисперсия;

       - наименьшая дисперсия.

Далее расчетный критерий сравнивается с табличным значением. Если F>Fрасч, то гипотеза о равенстве дисперсий отвергается.

Значения критерия Фишера (F-критерия) для уровня значимости p = 0,05 приведены в таблице 15, где f1 - число степеней свободы большей дисперсии, f2 - число степеней свободы меньшей дисперсии.

Таблица 15

f1

f2

1

2

3

4

5

6

7

8

9

10

15

1

161,45

199,50

215,71

224,58

230,16

233,99

236,77

238,88

240,54

241,88

245,95

2

18,51

19,00

19,16

19,25

19,30

19,33

19,35

19,37

19,38

19,40

19,43

3

10,13

9,55

9,28

9,12

9,01

8,94

8,89

8,85

8,81

8,79

8,70

4

7,71

6,94

6,59

6,39

6,26

6,16

6,09

6,04

6,00

5,96

5,86

5

6,61

5,79

5,41

5,19

5,05

4,95

4,88

4,82

4,77

4,74

4,62

6

5,99

5,14

4,76

4,53

4,39

4,28

4,21

4,15

4,10

4,06

3,94

7

5,59

4,74

4,35

4,12

3,97

3,87

3,79

3,73

3,68

3,64

3,51

8

5,32

4,46

4,07

3,84

3,69

3,58

3,50

3,44

3,39

3,35

3,22

9

5,12

4,26

3,86

3,63

3,48

3,37

3,29

3,23

3,18

3,14

3,01

10

4,96

4,10

3,71

3,48

3,33

3,22

3,14

3,07

3,02

2,98

2,85

11

4,84

3,98

3,59

3,36

3,20

3,09

3,01

2,95

2,90

2,85

2,72

12

4,75

3,89

3,49

3,26

3,11

3,00

2,91

2,85

2,80

2,75

2,62

13

4,67

3,81

3,41

3,18

3,03

2,92

2,83

2,77

2,71

2,67

2,53

14

4,60

3,74

3,34

3,11

2,96

2,85

2,76

2,70

2,65

2,60

2,46

15

4,54

3,68

3,29

3,06

2,90

2,79

2,71

2,64

2,59

2,54

2,40

16

4,49

3,63

3,24

3,01

2,85

2,74

2,66

2,59

2,54

2,49

2,35

17

4,45

3,59

3,20

2,96

2,81

2,70

2,61

2,55

2,49

2,45

2,31

18

4,41

3,55

3,16

2,93

2,77

2,66

2,58

2,51

2,46

2,41

2,27

19

4,38

3,52

3,13

2,90

2,74

2,63

2,54

2,48

2,42

2,38

2,23

20

4,35

3,49

3,10

2,87

2,71

2,60

2,51

2,45

2,39

2,35

2,20

В программе Excel  проверка однородности дисперсий осуществляется с помощью функции ФТЕСТ (рис. 30). F-тест возвращает одностороннюю вероятность того, что дисперсии аргументов массив1 и массив2 различаются несущественно. Эта функция используется для того, чтобы определить, имеют ли две выборки различные дисперсии. Например, если даны результаты тестирования для частных и общественных школ, то можно определить, имеют ли эти школы различные уровни разнородности учащихся по результатам тестирования.

Рис. 30. Функция ФТЕСТ

ФТЕСТ(массив1;массив2)

Массив1— это первый массив или интервал данных.

Массив2— это второй массив или интервал данных.

Аргументы должны быть числами или именами, массивами или ссылками, содержащими числа.

Если аргумент, который является массивом или ссылкой, содержит текст, логические значения или пустые ячейки, эти значения игнорируются; ячейки, содержащие нулевые значения, учитываются.

Если количество точек данных в аргументе массив1 или массив2 меньше 2, или если дисперсия аргумента массив1 или массив2 равна нулю, то функция ФТЕСТ возвращает значение ошибки #ДЕЛ/0!.

В надстройке «Пакет анализа» используется двухвыборочный F-тест для дисперсии.

Бесплатная лекция: "7 Дидактическая система Ушинского" также доступна.

Элементы диалогового окна «Двухвыборочный F-тест для дисперсии» приведены на рис. 29. Элементы диалогового окна «Двухвыборочный F-тест для дисперсии» совпадают с  элементами диалогового окна «Двухвыборочный t-тест с одинаковыми дисперсиями».

Рис. 29. Двухвыборочный F-тест для дисперсии

Двухвыборочный F-тест применяется для сравнения дисперсий двух генеральных совокупностей.

Например, можно использовать F-тест по выборкам результатов заплыва для каждой из двух команд. Это средство предоставляет результаты сравнения нулевой гипотезы о том, что эти две выборки взяты из распределения с равными дисперсиями, с гипотезой, предполагающей, что дисперсии различны в базовом распределении.

С помощью этого средства вычисляется значение f F-статистики (или F-коэффициент). Значение f, близкое к 1, показывает, что дисперсии генеральной совокупности равны. В таблице результатов, если f < 1, "P(F <= f) одностороннее” дает возможность наблюдения значения F-статистики меньшего f при равных дисперсиях генеральной совокупности и F критическом одностороннем выдает критическое значение меньше 1 для выбранного уровня значимости Alpha. Если f > 1, “P(F <= f) одностороннее” дает возможность наблюдения значения F-статистики большего f при равных дисперсиях генеральной совокупности и F критическом одностороннем выдает критическое значение большее 1 для Alpha.

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Нашёл ошибку?
Или хочешь предложить что-то улучшить на этой странице? Напиши об этом и получи бонус!
Бонус рассчитывается индивидуально в каждом случае и может быть в виде баллов или бесплатной услуги от студизбы.
Предложить исправление
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
5138
Авторов
на СтудИзбе
442
Средний доход
с одного платного файла
Обучение Подробнее