Проверка статистических гипотез
Проверка статистических гипотез.
Статистическая гипотеза -- это предположение о генеральной совокупности, высказанное на основании статистических выборочных данных.
Статистическая проверка гипотез -- это процедура обоснованного сопоставления высказанной гипотезы с имеющимися выборочными данными.
Например: исследуем влияние нового лекарственного препарата на снижение артериального давления.
X{x1, x2, … xn1} -- контрольная группа (выборка, объёмом n1)
Y{y1, y2, … yn2} -- опытная группа (выборка объёмом n2)
Высказываются две альтернативные гипотезы:
Н0: -- различия между выборками не достоверны (т.е. носят случайный характер).
Н: -- различия между выборками достоверны (т.е. влияние препарата достоверно (эффективно))
Рекомендуемые материалы
Чтобы принять или опровергнуть эти предположения, используют статистические критерии или критерии достоверности.
Статистический критерий -- это случайная величина, закон распределения которой известен, т.е. каждому значению критерия поставлена в соответствие вероятность, с которой он эти значения принимает.
Для каждого критерия существует таблица, в которой содержатся критические значения критерия. Каждое критическое значение соответствует определённому уровню значимости α и числу степеней свободы (или к)
где а -- число наложенных связей или ограничений.
α=1-РД -- это вероятность принять ошибочную гипотезу.
Критические значения позволяют определить вероятность нулевой гипотезы: Р(Н0).
Гипотеза Н0 принимается, если в результате проверки выяснилось, что её вероятность больше выбранного уровня значимости.
если Р(Н0)>α , то Н0 принимаем,
если Р(Н0)<α , то Н0 отвергаем.
Например: Хотим доказать достоверность различия между выборками X{x1, x2, … xn1} и Y{y1, y2, … yn2} с РД=0,95 (это значит, что влияние препарата достоверно (эффективно) на 95%).
Если в результате проверки выяснилось, что Р(Н0)˃α , (т.е. ˃0,05), то мы вынуждены принять гипотезу Н0, так как Р(Н)<РД
Р(Н)<0,95.
Основные этапы проверки статистических гипотез.
1).Выдвигается гипотеза Н0.
2).Выбирается величина уровня значимости α (α=1-РД).
3).По заданному α и числу степеней свободы ν(или к) в таблице находим критическое (табличное) значение критерия.
4).Подсчитывается экспериментальное значение критерия по имеющимся выборкам (для каждого критерия существует формула для определения значения критерия).
5).С помощью сравнения экспериментального и критического значений делается вывод о правомерности гипотезы Н0.
6).Если Н0 принимается, следовательно гипотеза Н (о достоверности различий) не верна.
Если Н0 отвергается, следовательно верна гипотеза Н..(Н0 и Н -- противоположные события).
Критерии достоверности подразделяются на параметрические и непараметрические.
Параметрические критерии для вычисления экспериментального значения используют статистические параметры: . Они могут использоваться для выборочных совокупностей, распределённых по закону близкому к нормальному (Гаусса).
Непараметрические критерии не требуют вычисления выборочных параметров, они менее точны, дают более грубую оценку, чем параметрические критерии, но:
1). Их можно применять к выборкам, закон распределения которых неизвестен (не обязательно нормальное распределение).
2). Они проще и позволяют быстрее производить проверку рассматриваемых гипотез.
1. Проверка гипотез о законе распределения.
Проверку гипотезы о законе распределения (то есть, соответствует ли выборочная совокупность какому либо определённому распределению) проводят с помощью критерия соответствия (предложен К.Пирсоном в 1900г.).
Критерий Пирсона ().
Н0 заключается в том, что различие между наблюдаемыми экспериментальными частотами mi попадания вариант выборки в интервалы вариационного ряда от вычисленных теоретических частот mi теор=mi·Pi теор не достоверно (т.е. носит случайный характер). Другими словами:
Н0: экспериментальные данные соответствуют предложенному теоретическому закону распределения.
Экспериментальное значение критерия вычисляется по формуле:
где -- объём выборки, к -- количество интервалов,
-- вероятность попадания в интервал для теоретического распределения.
Затем, по таблице критерия Пирсона для заданного уровня значимости α и числа степеней свободы , где а -- число наложенных связей, находим .
если теоретическое распределение произвольное, то а=1,
если теоретическое распределение распределено по нормальному закону Гаусса, то а=3 -- числу параметров, необходимых для вычисления вероятности: М[X],D[X] и σ[X],. следовательно
Если Н0 принимаем.
Вывод: экспериментальное распределение соответствует теоретическому.
Если Н0 отвергаем.
Вывод: экспериментальное распределение не соответствует теоретическому.
Пример: Изучался рост 50 человек. В таблице приведены экспериментальные частоты попадания в интервал mi и теоретические частоты, рассчитанные из вероятностей попадания в интервал для распределения Гаусса. К=5 , n=50.ν=5-3=2,
№ интервала | 1 | 2 | 3 | 4 | 5 |
mi практические | 5 | 9 | 22 | 8 | 6 |
mi теоретические | 5 | 10 | 20 | 10 | 5 |
0,1 | 0,2 | 0,4 | 0,2 | 0,1 |
Н0: Экспериментальное (практическое) распределение соответствует распределению Гаусса. (То есть различие между частотами не достоверно, носит случайный характер).
Из таблицы для ν=5-3=2 и ά=0,05 находим =5,99
Т.к. Н0 принимаем.
Вывод: практическое распределение соответствует распределению Гаусса.
2. Критерий Стьюдента.
Параметрический критерий , который используют для проверки статистических гипотез по выборкам, распределённым по нормальному закону Гаусса.
Используется:
1). Для определения достоверности среднего арифметического, полученного для одной выборки.
2). Для определения достоверности различия средних арифметических двух выборок.
3). Для определения достоверности корреляции двух случайных величин.
1). Проверка достоверности полученного среднего арифметического.
Определяется, существенны ли различия между -- среднего значения для выборки и М[X] -- мат. ожидания генеральной совокупности.
Н0: М[X]=0, то есть не достоверно.
где ошибка среднего арифм-го.
Число степеней свободы
Находим из таблицы критерия Стьюдента для и заданного ά,
если Н0 принимаем. Вывод: недостоверно
если Н0 отвергаем. Вывод: достоверно
2). Сравнение средних значений двух выборок.
Имеем две выборочные совокупности:
X{x1, x2, … xn1} и Y{y1, y2, … yn2}
n1 –объём первой выборки, n2 – объём второй выборки.
Н0: М[X]=M[Y] или M[X]-M[Y]=0, т.е. обе выборки принадлежат одной генеральной совокупности, то есть различия между выборками не достоверны. Задаём уровень значимости ά.
ошибка разности средних арифметических .
Число степеней свободы
Если ,
Находим из таблицы критерия Стьюдента для и заданного ά, .
если Н0 принимаем
Вывод: обе выборки принадлежат одной генеральной совокупности, различия между выборками не достоверны.
если Н0 отвергаем
Вывод: обе выборки не принадлежат одной генеральной совокупности, различия между выборками достоверны.
3. Непараметрические критерии.
Непараметрические критерии сравнивают сами значения выборок (варианты), они используют ранги.
Ранг -- это место по возрастанию.
Если встречается несколько одинаковых значений, то их ранг = среднему арифметическому рангов. Число рангов=n -- количество значений для которых расставляем ранги.
Пример:
X | Ранг | |
5 | 7 | |
3 | 4 | |
2 | 2,5 | Ранг «2»= |
5 | 7 | Ранг «5»= |
8 | 9 | |
9 | 10 | |
5 | 7 | |
1 | 1 | |
2 | 2,5 | |
4 | 5 | |
N=10 |
1).Критерий Вилкоксона.
Работает с так называемыми сопряжёнными вариантами, когда варианты из двух выборок измеряются парами (например, значению xi до воздействия препарата соответствует yi после воздействия).
Итак, имеем две выборки одинакового объёма n1=n2=n :
X{x1, x2, … xn} – контроль
Y{y1, y2, … yn} – опыт
Нас интересует достоверно ли различие между выборками, то есть принадлежат ли XиY одной генеральной совокупности для заданного уровня значимости ά.
Алгоритм проверки статистической гипотезы:
1). Н0: различие между выборками не достоверно.
2). Вычислить разности: . Если =0, то i-ю строку вычеркнуть и n=n-k -- количество вычеркнутых строк.
3). Расставить ранги для разностей, знак разности не учитываем. То есть расставляем ранги для .
4). Подсчитать суммы рангов, учитывая знаки разностей:
R+ -- сумма рангов для >0
R- -- сумма рангов для <0
5). , то есть выбираем меньшее из двух чисел.
6).Определить по таблице критерия Вилкоксона для α и числа степеней свободы=n Тэксп.
7). Если Тэксп ≤Ткрит то Н0 отвергаем.
если Тэксп>Ткрит то Н0 принимаем.
8). Записать вывод.
Пояснения: считается, что если различия между выборками не достоверны, (то есть верна гипотеза Н0), то R+и R-не сильно отличаются друг от друга. В таблице содержатся критические значения для меньшей суммы рангов и если Тэксп<Ткрит ,
то различия велики и гипотезу Н0 следует отвергнуть.
Пример: Достоверны ли различия между выборками для уровня значимости α=0,05? Н0: Различия между выборками не достоверны.
№ | Контроль Х | Опыт Y | Разности | Ранг разности |
1 | 32 | 21 | 11 | 7 |
2 | 31 | 19 | 12 | 8 |
3 | 29 | 27 | 2 | 2,5 |
4 | 28 | 29 | -1 | 1 |
5 | 30 | 30 | 0 |
|
6 | 27 | 29 | -2 | 2,5 |
7 | 29 | 22 | 7 | 6 |
8 | 33 | 27 | 6 | 5 |
9 | 26 | 21 | 5 | 4 |
n=9-1=8 R-=1+2,5=3,5 R+=7+8+2,5+6+5+4=32,5
Следовательно Тэксп=3,5.
По таблице для n=8 и α=0,05 находим: Ткрит=4.
Н0 отвергаем.
Вывод: Различия между выборками достоверны.
2). Критерий Манна-Уитни.
Этот непараметрический критерий можно использовать для двух выборок как одинаковых, так и разных объёмов. Объём меньшей выборки обозначают n1.
То есть, если .
Обе выборки объединяют в один ряд и ранги расставляют для всех n1+ n2 чисел.
Алгоритм проверки статистической гипотезы:
1). Н0: различие между выборками не достоверно.
2). Расставить ранги для всех n1+ n2 значений.
3). Вычислить:
где -- сумма рангов для первой выборки,
-- сумма рангов для второй выборки.
4) .
5).
а). Если , то в таблице для по и находим число -- это вероятность гипотезы Н0: Р(Н0).
если принимаем,
если отвергаем. Где α -- заданный уровень значимости.
в). Если, то существует другая таблица. В ней для и находим .
Если Uэксп ≤Uкрит то Н0 отвергаем.
если Uэксп˃Uкрит то Н0 принимаем.
6). Записать вывод.
Пример: даны две выборки. По критерию Манна-Уитни проверить, достоверны ли различия между выборками для уровня значимости α=0,05?
1-я выборка | Ранг | 2-я выборка | Ранг |
1 | 1 | 3 | 2 |
5 | 3 | 8 | 5 |
7 | 4 | 10 | 7 |
9 | 6 | 12 | 8 |
|
| 13 | 9 |
n1=4 | R1=14 | n2=5 | R2=31 |
Н0: Различия между выборками не достоверны.
n1+ n2 =4+5=9
R1=1+3+4+6=14
R2=2+5+7+8+9=31 =16
В таблице для n2=5, находим для n1=4 и=4:
Н0 принимаем.
Вывод: Различия между выборками не достоверны.
Контрольные вопросы.
Информация в лекции "Вихревые насосы" поможет Вам.
1.Что такое статистическая гипотеза и критерии проверки статистических гипотез?
2. Основные этапы проверки статистических гипотез.
3. Критерий Пирсона ().
4.Критерий Стьюдента.
5. Критерий Вилкоксона.
6. Критерий Манна-Уитни.