Проверка статистических гипотез

2020-06-032021-03-09zzyxelСтудИзба

Проверка статистических гипотез.

Статистическая гипотеза -- это предположение о генеральной совокупности, высказанное на основании статистических выборочных данных.

Статистическая проверка гипотез -- это процедура обоснованного сопоставления высказанной гипотезы с имеющимися выборочными данными.

Например: исследуем влияние нового лекарственного препарата на снижение артериального давления.

X{x₁, x₂, … x_n₁} -- контрольная группа (выборка, объёмом n₁)

Y{y₁, y₂, … y_n₂} -- опытная группа (выборка объёмом n₂)

Высказываются две альтернативные гипотезы:

Н₀: -- различия между выборками не достоверны (т.е. носят случайный характер).

Н: -- различия между выборками достоверны (т.е. влияние препарата достоверно (эффективно))

Рекомендуемые материалы

FREE

Лекция 13 - Заболевания щитовидной железы. Йод-дефицитные состояния (слайды) (Эндокринология)

Медицина

FREE

Лекция 03 - Рак желудка (слайды) (Факультетская хирургия)

Медицина

FREE

4661beab2834890981294b504c7ca42d (Оториноларингология)

Медицина

FREE

Лекция №6 3 курс, 5 семестр (Хирургическая стоматология)

Медицина

FREE

Лекция №1 3 курс 6 семестр (packed) (Хирургическая стоматология)

Медицина

FREE

Пищевые отравления: классификация, клиника, методика расследования, профилактика. Часть 3

Медицина

Чтобы принять или опровергнуть эти предположения, используют статистические критерии или критерии достоверности.

Статистический критерий -- это случайная величина, закон распределения которой известен, т.е. каждому значению критерия поставлена в соответствие вероятность, с которой он эти значения принимает.

Для каждого критерия существует таблица, в которой содержатся критические значения критерия. Каждое критическое значение соответствует определённому уровню значимости α и числу степеней свободы (или к)

где а -- число наложенных связей или ограничений.

α=1-Р_Д_-- это вероятность принять ошибочную гипотезу.

Критические значения позволяют определить вероятность нулевой гипотезы: Р(Н₀).

Гипотеза Н₀принимается, если в результате проверки выяснилось, что её вероятность больше выбранного уровня значимости.

если Р(Н₀)>α , то Н₀ принимаем,

если Р(Н₀)<α , то Н₀ отвергаем.

Например: Хотим доказать достоверность различия между выборками X{x₁, x₂, … x_n₁} и Y{y₁, y₂, … y_n₂} с Р_Д=0,95 (это значит, что влияние препарата достоверно (эффективно) на 95%).

Если в результате проверки выяснилось, что Р(Н₀)˃α , (т.е. ˃0,05), то мы вынуждены принять гипотезу Н₀, так как Р(Н)<Р_Д

Р(Н)<0,95.

Основные этапы проверки статистических гипотез.

1).Выдвигается гипотеза Н_0.

2).Выбирается величина уровня значимости α (α=1-Р_Д).

3).По заданному α и числу степеней свободы ν(или к) в таблице находим критическое (табличное) значение критерия.

4).Подсчитывается экспериментальное значение критерия по имеющимся выборкам (для каждого критерия существует формула для определения значения критерия).

5).С помощью сравнения экспериментального и критического значений делается вывод о правомерности гипотезы Н₀.

6).Если Н₀ принимается, следовательно гипотеза Н (о достоверности различий) не верна.

Если Н₀ отвергается, следовательно верна гипотеза Н..(Н₀ и Н -- противоположные события).

Критерии достоверности подразделяются на параметрические и непараметрические.

Параметрические критерии для вычисления экспериментального значения используют статистические параметры: . Они могут использоваться для выборочных совокупностей, распределённых по закону близкому к нормальному (Гаусса).

Непараметрические критерии не требуют вычисления выборочных параметров, они менее точны, дают более грубую оценку, чем параметрические критерии, но:

1). Их можно применять к выборкам, закон распределения которых неизвестен (не обязательно нормальное распределение).

2). Они проще и позволяют быстрее производить проверку рассматриваемых гипотез.

1. Проверка гипотез о законе распределения.

Проверку гипотезы о законе распределения (то есть, соответствует ли выборочная совокупность какому либо определённому распределению) проводят с помощью критерия соответствия (предложен К.Пирсоном в 1900г.).

Критерий Пирсона ().

Н₀ заключается в том, что различие между наблюдаемыми экспериментальными частотами m_i попадания вариант выборки в интервалы вариационного ряда от вычисленных теоретических частот m_i_теор=m_i·P_i_теор не достоверно (т.е. носит случайный характер). Другими словами:

Н₀: экспериментальные данные соответствуют предложенному теоретическому закону распределения.

Экспериментальное значение критерия вычисляется по формуле:

где -- объём выборки, к -- количество интервалов,

-- вероятность попадания в интервал для теоретического распределения.

Затем, по таблице критерия Пирсона для заданного уровня значимости α и числа степеней свободы , где а -- число наложенных связей, находим .

если теоретическое распределение произвольное, то а=1,

если теоретическое распределение распределено по нормальному закону Гаусса, то а=3 -- числу параметров, необходимых для вычисления вероятности: М[X],D[X] и σ[X],. следовательно

Если Н₀принимаем.

Вывод: экспериментальное распределение соответствует теоретическому.

Если Н₀ отвергаем.

Вывод: экспериментальное распределение не соответствует теоретическому.

Пример: Изучался рост 50 человек. В таблице приведены экспериментальные частоты попадания в интервал m_i и теоретические частоты, рассчитанные из вероятностей попадания в интервал для распределения Гаусса. К=5 , n=50.ν=5-3=2,

№ интервала	1	2	3	4	5
m_i практические	5	9	22	8	6
m_i теоретические	5	10	20	10	5
	0,1	0,2	0,4	0,2	0,1

Н₀: Экспериментальное (практическое) распределение соответствует распределению Гаусса. (То есть различие между частотами не достоверно, носит случайный характер).

Из таблицы для ν=5-3=2 и ά=0,05 находим =5,99

Т.к. Н₀ принимаем.

Вывод: практическое распределение соответствует распределению Гаусса.

2. Критерий Стьюдента.

Параметрический критерий , который используют для проверки статистических гипотез по выборкам, распределённым по нормальному закону Гаусса.

Используется:

1). Для определения достоверности среднего арифметического, полученного для одной выборки.

2). Для определения достоверности различия средних арифметических двух выборок.

3). Для определения достоверности корреляции двух случайных величин.

1). Проверка достоверности полученного среднего арифметического.

Определяется, существенны ли различия между -- среднего значения для выборки и М[X] -- мат. ожидания генеральной совокупности.

Н₀: М[X]=0, то есть не достоверно.

где ошибка среднего арифм-го.

Число степеней свободы

Находим из таблицы критерия Стьюдента для и заданного ά,

если Н₀ принимаем. Вывод: недостоверно

если Н₀ отвергаем. Вывод: достоверно

2). Сравнение средних значений двух выборок.

Имеем две выборочные совокупности:

X{x₁, x₂, … x_n₁} и Y{y₁, y₂, … y_n₂}

n₁ –объём первой выборки, n₂ – объём второй выборки.

Н₀: М[X]=M[Y] или M[X]-M[Y]=0, т.е. обе выборки принадлежат одной генеральной совокупности, то есть различия между выборками не достоверны. Задаём уровень значимости ά.

ошибка разности средних арифметических .

Число степеней свободы

Если ,

Находим из таблицы критерия Стьюдента для и заданного ά, .

если Н₀ принимаем

Вывод: обе выборки принадлежат одной генеральной совокупности, различия между выборками не достоверны.

если Н₀ отвергаем

Вывод: обе выборки не принадлежат одной генеральной совокупности, различия между выборками достоверны.

3. Непараметрические критерии.

Непараметрические критерии сравнивают сами значения выборок (варианты), они используют ранги.

Ранг -- это место по возрастанию.

Если встречается несколько одинаковых значений, то их ранг = среднему арифметическому рангов. Число рангов=n -- количество значений для которых расставляем ранги.

Пример:

X	Ранг
5	7
3	4
2	2,5	Ранг «2»=
5	7	Ранг «5»=
8	9
9	10
5	7
1	1
2	2,5
4	5
N=10

1).Критерий Вилкоксона.

Работает с так называемыми сопряжёнными вариантами, когда варианты из двух выборок измеряются парами (например, значению x_i до воздействия препарата соответствует y_iпосле воздействия).

Итак, имеем две выборки одинакового объёма n₁=n₂=n :

X{x₁, x₂, … x_n} – контроль

Y{y₁, y₂, … y_n} – опыт

Нас интересует достоверно ли различие между выборками, то есть принадлежат ли XиY одной генеральной совокупности для заданного уровня значимости ά.

Алгоритм проверки статистической гипотезы:

1). Н₀: различие между выборками не достоверно.

2). Вычислить разности: . Если =0, то i-ю строку вычеркнуть и n=n-k -- количество вычеркнутых строк.

3). Расставить ранги для разностей, знак разности не учитываем. То есть расставляем ранги для .

4). Подсчитать суммы рангов, учитывая знаки разностей:

R⁺ -- сумма рангов для >0

R^- -- сумма рангов для <0

5). , то есть выбираем меньшее из двух чисел.

6).Определить по таблице критерия Вилкоксона для α и числа степеней свободы=n Т_эксп.

7). Если Т_эксп≤Т_крит то Н₀ отвергаем.

если Т_эксп>Т_крит то Н₀ принимаем.

8). Записать вывод.

Пояснения: считается, что если различия между выборками не достоверны, (то есть верна гипотеза Н₀), то R⁺и R^-не сильно отличаются друг от друга. В таблице содержатся критические значения для меньшей суммы рангов и если Т_эксп<Т_крит ,

то различия велики и гипотезу Н₀ следует отвергнуть.

Пример: Достоверны ли различия между выборками для уровня значимости α=0,05? Н₀: Различия между выборками не достоверны.

№	Контроль Х	Опыт Y	Разности	Ранг разности
1	32	21	11	7
2	31	19	12	8
3	29	27	2	2,5
4	28	29	-1	1
5	30	30	0
6	27	29	-2	2,5
7	29	22	7	6
8	33	27	6	5
9	26	21	5	4