Шушерина О.А. - Математическая статистика для психологов (1092915), страница 6
Текст из файла (страница 6)
Альтернативная гипотеза может иметь различный вид: например,
, или
, или
.
Какая из этих гипотез более важна?
В психологии, как и в других науках, выявление различий более информативно в поиске нового, чем доказательство сходства. В психологии выявление различия разнообразных характеристик человека равносилен свидетельству его процесса развития, поэтому задача доказательства значимости различий (в терминах теории проверки гипотез – принятия альтернативной гипотезы) более существенна.
2. Критерий значимости. Общая схема проверки статистических гипотез
Для проверки любой статистической гипотезы выбирается какой-либо критерий, называемый критерием значимости - правило проверки статистической гипотезы.
Выдвинутую гипотезу проверяют на основе имеющейся выборки.
Суть проверки статистической гипотезы состоит в том, что для принятия или отклонения выдвинутой гипотезы используется специально составленная выборочная характеристика, случайная величина , называемая критерием значимости. Она получена по выборке, и закон ее распределения считается известным (точно или приближенно). С помощью случайной величины
по определенному правилу определяется «граница» между принятием и отклонением гипотезы. Поэтому термином «критерий » обозначают также правило, по которому принимается статистическое решение.
В основе большинства критериев значимости лежит следующий простой принцип: если сделана гипотеза о том, что событие имеет очень малую вероятность
(в психологии это обозначается часто
), но в результате одного лишь испытания это событие произошло, то следует подвергнуть сомнению справедливость выдвинутой гипотезы.
Вероятность
практически невозможного события абстрактно выбирать нельзя. Ее значения диктуются реальной ситуацией. Например, если
- вероятность нераскрытия парашюта, то
должно быть десятичной дробью с большим количеством нулей после запятой. Это число обычно стандартизируется мировой практикой. Так же и в психологии.
Уровнем значимости
называется столь малая вероятность, что событие с такой вероятностью является практически невозможным.
Необходимый уровень статистической значимости
выбирается психологом в зависимости от задач и гипотез исследования:
низкий уровень
(5%-ый уровень);
достаточный уровень
(1%-ый);
высокий уровень
(0,1%-ый).
Величина уровня значимости
означает, что допускается наличие только пяти ошибок в выборке из 100 испытуемых (случаев, элементов) или одна ошибка из 20 случаев. Большее число раз из 100 ошибиться нельзя, цена таких ошибок слишком велика. В наиболее ответственных случаях (испытаниях), когда требуется особая уверенность в достоверности полученных результатов и надежности выводов, уровень значимости принимают равным
или даже
.
Если сформулированы гипотезы
,
и выбран критерий
, то еще следует указать область маловероятных значений, попадание в которую статистики
заставляет нас отвергнуть
и принять
.
Критической областью критерия значимости называется такая часть области значений
, вероятность попадания в которую этой
, при условии истинности проверяемой гипотезы
, равна уровню значимости
.
Дополнительная область называется областью допустимых значений статистики критерия. Если значение критерия принадлежит области допустимых значений, то гипотеза
при заданном уровне значимости
принимается. Обычно говорят очень осторожно:
не противоречит имеющейся выборке, т.е. гипотеза
правдоподобна.
Критическую область можно найти однозначно, если иметь большой объем выборки и задав величину
.
Общая схема проверки статистических гипотез.
1. Формулируется нулевая и альтернативная
гипотезы
2. Выбирается уровень значимости (обычно 0,01; 0,05; 0,1).
3. В соответствии с видом гипотезы и типом решения психологических задач выбирается статистический критерий для ее проверки. То есть подбирается специальная случайная величина
.
4. По таблицам распределения критерия находится критическое значение
в зависимости от уровня значимости (или числа степеней свободы), объема выборки (количества наблюдений) и вида гипотез
,
.
5. Определяется вид критической области по виду альтернативной (конкурирующей) гипотезы .
6. На основании экспериментальных данных вычисляется выборочное значение (эмпирическое значение) критерия .
7. Определяется, в какую область (допустимых значений или критическую
) попадает значение
.
8. Формулируется критерий проверки.
Если принадлежит области допустимых значений, следовательно, то гипотеза
принимается на уровне значимости
. Говорят, что выборочные данные не противоречат гипотезе
о генеральной совокупности, т.е. нет оснований отклонить гипотезу
на уровне значимости
.
Если принадлежит критической области, то гипотеза
отклоняется в пользу конкурирующей гипотезы
, так как в результате одного лишь испытания, получения выборки произошло практически невозможное событие
с вероятностью
. Имеющиеся выборочные данные не позволяют с достаточной уверенностью принять
. Иначе говоря, данные наблюдений не согласуются с выдвинутой гипотезой
.
Заметим, что существуют и другие схемы проверки статистических гипотез.
3. Ошибки первого и второго рода. Мощность критерия
При проверке гипотезы экспериментальные данные могут противоречить гипотезе
, тогда эта гипотеза отклоняется.
В противном случае, если экспериментальные данные согласуются с гипотезой
, то она не отклоняется.
Значит, статистическая проверка гипотез, основанная на экспериментальных данных, неизбежно связанно с риском принять ложное решение.
Тогда в терминах правильности или ошибочности принятия H0 и
можно указать четыре потенциально возможных результата применения критерия к выборке. При этом возможны ошибки двух родов.
Ошибкой первого рода называется ошибка отклонения правильной гипотезы. Вероятность ошибки первого рода равна уровню значимости, т.е.
Эта формула означает, что гипотеза
отклоняется с вероятностью
, хотя эта гипотеза верна. Название «уровень значимости» в терминах «сходства и различия» - это вероятность того, что мы сочли различия существенными (приняли
), а они на самом деле случайны (верна гипотеза
).
Для того чтобы проверяемая гипотеза была достаточно обоснованно отвергнута, уровень значимости выбирают достаточно малым, в практике: 0,01; 0,001.
Ошибкой второго рода называется ошибка принятия неверной гипотезы. Вероятность ошибки второго рода обозначается
:
Эта формула означает, что гипотеза
принимается с вероятностью
, хотя верна альтернативная гипотеза
.
Чем меньше уровень значимости, тем меньше вероятность забраковать верную гипотезу, т.е. совершить ошибку первого рода, но при этом увеличивается вероятность принятия неверной гипотезы, т.е. совершения ошибки второго рода.
| Принята гипотеза | ||
H0 | H1 | ||
Верна гипотеза | H0 | | |
H1 | | |
Возможны два статистических правильных решения по выборочным данным:
1) принять верную гипотезу
. Вероятность этого решения называется уровнем доверия;
2) принять верную гипотезу
. Вероятность
такого решения называется мощностью критерия. Мощность критерия в терминах «сходство-различие» - это его способность выявлять различия, если они есть.
4. Односторонний и двусторонний критерии
По виду альтернативной (конкурирующей) гипотезы
определяется вид критической области, в которой результаты выборочного наблюдения выглядят менее правдоподобными в отношении нулевой гипотезы
.
Если конкурирующая гипотеза имеет вид
:
, то критическая область
- правосторонняя и соответствующий критерий называется правосторонним, а в случае
:
- критерий называется левосторонним.
Область допустимых Правосторонняя
значений критическая область
(принятия гипотезы
) (отклонения
и принятия
)
Если конкурирующая гипотеза имеет вид :
, т.е.
, то критическая область
является объединением полубесконечных промежутков: - двусторонняя.
Область