Шушерина О.А. - Математическая статистика для психологов (1092915), страница 6
Текст из файла (страница 6)
 Альтернативная гипотеза 
 может иметь различный вид: например, 
 , или 
 , или 
 . 
Какая из этих гипотез более важна?
В психологии, как и в других науках, выявление различий более информативно в поиске нового, чем доказательство сходства. В психологии выявление различия разнообразных характеристик человека равносилен свидетельству его процесса развития, поэтому задача доказательства значимости различий (в терминах теории проверки гипотез – принятия альтернативной гипотезы) более существенна.
2. Критерий значимости. Общая схема проверки статистических гипотез
Для проверки любой статистической гипотезы выбирается какой-либо критерий, называемый критерием значимости - правило проверки статистической гипотезы.
Выдвинутую гипотезу проверяют на основе имеющейся выборки.
 Суть проверки статистической гипотезы состоит в том, что для принятия или отклонения выдвинутой гипотезы используется специально составленная выборочная характеристика, случайная величина 
 , называемая критерием значимости. Она получена по выборке, и закон ее распределения считается известным (точно или приближенно). С помощью случайной величины 
 по определенному правилу определяется «граница» между принятием и отклонением гипотезы. Поэтому термином «критерий » обозначают также правило, по которому принимается статистическое решение. 
 В основе большинства критериев значимости лежит следующий простой принцип: если сделана гипотеза о том, что событие имеет очень малую вероятность 
 (в психологии это обозначается часто 
 ), но в результате одного лишь испытания это событие произошло, то следует подвергнуть сомнению справедливость выдвинутой гипотезы. 
  Вероятность 
 практически невозможного события абстрактно выбирать нельзя. Ее значения диктуются реальной ситуацией. Например, если 
 - вероятность нераскрытия парашюта, то 
 должно быть десятичной дробью с большим количеством нулей после запятой. Это число обычно стандартизируется мировой практикой. Так же и в психологии. 
  Уровнем значимости 
 называется столь малая вероятность, что событие с такой вероятностью является практически невозможным. 
  Необходимый уровень статистической значимости 
  выбирается психологом в зависимости от задач и гипотез исследования:
  низкий уровень 
 (5%-ый уровень); 
  достаточный уровень 
 (1%-ый); 
  высокий уровень 
 (0,1%-ый).
  Величина уровня значимости 
 означает, что допускается наличие только пяти ошибок в выборке из 100 испытуемых (случаев, элементов) или одна ошибка из 20 случаев. Большее число раз из 100 ошибиться нельзя, цена таких ошибок слишком велика. В наиболее ответственных случаях (испытаниях), когда требуется особая уверенность в достоверности полученных результатов и надежности выводов, уровень значимости принимают равным 
 или даже 
 . 
  Если сформулированы гипотезы 
 , 
 и выбран критерий 
 , то еще следует указать область маловероятных значений, попадание в которую статистики 
 заставляет нас отвергнуть 
 и принять 
 .
  Критической областью критерия значимости 
 называется такая часть области значений  
 , вероятность попадания в которую этой  
 , при условии истинности проверяемой гипотезы  
 , равна уровню значимости  
 .
 Дополнительная область называется областью допустимых значений статистики критерия. Если значение критерия 
 принадлежит области допустимых значений, то гипотеза 
 при заданном уровне значимости  
 принимается. Обычно говорят очень осторожно: 
 не противоречит имеющейся выборке, т.е. гипотеза 
 правдоподобна. 
 Критическую область можно найти однозначно, если иметь большой объем выборки 
 и задав величину  
 .
Общая схема проверки статистических гипотез.
 1. Формулируется нулевая 
 и альтернативная 
 гипотезы
 2. Выбирается уровень значимости 
 (обычно 0,01; 0,05; 0,1).
 3. В соответствии с видом гипотезы 
 и типом решения психологических задач выбирается статистический критерий для ее проверки. То есть подбирается специальная случайная величина 
 .
 4. По таблицам распределения критерия 
 находится критическое значение 
 в зависимости от уровня значимости (или числа степеней свободы), объема выборки (количества наблюдений) и вида гипотез 
 , 
 . 
 5. Определяется вид критической области по виду альтернативной (конкурирующей) гипотезы 
 .
 6. На основании экспериментальных данных вычисляется выборочное значение (эмпирическое значение) критерия 
 . 
 7. Определяется, в какую область (допустимых значений 
 или критическую 
 ) попадает значение 
 . 
8. Формулируется критерий проверки.
 Если 
 принадлежит области допустимых значений, следовательно, то гипотеза 
 принимается на уровне значимости  
 . Говорят, что выборочные данные не противоречат гипотезе 
 о генеральной совокупности, т.е. нет оснований отклонить гипотезу 
 на уровне значимости  
 .  
 Если 
 принадлежит критической области, то гипотеза 
 отклоняется в пользу конкурирующей гипотезы 
 , так как в результате одного лишь испытания, получения выборки произошло практически невозможное событие 
 с вероятностью 
 . Имеющиеся выборочные данные не позволяют с достаточной уверенностью принять 
 . Иначе говоря, данные наблюдений не согласуются с выдвинутой гипотезой 
 .
Заметим, что существуют и другие схемы проверки статистических гипотез.
3. Ошибки первого и второго рода. Мощность критерия
 При проверке гипотезы экспериментальные данные могут противоречить гипотезе 
 , тогда эта гипотеза отклоняется. 
  В противном случае, если экспериментальные данные согласуются с гипотезой 
 , то она не отклоняется. 
 Значит, статистическая проверка гипотез, основанная на экспериментальных данных, неизбежно связанно с риском принять ложное решение.
 Тогда в терминах правильности или ошибочности принятия H0 и 
  можно указать четыре потенциально возможных результата применения критерия к выборке. При этом возможны ошибки двух родов. 
 Ошибкой первого рода называется ошибка отклонения правильной гипотезы. Вероятность ошибки первого рода равна уровню значимости, т.е.
 Эта формула означает, что гипотеза 
 отклоняется с вероятностью 
 , хотя эта гипотеза верна. Название «уровень значимости» в терминах «сходства и различия» - это вероятность того, что мы сочли различия существенными (приняли 
 ), а они на самом деле случайны (верна гипотеза 
 ). 
 Для того чтобы проверяемая гипотеза была достаточно обоснованно отвергнута, уровень значимости выбирают достаточно малым, в практике: 0,01; 0,001.
 Ошибкой второго рода называется ошибка принятия неверной гипотезы. Вероятность ошибки второго рода обозначается 
 : 
   Эта формула означает, что гипотеза 
 принимается с вероятностью 
 , хотя верна альтернативная гипотеза 
 . 
 Чем меньше уровень значимости, тем меньше вероятность забраковать верную гипотезу, т.е. совершить ошибку первого рода, но при этом увеличивается вероятность принятия неверной гипотезы, т.е. совершения ошибки второго рода.
|   
  |    Принята гипотеза  |  ||
|   H0  |    H1  |  ||
|   
 
 Верна гипотеза  |        H0  |       |       |  
|     H1  |       |       |  |
Возможны два статистических правильных решения по выборочным данным:
 1) принять верную гипотезу 
 . Вероятность этого решения называется уровнем доверия;
  2) принять верную гипотезу 
 . Вероятность 
 такого решения называется мощностью критерия. Мощность критерия в терминах «сходство-различие» - это его способность выявлять различия, если они есть. 
 4. Односторонний и двусторонний критерии
 По виду альтернативной (конкурирующей) гипотезы 
 определяется вид критической области, в которой результаты выборочного наблюдения выглядят менее правдоподобными в отношении нулевой гипотезы 
 .
  Если конкурирующая гипотеза имеет вид 
 : 
 , то критическая область 
 - правосторонняя и соответствующий критерий называется правосторонним, а в случае 
 : 
 - критерий называется левосторонним.
 Область допустимых Правосторонняя
значений критическая область
 (принятия гипотезы 
 ) (отклонения 
 и принятия 
 )
  Если конкурирующая гипотеза имеет вид 
 : 
 , т.е. 
 , то критическая область 
 является объединением полубесконечных промежутков: - двусторонняя. 
 
 
 
Область
 














