Статистическая проверка гипотез о свойствах эксперимента
Статистическая проверка гипотез о свойствах эксперимента
На основании оценок, полученных по выборке после проведения измерений, можно сделать предположения о распределении генеральной совокупности той или иной случайной величины. Такие предположения называются статистическими гипотезами. Чтобы принять или отвергнуть гипотезу, ее необходимо проверить, т.е. сопоставить некоторые статистические показатели, вычисленные по выборке, со значениями этих показателей, определенных в предположении, что проверяемая гипотеза верна. Эти показатели называются критериями проверки (значимости).
При проверке гипотез можно совершить ошибки двух видов. Можно отвергнуть верную гипотезу. Вероятность такой ошибки не больше принятого при проверке уровня значимости q (либо р). Другая ошибка заключается в том, что принимается неверная гипотеза. Вероятность этой ошибки тем меньше, чем выше уровень значимости, т.к. при высоком уровне значимости отвергается большое число гипотез. Одну и ту же статистическую гипотезу можно исследовать при помощи различных критериев проверки. Обычно стараются выбрать тот, у которого при заданном уровне значимости меньше вероятность a принятия неверной гипотезы, другими словами, чем больше мощность критерия 1-a.
При анализе результатов экспериментов (например, при проверке статистических гипотез о свойствах эксперимента) наиболее часто используются следующие критерии.
· Критерий Фишера (F-критерий)
применяется в случае, когда необходимо проверить гипотезу о фактическом равенстве двух дисперсий нормально распределенной случайной величины. Такие заключения бывают необходимы, в частности, при сравнении точности измерений двумя методами, когда нужно оценить является ли случайным различие дисперсий для одной и той же случайной величины; либо при уточнении вопроса о воспроизводимости эксперимента, когда нужно оценить однородность изменчивости в разных опытах.
По измеренным в ходе опыта значениям вычисляется экспериментальное значение F-критерия, равное отношению двух дисперсий s1 и s2 c соответствующими степенями свободы f1, f2:
(8)
Рекомендуемые материалы
Причем, дисперсия, стоящая в числителе, должна быть больше дисперсии в знаменателе. Найденное экспериментальное значение F-критерия сравнивают с его критическим значением Fкр , соответствующим максимальному значению отношения двух дисперсий, при котором еще можно считать гипотезу о равенстве рассматриваемых дисперсий справедливой. Критическое значение критерия определяется по соответствующим таблицам исходя из числа степеней свободы дисперсий и заданного уровня значимости. Если F< =Fкр , то гипотеза о равенстве выборочных дисперсий принимается. В противном случае рассматриваемые дисперсии нельзя признать равными.
· Критерий Кохрена (G-критерий)
применяется для оценки однородности нескольких дисперсий при равном числе повторов в каждом эксперименте, в частности, при проверке воспроизводимости эксперимента, состояшего из нескольких опытов.
Для его использования рассчитываются дисперсии экспериментальных значений функции отклика в каждом эксперименте. Очевидно, что недоверие будут вызывать наибольшие значения. Поэтому критерий Кохрена подсчитывается как отношение максимального значения изменчивости среди N опытов к сумме изменчивостей во всех опытах:
(9)
Найденное экспериментальное значение сравнивают с критическим Gkp , представляющим собою максимально возможное значение критерия G, при котором гипотеза об однородности дисперсий может считаться справедливой. Критическое значение определяется исходя из числа сравниваемых дисперсий N, числа параллельных опытов n и заданного уровня значимости. Если G<=Gkp, то «подозрительное» максимальное значение изменчивости не является «инородным». В противном случае эксперимент не является воспроизводимым.
· Критерий Стьюдента (t-критерий)
применяется для проверки гипотезы о равенстве двух выборочных средних значений случайной величины, имеющей нормальный (гауссовский) закон распределения (при n>=30 распределение можно считать практически нормальным , при n<=10 распределение не является нормальным). Типичным является его применение для сопоставления номинального значения параметра с реальным, т.е. измеренным в результате эксперимента.
Для его использования подсчитывают выборочные средние арифметические значения случайной величины х1 и х2, соответственно для выборок n1 и n2, и их выборочные стандартные отклонения:
(10)
и
Далее подсчитывают величину стандартного отклонения выборочных средних арифметических значений по формуле:
(11)
и величину
(12)
Для случая, когда среднее выборочное сравнивается с математическим ожиданием М(х) генеральной совокупности N, из которой берется выборка n (n<<N), дисперсия средних подсчитывается по формуле:
Dx = D / n1/2 (13а)
Если генеральная характеристика D неизвестна ( а это наиболее часто встречающийся случай), то берется ее оценка
(13б)
После того, как определены стандартные отклонения выборочных средних арифметических, подсчитывают размах Стьюдента:
(14)
или
(15)
Найденное экспериментальное значение t-критерия сравнивают с критическим, найденным по таблице распределения Стьюдента исходя из заданного критерия значимости и числа степеней свободы f.
Если t<=tkp, то гипотеза о равенстве выборочных средних арифметических значений принимается, а это значит, что выборки взяты из одной и той же генеральной совокупности.
· Критерий Пирсона (c2 -критерий)
и его применение в общем виде для оценки соответствия экспериментального распределения предполагаемому теоретическому можно проиллюстрировать на следующем примере.
Предположим, что имеется статистический ряд наблюдений над случайной величиной х. Требуется проверить, согласуются ли экспериментальные данные с гипотезой о том, что случайная величина имеет предполагаемый теоретический закон распределения.
Первоначально статистический ряд разбивают на k интервалов и подсчитывают число значений случайной величины Y в каждом интервале. В результате получают экспериментальный ряд частот:
m’1, m’2....... m’k
Следует сразу оговорить, что предпосылкой применения критерия c2 является достаточная заполненность интервалов. На практике рекомендуется иметь в каждом интервале не менее 5... 10 наблюдений. число наблюдений п отдельных интервалах мало, имеет смысл объединить эти интервалы.
Исходя из предполагаемого теоретического закона распределения вычисляют частоты в тех самых интервалах, на которые разбит статистический ряд. В результате получают теоретический ряд частот в k интервалах: m1, m2....... mk
Для проверки согласованости теоретического и экспериментального распределении подсчитывают меру расхождения:
Ещё посмотрите лекцию "3 Специфика постсоветского этнонационализма" по этой теме.
(16)
и число степеней свободы n. Число степеней свободы в этом случае равно числу интервалов k минус число ограничений f:
n=k-f. (17)
Число ограничений равно числу параметров в рассматриваемом законе распределення, увеличенному на единицу. Например, для гауссовского закона имеются два параметра [M(х) и (s)]; в этом случае число ограничений равно трем, а экспоненциальный закон характеризуется одним параметром, т. е. число ограничении для него равно двум.
Для распределения c2 составлены специальные таблицы. Пользуясь этими таблицами, можно для каждого значения c2 и числа степеней свободы v, являющихся входами, определить вероятность Р того, что за счет чисто случайных причин мера расхождения теоретического и экспериментального распределения (16) будет меньше, чем фактически наблюдаемое в данной серии опытов значение c2. Если эта вероятность Р мала (настолько, что событие с такой вероятностью можно считать практически невозможным), то результат опыта следует считать противоречащим гипотезе о том, что закон распределения величины Y является гауссовским. Эту гипотезу следует отбросить, как неправдоподобную. Напротив, если вероятность Р сравнительно велика, можно признать расхождение между теоретическим и экспериментальным распределениями несущественным и отнести его за счет случайных причин. Гипотезу о том, что величина Y распределена по нормальному закону, можно считать в этом случае правдоподобной, по крайней мере не противоречащей экспериментальным данным. В таблице приложения входами являются значение c2 и число степеней свободы v. Числа, стоящие в таблице, представляют соответствующие значения Р.
Насколько мала должна быть вероятность Р для того, чтобы отбросить или пересмотреть гипотезу,— вопрос неопределенный. Он не может быть решен из математических соображений, а должен базироваться на априорных сведениях о физической сущности изучаемого процесса.