rpd000003197 (1012246), страница 28
Текст из файла (страница 28)
Чаще всего в практических задачах дисперсии 2x, 2y заранее неизвестны и должны быть определены на основе выборочных значений. В этом случае для проверки нулевой гипотезы (предполагающей отсутствие различий между группами по величине числовой характеристики) используется статистика:
где - выборочные средние измеряемого параметра в сравниваемых группах; n,m- объемы выборок;
- объединенная оценка неизвестных дисперсий 2x, 2y
Приведенная выше статистика Т в том случае, когда нулевая гипотеза верна, имеет стандартное t - распределение (распределение Стьюдента) с n+m-2 степенями свободы. Очевидно, что предположение об отсутствии различий между сравниваемыми группами по значению исследуемой числовой характеристики должно быть отвергнуто, если рассчитанное значение статистики слишком велико. Как и в случае рассмотренных ранее критериев согласия вопрос состоит в том, чтобы определить какую величину следует считать «достаточно большой», чтобы утверждать наличие значимых различий между группами.
Учитывая, что Т – случайная величина, подобно тому, как мы рассуждали применительно к проверке согласия распределений, «достаточно большим» является такое значение статистики, для которого выполняется неравенство /Т*/ Т/2, где /Т*/ –абсолютное значение статистики, рассчитанное на основе выборочных значений ,
; Т/2 – значение квантили стандартного t-распределения с n+m-2 степенями свободы, соответствующее доверительной вероятности /2. Как уже указывалось ранее достаточная достоверность результатов проверки гипотезы достигается на уровне =0.95, =0.99 или =0.999.
Другой способ проверки нулевой гипотезы, используемый в большинстве статистических пакетов, основан на вычислении вероятности р = Р{t /T*/} получить такое же или большее значение статистики. Если указанная вероятность слишком мала, то есть р 1-, где - значение доверительной вероятности, в качестве которого обычно используются приведенные выше значения, нулевая гипотеза отвергается на уроне значимости 1-.
Ранее упоминалось, что возможности статистических пакетов ограничены использованием критерия Стьюдента в случае равенства генеральных дисперсий. На практике, как правило, отсутствуют убедительные соображения, подтверждающие это утверждение. Проверка этого условия возможна лишь на основе имеющихся выборочных данных. Поэтому, в статистических пакетах, наяду с вычислением статистики Т и вероятности р, предусмотрен расчет отношения Фишера, позволяющего проверить гипотезу о равенстве генеральных дисперсий.
Отношением или статистикой Фишера для проверки гипотезы о равенстве дисперсий x2= y2 называется отношение следующего вида:
В случае справедливости гипотезы о равенстве дисперсий величина F имеет стандартное F- распределение с числом степеней свободы (n-1,m-1). То есть гипотеза x2= y2 принимается против альтернативы x2 y2, если
F [F /2, F1- /2],
где F /2 ,F1- /2 - квантили F- распределения уровней /2 ,1-/2 соответственно с числом степеней свободы (n-1,m-1). Значение доверительной вероятности , как уже неоднократно указывалось, выбирается достаточно большим (=0.95, =0.99 или =0.999). То есть интервал [F /2, F1- /2] ограничивает диапазон, в который, при справедливости предположения о равенстве генеральных дисперсий, с вероятностью P{F [F /2, F1- /2]} = должны попадать значения статистики Фишера. Напротив, вероятность р = P{F[F /2,F1-/2]} получения значения статистики вне указанного диапазона очень мала. То есть, гипотеза о равенстве генеральных дисперсий должна быть отвергнута (на уровне значимости 1- ) , если рассчитанное значение вероятности р 1-.
Проиллюстрируем реализацию критерия Стьюдента с использованием статистического пакета STATISTICA (рис. 3.1).
Из приведенного рисунка видно, что пакет STATISTICA, как впрочем и большинство известных статистических пакетов, не формулирует окончательный вывод. Он предлагает набор данных, достаточный для того, чтобы сформулировать вывод в терминах исследуемой задачи. Структура отображаемых данных включает в себя следующие значения:
-
выборочное среднее
значений исследуемого показателя в первой сравниваемой группе (Mean G_1);
-
выборочное среднее
значений исследуемого показателя во второй сравниваемой группе (Mean G_2);
-
статистика Стьюдента Т (t-value);
-
число степеней свободы (df);
-
значимость р гипотезы о равенстве средних значений в исследуемых группах;
-
объем выборочных данных в первой группе (valid G_1);
-
объем выборочных данных во второй группе (valid G_2);
-
дисперсия
значений показателя в первой группе (Std. Dev. G_1);
-
дисперсия
значений показателя во второй группе (Std. Dev. G_2);
-
статистика Фишера (F-ratio);
-
значимость гипотезы о равенстве дисперсий в исследуемых группах (p variance).
Представленные результаты позволяют сделать следующие выводы. Во-первых, рассчитанный уровень значимости статистики Фишера (р =0.245) не является достаточно малым, чтобы отвергнуть гипотезу о равенстве дисперсий в исследуемых группах. То есть предпосылки, необходимые для корректного использования критерия Стьюдента (наряду с ранее доказанным нормальным характером распределения выборочных значений в обоих в группах), выполнены. Во-вторых, рассчитанный уровень значимости для Статистики Стьюдента достаточно мал (р < 0.01), чтобы утверждать с достаточной степенью достоверности, что наблюдаются различия в значениях исследуемого показателя в сравниваемых группах.
3.2. Непараметрические (ранговые) критерии оценки групповых различий. Критерий Манна-Уитни.
Непараметрические тесты для сравнения двух независимых выорочных совокупностей используются в тех случаях, когда либо невозможно обоснованно (на основе критериев согласия) доказать принадлежность распределения количественного параметра, по которому проводится сравнение, нормальному закону распределения, либо сравнение производится по количественной характеристике, измеренной в порядковой шкале. Вся совокупность непараметрических критериев может быть подразделена на две группы, отличающиеся способом представления значений числовой переменной, по которой проводится сравнение: первая группа - ранговые критерии (критерий Вальда - Волфовитца, критерий Манна-Уитни, критерий Уилкоксона, критерий знаков); вторая группа - критерии, основанные на анализе конкретных значений числовой переменной (критерий Колмогорова-Смирнова для двух выборок).
Ранговые критерии основаны на переходе от анализа конкретных значений числовой переменной к анализу информации об их взаимной упорядоченности. Для этого осуществляют переход от исходных числовых значений к их рангам. Рангом называют тот номер, который получает некоторое значение переменной в упорядоченной по определенному правилу (например, в порядке возрастания значений переменной) совокупности всех значений. Привлекательность ранговых критериев заключается в том, что они надежно работают при очень слабых предположениях о характере распределения эмпирических данных, не требуя, чтобы эти распределения имели какой-либо конкретный закон распределения. Поясним смысл ранговых критериев на примере критерия Манна-Уитни.
По-прежнему рассматриваются две выборки x1,...xn и y1,...,ym значений исследуемой переменной в каждой из двух сравниваемых групп объемами n и m соответственно. Обозначим Fx, Fy - функции распределений случайных значений x1,...xn и y1,...,ym. Применение ранговых критериев основано на следующих предположениях:
1) выборки x1,...xn и y1,...,ym - независимы;
-
функции распределения Fx, Fy - непрерывны (то есть среди значений x1,...xn и y1,...,ym нет совпадающих);
-
кроме того, критерий Манна-Уитни предполагает, что формы функций распределений Fx, Fy совпадают, а различаются лишь их положения на числовой оси. То есть критерий Манна-Уитни позволяет делать выводы на основе различий в положениях функций распределения. В отличие от него критерий Вальда - Волфовитца и критерий Колмогорова-Смирнова позволяют делать выводы на основе анализа различий не только в положении функций распределения, но и на основании анализа различий в форме функций распределения Fx, Fy.
В рамках ранговых критериев сравнение двух независимых групп основано на проверке гипотезы Н: Fx=Fy, альтернативой к которой выступают все возможности FxFy. Для подтверждения приведенной выше гипотезы критерий Манна-Уитни использует следующую идею. Пусть выполнение условия xi yj,(значение исследуемого показателя в первой группе не превышает его значение во второй) i=1,..,m; j=1,..,n означает “успех”, а xi yj (некоторое значение исследуемого показателя в первой группе превышает его значение во второй) означает “неудачу”. Сформируем mn всех пар сравнений и обозначим через U число успехов, 0 U mn. Определенная таким образом случайная величина U называется статистикой Манна-Уитни.