rpd000003197 (1012246), страница 29
Текст из файла (страница 29)
Очевидно, что при справедливости гипотезы Н: Fx=Fy выполняется условие Р(xi yj) = Р(xi yj) = 0.5, то есть количество “успехов” и “неудач” должно быть приблизительно равно, а это значит, что значение статистики Манна-Уитни не должно значительно отклоняться от mn/2.. Напротив, в случае Fx Fy выполняется условие Р(xi yj) 0.5 и общее число успехов имеет тенденцию превосходить значение mn/2, в случае Fx Fy выполняется условие Р(xi yj) 0.5 и общее число успехов должно быть меньше mn/2.
Оказывается, в том случае, когда гипотеза Н выполнена (то есть исследуемые выборочные совокупности не обнаруживают различий в значениях численного показателя, на основе которого проводится оценка) распределение статистики Манна-Уитни не зависит от законов распределения значений xi и yj, i=1,..,m; j=1,..,n, а зависит только от объемов выборок. В таблицах математической статистики приводятся функции распределения значений U, что позволяет сформулировать правило проверки сформулированной гипотезы:
-
задается уровень значимости р, формирующий требования со стороны исследователя к достоверности выводов. Ранее неоднократно отмечалось, в качестве стандартных значений р, обеспечивающих приемлемую на практике достоверность выводов, используются значения р=0.001, р=0.01, р=0.05;
-
используя таблицы распределения Манна-Уитни рассчитывается верхнее критическое значение статистики UП(р,m,n), то есть такое значение статистики, вероятность превышения которого равна P{ U UП(,m,n)}= р. Превышение рассчитанным значением статистики U* верхнего критического значения U UП(,m,n)} означает, что нулевая гипотеза должна быть отвергнута в пользу правосторонней альтернативы (значения yj имеют тенденцию превосходить значения xi);
-
рассчитывается нижняя критическая граница статистики Манна-Уитни UЛ(р,m,n): UЛ(р,m,n)=mn-UП(р,m,n). Сформулированная гипотеза, предполагающая отсутствие различий между выборочными совокупностями по значениям исследуемого показателя, отвергается в пользу левосторонней гипотезы (значения xi имеют тенденцию превосходить значения yj), если рассчитанное значение статистики Манна-Уитни U* UЛ(,m,n);
-
наконец, если рассчитанное значение статистики Манна-Уитни лежит в диапазоне UЛ(р,m,n) U* UП(,m,n) предположение об отсутствии различий между исследуемыми группами принимается.
В большинстве статистических пакетов используется более простое правило проверки нулевой гипотезы: нулевая гипотеза должна быть отвергнуто если вероятности P{U U*} или P{U U*} оказываются малыми. Ранее мы упоминали, что достаточно малыми (на соответствующем уровне значимости) полагаются вероятности, не превышающие стандартные уровни значимости.
В случае достаточно больших объемов m,n исследуемых выборок используют аппроксимацию распределения статистики U нормальным распределением с последующей проверкой гипотезы Н с использованием критических значений нормального распределения. Для этого вместо величины U используется величина Z: Z=(U-mU)/U, где mU=nm/2; 2U=mn(m+n+1)/12. Доказано, что при достаточно больших значениях m,n случайная величина Z имеет стандартное нормальное распределение с нулевым математическим ожиданием и единичной дисперсией.
В этом случае правило проверки гипотезы Н формулируется следующим образом: гипотеза отвергается в пользу соответствующих альтернатив, если оказывается малой вероятность 1-Ф(Z*), где Ф(Z*) – функция стандартного нормального распределения (функция Лапласа), Z* – наблюдаемое значение случайной величины Z, рассчитываемое на основе вышеприведенной формулы.
Рассмотрим представление результатов выполнения критерия Манна-Уитни в пакете STATISTICA. Целью статистического исследования являлась оценка индивидуальных различий в манере пилотирования двух летчиков, обладающих одинаковой летной квалификацией. В процессе экспериментального исследования два летчика на пилотажном стенде многократно выполняли режим посадки. В процессе пилотирования в фиксированных точках траектории посадки регистрировались управляющие реакции каждого из летчиков на основе измерения значений перемещений ручки управления самолетом (РУС) по тангажу. Таким образом, объектом статистического исследования являются две независимые выборки значений, объединяющие значения перемещений РУС. Цель статистического исследования заключалась в подтверждении того факта, что летчикам присуща индивидуальная манера пилотирования («почерк»). В математической постановке задача формулировалась как оценка различий между двумя независимыми выборками.
Анализ распределения величин перемещений РУС в обоих выборках показал их существенные отличия от нормального закона распределения, что указывает на необходимость использования рангового критерия Манна-Уитни. Результаты его применения иллюстрирует рис. 3.3
Таблица результатов, отображаемая пользователю в пакете STATISTICA, включает следующие необходимые значения, на основе которых формулируется окончательный вывод. С точки зрения интерпретации результатов представляют интерес следующие данные:
-
наблюдаемое значение статистики Манна Уитни (U);
-
наблюдаемое значение статистики Z, представляющей собой результат аппроксимации распределения Манна-Уитни стандартным нормальным распределением;
-
уровень значимости гипотезы, предполагающей равенство значений исследуемого показателя в рассматриваемых группах (p);
Полученные результаты подтверждают наличие статистически достоверных (на уровне значимости р=0.05) различий в управляющих реакциях летчиков даже при выполнении ими такого максимально регламентированного полетного режима, как режим посадки. Этот вывод указывает на необходимость учета индивидуальных психофизиологических реакций летчиков, например, при разработке бортовых средств, реализующих функции поддержки их управляющих действий.
3.3. Анализ групповых различий по качественным показателям.
Ранее упоминалось, что значительное место среди результатов экспериментальных исследований занимают качественные признаки, то есть признаки, регистрируемые по принципу «да» – «нет». Предположим, что предметом статистического исследования являются две независимые группы, которые сравниваются между собой по значению некоторого качественного показателя.
Рассмотрим методы, позволяющие проводить подобный анализ. Качественном признаку можно поставить в соответствие дискретное случайное число, принимающее одно из двух возможных значений: у членов выборочной совокупности, обладающих качественным признаком, оно равно 1, а у членов не обладающих этим признаком оно будет равно 0. Таким образом, целью анализа являются две независимые выборки x1,...xn и y1,...,ym, где xi=(0,1), i=1,…,n; yj= (0,1),j=1,…,m. То есть, сравниваемые выборки в этом случае представляют собой случайные последовательности нулей и единиц.
Особенность анализа качественных признаков состоит в том, что они не связаны между собой никакими арифметическими соотношениями, упорядочить их также нельзя, что не позволяет осуществить переход к рангам и использовать в дальнейшем ранговые методы. Единственный способ описания качественных признаков, состоит в том, чтобы подсчитать частоту признака в каждой из групп. Обозначим выборочные частоты качественного признака в двух сравниваемых группах как р1*,р2*. Частота признака в группе представляет собой отношение числа выборочных значений, равных единице к общему числу объектов в группе. Пусть число элементов первой выборки, имеющих значение равное единице равно n*, а второй m*. Тогда выборочные частоты можно рассчитать на основе простых соотношений р1* =n*/n; р2*=m*/m.
Проблема сравнения групп по качественному признаку на основе выборочных частот р1*,р2* состоит в том, что они являются случайными оценками «истинных» вероятностей, характеризующих распределение признаков в генеральной совокупности. Это означает, что сравнение групп на основе выборочных частот не позволяет сформулировать вывод, обладающий достаточной степенью достоверности.
Обозначим р1,р2 – неизвестные нам «истинные» вероятности качественного признака в первой и второй исследуемых группах. Сформулируем нулевую гипотезу Н0: р1=р2 , предполагающую, что исследуемые группы не обнаруживают различий по частоте проявления качественного признака. Для проверки нулевой гипотезы используется статистика
В математической статистике доказывается, что при достаточно больших объемах выборки величина Z имеет стандартное нормальное распределение с нулевым математическим ожиданием и единичной дисперсией. Таким образом, о статистически значимом различии выборочных частот можно говорить, если значение окажется достаточно большим.
Иными словами, имеют место статистически значимые различия выборочных частот, если оказывается малой вероятность Р=1-Ф(Z*), где Ф(Z*) – функция стандартного нормального распределения (функция Лапласа), Z* – наблюдаемое значение случайной величины Z, рассчитываемое на основе вышеприведенной формулы.
При использовании программного пакета STATISTICA расчета уровня значимости Р производится автоматически для конкретных значений наблюдаемых частот р1*,р2* и объемов выборок n, m производится автоматически. На рис. 3.4 приведен экран ввода данных и отображения результатов
Лекция 6.doc
Лекция 6.. Оценка множественных различий между более, чем двумя выборками, объединяющими данные, накопленные в результате повторных воздействий на исследуемый объект.
Объектом исследования рассматриваемой ниже группы методов является многочисленная группа задач анализа экспериментальных данных, общее содержание которых можно представить как сравнение по достигаемым результатам различных способов действия (называемых факторами), направленных на достижение одной цели. Наиболее простой является ситуация, когда имеется только один фактор, влияющий на результат, и этот фактор может принимать конечное число уровней.
В этом случае статистический материал накапливается в результате многократного применения каждого из k способов воздействия (называемых фактором) к исследуемому объекту. Итогом таких исследований являются k выборок. Примером подобной ситуации является, например, экспериментальное исследование, при котором группа летчиков подвергалась воздействию перегрузок различной интенсивности. То есть, статистический материал, доступный для анализа, может быть представлен табл. 6.1.
Таблица 6.1.
Структура данных исследования, сформированных в результате многократных
воздействий на объекты исследуемой группы.
Уровни фактора Объекты | 1 | 2 | ................ | k |
1 2 …. n | x11 x21 .... xn1 | x12 x22 .... xn2 | ................ ................ ................ | x1k x2k .... xnk |
Здесь xij - значение числовой характеристики, на основе которой проводится оценка. 1,...,k- уровни исследуемого фактора; n – объем сравниваемых выборок.
В зависимости от типа данных, на основе проводится сравнение выборочных совокупностей и предположений о характере распределения значений хij возможно использование следующих статистических методов и критериев для оценки различия произведенных воздействий по достигаемому результату:
-
методы дисперсионного анализа повторных наблюдений, используемые в случае, когда сравнение групп проводится на основе регистрации количественной характеристики, имеющей нормальное распределение;
-
ранговый критерий Фридмана используется тогда, когда оценка эффектов воздействий проводится на основе количественного показателя, распределение которого отличается от нормального, либо на основе показателя, измеренного в порядковой шкале;
-
критерий Кокрена используется для анализа эффектов воздействия на основе качественного признака.
6.1. Метод дисперсионного анализа повторных измерений
В тех случаях, когда доказано предположение о том, что распределение значений показателя эффективности xij, i=1,...,n, j=1,...,k принадлежит гауссовскому семейству распределений, можно использовать методы дисперсионного анализа повторных наблюдений.
Подобно рассмотренному ранее методу дисперсионного анализа для сравнения независимых выборочных совокупностей, в данном случае проверка нулевой гипотезы (предполагающей отсутствие различий между исследуемыми воздействиями по достигаемому эффекту) основывается на сравнении двух независимых оценок 12 и 22 дисперсии 2, характеризующей разброс значений xij. При этом, одна из оценок (12)не зависит от того, верна ли нулевая гипотеза, а вторая 22- существенно зависит от ее справедливости. Оценки 12 и 22 в методе множественного анализа повторных наблюдений определяются следующим образом: