rpd000003197 (1012246), страница 24
Текст из файла (страница 24)
где
выборочное среднее значение показателя в j-ой группе,
Оценка 22 определяется следующим образом:
где
выборочное среднее значений показателя, рассчитанное по всей совокупности данных. Оценка 22 отличается тем, что она возрастает тем больше, чем больше отклонение от сформулированного предположения (нулевой гипотезы). Поскольку 12 , 22- две независимые оценки дисперсии 2, характеризующей разброс значений случайного показателя, их частное:
F = 12/22
должно иметь F- распределение с (k-1,N-k) степенями свободы.
Оценка значимости нулевой гипотезы на основе статистики Фишера, подробно рассматривалась нами при обсуждении критерия Стьюдента в части подтверждения равенства генеральных дисперсий. Напомним коротко процедуру проверки гипотезы. Поскольку против гипотезы H0 говорят большие значения 22 , следовательно, нулевая гипотеза должна быть отвергнута, если вероятность p=P(FFнабл )- мала. Здесь Fнабл – наблюдаемое значение статистики, рассчитываемое на основе опытных данных.
Рассмотрим применение метода дисперсионного анализа на примере оценки эффективности трех конкурирующих вариантов формирования курсо-глиссадных планок на панели пилотажно-командного прибора (ПКП). Курсо-глиссадные планки задают требуемое положение самолета по высоте и боковому отклонению на посадочной глиссаде. В экспериментальном исследовании участвовали три летчика, обладающих одинаковой летной квалификацией. Каждый из летчиков выполнил 50 посадочных режимов используя ПКП, на панели которого отображались курсо-глиссадные планки, алгоритмически формируемые тремя разными способами:
- традиционным с использованием радиотехнической системы посадки (летчик №1);
- традиционным с использованием радиотехнической системы посадки и вводом «стимулирующих» поправок, активизирующих действия летчика при отклонении от требуемого положения (летчик №2);
- с поправками, учитывающими различия управляющих реакций каждого из летчиков (индивидуально-адаптированные курсо-глиссадные планки, летчик №3).
В качестве показателя эффективности вариантов формирования курсо-глиссадных планок на панели ПКП использовалась точность приведения самолета на ВПП (боковое отклонение от оси ВПП в точке касания). Таким образом, в результате проведенных исследований были сформированы три независимые выборки, объединяющие значения показателей точности приведения самолета на ВПП, продемонстрированные каждым из летчиков. Целью статистического исследования является ответ на вопрос: различаются ли рассматриваемые варианты формирования курсо-глиссадных планок по достигаемому эффекту или они равнозначны
Предварительный анализ с использованием критерия согласия Колмогорова-Смирнова подтвердил соответствие распределения значений бокового промаха нормальному закону распределения, что указывает на необходимость использования метода дисперсионного анализа для ответа на поставленный вопрос. На рис. 4.1 приведена компоновка экранов пакета STATISTICA, обеспечивающих вызов процедуры дисперсионного анализа и представление результатов.
Результаты выполнения процедуры дисперсионного анализа в пакете STATISTICA представлены в виде таблицы, содержащей данные, участвующие в вычислении дисперсий 12,22 и F-отношения. Рассчитанный уровень значимости мал настолько, что позволяет с требуемой достоверностью утверждать, что среди трех рассматриваемых вариантов формирования курсо-глиссадных планок на панели ПКП есть такой, который по достигаемому эффекту превосходит другие. Дальнейший анализ показал, что использование индивидуально-адаптированных курсо-глиссадных планок обеспечивает существенное повышение точности приведения самолета на ВПП,
4.2. Критерий Краскела-Уоллиса.
Критерий Краскела-Уоллиса предполагает проверку гипотезы H0, состоящей в том, что между столбцами таблицы различия отсутствуют. Для проверки гипотезы H0 значения xij, i=1,...,ni, j=1,...,k заменяются их рангами rij, упорядочивая всю совокупность значений xij, i=1,...,ni, j=1,...,k, например, в порядке возрастания. В основе критерия Краскела-Уоллиса лежит то обстоятельство, что при справедливости гипотезы H0, различия между средними рангами Rj, j=1,...,k, вычисленными по каждому из столбцов исходной таблицы рангов rij и средним рангом R, вычисленным по всей совокупности значений rij i=1,...,ni, j=1,...,k, должны быть незначительными. В качестве количественной меры указанных различий используется статистика Краскела-Уоллиса:
где
R = (N+1)/2- средний ранг, расcчитанный по всей совокупности значений rij i=1,...,ni, j=1,...,k,
Распределение статистики H при справедливости нулевой гипотезы приведено в сборниках статистических таблиц. При больших объемах выборок случайная величина H имеет стандартное 2 -распределение с k-1 степенями свободы. Это позволяет достаточно просто сформулировать правило проверки сформулированной нулевой гипотезы. По таблице значений 2-распределения можно определить квантиль 2- предельное значение, не превышаемое статистикой 2 с уровнем доверительной вероятности . По смыслу статистики Краскела-Уоллиса предположение о согласии должно быть отвергнуто, если рассчитанное на основе экспериментальных данных значение Н слишком велико. Здесь, учитывая случайный характер статистики 2, термин «слишком велико» означает, что Н 2.
Или, иными словами, если вероятность р=Р(2 Н) слишком мала, то есть р 1- где - принятое значение доверительной вероятности (=0.95, =0.99, =0.999), говорят, что нулевая гипотеза отвергается на уроне значимости 1-.
На рис. 4.2 приведена компоновка экранов пакета STATISTICA, обеспечивающих вызов критерия Краскела-Уоллиса и представление результатов.
4.3. Оценка множественных групповых различий на основе качественных признаков. Критерий 2.
Как уже отмечалось выше данный метод используется для сравнения групп, когда характеристика, на основе которой проводится анализ, представляет собой качественный признак, регистрируемый по принципу «да – нет». Основу статистического анализа такого рода данных составляет таблица сопряженности признаков. Таблица сопряженности признаков имеет следующую структуру (табл. 4.1):
Таблица 4.1.
Структура таблицы сопряженности признаков
Группа | Количество объектов группы, у которых наблюдался качественный признак («да») | Количество объектов группы, у которых отсутствовал качественный признак («нет») | Всего объектов в группе |
1 | N11 | N12 | N11 +N12 |
2 | N21 | N22 | N21 +N22 |
………….. | ……………. | ……………. | ……………. |
k | Nk1 | Nk2 | Nk1 +Nk2 |
Всего: | N1 | N2 | N |
Дальнейший анализ проводится в следующей последовательности. Подсчитывается доля объектов, у которых наблюдался исследуемый признак («да), от общего числа объектов f1= N1/N и доля объектов, у которых этот признак отсутствовал f2 = N2 /N. Если предположить, что сравниваемые группы не обнаруживают различий по рассматриваемому качественному признаку, то доля объектов, у которых наблюдался данный признак, в каждой группе составляло бы величину f1 от числа объектов в группе. Соответственно доля объектов, у которых отсутствовал данный качественный признак, составляло бы величину f2 от числа объектов в группе. Исходя из этих соображений рассчитываются ожидаемые численности объектов :
N*j1 =Nj1 f1 , N*j2 =Nj2 f2, j=1,…k.
Рассчитывается значение статистики Х2 :
При справедливости предположения о том, что исследуемые группы не различаются случайная величина Х2 распределена как 2 с (k-1) степенями свободы. Исходя из этого нулевая гипотеза, предполагающая отсутствие различий между группами, отвергается на уровне значимости 1-, если наблюдаемое значение статистики Х2 2, где 2 - квантиль распределения 2 с (k-1) степенями свободы для доверительной вероятности (=0.95, =0.99, =0.999).
Лекция 2.doc
Лекция 2. Основные теоретические законы распределения вероятностей, наиболее используемые в процессе статистической обработки экспериментальных данных
Процесс обработки и анализа экспериментальных данных существенно упрощается, если их распределение может быть описано одним из теоретических законов распределения, свойства которых исчерпывающе изучены и описаны. В практике обработки экспериментальных данных наибольшее распространение получили следующие теоретические законы распределения.
2.1. Основные теоретические законы распределения