Лекция 4 (1032387)
Текст из файла
29
Лекция 4.
4.3. Критерий Стьюдента с точки зрения дисперсионного анализа
Рассмотрим две выборки равного объема n со средними и
и стандартными отклонениями s1 и s2. Как известно, отношение F есть отношение двух оценок дисперсии. Первая оценка – внутригрупповая дисперсия, определяемая как среднее выборочных дисперсий:
Вторая оценка, межгрупповая, вычисляется по выборочным средним:
где - среднее двух выборочных средних:
Исключим теперь из формулы для
:
Так как если разность возводится в квадрат, то все равно что из чего вычитать.
Таким образом, межгрупповая оценка дисперсии
Тогда
Величина в скобках есть t. Поэтому F=t2.
Межгрупповое число степеней свободы в F равно числу групп минус единица 2–1=1. Внутригрупповое число степеней свободы равно произведению числа групп на число, равное численности каждой группы минус единица, 2(n-1), что соответствует числу степеней свободы в критерии Стьюдента. Таким образом, в случае сравнения двух групп критерий Стьюдента и дисперсионный анализ – варианты одного критерия.
4.4. Ошибки в использовании критерия Стьюдента
Критерий Стьюдента предназначен для сравнения двух групп. Однако на практике он широко и часто неправильно используется для оценки различий большего числа групп посредством попарного их сравнения. При этом вступает в силу эффект множественных сравнений.
Рассмотрим пример. Исследуют влияние препаратов 1 и 2 на уровень глюкозы плазмы. Исследование проводят на трех группах — получавших препарат 1, получавших препарат 2 и получавших плацебо 3. С помощью критерия Стьюдента проводят 3 парных сравнения: группу 1 сравнивают с группой 3, группу 2—с группой 3 и наконец 1 с 2. Получив достаточно высокое значение t в каком-либо из трех сравнений, сообщают, что «Р < 0,05». Это означает, что вероятность ошибочного заключения о существовании различий не превышает 5%. Но это неверно: вероятность ошибки значительно превышает 5%.
Разберемся подробнее. В исследовании был принят 5% уровень значимости. Значит, вероятность ошибиться при сравнении групп 1 и 3 — 5%. Казалось бы, все правильно. Но точно так же мы ошибемся в 5% случаев при сравнении групп 2 и 3. И наконец, при сравнении групп 1 и 2 ошибка возможна также в 5% случаев. Следовательно, вероятность ошибиться хотя бы в одном из трех сравнений составит не 5%, а значительно больше. В общем случае эта вероятность равна
Р'=1-(1-α)m (16)
где m — число сравнений.
При небольшом числе сравнений можно использовать приближенную формулу
P'= α m (17)
то есть вероятность ошибиться хотя бы в одном из сравнений примерно равна вероятности ошибиться в одном, помноженной на число сравнений.
Итак, в нашем исследовании вероятность ошибиться хотя бы в одном из сравнений составляет примерно 15%. При сравнении четырех групп число пар и соответственно возможных попарных сравнений равно 6. Поэтому при уровне значимости в каждом из сравнений 0,05 вероятность ошибочно обнаружить различие хотя бы в одном равна уже не 0,05, а примерно 6*0,05 = 0,30. И когда исследователь, выявив таким способом «эффективный» препарат, будет говорить про 5% вероятность ошибки, на самом деле эта вероятность равна 30%.
При неправильном применении критерия Стьюдента возможен противоречивый результат. Например, действие препарата 1 может быть признано отличным от плацебо, хотя действие препарата 2 признается одинаковым с препаратом 1 и плацебо одновременно.
Поэтому использовать критерий Стьюдента можно при соблюдении следующих правил:
• Критерий Стьюдента может быть использован для проверки гипотезы о различии средних только для двух групп.
• Если схема эксперимента предполагает большее число групп, воспользуйтесь дисперсионным анализом.
• Если критерий Стьюдента был использован для проверки различий между несколькими группами, то истинный уровень значимости можно получить, умножив уровень значимости при одном сравнении на число возможных сравнений.
4.5. Критерий Стьюдента для множественных сравнений
В предыдущем разделе мы познакомились с эффектом множественных сравнений. Он состоит в том, что при многократном применении критерия вероятность ошибочно найти различия там, где их нет, возрастает.
Если исследуемых групп больше двух, то следует воспользоваться дисперсионным анализом. Однако дисперсионный анализ позволяет проверить лишь гипотезу о равенстве всех средних. Но, если гипотеза не подтверждается, нельзя узнать, какая именно группа отличается от других.
Это позволяют сделать методы множественного сравнения. Все они основаны на критерии Стьюдента, но учитывают, что сравнивается более одной пары средних. Когда же следует использовать эти методы? Подход состоит в том, чтобы в первую очередь с помощью дисперсионного анализа проверить нулевую гипотезу о равенстве всех средних, а уже затем, если нулевая гипотеза отвергнута, выделить среди них отличные от остальных, используя для этого методы множественного сравнения. Простейший из методов множественного сравнения — введение поправки Бонферрони.
Как было показано в предыдущем разделе, при трехкратном применении критерия Стьюдента с 5% уровнем значимости вероятность обнаружить различия там, где их нет, составляет не 5%, а почти 3*5=15%. Этот результат является частным случаем неравенства Бонферрони: если m раз применить критерий с уровнем значимости а, то вероятность хотя бы в одном случае найти различие там, где его нет, не превышает произведения m на α. Неравенство Бонферрони выглядит так:
α'< mα,
где α' — вероятность хотя бы один раз ошибочно выявить различия.
Можно сказать, что α', собственно, и является истинным уровнем значимости многократно примененного критерия. Из неравенства Бонферрони следует, что если мы хотим обеспечить вероятность ошибки α', то в каждом из сравнений мы должны принять уровень значимости α'/m — это и есть поправка Бонферрони. Например, при трехкратном сравнении уровень значимости должен быть 0,05/3 =1,7%.
Поправка Бонферрони хорошо работает, если число сравнений невелико. Если оно превышает 8, метод становится слишком «строгим» и даже весьма большие различия приходится признавать статистически незначимыми. Существуют не столь жесткие методы множественного сравнения, например критерий Ньюмена-Кейлса. Все методы множественного сравнения схожи с поправкой Бонферрони в том, что, будучи модификацией критерия Стьюдента, учитывают многократность сравнений.
Один из способов смягчить строгость поправки Бонферрони состоит в том, чтобы увеличить число степеней свободы, воcпользовавшись знакомой из дисперсионного анализа внутригрупповой оценкой дисперсии. Вспомним, что
где s2 — объединенная оценка дисперсии совокупности.
Используя в качестве такой оценки внутригрупповую дисперсию s2вну, получим:
Если объемы выборок одинаковы, то
Число степеней свободы v=k(n-1). Если число групп k больше 2, то число степеней свободы при таком расчете будет больше 2(n-1), благодаря чему критическое значение t уменьшится.
Практическая рекомендация для тех, кто пользуется поправкой Бонферрони. Если требуемое значение для α в таблице отсутствует (например, α=0,017), то можно использовать ближайшее значение α (в примере это 0,01), либо приблизительно рассчитать нужное критическое значение tн по соседним. Если нужное значение αн находится между α1 и α2, которым соответствуют критические значения t1 и t2, то
4.6. Критерии Ньюмена-Кейлса и Тьюки
При большом числе сравнений поправка Бонферрони делает критерий Стьюдента слишком жестким. Критерий Ньюмена-Кейлса дает более точную оценку вероятности α'; его чувствительность выше, чем у критерия Стьюдента с поправкой Бонферрони.
Сначала нужно с помощью дисперсионного анализа проверить основную гипотезу о равенстве всех средних. Если она отвергается, все средние упорядочивают по возрастанию и сравнивают попарно, каждый раз вычисляя значения критерия Ньюмена-Кейлса:
где и
– сравниваемые средние,
– внутригрупповая дисперсия, nA и nB – численность групп.
Вычисленное значение q сравнивается с критическим значением. Критическое значение зависит от α' (вероятность ошибочно обнаружить различия хотя бы в одной из всех сравниваемых пар, то есть истинный уровень значимости), числа степеней свободы ν = N - k (где N — сумма численностей всех групп, k — число групп) и величины l, которая называется интервалом сравнения. Интервал сравнения определятся так. Если сравниваются средние, стоящие соответственно на j-м и i-м месте в упорядоченном ряду, то интервал сравнения l=j-i+1. Например, при сравнении 4-го и 1-го членов этого ряда l = =4-1+1=4, при сравнении 2-го и 1-го l=2-1+1=2.
Результат применения критерия Ньюмена—Кейлса зависит от очередности сравнений, поэтому их следует проводить в определенном порядке. Этот порядок задается двумя правилами.
1. Если мы расположили средние от меньшего к большему (от 1 до k), то сначала нужно сравнить наибольшее с наименьшим, то есть k-е с 1-м, затем k-е со 2-м, 3-м и так далее, вплоть до k-1-го. Затем предпоследнее (k –1)-е тем же порядком сравниваем с 1-м, 2-м и так далее до k-2-го. Продолжаем эти «стягивающие сравнения», пока не переберем все пары. Например, в случае 4 групп порядок сравнений такой: 4—1, 4—2, 4—3, 3—1, 3—2, 2—1.
Характеристики
Тип файла документ
Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.
Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.
Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.