Стентон Гланц - Медико-биологическая статистика (1034784), страница 7
Текст из файла (страница 7)
Что это за распределение? Вычислите его среднее и стандартное отклонение. Что онихарактеризуют?46ГЛАВА 22.6. Р. Флетчер и С. Флетчер (R. Fletcher, S. Fletcher. Clinicalresearch in general medical journals: a 30-year perspective. N. Engl.J. Med., 301:180–183, 1979) изучили библиографические характеристики 612 случайно выбранных статей, опубликованных вжурналах Journal of American Medical Association, New EnglandJournal of Medicine и Lancet с 1946 г. Одним из показателей былочисло авторов статьи. Было установлено следующее:ГодЧисло обследо- Среднее число Стандартноеванных статейавторовотклонение19461512,01,419561492,31,619661572,81,219761554,97,3Нарисуйте график среднего числа авторов по годам.
Можетли распределение статей по числу авторов быть нормальным?Почему?Глава 3Сравнение нескольких групп:дисперсионный анализСтатистические методы используют для описания данных идля оценки статистической значимости результатов опыта. Впредыдущей главе мы занимались описанием данных.
Мыввели понятия среднего, стандартного отклонения, медианыи процентилей. Мы узнали, как оценивать эти показатели повыборке. Мы разобрались, как определить, насколько точнавыборочная оценка среднего. Перейдем теперь к методамоценки статистической значимости различий (их называюткритериями значимости, или просто критериями*). Методов этих существует множество, но все они построеныпо одному принципу. Сначала мы формулируем нулевую гипотезу, то есть, предполагаем, что исследуемые факторы неоказывают никакого влияния на исследуемую величину и полученные различия случайны.
Затем мы определяем, каковавероятность получить наблюдаемые (или более сильные) различия при условии справедливости нулевой гипотезы. Если*Критерием называют и сам метод, и ту величину, которая получается врезультате его применения.48ГЛАВА 3эта вероятность мала*, то мы отвергаем нулевую гипотезу и заключаем что результаты эксперимента статистически значимы.Это, разумеется, еще не означает что мы доказали действие именно изучаемых факторов (это вопрос прежде всего планирования эксперимента), но, во всяком случае, маловероятно, что результат обусловлен случайностью.Дисперсионный анализ был разработан в 20-х годах нашегостолетия английским математиком и генетиком Рональдом Фишером.
На дисперсионном анализе основан широкий класс критериев значимости, со многими из которых мы познакомимся вэтой книге. Сейчас мы постараемся понять общий принцип этогометода.СЛУЧАЙНЫЕ ВЫБОРКИ ИЗ НОРМАЛЬНОРАСПРЕДЕЛЕННОИ СОВОКУПНОСТИОднажды в небольшом городке (200 жителей) ученые исследовали влияние диеты на сердечный выброс.
Случайным образом отобрали 28 человек, каждый из которых согласился участвовать висследовании. После этого они опять таки случайным образомбыли разделены на 4 группы по 7 человеке каждой. Члены первой (контрольной) группы продолжали питаться как обычно, члены второй группы стали есть только макароны, третьей группы— мясо, четвертой — фрукты. Через месяц у всех участниковэксперимента измерили сердечный выброс. Результаты представлены на рис.
3.2.Анализ данных мы начинаем с формулировки нулевой гипотезы. В данном случае она заключается в том, что ни одна из диетне влияет на сердечный выброс. Откроем маленький секрет, —дело обстоит именно так. На рис. 3.1 показано распределениесердечного выброса для всех жителей городка, каждый жительпредставлен кружком.
Члены наших экспериментальных группизображены заштрихованными кружками. Все четыре группы*Максимальную приемлемую вероятность отвергнуть верную нулевую гипотезу называют уровнем значимости и обозначают α. Обычнопринимают α = 0,05.СРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ49Рис. 3.1.
Распределение жителей городка по величине сердечного выброса. Диета невлияет на сердечный выброс, и экспериментальные группы представляют собой просточетыре случайные выборки из нормально распределенной совокупности.представляют собой просто случайные выборки из нормальнораспределенной совокупности.Однако как убедиться в этом, располагая только результатами эксперимента (рис. 3.2)? Как видно из рисунка 3.2, группывсе же различаются по средней величине сердечного выброса.Вопрос можно поставить так: какова вероятность получить такие различия, извлекая случайные выборки из нормально распределенной совокупности? Прежде чем ответить на этот вопрос нам надо получить показатель, характеризующий величинуразличий.Оставим на время наш эксперимент и зададимся вопросом,что заставляет нас, взглянув на несколько выборок думать, чторазличия между ними не случайны.Попробуем (исключительно в учебных целях) так изменитьнаши данные, чтобы читатель поверил во влияние диеты на сердечный выброс.
Результат этой подтасовки представлен на рис.3.3. Взаимное расположение точек в группах осталось прежним,но сами группы значительно раздвинуты по горизонтальнойоси. Сравнив рис. 3.2 и 3.3 всякий скажет, что четыре вы-50ГЛАВА 3Рис. 3.2. Исследователь не может наблюдать совокупность, все, чем он располагает– это его экспериментальные группы.
На этом рисунке данные с рис. 3.1 представлены такими, какими их видит исследователь. Результаты в разных группах несколькоразличаются. Вызваны эти различия диетой или просто случайностью? Внизу рисунка показаны средние значения сердечного выброса в четырех группах (выборочные средние) а также среднее и стандартное отклонение этих четырех средних.борки на рис. 3.2 «не различаются», а выборки на рис.
3.3. —«различаются». Почему? Сравним разброс значений внутри выборок с разбросом выборочных средних. Разброс выборочныхсредних на рис. 3.2. значительно меньше разброса значений в каждой из выборок. На рис. 3.3 картина обратная — разброс выборочных средних превышает разброс в каждой из выборок. То жесамое можно сказать и о данных на рис. 3.4, хотя здесь три выборочныхСРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ51Рис. 3.3.
Те же группы что на предыдущих рисунках; теперь они раздвинуты по горизонтальной оси. Вряд ли такие различия можно отнести на счет случайности — влияние диеты налицо! Обратите внимание, что разброс выборочных средних превышаетразброс внутри групп. На предыдущем рисунке картина была иной, — разброс выборочных средних был меньше разброса внутри групп.средних близки друг другу и заметно отличается от них толькоодна.Итак, чтобы оценить величину различий, нужно каким-то образом сравнить разброс выборочных средних с разбросом значений внутри групп.
Сейчас мы покажем, как это можно сделать с помощью дисперсии (как мы выяснили в предыдущейглаве, этот показатель характеризует именно разброс), но прежде сделаем несколько замечаний.Дисперсия правильно характеризует разброс только в том случае,если совокупность имеет нормальное распределение (вспомните52ГЛАВА 3Рис. 3.4. Еще один возможный исход эксперимента с диетой. В трех группах средние примерно равны и только в группе макаронной диеты сердечный выброс явноповысился.
Такой результат, как и предыдущий никто не отнесет на счет случайности. И снова разброс выборочных средних превышает разброс внутри групп.обследование юпитериан, чуть было не приведшее к ошибочным заключениям). Поэтому и критерий, основанный на дисперсии, применим только для нормально распределенныхсовокупностей.Вообще, все критерии, основанные на оценке параметров распределения (они называются параметрическими),применимы только в случае, если данные подчиняются соответствующему распределению (чаще всего речь идет онормальном распределении). Если распределение отличаетсяот нормального, следует пользоваться так называемыми непараметрическими критериями.
Эти критерии не основанына оценке параметров распределения и вообще не требуют,чтобы данные подчинялись какому-то определенному типуСРАВНЕНИЕ НЕСКОЛЬКИХ ГРУПП: ДИСПЕРСИОННЫЙ АНАЛИЗ53Рис. 3.5. Еще один набор из четырех случайных выборок по семь человек в каждой,извлеченых из совокупности в 200 человек (население городка, где изучали влияниедиеты на сердечный выброс).распределения. Более подробно мы рассмотрим непараметрические критерии в гл. 5, 8 и 10. Непараметрические критериидают более грубые оценки, чем параметрические. Параметрические методы более точны, но лишь в случае, если правильноопределено распределение совокупности.ДВЕ ОЦЕНКИ ДИСПЕРСИИМы уже выяснили, что чем больше разброс средних и чем меньше разброс значений внутри групп, тем меньше вероятностьтого, что наши группы — это случайные выборки из одной совокупности.
Осталось только оформить это суждение количественно.Дисперсию совокупности можно оценить двумя способами.Во-первых, дисперсия, вычисленная для каждой группы, — это54ГЛАВА 3оценка дисперсии совокупности. Поэтому дисперсию совокупности можно оценить на основании групповых дисперсий. Такая оценка не будет зависеть от различий групповых средних.Например, для данных на рис. 3.2 и 3.3 она будет одинаковой.Во-вторых, разброс выборочных средних тоже позволяет оценить дисперсию совокупности.