Стентон Гланц - Медико-биологическая статистика (1034784), страница 30
Текст из файла (страница 30)
От этой вероятности kзависит ширина интервала. Взглянем еще раз на рис. 7.1. Еслимы хотим, чтобы больше интервалов перекрывало истинноезначение, нам придется их расширить. Чем больше k, тем ширеk-процентный доверительный интервал. Для примера вычислим, в дополнение к 95%, еще и 90 и 99% доверительные интервалы для двух выборок с рис. 6.1. Разность средних и стандартная ошибка разности средних у нас уже есть, осталось толькопо табл. 4.1 найти новые значения tα (по-прежнему число степеней свободы ν = 18).Для 90% доверительного интервала находим t0,01 = 1,734.Тогда:220 − 1,734 × 89,9 < µ Д − µ П < 220 + 1,734 × 89,9,64 < µ Д − µ П < 376.По сравнению с 95%, 90% доверительный интервал более узкий (рис.
7.2). Неужели волшебным образом наши знания о величине µд – µп стали более точными? Разумеется, нет. Сужениедоверительного интервала досталось нам ценой снижения вероятности того, что он действительно содержит истинное значение.Для вычисления 99% доверительного интервала находим втабл.
4.1 критическое значение t0,01 = 2,878. Тогда интервал имеет вид220 − 2,878 × 89,9 < µ Д − µ П < 220 + 2,878 × 89,9,то есть−36 < µ Д − µ П < 478.Это самый широкий доверительный интервал из трех изображенных на рис. 7.2.Подведем итоги. Приводя k-процентный доверительный интервал, мы сообщаем, во-первых, в каких пределах находитсяистинное значение неизвестной нам величины и, во-вторых — скакой вероятностью k.
Например, говоря: «95% доверительный202ГЛАВА 7Рис. 7.2. Три доверительных интервала одной и той же разности средних (см. рис. 6.1).99% доверительный интервал самый широкий, 90% — самый узкий. Истинная разностьсредних (изменение суточного диуреза) показана вертикальной пунктирной линией.интервал 31—409 мл», имеют в виду следующее: «Вероятностьтого, что истинное значение лежит в пределах 31—409 мл, составляет 95%». Не исключено, к сожалению, что вам не повезети истинное значение окажется вне доверительного интервала.С 95% доверительными интервалами такое случается в 5% случаев.
Желая застраховаться от подобной ошибки, вы можетерассчитать 99% доверительный интервал. Однако учтите, чтоон окажется шире 95% доверительного интервала. Вообще, чембольше k (вероятность того, что доверительный интервал содержит истинное значение), тем больше ширина интервала.ПРОВЕРКА ГИПОТЕЗ С ПОМОЩЬЮ ДОВЕРИТЕЛЬНЫХИНТЕРВАЛОВДоверительные интервалы можно использовать для оценки статистической значимости различий.
Это и не удивительно, ведьнахождение доверительного интервала имеет общую базу с тра-ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ203диционными методами проверки гипотез. И там и тут мы встречаем разность выборочных средних, ее стандартную ошибку ираспределение Стьюдента.Истинная разность средних может находиться в любой точкедоверительного интервала, поэтому если доверительный интервал содержит ноль, то мы не можем отвергнуть возможность того,что µд – µп = 0, то есть нулевую гипотезу. С другой стороны, нахождение истинной разности средних вне доверительного интерваламаловероятно. Поэтому, если доверительный интервал не содержит нуля, справедливость нулевой гипотезы о равенстве средних маловероятна.
Можно сформулировать следующее правило.Если 100(1 – α)-процентный доверительный интервал разности средних не содержит нуля, то различия статистическизначимы (Р < α); напротив, если этот интервал содержит ноль,то различия статистически не значимы (Р > α).Применим это правило к двум только что рассмотренным примерам. На рис.
7.1 А 95% доверительный интервал не содержитнуля, поэтому, как и при использовании критерия Стьюдента, мызаключаем, что препарат увеличивает диурез (уровень значимости α = 0,05). Напротив, 95% доверительный интервал на рис. 7.1Бсодержит ноль. Значит, в данном случае мы не можем отвергнутьгипотезу об отсутствии эффекта. К такому же выводу мы пришли раньше, используя критерий Стьюдента.Из пятидесяти 95% доверительных интервалов на рис.
7.1 двадцать три содержат ноль. Следовательно, 23/50 = 44% соответствующих выборок не дают оснований говорить о статистическизначимых различиях (то есть о наличии эффекта) при уровне значимости 1 – 0,95 = 0,05. Если бы в нашем распоряжении были всевозможные доверительные интервалы, мы увидели бы, что 45%из них содержат ноль. Это значит, что в 45% случаев мы не сможем отвергнуть гипотезу об отсутствии эффекта, то есть совершим ошибку II рода.
Следовательно, как и прежде (см. рис. 6.4),β = 0,45, а чувствительность критерия равна 1 – 0,45 = 0,55.Говоря о «статистически значимых различиях», всегда полезнопривести еще и доверительный интервал — это даст возможностьсудить о величине эффекта.
Если статистическая значимость обнаружена благодаря большому объему выборки, а не величине эффекта, доверительный интервал укажет на это. Другими cловами,ГЛАВА 7204использование доверительных интервалов позволяет среди статистически значимых эффектов выделить те, которые сами посебе слишком слабы, чтобы иметь клиническое значение.Предположим, мы должны оценить эффективность гипотензивного препарата.
Мы набираем две группы по 100 человеке каждой— контрольную, которой даем плацебо, и экспериментальную, которой даем препарат. Пусть в экспериментальной группе диастолическое давление составило в среднем X э = 81 мм рт.ст. (стандартноеотклонение 11 мм рт.
ст.), а в контрольной — X к = 85 мм рт. ст.(стандартное отклонение 9 мм рт. ст.). Для оценки статистическойзначимости различий воспользуемся критерием Стьюдента.Объединенная оценка дисперсии составляетs2 =1 211 + 9 2 = 10 2 ,2()откудаt=Xэ − Xк81 − 85== −2,83.sXэ −Xк102 102+100 100Это значение по абсолютной величине больше критического значения t0,01 = 2,601 для уровня значимости 0,01 и числа степеней свободы ν = 2(n – 1) = 198 (см. табл. 4.1).
Таким образом,снижение диастолического артериального давления статистически значимо (Р < 0,01).Мы обнаружили статистически значимый эффект. Но каковаего клиническая значимость? Вычислим 95% доверительный интервал для разности средних. Так как при 198 степенях свободыt0,05 равно 1,972 (см. табл. 4.1), доверительный интервал имеет вид−4 − 1,972 × 1, 41 < µ э − µ к < −4 + 1,972 × 1, 41,то есть−6,8 < µ э − µ к < −1, 2Таким образом, с вероятностью 95% препарат снижает артериальное давление на 1,2—6,8 мм рт. ст.
Этот эффект невелик,особенно если сравнить его со стандартными отклонениями (9 иДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ20511 мм рт. ст.). Итак, гипотензивный эффект выражен слабо, аего статистическая значимость обусловлена исключительно большой численностью групп.Приведенный пример наглядно показывает, почему, знакомясьс исследованием эффективности того или иного препарата, важно знать не только уровень значимости, но и величину эффекта.Авторы публикаций редко балуют читателя доверительными интервалами, но обычно все же указывают численность групп, средние величины и их стандартные ошибки. В таких случаях нужносамостоятельно рассчитать стандартные отклонения (произведение стандартной ошибки среднего на квадратный корень из численности группы) и построить доверительный интервал.
Этогочасто достаточно, чтобы понять, имеет исследование сугубо академическую или еще и практическую ценность.ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ СРЕДНЕГОПродолжим рассматривать разнообразные применения доверительных интервалов. Найдем доверительный интервал для среднего. Определив выборочное среднее X , мы понимаем, разумеется, что это всего лишь выборочная оценка истинного среднего µ,которое, впрочем, скорее всего находится где-то поблизости.
«Где-топоблизости» можно охарактеризовать количественно, то есть указать интервал, в котором с заданной вероятностью k находитсяистинное среднее. Это и будет k-процентный доверительныйинтервал для среднего.Приближенный способ вычисления этого интервала изложенв гл. 2: примерно в 95% случаев выборочное среднее уклоняетсяот истинного не более чем на две стандартные ошибки среднего.Осталось внести некоторые уточнения.Ранее мы выяснили, что величинаРазность выборочных средних – Разностьистинных средних.t=Стандартная ошибка разности выборочных среднихподчиняется распределению Стьюдента. Можно показать, чтоГЛАВА 7206Выборочное среднее – Истинное среднееt = Стандартная ошибка среднеготакже подчиняется распределению Стьюдента.
Математичес.кая запись для последней величины выглядит так:t=X −µ.sXДальнейший вывод аналогичен выводу доверительного интервала для разности истинных средних. Опустив промежуточные этапы, приведем формулу 100(1 – α)-процентного доверительного интервала для среднего:X − tα s X < µ < X + tα s X ,где tα — критическое значение t для уровня значимости α и числа степеней свободы ν = n – 1 (n — объем выборки).Смысл доверительного интервала для среднего совершенноаналогичен смыслу доверительного интервала для разностисредних.
Приводя k-процентный доверительный интервал среднего, мы утверждаем, что вероятность того, что истинное среднее находится в этом интервале, равна k. Иными словами, еслиполучить все возможные выборки из некоторой совокупности идля каждой рассчитать k-процентный доверительный интервал,то доля интервалов, содержащих среднее по совокупности (истинное среднее), составит k.Вычислить доверительный интервал несложно, однако — если объем выборки достаточно велик — можно пользоваться иприведенным выше «правилом двух стандартных ошибок». Длявыборок, имеющих объем от 20 и выше, t0,05 приблизительно равно 2 (см. табл.
4.1), и мы получим достаточно точный результат.Если же объем выборки меньше 20, доверительный интервал окажется зауженным, а наше представление о точности, с какой мыможем судить об истинном среднем, — преувеличенным.ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ РАЗНОСТИ ДОЛЕЙИзложенные способы вычисления доверительных интерваловДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ207нетрудно приспособить для разности долей. В гл. 5 мы определили критерий z какРазность выборочных долейz = Стандартная ошибка разности выборочных долейВеличина z имеет приблизительно нормальное распределение; в гл.