Стентон Гланц - Медико-биологическая статистика (1034784), страница 28
Текст из файла (страница 28)
Эта проблема в значительной мере снимаетсяметодами последовательного анализа. При последовательном анализе численность групп не определяется заранее: вместо этого больных включают в исследование по одному. Дождавшись наступлениятого или иного исхода, выбирают одно из трех: 1) принять гипотезуоб отсутствии эффекта, 2) отвергнуть гипотезу либо 3) включить ещеодного больного. Последовательный анализ обычно обеспечивает теже величины α и β, что и обычные методы, при меньшей численностигрупп. Применять на каждом шаге критерий Стьюдента было бы неправильно: из-за эффекта множественных сравнений мы получили бычрезмерно «оптимистическое» значение Р.
Последовательный анализтребует применения специальных методов оценки статистическойзначимости, которые изложены в главе «Sequential analysis» книги W.J. Dixon, F. J. Massey. Introduction to Statistical Analysis, McGraw-Hill,New York, 1969.190ГЛАВА 6нуть рукой на полученные результаты или из них можно извлечьнечто полезное? Оказывается, можно. Для этого следует отказаться от альтернативной логики «эффект есть — эффекта нет»и вместо этого оценить величину эффекта и степень неопределенности этой опенки, то есть рассчитать доверительный интервал,чем мы и займемся в следующей главе.ЗАДАЧИ6.1. Используя данные табл. 4.2, вычислите чувствительностькритерия Стьюдента, способного обнаружить 50% различие наилучшего сердечного индекса между галотановой и морфиновой анестезией.6.2.
По тем же данным определите, какова должна быть численность групп, чтобы с вероятностью 80% обнаружить 25%различие в наилучшем сердечном индексе.6.3. Используя данные табл. 4.2, определите чувствительность критерия Стьюдента для выявления изменения среднегоартериального давления и общего периферического сосудистого сопротивления на 25%.6.4. В задаче 3.5 мы не обнаружили влияния внутривенноговведения тетрагидроканнабинолов на антибактериальную защиту у крыс. Допустим, минимальное снижение, которое мыхотим выявить, составляет 20%, уровень значимости α = 0,05.Какова чувствительность критерия Стьюдента?6.5.
По тем же данным определите, какой должна быть численность групп, чтобы обеспечить выявление снижения антибактериальной защиты на 20% с вероятностью 90% (уровеньзначимости α = 0,05).6.6. Какой должна быть численность групп, чтобы с вероятностью 90% обнаруживать снижение летальности с 90 до 30%.Уровень значимости α = 0,05. При решении вам пригодятся табличные значения стандартного нормального распределения(табл. 6.4).6.7.
Используя данные из задачи 3.2, найдите вероятностьобнаружить снижение максимальной объемной скорости середины выдоха на 0,25 л/с при уровне значимости α = 0,05.ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ191Таблица 6.4. Процентили стандартного нормального распределенияОтклонение z от среднегоПлощадьПлощадь(в стандартных отклонениях) слева от zсправа от z–2,50,00620,9938–2,40,00820,9918–2,30,01070,9893–2,20,01390,9861–2,10,01790,9821–2,00,02280,9772–1,90,02870,9713–1,80,03590,9641–1,70,04460,9554–1,60,05480,9452–1,50,06680,9332–1,40,08080,9192–1,30,09680,9032–1,20,11510,8849–1,10,13570,8643–1,00,15870,8413–0,90,18410,8159–0,80,21190,7881–0,70,24200,7580–0,60,27430,7267–0,50,30850,6975–0,40,34460,6554–0,30,38210,6179–0,20,42070,5793–0,10,46020,53980,00,50000,50000,10,53980,46020,20,57930,42070,30,61790,38210,40,65540,34460,50,69750,30850,60,72670,27430,70,75800,2420ГЛАВА 6192Таблица 6.4.
ОкончаниеОтклонение z от среднего(в стандартных отклонениях)0,80,91,01,11,21,31,41,51,61,71,81,92,02,12,22,32,42,5Площадьслева от z0,78810,81590,84130,86430,88490,90320,91920,93320,94520,95540,96410,97130,97720,98210,98610,98930,99180,9938Площадьсправа от z0,21190,18410,15870,13570,11510,09680,08080,06680,05480,04460,03590,02870,02280,01790,01390,01070,00820,00626.8. Используя данные из задачи 3.3, найдите вероятностьобнаружить увеличение уровня липопротеидов высокой плотности на 5 и 10 мг%. Уровень значимости α = 0,05.6.9. По тем же данным определите, какой должна быть численность групп, чтобы изменение в 5 мг% можно было обнаружить с вероятностью 80% при уровне значимости α = 0,05.6.10. В задаче 5.4 сравнивали частоту рецидивов инфекциимочевых путей после короткого курса того или иного антибактериального препарата.
Допустим, минимальные различия, которые мы хотим выявить, таковы: в группах ампициллина и триметоприма/сулъфаметоксазола рецидив наступает у двух третейдевочек, в группе цефалексина — у одной трети. Какой была бычувствительность таблицы сопряженности при численностигрупп, указанной в задаче 5.4? Уровень значимости α = 0,05.6.11.
Каким должен быть объем выборки, чтобы в задаче 6.10чувствительность составила 80%?Глава 7Доверительные интервалыДо сих пор мы занимались в основном нахождением различиймежду группами, не слишком интересуясь величиной этих различий. Мы формулировали нулевую гипотезу, то есть предполагали, что экспериментальные группы — это просто две случайные выборки из одной и той же совокупности. Затем мы оценивали вероятность получить наблюдаемые различия при условии, что нулевая гипотеза верна. Если эта вероятность была мала,мы отвергали нулевую гипотезу и делали вывод, что различиястатистически значимы. При таком подходе мы всегда получаемтолько качественный результат: либо отклоняем нулевую гипотезу, либо не отклоняем, либо признаем различия статистическизначимыми, либо не признаем. Количественная оценка различийот нас ускользает. Между тем, как мы выяснили в предыдущейглаве, вероятность выявления различий зависит не только от ихвеличины, но и от численности групп. Сколь угодно малые различия при достаточно большой численности групп могут оказаться статистически значимыми, или, как пишут в диссертаци-ГЛАВА 7194ях, «высоко достоверными».
При этом речь может идти о разницев несколько миллиметров ртутного столба.Характеристика, которая дополняет и даже заменяет качественное суждение (значимо—незначимо), — это доверительный интервал. В гл. 2 мы уже встречались с этим понятием,хотя и не применяли этот термин. Тогда мы выяснили, что истинное среднее в 95% случаев лежит на расстоянии не большедвух ошибок среднего от выборочного среднего. Промежутокдлиной в четыре ошибки среднего — это и есть 95% доверительный интервал. Смысл доверительного интервала из этогопримера достаточно ясен: мы не знаем точно, чему равна некоторая величина, но можем указать интервал, в котором она находится (с заданной вероятностью).
В этой главе мы научимсяопределять доверительные интервалы для разных величин, в томчисле для разности средних (величины эффекта) и доли. Мыпокажем, что доверительный интервал можно использовать вместо обычных критериев значимости*. Доверительные интервалы используют также для определения границ нормы лабораторного показателя.ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ РАЗНОСТИ СРЕДНИХВ гл.
4 мы определили критерий Стьюдента какРазность выборочных средних.Стандартная ошибка разности выборочных среднихВычислив t, его сравнивают с критическим значением tα длязаданного уровня значимости α. Для двух случайных выборокиз одной совокупности вероятность получить значение t, по абсолютной величине превышающее tα, весьма мала (а именно, непревышает α; напомним, что уровень значимости α — это максимальная приемлемая вероятность ошибочно признать существование различий там, где их нет). Поэтому, получив «больt=*Существует мнение, что только доверительные интервалы и нужно использовать. Эта точка зрения кратко изложена в работе: К. J. Rothman.
Ashow of confidence. N. Engl. J. Med., 299:1362—1363, 1978.ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ195шое» значение t, мы делаем вывод о статистической значимости различий.Для случайных выборок, извлеченных из одной совокупности, распределение всех возможных значений t (распределениеСтьюдента) симметрично относительно среднего, равного нулю(см. рис. 4.5). Если же выборки извлечены из двух совокупностей с разными средними, то распределение всех возможныхзначений t будет иметь среднее, отличное от нуля (см. рис. 6.3 и6.5).Формулу для t можно видоизменить так, чтобы распределение t было всегда симметрично относительно нуля:Разность выборочных средних – Разностьистинных средних.t=Стандартная ошибка разности выборочных среднихЗаметим, что если обе выборки извлечены из одной совокупности, то разность истинных средних равна нулю и в этом случае новая формула совпадает с предыдущей.Вот математическая запись новой формулы:t=(X1− X 2 ) − (µ1 − µ 2 )s X1 − X 2.Поскольку истинных средних (то есть средних по совокупности) мы не знаем, то и вычислить значение t по этой формуле мыне можем.