Стентон Гланц - Медико-биологическая статистика (1034784), страница 31
Текст из файла (страница 31)
5 мы использовали z для проверки гипотезы о равенстведвух выборочных долей (или, что то же самое, для оценки статистической значимости различий выборочных долей). Можнопоказать, что даже если в совокупностях, из которых извлеченывыборки, доли различны, то отношениеРазность выборочных долей – Разность истинных долейz = Стандартная ошибка разности выборочных долейприближенно следует нормальному распределению — при условии, что объемы выборок достаточно велики.Если р1, и р2 — истинные доли в каждой из совокупностей, аp̂1 и p̂2 — выборочные оценки этих долей, тоz=( pˆ1 − pˆ 2 ) − ( p1 − p2 ) .s pˆ1 − pˆ 2В 100(1 – α) процентах случаев z по абсолютной величинене превышает z, то есть− zα <( pˆ1 − pˆ 2 ) − ( p1 − p2 ) < zs pˆ1 − pˆ 2α.Преобразовав это неравенство, мы получим формулу для100(1 – α)-процентного интервала для разности истинных долей:( pˆ1 − pˆ 2 ) − zα s pˆ − pˆ< p1 − p2 < ( pˆ1 − pˆ 2 ) + zα s pˆ1 − pˆ 2 .Как вы помните, распределение Стьюдента с увеличениемчисла степеней свободы стремится к нормальному.
Поэтому zαможно найти в табл. 4.1 — в строке, соответствующей бесконечному числу степеней свободы.Чаще всего используют 95% доверительный интервал, в этомслучае zα = z0,05 = 1,96.12ГЛАВА 7208Галотан и морфин: операционная летальностьВ гл. 5 мы сравнивали операционную летальность при галотановой и морфиновой анестезии и не нашли статистически значимых различий. Посмотрим, каков 95% доверительный интервал для различия летальностей.В группе галотана умерли 8 оперированных из 61, доля умерших p̂1 = 8/61 = 0,13. В группе морфина умерли 10 из 67, p̂2 = 0,15.Разность долей равна pˆ1 − pˆ 2 = 0,13 – 0,15 = –0,02.
Объединеннаяоценка доли8 + 10= 0,1461 + 67и стандартная ошибка разностиpˆ =s pˆ1 − pˆ 2 =1 1pˆ (1 − pˆ ) + = n1 n2 1 1= 0,14 (1 − 0,14 ) + = 0,062 = 6, 2%. 61 67 Тем самым, 95% доверительный интервал для различия летальности имеет вид:( pˆ1 − pˆ 2 ) − z0,05 s pˆ − pˆ12< p1 − p2 < ( pˆ1 − pˆ 2 ) + z0,05 s pˆ1 − pˆ 2 ,то есть–0,020 – 1,960 × 0,062 < p1 – p2 < –0,020 + 1,960 × 0,062и окончательно−0,142 < p1 − p2 < 0,102.Итак, с вероятностью 95% можно утверждать, что истиннаявеличина различия попадает в интервал между –14,2 и 10,2%.Вычисленный доверительный интервал содержит ноль, поэтому различия летальности статистически не значимы*.*При использовании поправки Йейтса нужно раздвинуть границы доверительного интервала, соответственно уменьшив нижнюю и увеличив верхнюю на величину (1/n1 + 1/n2)/2.ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ209Тромбоз шунта у больных на гемодиализеВ гл.
5 мы рассмотрели влияние аспирина на риск тромбоза шунтау больных на гемодиализе. Доля больных с тромбозом в группеплацебо составила 72%, а в группе, получавшей аспирин, — 32%.Мы уже убедились, что это различие статистически значимо.Однако мы не можем утверждать, что «аспирин снижает риск тромбоза на 40%», — правильнее будет указать доверительный интервал для снижения риска. Стандартную ошибку разности долей мыуже рассчитали в гл. 5, она составляет 0,15. Поэтому 95% доверительный интервал для истинной разности долей имеет вид0,40 – 1,96 × 0,15 < pп – pa < 0,40 + 1,96 × 0,15,то есть0,11 < pп – pa < 0,69.Таким образом, в вероятностью 95% можно утверждать, чтоприем аспирина снижает риск тромбоза на величину от 11 до 69%.Отрицателен ли «отрицательный» результат?В гл.
6 мы познакомились со статьей Фреймана и соавт. Они рассмотрели 71 медицинскую публикацию, в которых исследуемыйметод лечения не дал статистически значимого снижения частоты неблагоприятных исходов (под неблагоприятным исходом вразных статьях понимали смерть, осложнения и т. п.). Фрейман исоавт. обнаружили, что в большинстве работ численность группбыла слишком мала, чтобы обеспечить достаточную чувствительность. Неужели столь огромный труд пропал даром? Попробуемполучить из этих работ хоть какую-то информацию.На рис. 7.3 представлены 90% доверительные интервалы величины эффекта (разность долей неблагоприятных исходов в контрольной и экспериментальной группах).
Статистически значимых различий не было выявлено ни в одном случае, поэтомувсе они содержат ноль. Посмотрим на верхнюю границу доверительных интервалов. Можно заметить, что во многих случаях онаотличается от нуля всего на несколько процентов. Иными словами, с вероятностью 90% мы можем утверждать, что эффект, еслии существует, весьма незначителен. Дальнейшие исследования210ГЛАВА 7Рис. 7.3. 90% доверительные интервалы величины эффекта в 71 клиническом испытании.
Здесь величина эффекта — это разность долей больных с неблагоприятнымисходом в контрольной и экспериментальной группах. Поскольку статистически значимого эффекта не было выявлено ни в одном случае, все доверительные интервалы содержат ноль. Видно, что некоторые доверительные интервалы довольно сильно смещены в сторону положительных значений — возможно, при большем числебольных различия достигли бы статистической значимости. В других случаях верхняя граница интервала превышает ноль всего на несколько процентов.
Можно сделать вывод, что если соответствующие методы лечения и дают эффект, то оченьнезначительный.ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ211соответствующих методов лечения вряд ли перспективны. Верхняя граница некоторых интервалов простирается до 30% и дажедо 40%. Напомним, что с вероятностью 90% мы можем утверждать, что истинная величина находится внутри доверительногоинтервала, но где именно — определить невозможно. Поэтомуне исключено, что соответствующие методы лечения все же эффективны и при большей численности групп это удалось бы доказать.
Если мы решим повторить испытание, то при его планировании стоит учесть полученные оценки. Было бы неразумно,например, рассчитывать чувствительность и численность групп,полагая, что величина эффекта достигнет 50%.ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ ДЛЯ ДОЛИЕсли объем выборки достаточно велик, то доверительный интервал для доли можно приближенно вычислить, используя нормальное распределение*.Когда выборка мала (а в медицинских исследованиях таконо обычно и бывает), приближение нормальным распределением недопустимо. В таких случаях приходится вычислятьточные значения доверительных интервалов, используя биномиальное распределение. Чтобы не обременять читателя вычислительными тонкостями, мы чуть позже приведем графический способ нахождения доверительных интервалов по малым выборкам. Заметим, что при оценке долей по выборкамнебольшого объема расчет доверительного интервала особенно желателен.
Причина в том, что, если выборка мала, изменение признака даже у одного из ее членов приведет к резкомуизменению долей.z=Наблюдаемая доля – Истинная доляСтандартная ошибка долейИтак, при достаточно большом объеме выборки величинаприближенно следует нормальному распределению (см.табл. 6.4).*Как говорилось в гл. 5, для этого нужно, чтобы и пр и п(1 – р) были больше 5 (здесь n — объем выборки, р — доля).ГЛАВА 7212Математическая запись для z:z=pˆ − p.s pˆОтсюда уже знакомым способом получаем формулу для100(1 – α)-процентного доверительного интервала для истинной доли:pˆ − zα s pˆ < p < pˆ − zα s pˆ .Доля статей, содержащих статистические ошибкиКак видно из рис.
1.3, доля статей с ошибками в применениистатистических методов за последние несколько десятков летсоставляет 40—60%. Глядя на график, можно подумать, что доляэта с годами снижается. Однако рассмотрены были далеко невсе статьи, поэтому точки — это всего лишь оценки истиннойдоли. Построим 95% доверительный интервал для последнейточки — может быть, наше впечатление изменится.Последняя точка соответствует периоду с января по март 1976 г.Из оригинальных статей, опубликованных в этот период, С. Гори соавт.* рассмотрели 77, статистические ошибки были обнаружены в 32. Выборочная доля составляет p̂ = 32/77 = 0,42, еестандартная ошибкаs pˆ =0,42 (1 − 0, 42 )= 0,056.77Тогда 95% доверительный интервал имеет вид0,42 – 1,96 × 0,056 < p < 0,42 + 1,96 × 0,056,то есть0,31 < p < 0,53.В этот интервал попадают обе оценки, сделанные в 60-х го*S.
M. Gore, I. G. Jones, E. С. Rytter. Misuse of statistical methods: criticalassessment of articles in BMJ from January to March 1976. Br. Med. J.,l(6053):85–87, 1977.ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ213дах. Вряд ли это позволяет утверждать, что ситуация меняетсяк лучшему.Ошибки плодят ошибки. Авторы обзоров, опираясь на неверные данные оригинальных статей, делают неверные выводы,которые воспринимаются читателями как последнее слово медицинской науки. Насколько широко распространено это явление?На несостоятельные данные оригинальных статей опиралисьавторы 5 из 62 обзорных статей, рассмотренных Гор.
Такимобразом,pˆ =s pˆ =5= 0,081,620,081(1 − 0,081)62= 0,035.Тогда 95% доверительный интервал для доли обзорных статей, содержащих необоснованные выводы, имеет вид:0,081 – 1,960 × 0,035 < p < 0,081 + 1,960 × 0,035.То есть это интервал от 1,2 до 15%.Точные доверительные интервалы для долейЧасто объем выборки или наблюденная доля слишком малы,чтобы использовать приближение с помощью нормального распределения*. В подобных случаях следует воспользоваться точным распределением. Это так называемое биномиальное распределение.
Оно чрезвычайно важно для медицинских исследова*Причина, позволившая нам (в этой главе и гл. 5) использовать нормальное распределение вместо биномиального, состоит в том, что сростом объема выборки биномиальное распределение стремится кнормальному. Это следует из сформулированной в гл. 2 центральной предельной теоремы. Более подробное изложение можно найтив: W. J. Dixon, F. J.
Massey. Introduction to statistical analysis, McGrawНill, New York, 1983, sec. 13–5, Binomial distribution: proportion, иВ. W. Broun, Jr., M. Hollander. Statistics: a biomedical introduction,Wiley, New York, 1977, Chap. 7, Statistical Inference for DichotomousVariable.214ГЛАВА 7Рис. 7.4. 95% доверительные интервалы для долей, вычисленные на основании биномиального распределения. Найдите на горизонтальной оси точку, соответствующуювыборочной доле.
Проведите через эту точку вертикальную линию. Границы доверительного интервала — это вертикальные координаты точек пересечения этой линии спарой кривых, соответствующих объему выборки n.ний, в которых часто приходится иметь дело с редкими событиями и выборками малого объема.Сначала покажем, к чему приводит неправомерное использование метода, основанного на нормальном распределении. Рассмотрим пример, в котором пр < 5, то есть нарушено одно изусловий применимости нормального распределения.
Испытываяновый препарат, мы дали его 30 добровольцам, и, к счастью, ни уДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ215одного из них препарат не оказал побочного действия. Выборочная оценка риска побочного действия0= 0%.30Вряд ли можно на этом основании гарантировать, что препарат никогда не окажет побочного действия. Чтобы получить более реалистичную оценку, вычислим 95% доверительный интервал для р.Какие результаты даст расчет, основанный на использованиинормального распределения? Имеем pˆ = 0 , поэтомуpˆ =s pˆ =pˆ (1 − pˆ )0 (1 − 0 )= 0.30nТем самым, 95% доверительный интервал состоит из единственной точки — нуля. Возможно, это неплохо для рекламы нового препарата, но, увы, противоречит здравому смыслу.Обратимся теперь к рис. 7.4. Чтобы определить доверительный интервал, основанный на биномиальном распределении,нужно сначала найти на горизонтальной оси точку, соответствующую выборочной доле p̂.