Стентон Гланц - Медико-биологическая статистика (1034784), страница 29
Текст из файла (страница 29)
Но эта формула и не предназначена для нахождения t.Она позволяет сделать другое — оценить разность µ1 – µ2, то естьистинную величину различий. Для этого вместо вычисления tвыберем его подходящее значение и, подставив в формулу, вычислим величину µ1 – µ2.
Как выбрать «подходящее» значение?По определению 100α процентов всех возможных значенийt расположены левее –tα или правее +tα. Остальные 100(1 – α)процентов значений t попадают в интервал от –tα до +tα. Например, 95% значений t находится в интервале от –t0,05 до +t0,05 . (Критические значения t, в частности t0,05, можно найти по табл. 4.1.)Значит, в 100(1 – α) процентах всех случаев− tα <(X1− X 2 ) − (µ1 − µ 2 )s X1 − X 2< + tα .ГЛАВА 7196Преобразуя это неравенство, получаем(X1− X 2 ) − tα s X1 − X 2 < µ1 − µ 2 < ( X 1 − X 2 ) + tα s X1 − X 2 .Таким образом, разность истинных средних отличается отразности выборочных средних менее чем на произведение tα истандартной ошибки разности выборочных средних.
Это неравенство задает доверительный интервал для разности среднихµ1 – µ2. К примеру, 95% доверительный интервал для разностисредних определяется неравенством(X1− X 2 ) − t0,05 s X1 − X 2 < µ1 − µ 2 < ( X 1 − X 2 ) + t0,05 s X1 − X 2 .В этот интервал разность истинных средних попадет в 95%случаев.Этот способ определения доверительного интервала, как икритерий Стыодента, на котором он основан, можно применятьтолько тогда, когда совокупность имеет хотя бы приближеннонормальное распределение*.Эффективный диуретикНа рис. 6.1 показан суточный диурез в совокупности из 200 человек после приема плацебо (рис. 6.1 А) и диуретика (рис. 6.1Б).Средний диурез при приеме плацебо составил µп = 1200мл, приприеме диуретика — µд = 1400 мл. Таким образом, препарат увеличивает суточный диурез на µд – µп = 1400 – 1200 = 200 мл.
Какобычно, исследователь вынужден довольствоваться выборками,по которым он и оценивает величину эффекта. На рис. 6.1 помимо известных нам, но не исследователю, данных по совокупности приведены данные, полученные по двум выборкам, в каждуюиз которых входило по 10 человек. В контрольной группе средний диурез составил 1180 мл, а в группе, получавшей диуретик,— 1400 мл. Среднее увеличение диуреза в данном опыте:X Д − X П = 1400 − 1180 = 220 мл.Как и всякая выборочная оценка, подверженная влиянию*Доверительные интервалы можно определять и в случае множественныхсравнений.
Подробнее об этом см.: J. H. Zar. Biostatistical analysis, 2nd ed,Prentice-Hall, Englewood Cliff, N. J., 1984, p. 191-192, 195.ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ197случая, эта величина отличается от истинного увеличения суточного диуреза, равного 200 мл. И если бы мы, основываясьна выборочных данных, сказали, что препарат увеличиваетсуточный диурез в среднем на 220 мл, то упустили бы из видунеопределенность, присущую выборочной оценке. Правильнеебудет рассчитать доверительный интервал — он покажет не одночисло, скорее всего не совпадающее с истинным, а диапазончисел, куда истинное попадает почти наверняка (например, свероятностью 95%).Вычислим сначала объединенную оценку дисперсии. По неймы сможем найти стандартную ошибку разности средних. Стандартные отклонения у принимавших диуретик и плацебо составили соответственно 245 и 144 мл.
В обеих группах было по 10человек. Объединенная оценка дисперсии1 21sД − sП2 = 2452 + 1442 = 2012.22Стандартная ошибка разности среднихs2 =(s XД − XП =)()s2 s22012 2012+=+= 89,9.nД nП1010Для определения 95% доверительного интервала найдем потабл. 4.1 значение t0,05. Объем каждой из выборок n = 10. Поэтомучисло степеней свободы ν = 2(n – 1) = 2(10 – 1) = 18. Соответствующее табличное значение t0,05 равно 2,101.Теперь можно вычислить 95% доверительный интервал длясреднего изменения диуреза:(XД− X П ) − t0,05 s X Д − X П < µ Д − µ П < ( X Д − X П ) + t0,05 s X Д − X П .то есть220 − 2,101 × 89,9 < µ Д − µ П < 220 + 2,101 × 89,9и окончательно:31 < µ Д − µ П < 409.Таким образом, 95% доверительный интервал среднего изменения диуреза составляет 31—409 мл. Иными словами, выбо-198ГЛАВА 7ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ199рочные данные позволяют с 95% надежностью утверждать, чтопрепарат увеличивает диурез более чем на 31 мл, но менее чемна 409 мл.
Как и следовало ожидать, истинное значение 200 млнаходится в этом интервале.Первый из рассчитанных нами доверительных интерваловизображен на рис. 7.1А.Другие выборкиПонятно, что в нашем распоряжении могли оказаться совершеннодругие выборки. Ранее мы видели, что разные выборки дают разные оценки среднего и стандартного отклонения. Точно так жепо разным выборкам мы будем получать разные доверительныеинтервалы.
(И не удивительно — ведь доверительный интервалрассчитывают по среднему и стандартному отклонению.) Мывычислили интервал по выборкам с рис 6.1. Для другой парывыборок — например с рис. 6.2 — доверительный интервал будет другим. Вычислим его.Суточный диурез в группе плацебо составил в среднем 1216 мл,а в группе, получавшей диуретик, — 1368 мл. Стандартные отклонения — 97 и 263 мл соответственно. Увеличение среднего диуреза при приеме препарата X Д − X П = 1368 – 1216 = 152 мл.
Находимобъединенную оценку дисперсии:s2 =197 2 + 2632 = 19822()Рис. 7.1. Новый взгляд на испытания диуретика. А. 95% доверительный интервализменения диуреза, вычисленный по данным с рис. 6.1 В. Интервал содержит истинную величину изменения (+200 мл) и не содержит нуля. Последнее говорит отом, что изменение диуреза статистически значимо. Б. Такой же доверительныйинтервал, вычисленный по данным с рис. 6.2В. Он тоже содержит истинную величину изменения диуреза, но он содержит также и ноль: статистически значимогоизменения диуреза не выявлено.
В. Еще сорок восемь 95% доверительных интервалов для пар выборок, извлеченных из той же пары совокупностей (рис. 6.1 А и Б).Теперь у нас в общей сложности 50 доверительных интервалов. Из них 3 не содержат истинного значения и 27 не содержат нуля. Если бы мы построили 95% доверительные интервалы по всем возможным парам выборок, то доля не содержащих истинного значения составила бы 5%, а доля не содержащих нуля – 55%, что соответствует чувствительности критерия.ГЛАВА 7200и стандартную ошибку разности средних:1982 1982+= 89.1010Тогда 95% доверительный интервал для среднего изменениясуточного диуреза:sXД − XП =152 − 2,101 × 89 < µ Д − µ П < 152 + 2,101 × 89,−35 < µ Д − µ П < 339.Этот интервал (рис.
7.1 Б) отличается от полученного ранее.Однако и он содержит истинное среднее увеличение диуреза —200 мл. Если бы в нашем распоряжении была только выборка срис. 6.2, мы бы сказали, что на 95% уверены в том, что препаратувеличивает средний диурез на величину, меньшую 339 и большую –35 мл. Заметьте, на сей раз доверительный интервал включает и отрицательные значения. Тем самым, выборочные данные не противоречат тому, что «диуретик» в действительностиможет уменьшать диурез. Значение этого интересного обстоятельства мы разберем позже, когда будем обсуждать использование доверительных интервалов для проверки гипотез.Пока что мы определили доверительные интервалы для двухпар выборок из совокупности, изображенной на рис.
6.1. На самом деле число возможных пар выборок превышает 1027. На рис.7.1В показаны 95% доверительные интервалы для 48 из них. Теперь у нас в общей сложности 50 доверительных интервалов. Ещераз убедившись, что разные выборки дают разные доверительныеинтервалы, заметим, что большинство из них — точнее 47 из 50— содержат истинное значение, показанное на рис.
7.1 вертикальной пунктирной линией. Если бы мы перебрали все возможные выборки, то доля 95% доверительных интервалов, содержащих истинное значение, составила бы в точности 95%.ИНТЕРВАЛ ШИРЕ — ДОВЕРИЯ БОЛЬШЕМы только что убедились, что 95% доверительный интервал может и не содержать истинного значения, однако, как правило, онДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ201его содержит — а именно, в 95% случаев. Вообще, истинноезначение содержат k процентов k-процентных доверительныхинтервалов. Иными словами, k — это вероятность того, чтоинтервал содержит истинное значение.