Стентон Гланц - Медико-биологическая статистика (1034784), страница 13
Текст из файла (страница 13)
Чем меньше (по абсолютной величине) t,тем больше вероятность нулевой гипотезы. Чем больше t, тембольше оснований отвергнуть нулевую гипотезу и считать, чторазличия статистически значимы.Для нахождения величины t нужно знать разность выборочных средних и ее ошибку. Вычислить разность выборочных средних нетрудно — просто вычтем из одного среднего другое. Сложнее найти ошибку разности. Для этого обратимся к более общей задаче нахождения стандартного отклонения разности двухчисел, случайным образом извлеченных из одной совокупности.СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА85Рис. 4.3 А.
Из этой совокупности мы будем извлекать пары и вычислять разности.Б. Разности первых 6 пар. В. Разности еще ста пар. Разброс разностей больше,чем разброс самих значений.СТАНДАРТНОЕ ОТКЛОНЕНИЕ РАЗНОСТИНа рис. 4.ЗА представлена совокупность из 200 членов. Среднееравно 0, стандартное отклонение 1. Выберем наугад два членасовокупности и вычислим разность. Выбранные члены помечены на рис. 4.ЗА черными кружками, полученная разность представлена таким же кружком на рис. 4.ЗБ.
Извлечем еще пять пар(на рисунках они различаются штриховкой), вычислим разностьдля каждой пары, результат снова поместим на рис. 4.ЗБ. Похоже, что разброс разностей больше разброса исходных данных.Извлечем наугад из исходной совокупности еще 100 пар, для ка-86ГЛАВА 4ждой из которых вычислим разность. Теперь все разности включая вычисленные ранее изображены на рис. 4.3В. Стандартноеотклонение для полученной совокупности разностей — примерно 1,4 то есть на 40% больше чем в исходной совокупности.Можно доказать что дисперсия разности двух случайно извлеченных значении равна сумме дисперсии совокупностей изкоторых они извлечены*.В частности если извлекать значения из одной совокупно*Интересно, что дисперсия суммы двух случайно извлеченных значенийтоже равна сумме дисперсий совокупностей, из которых они извлечены.Отсюда можно вывести формулу для стандартной ошибки среднего:σ.nПредположим, что мы случайным образом извлекли n значений из совокупности, имеющей стандартное отклонение σ.
Выборочное среднее равноσX =X =1( X 1 + X 2 + X 3 + … X n ),nпоэтомуnX = X 1 + X 2 + X 3 + … X n .Так как дисперсия каждого из Xi равна σ2, дисперсия величины nX составит2σ nX= σ 2 + σ 2 + σ 2 + …σ 2 = nσ 2 ,а стандартное отклонениеσ nX = nσ .Нам нужно найти стандартное отклонение среднего X тождественно равного nX n поэтомуσ nXσσ= n =.nnnМы получили формулу, которой неоднократно пользовались в предыдущих главах — формулу для стандартной ошибки среднего.
Заметим что,выводя, ее мы, не делали никаких допущений о совокупности, из которойизвлечена выборка. В частности мы не требовали, чтобы она имела нормальное распределение.σX =СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА87сти, то дисперсия их разности будет равна удвоенной дисперсии этой совокупности. Говоря формально если значение X извлечено из совокупности, имеющей дисперсию σ2X , а значениеY из совокупности имеющей дисперсию σY2 , то распределениевсех возможных значений X – Y имеет дисперсиюσ X2 −Y = σ X2 + σ Y2 .Почему дисперсия разностей больше дисперсии совокупности легко понять на нашем примере (см. рис.
4.3): в половинеслучаев члены пары лежат по разные стороны от среднего, поэтому их разность еще больше отклоняется от среднего, чем онисами.Продолжим рассматривать рис. 4.3. Все пары извлекали изодной совокупности. Ее дисперсия равна 1. В таком случае дисперсия разностей будетσ X2 −Y = σ X2 + σ Y2 = 1 + 1 = 2.Стандартное отклонение есть квадратный корень из дисперсии. Поэтому стандартное отклонение разностей равно 2 , тоесть больше стандартного отклонения исходной совокупностипримерно на 40%, как и получилось в нашем примере.Чтобы оценить дисперсию разности членов двух совокупностей по выборочным данным нужно в приведенной выше формуле заменить дисперсии их выборочными оценкамиs X2 −Y = s X2 + sY2 .Этой формулой можно воспользоваться и для оценки стандартной ошибки разности выборочных средних.
В самом деле,стандартная ошибка выборочного среднего — это стандартноеотклонение совокупности средних значений всех выборок объемом n. Поэтомуs X2 −Y = s X2 + sY2 .Тем самым искомая стандартная ошибка разности среднихs X −Y = s X2 + sY2 .Теперь мы можем вычислить отношение t.88ГЛАВА 4КРИТИЧЕСКОЕ ЗНАЧЕНИЕ tНапомним, что мы рассматриваем отношениеt=Разность выборочных средних.Стандартная ошибка разности выборочных среднихВоспользовавшись результатом предыдущего раздела, имеемt=X1 − X 2s X2 1 + s X2 2.Если ошибку среднего выразить через выборочное стандартное отклонение, получим другую запись этой формулыt=X1 − X 2s12 s22+n n,где n — объем выборки.Если обе выборки извлечены из одной совокупности, то выборочные дисперсии s12 и s22 — это оценки одной и той же дисперсии σ2.
Поэтому их можно заменить на объединенную оценку дисперсии. Для выборок равного объема объединенная оценка дисперсии вычисляется какs2 =s12 + s22.2Значение t, полученное на основе объединенной оценкиt=X1 − X 2s2 s2+n n.Если объем выборок одинаков, оба способа вычисления t дадут одинаковый результат. Однако если объем выборок разный,то это не так. Вскоре мы увидим, почему важно вычислять объединенную оценку дисперсии, а пока посмотрим, какие значенияСРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА89t мы будем получать, извлекая случайные пары выборок из однойи той же нормально распределенной совокупности.Так как выборочные средние обычно близки к среднему посовокупности, значение t будет близко к нулю.
Однако иногда мывсе же будем получать большие по абсолютной величине значения t (вспомним опыты с F в предыдущей главе). Чтобы понять,какую величину t следует считать достаточно «большой», чтобыотвергнуть нулевую гипотезу, проведем мысленный эксперимент,подобный тому, что мы делали в предыдущей главе. Вернемся киспытаниям предполагаемого диуретика.
Допустим, что в действительности препарат не оказывает диуретического действия.Тогда и контрольную группу, которая получает плацебо, и экспериментальную, которая получает препарат, можно считать случайными выборками из одной совокупности. Пусть это будет совокупность из 200 человек, представленная на рис. 4.4А. Членыконтрольной и экспериментальной групп различаются штриховкой.
В нижней части рисунка данные по этим двум выборкампоказаны так, как их видит исследователь. Взглянув на эти данные, трудно подумать, что препарат — диуретик. Полученное поэтим выборкам значение t равно –0,2.Разумеется, с не меньшим успехом можно было бы извлечьлюбую другую пару выборок, что и сделано на рис. 4.4Б. Как иследовало ожидать, две новые выборки отличаются как друг отдруга, так и от извлеченных ранее (рис. 4.4А).
Интересно, что наэтот раз нам «повезло» — средний диурез довольно сильно различается. Соответствующее значение t равно –2,1. На рис. 4.4Визображена еще одна пара выборок. Они отличаются друг от другаи от выборок с рис. 4.4А и 4.4Б. Значение t для них равно 0.Разных пар выборок можно извлечь более 1027. На рис.
4.5Априведено распределение значений t, вычисленных по 200 парамвыборок. По нему уже можно судить о распределении t. Оно симметрично относительно нуля, поскольку любую из пары выборок можно счесть «первой». Как мы и предполагали, чаще всегозначения t близки к нулю, значения, меньшие –2 и большие +2,встречаются редко.На рис. 4.5Б видно, что в 10 случаях из 200 (в 5% всех случаев)t меньше –2,1 или больше +2,1.
Иначе говоря, если обе выборкиизвлечены из одной совокупности, вероятность того, что значение90Рис. 4.4.ГЛАВА 4СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА91Рис. 4.4. Испытания предполагаемого диуретика. А. В действительности препарат не обладает диуретическим действием, поэтому обе группы — просто две случайные выборки из совокупности, показанной в верхней части рисунка. Членысовокупности, которым посчастливилось принять участие в исследовании, помечены штриховкой.
В нижней части рисунка данные показаны такими, какими ихвидит исследователь. Вряд ли он решит, что препарат — диуретик: средний диурез в группах различается очень незначительно. Б. Исследователю могла бы попасться и такая пара выборок. В этом случае он наверняка бы счел препарат диуретиком.
В. Еще две выборки из той же совокупности.t лежит вне интервала от –2,1 до +2,1, составляет 5%. Продолжаяизвлекать пары выборок, мы увидим, что распределение принимает форму гладкой кривой, показанной на рис. 4.5В. Теперь 5%крайних значений соответствуют закрашенным областям графика левее –2,1 и правее +2,1. Итак, мы нашли, что если две выборки извлечены из одной и той же совокупности, то вероятностьполучить значение t, большее +2,1 или меньшее –2,1, составляет всего 5%. Следовательно, если значение t находится вне92BГ-3,0-2,0-1,00t1,02,03,0Рис.
4.5. А. Из совокупности, показанной на рис. 4.4, извлекли 200 пар случайныхвыборок по 10 членов в каждой, для каждой пары рассчитали значение t и нанеслиего на график. Значения для t трех пар выборок с рис. 4.4 помечены черным. Большая часть значений сгруппирована вокруг нуля, однако некоторые значения поабсолютной величине превышают 1,5 и даже 2. Б. Число значений, по абсолютнойвеличине превышающих 2,1 составляет 5%.
В. Продолжая извлекать пары выборок, в конце концов мы получим гладкую кривую. 5% наибольших (по абсолютной величине) значений образуют две заштрихованные области (сумма заштрихованных площадей как раз и составляет 5% всей площади под кривой). Следовательно «большие» значения t начинаются там, где начинается заштрихованнаяобласть, то есть с t = ±2,1. Вероятность получить столь высокое значение t, извлекая случайные выборки из одной совокупности, не превышает 5%. Г. Описанныйспособ выбора критического значения t предопределяет возможность ошибки: в5% случаев мы будем находить различия там, где их нет. Чтобь снизить вероятность ошибочного заключения, мы можем выбрать более высокое критическоезначение. Например, чтобы площадь заштрихованной области составляла 1% отобшей площади под кривой, критическое значение должно составлять 2,878.СРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА93интервала от –2,1 до +2,1, нулевую гипотезу следует отклонить,а наблюдаемые различия признать статистически значимыми.Обратите внимание, что таким образом мы выявляем отличия экспериментальной группы от контрольной как в меньшую,так и в большую сторону — именно поэтому мы отвергаем нулевую гипотезу как при t < –2,1 так и при t > +2,1.