Стентон Гланц - Медико-биологическая статистика (1034784), страница 26
Текст из файла (страница 26)
Во-первых, увеличение объема выборки увеличивает число степенейсвободы, что, в свою очередь, уменьшает критическое значение. Во-вторых, как видно из только что полученной формулыt′ =δσn,2значение t растет с ростом объема выборки n (это справедливо идля многих других критериев).На рис 6.7А воспроизведены распределения с рис. 6.4А. Верхний график соответствует случаю, когда препарат не обладаетдиуретическим действием, нижний — когда препарат увеличивает суточный диурез на 200 мл. Численность каждой из группсоставляет 10 человек. На рис 6.7Б приведены аналогичные распределения. Отличие в том, что теперь в каждую группу входило не 10, а 20 человек.
Раз объем каждой из групп равен 20,число степеней свободы равно ν = 2(20 – 1) = 38. Из таблицы 4.1находим, что критическое значение t при 5% уровне значимости равно 2,024 (в случае выборок объемом 10 оно равнялось2,101). С другой стороны, увеличение объема выборок привелок увеличению значений критерия. В результате уже не 55, а 87%значений t превышают критическое значение. Итак, увеличение численности групп с 10 до 20 человек привело к повышению чувствительности с 0,55 до 0,87.Перебирая все возможные объемы выборок, можно построить график чувствительности критерия как функции от численности групп (рис.
6.8). С увеличением объема чувствительность176ГЛАВА 6Рис. 6.7. Увеличение объема выборки повышает чувствительность по двум причинам. Во-первых, увеличивается число степеней свободы, и критическое значение t уменьшается. Во-вторых, при той же величине различий получаются более высокие значения t.ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ177растет. Сначала она растет ускоренно, затем, начиная с некоторого объема выборки, рост замедляется.Расчет чувствительности — важнейшая составная часть планирования медицинских исследований. Теперь, познакомившисьс наиболее важным фактором, определяющим чувствительность,мы готовы решить эту задачу.Как определить чувствительность критерия?На рис. 6.9 чувствительность критерия Стьюдента представлена как функция от параметра нецентральности ϕ = δ/σ при уровне значимости α = 0,05. Четыре кривые соответствуют четыремобъемам выборок.Подразумевается, что выборки имеют равный объем.
Что делать, если это не так? Если вы обратились к рис. 6.9 при планировании исследования (что весьма разумно), то нужно учестьследующее. При заданной общей численности обследованныхименно равная численность групп обеспечивает максимальнуючувствительность. Значит, равную численность групп и следует запланировать. Если же вы решили рассчитать чувствительность после проведения исследования, когда, не найдя статистически-значимых различий, вы хотите определить, в какой степени это можно считать доказательством отсутствия эффекта,— тогда следует принять численность обеих групп равной меньшей из них. Такой расчет даст несколько заниженную оценкучувствительности, но убережет вас от излишнего оптимизма.Применим кривые с рис.
6.9 к примеру с диуретиком (см.рис. 6.1). Мы хотим вычислить чувствительность критерия Стьюдента при уровне значимости α = 0,05. Стандартное отклонениеравно 200 мл. Какова вероятность выявить увеличение суточногодиуреза на 200 мл?δ 200== 1.σ 200Численность контрольной и экспериментальной групп равна десяти. Выбираем на рис. 6.9 соответствующую кривую инаходим, что чувствительность критерия равна 0,55.До сих пор мы говорили о чувствительности критерия Стьюϕ=178ГЛАВА 6Рис. 6.8.
Чувствительность критерия Стьюдента как функция от объема выборок при величине различий 200 мл, уровне значимости α = 0,05 и стандартномотклонении σ = 200 мл. При объеме выборок 10 человек чувствительность составляет 0,55.ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ179дента. Можно рассчитать чувствительность и других критериев.
Определяется она теми же самыми факторами, но ход вычислений будет несколько иным.Галотан и морфин при операциях на открытом сердцеВ гл. 4 мы сравнили сердечный индекс при галотановой иморфиновой анестезии (см. табл. 4.2) и не нашли статистически значимых различий. (Напомним, что сердечный индекс— это отношение минутного объема сердца к площади поверхности тела.) Однако группы были малы — 9 и 16 человек. Средняя величина сердечного индекса в группе галотанаравнялась 2,08 л/мин/м2; в группе морфина 1,75 л/мин/м2, тоесть на 16% меньше.
Даже если бы различия были статистически значимыми, вряд ли столь небольшая разница представляла бы какой-либо практический интерес.Поэтому поставим вопрос так: какова была вероятность выявить разницу в 25%? Объединенная оценка дисперсии s2 = 0,89,значит, стандартное отклонение равно 0,94 л/мин/м2.
Двадцатьпять процентов от 2,08 л/мин/м2 — это 0,52 л/мин/м2.Тем самым,δ 0,52== 0,553.σ 0,94Поскольку численности групп не совпадают, для оценки чувствительности выберем меньшую из них — 9. Из рис. 6.9 следует, что в таком случае чувствительность критерия — 0,16.Шансы выявить даже 25% различия были весьма малы.Подведем итоги.• Чувствительность критерия есть вероятность отвергнуть ложную гипотезу об отсутствии различий.• На чувствительность критерия влияет уровень значимости:чем меньше α, тем ниже чувствительность.• Чем больше величина эффекта, тем больше чувствительность.• Чем больше объем выборки, тем больше чувствительность.• Для разных критериев чувствительность вычисляется по-разному.ϕ=180ГЛАВА 6Рис.
6.9. Чувствительность критерия Стьюдента в зависимости от параметра нецентральности ϕ при уровне значимости α = 0,05 для разных объемов выборок n.Параметр нецентральности — это отношение величины различий к стандартномуотклонению в совокупности: ϕ = δ/σ. Пунктирные линии показывают, как пользоваться графиками. Если, например, величина различий δ = 200 мл, стандартноеотклонение σ = 200 мл, то ϕ = 1. Для объема выборок n = 10 чувствительностьсоставляет 0,55. При ϕ = 0,55 и n = 9 чувствительность — всего лишь 0,16.ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ181ЧУВСТВИТЕЛЬНОСТЬ ДИСПЕРСИОННОГО АНАЛИЗАЧувствительность дисперсионного анализа* определяется темиже факторами, что чувствительность критерия Стьюдента, похож и способ ее вычисления.
Для расчета нам понадобятся следующие данные: число групп, их численность, уровень значимости и величина различий. Что понимать под величиной различий, если число групп больше двух? В качестве величиныразличий δ используют минимальную величину различий между любыми двумя группами. Параметр нецентральности рассчитывают по формуле:δ n,σ 2kгде σ — стандартное отклонение в совокупности, k — числогрупп, n — численность каждой из них**.
Есть другой способ,несколько более сложный. Если µi, — среднее в i-й труппе, тоϕ=ϕ=∑ (µ− µ)2ikσ 2,гдеµ=∑µikесть среднее по всем группам.Определив параметр нецентральности, и зная межгрупповоечисло степеней свободы νмеж = k – 1, чувствительность находятпо графикам, где она представлена как функция от параметранецентральности. На рис. 6.10 изображены графики для νмеж = 2,графики для других значений νмеж вы найдете в приложении Б.*Во вводном курсе этот раздел можно пропустить без ущерба дляпонимания последующего материала.** Численность групп предполагается равной.
Как и в случае критерияСтьюдента, именно равная численность групп обеспечивает максимальную чувствительность при заданной общей численности обследованных.ГЛАВА 6182Те же графики можно использовать и для определения численности групп, обеспечивающей необходимую чувствительность. Это сложнее, чем в случае критерия Стьюдента, так кактеперь n входит и в параметр нецентральности ϕ, и в выражениедля числа степеней свободы νвну. Поэтому значение n приходитсяподбирать путем последовательного приближения. Сначала выпроизвольно выбираете начальное значение n и вычисляете чувствительность.
В зависимости от найденного значения чувствительности вы изменяете n, после чего повторяете вычисление.Эта процедура повторяется до тех пор, пока значение чувствительности не окажется достаточно близким к нужному.БЕГ И МЕНСТРУАЦИИЧтобы получше разобраться с тем, как вычислить чувствительность и объем выборки при дисперсионном анализе, обратимся кпримеру с влиянием бега на частоту менструаций, который мыразбирали в гл.
3 (рис. 3.9). Сейчас нас интересует, какова вероятность выявить различие в одну менструацию в год (δ = 1). Числогрупп k = 3; стандартное отклонение σ = 2. Численность каждойиз групп n = 26. Уровень значимости выбираем: α = 0,05. Найдемпараметр нецентральности:1 26= 1,04.2 2×3Межгрупповое число степеней свободы νмеж = k – 1 = 3 – 1 = 2и внутригрупповое νвну = k(n – 1) =3(26 – 1) = 75. По рис.
6.10находим, что чувствительность составит около 0,30.Результат обескураживающий, что вообще характерно для расчетов чувствительности. Положим, нам хотелось бы иметь чувствительность равной 0,80. Какая численность групп нужна дляэтого? В том, что объем n = 26 слишком мал, мы только что убедились. Из рис. 6.10 мы видим, что параметр нецентральностидолжен быть приблизительно равен 2. Для n = 26 он близок к 1.Значит, численность групп должна быть такой, чтобы параметрнецентральности увеличился вдвое.
При вычислении ϕ из численности групп n извлекается квадратный корень, поэтому чиc-ϕ=ЧТО ЗНАЧИТ «НЕЗНАЧИМО»: ЧУВСТВИТЕЛЬНОСТЬ КРИТЕРИЯ183Рис. 6.10. Чувствительность дисперсионного анализа как функция от параметра нецентральности ϕ при уровне значимости α = 0,05 и межгрупповом числестепеней свободы ν меж = 2. В приложении Б вы найдете аналогичные графикидля других значений α и ν меж .E. S. Pearson, H. O. Hartley. Charts for power function for analysis of variancetests, derived from the non-central F distribution.
Biometrika, 38:112–130, 1951.ГЛАВА 6184ленность групп должна увеличиться в 22 = 4 раза. Таким образом, нужно, чтобы в каждую из групп входило по 100 человек.Тогдаϕ=1 100= 2,042 2×3и νвну = k(n – 1) = 3(100 – 1) = 297. По рис. 6.10 находим, что вэтом случае чувствительность составит 0,88, то есть даже больше, чем мы хотели. Поскольку стандартное отклонение можетоказаться больше, чем мы думали, некоторый избыток чувствителности нам не помешает, однако резонно спросить, где же ина какие средства мы наберем такие группы.