Лекция 8-11_ (1032390), страница 2
Текст из файла (страница 2)
Если мы ошибочно отклоняем нулевую гипотезу, то есть находим различия там, где их нет, то это называется ошибкой I poдa. Максимальная приемлемая вероятность ошибки I рода называется уровнем значимости и обозначается . С этой величиной мы уже много раз встречались; обычно а принимают равной 0,05 (то есть 5%), однако можно взять и какой-нибудь другой уровень значимости, например 0,1 или 0,01.
Если мы не отклоняем нулевую гипотезу, когда она не верна, то есть не находим различий там, где они есть, то это – ошибка II рода. Ее вероятность обозначается . Ясно, что вероятность обнаружить различия, то есть чувствительность критерия, равна 1 -.
Естественно, мы заинтересованы в том, чтобы по возможности уменьшить вероятность ошибки II рода, то есть повысить чувствительность критерия. Для этого нужно знать, от чего она зависит.
6.2.Факторы, влияющие на чувствительность.
В принципе, эта задача похожа на ту, что решалась применительно к ошибкам I рода, но за одним важным исключением. Чтобы оценить чувствительность критерия, нужно задать величину различий, которую он должен выявлять. Эта величина определяется задачами исследования.
С увеличением разброса данных повышается вероятность ошибок обоих типов. Как мы вскоре увидим, величину различий и разброс данных удобнее учитывать совместно, рассчитав отношение величины различий к стандартному отклонению.
Чувствительность диагностической пробы можно повысить, снизив ее специфичность — аналогичное соотношение существует между уровнем значимости и чувствительностью критерия. Чем выше уровень значимости (то есть чем меньше ), тем ниже чувствительность.
Как мы уже говорили, важнейший фактор, который влияет на вероятность ошибок как I, так и II рода, - это объем выборок. С ростом объема выборок вероятность ошибок уменьшается. Практически это очень важно, поскольку прямо связано с планированием эксперимента.
Прежде чем перейти к подробному рассмотрению факторов, влияющих на чувствительность критерия, перечислим их еще раз.
•Уровень значимости . Чем меньше а, тем ниже чувствительность.
•Отношение величины различий к стандартному отклонению. Чем больше это отношение, тем чувствительнее критерий.
•Объем выборок. Чем больше объем, тем выше чувствительность критерия.
Чтобы получить наглядное представление о связи чувствительности критерия с уровнем значимости, обратимся к рис. Выбирая уровень значимости , мы тем самым задаем критическое значение. Это значение мы выбираем так, чтобы доля превосходящих его значений – при условии, что эффект отсутствует, - была равна . Чувствительность критерия есть доля тех значений критерия, которые превосходят критическое при условии, что эффект наблюдается. Как видно из рисунка, если изменить критическое значение, изменится и эта доля.
Чувствительность критерия возрастает с ростом наблюдаемых различий; с ростом разброса значений чувствительность, напротив, снижается.
6.3.Чувствительность критерия Стьюдента.
Напомним, что критерий Стьюдента t определяется следующим образом:
где и
– средние, s – объединенная оценка стандартного отклонения, n1 и n2 – объемы выборок. Заметьте, что
и
– это оценки двух (различных) средних -
и
. Для простоты допустим, что объемы обеих выборок равны, то есть n1 = n2. Тогда вычисленное значение t есть оценка величины
Обозначим величину эффекта, то есть разность средних: = -
. тогда
Таким образом, t' зависит от отношения величины эффекта к стандартному отклонению.
Итак, на чувствительность критерия влияет не абсолютная величина эффекта, а ее отношение к стандартному отклонению. Обозначим его , это отношение =/ называется параметром нецентральности.
Мы узнали о двух факторах, которые влияют на чувствительность критерия: уровень значимости и параметр нецентральности . Чем больше и чем больше , тем больше чувствительность. К сожалению, влиять на мы не можем вовсе, а что касается, то его увеличение повышает риск отвергнуть верную нулевую гипотезу, то есть найти различия там, где их нет. Однако есть еще один фактор, который мы можем, в определенных пределах, менять по своему усмотрению, не жертвуя уровнем значимости. Речь идет об объеме выборок (численности групп). С увеличением объема выборки чувствительность критерия увеличивается.
Существуют две причины, в силу которых увеличение объема выборки увеличивает чувствительность критерия. Во-первых, увеличение объема выборки увеличивает число степеней свободы, что, в свою очередь, уменьшает критическое значение. Во-вторых, как видно из только что полученной формулы значение t растет с ростом объема выборки и (это справедливо и для многих других критериев).
Перебирая все возможные объемы выборок, можно построить график чувствительности критерия как функции от численности групп. На практике чувствительность критерия Стьюдента определяют по семейству кривых, зависящих от размера выборки и являющихся функциями от параметра нецентральности при уровне значимости = 0,05.
Подразумевается, что выборки имеют равный объем. Что делать, если это не так? При заданной общей численности обследованных именно равная численность групп обеспечивает максимальную чувствительность. Значит, равную численность групп и следует запланировать. Если же вы решили рассчитать чувствительность после проведения исследования, когда, не найдя статистически значимых различий, вы хотите определить, в какой степени это можно считать доказательством отсутствия эффекта, - тогда следует принять численность обеих групп равной меньшей из них. Такой расчет даст несколько заниженную оценку чувствительности, но убережет нас от излишнего оптимизма.
6.4. Чувствительность дисперсионного анализа.
Чувствительность дисперсионного анализа определяется теми же факторами, что чувствительность критерия Стьюдента, похож и способ ее вычисления. Для расчета нам понадобятся следующие данные: число групп, их численность, уровень значимости и величина различий. Что понимать под величиной различий, если число групп больше двух? В качестве величины различий используют минимальную величину различий между любыми двумя группами. Параметр нецентральности рассчитывают по формуле:
где - стандартное отклонение в совокупности, k – число групп, n – численность каждой из них. Есть другой способ, несколько более сложный. Если i, — среднее в i-й группе, то
есть среднее по всем группам.
Определив параметр нецентральности и зная межгрупповое число степеней свободы меж =k-1, чувствительность находят по графикам, где она представлена как функция от параметра нецентральности.
Численность групп предполагается равной. Как и в случае критерия Стьюдента, именно равная численность групп обеспечивает максимальную чувствительность при заданной общей численности обследованных.
Те же графики можно использовать и для определения численности групп, обеспечивающей необходимую чувствительность. Это сложнее, чем в случае критерия Стьюдента, так как теперь n входит и в параметр нецентральности , и в выражение для числа степеней свободы вну. Поэтому значение n приходится подбирать путем последовательного приближения. Сначала вы произвольно выбираете начальное значение n и вычисляете чувствительность. В зависимости от найденного значения чувствительности вы изменяете n, после чего повторяете вычисление. Эта процедура повторяется до тех пор, пока значение чувствительности не окажется достаточно близким к нужному.
6.5.Чувствительность таблиц сопряженности.
Теми же графиками для дисперсионного анализа можно воспользоваться для нахождения чувствительности и объема выборки при работе с таблицами сопряженности. Сначала нужно решить, какое минимальное различие вы хотели бы обнаружить. В случае таблиц сопряженности это означает, что вам нужно заполнить клетки некоторыми долями. В таблице приведены обозначения, используемые при вычислении чувствительности таблицы сопряженности, для примера взята таблица 3x2. Здесь pij - доля в i-й строке j-го столбца. Сумма всех долей составляет 1. Суммы по строкам обозначаются Ri, по столбцам – Сj. Параметр нецентральности задается формулой
где r – число строк, с – число столбцов и N – общее число наблюдений. Зная значение и число степеней свободы вну = и меж = (r-1)(c-1), чувствительность можно определить по кривым для дисперсионного анализа.
Таблица. Обозначения, используемые при вычислении чувствительности критерия 2 | ||
p11 | p12 | R1 |
p21 | p22 | R2 |
p31 | p32 | R3 |
C1 | С2 | 1,00 |
Для нахождения объема выборки, при котором достигается требуемая чувствительность, воспользуемся обратной процедурой. Именно, сначала по таблицам найдем значение параметра нецентральности для заданной чувствительности и числа степеней свободы меж = (r-1)(c-1), и вну = . А затем найдем объем выборки, разрешив приведенную выше формулу относительно N:
Нетрудно рассчитать чувствительность критерия задним числом, когда и стандартное отклонение, и величина эффекта уже известны. К сожалению, мы не знаем эти параметры, когда планируем исследование. Стандартное отклонение можно примерно оценить по литературным данным или проведя предварительное исследование. Величину эффекта узнать заранее невозможно (обычно ее оценка и является целью исследования). Поэтому при расчете чувствительности нужно указать минимальную величину эффекта, которую мы хотим выявить. Между тем делать это совершенно необходимо: иначе мы рискуем проводить исследования, заведомо обреченные на неудачу.
Если после проведения исследования эффект обнаружен, то чувствительность уже не важна. В противном случае – если эффекта не выявлено – она приобретает первостепенное значение. В самом деле, если мы не обнаружили статистически значимых различий при чувствительности 80%, то с высокой вероятностью можно утверждать, что различий действительно нет. Иными словами, мы получили отрицательный результат. Если же чувствительность составляла 25%, то мы просто не получили никакого результата.