Лекция 12_ (1032391), страница 2
Текст из файла (страница 2)
При достаточно большом объеме выборки величина
приближенно следует нормальному распределению.
Отсюда получаем формулу для 100(1- ) процентного доверительного интервала для истинной доли
Часто бывает так, что объем выборки или наблюдаемая доля слишком малы, чтобы использовать приближение с помощью нормального распределения. Тогда необходимо воспользоваться точным распределением. Это биномиальное распределение. Оно чрезвычайно важно для медицинских исследований, в которых часто приходится иметь дело с редкими событиями и выборками малого объема.
В этом случае необходимо воспользоваться графическими зависимостями величины границ доверительных интервалов от выборочной доли из справочника.
7.5.Доверительный интервал для значений
До сих пор нас интересовали доверительные интервалы для тех или иных параметров распределения, например среднего или доли р. Нередко, однако, нужен доверительный интервал для самих значений измеряемого признака. Например, мы хотим оценить диапазон, в который будет попадать 95% всех значений. Особенно часто подобные задачи возникают при определении границ нормы какого-нибудь лабораторного показателя. Обычно доверительный интервал значений определяют как выборочное среднее плюс-минус два стандартных отклонения (это применимо только в случае нормального распределения). Если мы имеем дело с нормальным распределением и объем выборки достаточно велик (больше 100 человек), то правило двух стандартных отклонений дает верный результат. Как быть, если в нашем распоряжении не 100, а менее двух десятков человек, что довольно типично для клинических исследований? Разумеется, об определении границ нормы по столь малой выборке нечего и думать. Тем не менее, оценку доверительного интервала можно получить и тут. Однако от правила двух стандартных отклонений придется отказаться: при малых выборках интервал получается слишком узким. Учитывая приблизительность оценок по выборкам небольшого объема, нужно брать интервал, более широкий, чем плюс-минус два стандартных отклонения (при выборках большого объема такая страховка не нужна). Этот интервал вычисляют по формуле
где - выборочное среднее, s - выборочное стандартное отклонение, а
- коэффициент, который зависит от доли / членов совокупности, которые должны попасть в доверительный интервал, от вероятности того, что они действительно туда попали 1-а и от объема выборки п. Этот коэффициент играет примерно ту же роль, что
или
. Для вычисления 95% доверительного интервала нужно определить К0,05; зависимость К0,05 от объема выборки для различных значений/приведена в виде графиков в справочниках.
Заметим, что К0,05 больше, чем (как
больше, чем
), поскольку учитывает не только значение среднего, но и неопределенность оценок среднего и стандартного отклонения.
При объеме выборки от 5 до 25, типичном для медицинских i исследований, К0,05 должен быть существенно больше двух.
Применение правила двух стандартных отклонений к выборкам небольшого объема приводит к зауживанию доверительного интервала значений. Упомянем еще об одной распространенной ошибке. Как говорилось ранее, многие путают стандартную ошибку среднего со стандартным отклонением. Найдя интервал «выборочное среднее плюс-минус две стандартные ошибки среднего», они уверены, что в него попадет 95% совокупности (тогда как на самом деле 95% составляет вероятность, что в интервал попадет среднее по совокупности). В результате интервал допустимых значений оказывается еще более зауженным.