Доверительное оценивание и доверительный интервал
6. Доверительное оценивание и доверительный интервал
Доверительное оценивание это метод математической статистики, предназначенный для построения множества приближённых значений неизвестных параметров вероятностных распределений.
Пусть — случайный вектор, принимающий значения на множестве
в евклидовом пространстве, причём распределение вероятностей этого вектора принадлежит параметрическому семейству распределений, заданному плотностями
,
,
, относительно некоторой меры
. Предполагается, что истинное значение параметрической точки
, соответствующей результату наблюдений
, неизвестно. Суть доверительного оценивания заключается в построении такого множества
, зависящего от
, которое содержит значение заданной функции
, соответствующее неизвестному истинному значению параметрической точки
.
Пусть — множество значений функции
,
, и пусть
,
, — какая-либо совокупность множеств, принадлежащих
при всех
из
, причём предполагается, что для произвольного элемента
и любого значения
определена вероятность события {
}. Эта вероятность выражается интегралом
,
,
,
и называется вероятностью накрытия множеством значения
при заданном значении
.
Если истинное значение неизвестно, то множество
(из совокупности множеств
,
, соответствующее результату наблюдений X, называется доверительным множеством (или интервальной статистической оценкой) для неизвестного истинного значения функции
. В качестве вероятностной характеристики интервальной оценки
, построенной по указанному правилу, используется доверительная вероятность
, выражающаяся в терминах вероятности накрытия равенством
,
.
Иными словами — вероятность накрытия множеством
значения заданной функции
, соответствующего неизвестной истинной параметрической точке
.
Рекомендуемые материалы
В тех случаях, когда доверительная вероятность от
не зависит, интервальную оценку
называют подобной пространству выборок. Это название обусловлено аналогией формул
и
.
В более общей ситуации зависит от неизвестного
, и поэтому в практической работе принято характеризовать качество интервальной оценки коэффициентом доверия
,
где нижняя грань вычисляется на множестве (иногда коэффициент доверия называется доверительным уровнем).
Оптимизация доверительного оценивания определяется теми требованиями, которые предъявляются к интервальным оценкам. Например, если цель заключается в построении доверительных множеств, подобных пространству выборок и имеющих заданный коэффициент доверия (
), то первое требование выражается тождеством
,
.
При этом естественно искать такие интервальные оценки, которые накрывают истинное значение с вероятностью, не меньшей вероятности накрытия любого произвольного значения
. Иными словами, второе требование, называемое требованием несмещённости, выражается неравенством
,
,
.
В этих условиях «наилучшей» разумно считать ту интервальную оценку , которая с меньшей вероятностью накрывает любое значение
, отличное от истинного
. Отсюда возникает третье требование «наибольшей селективности»: для всякого другого доверительного множества
, отличного от
и удовлетворяющего условию
,
.
должно выполняться неравенство
,
,
.
Задача отыскания интервальных оценок , удовлетворяющих указанным трём требованиям, эквивалентна задаче построения несмещённых, наиболее мощных статистических критериев, подобных пространству выборок и имеющих уровень значимости
. Вопросы существования решения такой задачи и его конструктивного описания составляют основу общей теории статистической проверки гипотез.
Наиболее часто применяется доверительное оценивание в ситуации, когда — скалярная функция. Пусть
,
, — независимые случайные величины, подчиняющиеся одному и тому же нормальному распределению с неизвестными параметрами
и
, причём требуется построить интервальную оценку для
. Пусть
и
.
Поскольку случайная величина подчиняется распределению Стъюдента с
степенями свободы и это распределение не зависит от неизвестных параметров
и
(
,
), то при любом положительном
вероятность события
зависит лишь от
. Если указанный интервал принять за интервальную оценку
для
, то ему будет соответствовать доверительная вероятность
,
не зависящая от . Такую интервальную оценку называют доверительным интервалом, а её концевые точки — доверительными границами, или доверительными пределами, причём в данном случае доверительный интервал представляет собой интервальную оценку, подобную пространству выборок. В приведённом примере интервальная оценка является несмещённой и наиболее селективной.
Доверительный интервал это статистическая оценка параметра вероятностного распределения, имеющая вид интервала, границами которого служат функции от результатов наблюдений и который с высокой вероятностью «накрывает» неизвестное значение параметра. Именно, пусть результаты наблюдений суть независимые случайные величины с распределением вероятностей
, зависящим от числового параметра
, где
— так называемое параметрическое множество. Тогда при фиксированном
, 0<
<1, интервал с границами
и
,
в параметрическом множестве
такой, что
,
называется доверительным интервалом для параметра с доверительным уровнем (коэффициентом доверия)
. Здесь доверительная вероятность
вычисляется при истинном значении параметра
. Границы
называются доверительными границами, или доверительными пределами.
Пример. Пусть есть нормальное распределение с плотностью вероятности
где и
— известное число. Для построения доверительных интервалов для
рассматривается точечная статистическая оценка
параметра
и статистика
, которая при любом значении
имеет стандартное нормальное распределение с функцией распределения
.
Поэтому для любого вероятность
не зависит от . Для заданного
значение
находится из соотношения
Если Вам понравилась эта лекция, то понравится и эта - История психологии.
.
Для выбранного значения доверительный интервал
накрывает неизвестное значение с вероятностью
. Точность доверительного интервала измеряется числом
: вероятность ошибки, состоящей в том, что построенный доверительный интервал не накрывает истинное значение
, не превосходит
. Во многих задачах удаётся найти лишь доверительный интервал, отвечающий приближённому значению доверительного уровня.
Понятие доверительного интервала для векторного параметра воплощается в соответствующей многомерной доверительной области. Для многих функциональных характеристик вероятностных распределений строятся различные доверительные множества и зоны. Задача построения наилучших доверительных интервалов родственна задаче получения наилучших критериев в теории проверки статистических гипотез.
Метод оценивания с помощью доверительных интервалов принадлежит Е. Нейману (1935); он отличается от других методов интервального статистического оценивания логической простотой и независимостью от априорных предположений о параметре .