Доверительное оценивание и доверительный интервал
6. Доверительное оценивание и доверительный интервал
Доверительное оценивание это метод математической статистики, предназначенный для построения множества приближённых значений неизвестных параметров вероятностных распределений.
Пусть
— случайный вектор, принимающий значения на множестве
в евклидовом пространстве, причём распределение вероятностей этого вектора принадлежит параметрическому семейству распределений, заданному плотностями
,
,
, относительно некоторой меры
. Предполагается, что истинное значение параметрической точки
, соответствующей результату наблюдений
, неизвестно. Суть доверительного оценивания заключается в построении такого множества
, зависящего от
, которое содержит значение заданной функции
, соответствующее неизвестному истинному значению параметрической точки
.
Пусть
— множество значений функции
,
, и пусть
,
, — какая-либо совокупность множеств, принадлежащих
при всех
из
, причём предполагается, что для произвольного элемента
и любого значения
определена вероятность события {
}. Эта вероятность выражается интегралом
,
,
,
и называется вероятностью накрытия множеством
значения
при заданном значении
.
Если истинное значение
неизвестно, то множество
(из совокупности множеств
,
, соответствующее результату наблюдений X, называется доверительным множеством (или интервальной статистической оценкой) для неизвестного истинного значения функции
. В качестве вероятностной характеристики интервальной оценки
, построенной по указанному правилу, используется доверительная вероятность
, выражающаяся в терминах вероятности накрытия равенством
,
.
Иными словами
— вероятность накрытия множеством
значения заданной функции
, соответствующего неизвестной истинной параметрической точке
.
Рекомендуемые материалы
В тех случаях, когда доверительная вероятность
от
не зависит, интервальную оценку
называют подобной пространству выборок. Это название обусловлено аналогией формул

и
.
В более общей ситуации
зависит от неизвестного
, и поэтому в практической работе принято характеризовать качество интервальной оценки коэффициентом доверия
,
где нижняя грань вычисляется на множестве
(иногда коэффициент доверия называется доверительным уровнем).
Оптимизация доверительного оценивания определяется теми требованиями, которые предъявляются к интервальным оценкам. Например, если цель заключается в построении доверительных множеств, подобных пространству выборок и имеющих заданный коэффициент доверия
(
), то первое требование выражается тождеством
,
.
При этом естественно искать такие интервальные оценки, которые накрывают истинное значение
с вероятностью, не меньшей вероятности накрытия любого произвольного значения
. Иными словами, второе требование, называемое требованием несмещённости, выражается неравенством
,
,
.
В этих условиях «наилучшей» разумно считать ту интервальную оценку
, которая с меньшей вероятностью накрывает любое значение
, отличное от истинного
. Отсюда возникает третье требование «наибольшей селективности»: для всякого другого доверительного множества
, отличного от
и удовлетворяющего условию
,
.
должно выполняться неравенство
,
,
.
Задача отыскания интервальных оценок
, удовлетворяющих указанным трём требованиям, эквивалентна задаче построения несмещённых, наиболее мощных статистических критериев, подобных пространству выборок и имеющих уровень значимости
. Вопросы существования решения такой задачи и его конструктивного описания составляют основу общей теории статистической проверки гипотез.
Наиболее часто применяется доверительное оценивание в ситуации, когда
— скалярная функция. Пусть
,
, — независимые случайные величины, подчиняющиеся одному и тому же нормальному распределению с неизвестными параметрами
и
, причём требуется построить интервальную оценку для
. Пусть
и
.
Поскольку случайная величина
подчиняется распределению Стъюдента с
степенями свободы и это распределение не зависит от неизвестных параметров
и
(
,
), то при любом положительном
вероятность события
зависит лишь от
. Если указанный интервал принять за интервальную оценку
для
, то ему будет соответствовать доверительная вероятность
,
не зависящая от
. Такую интервальную оценку называют доверительным интервалом, а её концевые точки — доверительными границами, или доверительными пределами, причём в данном случае доверительный интервал представляет собой интервальную оценку, подобную пространству выборок. В приведённом примере интервальная оценка является несмещённой и наиболее селективной.
Доверительный интервал это статистическая оценка параметра вероятностного распределения, имеющая вид интервала, границами которого служат функции от результатов наблюдений и который с высокой вероятностью «накрывает» неизвестное значение параметра. Именно, пусть результаты наблюдений
суть независимые случайные величины с распределением вероятностей
, зависящим от числового параметра
, где
— так называемое параметрическое множество. Тогда при фиксированном
, 0<
<1, интервал с границами
и
,
в параметрическом множестве
такой, что
,
называется доверительным интервалом для параметра
с доверительным уровнем (коэффициентом доверия)
. Здесь доверительная вероятность
вычисляется при истинном значении параметра
. Границы
называются доверительными границами, или доверительными пределами.
Пример. Пусть
есть нормальное распределение с плотностью вероятности

где
и
— известное число. Для построения доверительных интервалов для
рассматривается точечная статистическая оценка
параметра
и статистика
, которая при любом значении
имеет стандартное нормальное распределение с функцией распределения
.
Поэтому для любого
вероятность

не зависит от
. Для заданного
значение
находится из соотношения
Если Вам понравилась эта лекция, то понравится и эта - История психологии.
.
Для выбранного значения
доверительный интервал

накрывает неизвестное значение
с вероятностью
. Точность доверительного интервала измеряется числом
: вероятность ошибки, состоящей в том, что построенный доверительный интервал не накрывает истинное значение
, не превосходит
. Во многих задачах удаётся найти лишь доверительный интервал, отвечающий приближённому значению доверительного уровня.
Понятие доверительного интервала для векторного параметра воплощается в соответствующей многомерной доверительной области. Для многих функциональных характеристик вероятностных распределений строятся различные доверительные множества и зоны. Задача построения наилучших доверительных интервалов родственна задаче получения наилучших критериев в теории проверки статистических гипотез.
Метод оценивания с помощью доверительных интервалов принадлежит Е. Нейману (1935); он отличается от других методов интервального статистического оценивания логической простотой и независимостью от априорных предположений о параметре
.



















