Доверительное оценивание и доверительный интервал
6. Доверительное оценивание и доверительный интервал
Доверительное оценивание это метод математической статистики, предназначенный для построения множества приближённых значений неизвестных параметров вероятностных распределений.
Пусть — случайный вектор, принимающий значения на множестве в евклидовом пространстве, причём распределение вероятностей этого вектора принадлежит параметрическому семейству распределений, заданному плотностями , , , относительно некоторой меры . Предполагается, что истинное значение параметрической точки , соответствующей результату наблюдений , неизвестно. Суть доверительного оценивания заключается в построении такого множества , зависящего от , которое содержит значение заданной функции , соответствующее неизвестному истинному значению параметрической точки .
Пусть — множество значений функции , , и пусть , , — какая-либо совокупность множеств, принадлежащих при всех из , причём предполагается, что для произвольного элемента и любого значения определена вероятность события {}. Эта вероятность выражается интегралом
,, ,
и называется вероятностью накрытия множеством значения при заданном значении .
Если истинное значение неизвестно, то множество (из совокупности множеств , , соответствующее результату наблюдений X, называется доверительным множеством (или интервальной статистической оценкой) для неизвестного истинного значения функции . В качестве вероятностной характеристики интервальной оценки , построенной по указанному правилу, используется доверительная вероятность , выражающаяся в терминах вероятности накрытия равенством
, .
Иными словами — вероятность накрытия множеством значения заданной функции , соответствующего неизвестной истинной параметрической точке .
Рекомендуемые материалы
В тех случаях, когда доверительная вероятность от не зависит, интервальную оценку называют подобной пространству выборок. Это название обусловлено аналогией формул
и
.
В более общей ситуации зависит от неизвестного , и поэтому в практической работе принято характеризовать качество интервальной оценки коэффициентом доверия
,
где нижняя грань вычисляется на множестве (иногда коэффициент доверия называется доверительным уровнем).
Оптимизация доверительного оценивания определяется теми требованиями, которые предъявляются к интервальным оценкам. Например, если цель заключается в построении доверительных множеств, подобных пространству выборок и имеющих заданный коэффициент доверия (), то первое требование выражается тождеством
, .
При этом естественно искать такие интервальные оценки, которые накрывают истинное значение с вероятностью, не меньшей вероятности накрытия любого произвольного значения . Иными словами, второе требование, называемое требованием несмещённости, выражается неравенством
, , .
В этих условиях «наилучшей» разумно считать ту интервальную оценку , которая с меньшей вероятностью накрывает любое значение , отличное от истинного . Отсюда возникает третье требование «наибольшей селективности»: для всякого другого доверительного множества , отличного от и удовлетворяющего условию
, .
должно выполняться неравенство
, , .
Задача отыскания интервальных оценок , удовлетворяющих указанным трём требованиям, эквивалентна задаче построения несмещённых, наиболее мощных статистических критериев, подобных пространству выборок и имеющих уровень значимости . Вопросы существования решения такой задачи и его конструктивного описания составляют основу общей теории статистической проверки гипотез.
Наиболее часто применяется доверительное оценивание в ситуации, когда — скалярная функция. Пусть , , — независимые случайные величины, подчиняющиеся одному и тому же нормальному распределению с неизвестными параметрами и , причём требуется построить интервальную оценку для . Пусть
и .
Поскольку случайная величина подчиняется распределению Стъюдента с степенями свободы и это распределение не зависит от неизвестных параметров и (,), то при любом положительном вероятность события зависит лишь от . Если указанный интервал принять за интервальную оценку для , то ему будет соответствовать доверительная вероятность
,
не зависящая от . Такую интервальную оценку называют доверительным интервалом, а её концевые точки — доверительными границами, или доверительными пределами, причём в данном случае доверительный интервал представляет собой интервальную оценку, подобную пространству выборок. В приведённом примере интервальная оценка является несмещённой и наиболее селективной.
Доверительный интервал это статистическая оценка параметра вероятностного распределения, имеющая вид интервала, границами которого служат функции от результатов наблюдений и который с высокой вероятностью «накрывает» неизвестное значение параметра. Именно, пусть результаты наблюдений суть независимые случайные величины с распределением вероятностей , зависящим от числового параметра , где — так называемое параметрическое множество. Тогда при фиксированном , 0<<1, интервал с границами и , в параметрическом множестве такой, что
,
называется доверительным интервалом для параметра с доверительным уровнем (коэффициентом доверия) . Здесь доверительная вероятность вычисляется при истинном значении параметра . Границы называются доверительными границами, или доверительными пределами.
Пример. Пусть есть нормальное распределение с плотностью вероятности
где и — известное число. Для построения доверительных интервалов для рассматривается точечная статистическая оценка параметра и статистика , которая при любом значении имеет стандартное нормальное распределение с функцией распределения
.
Поэтому для любого вероятность
не зависит от . Для заданного значение находится из соотношения
Если Вам понравилась эта лекция, то понравится и эта - История психологии.
.
Для выбранного значения доверительный интервал
накрывает неизвестное значение с вероятностью . Точность доверительного интервала измеряется числом : вероятность ошибки, состоящей в том, что построенный доверительный интервал не накрывает истинное значение , не превосходит . Во многих задачах удаётся найти лишь доверительный интервал, отвечающий приближённому значению доверительного уровня.
Понятие доверительного интервала для векторного параметра воплощается в соответствующей многомерной доверительной области. Для многих функциональных характеристик вероятностных распределений строятся различные доверительные множества и зоны. Задача построения наилучших доверительных интервалов родственна задаче получения наилучших критериев в теории проверки статистических гипотез.
Метод оценивания с помощью доверительных интервалов принадлежит Е. Нейману (1935); он отличается от других методов интервального статистического оценивания логической простотой и независимостью от априорных предположений о параметре .