lr4 (Лабораторные по Теория вероятностей)
Описание файла
Документ из архива "Лабораторные по Теория вероятностей", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 7 семестр, которые можно найти в файловом архиве НИУ «МЭИ» . Не смотря на прямую связь этого архива с НИУ «МЭИ» , его также можно найти и в других разделах. Архив можно найти в разделе "лабораторные работы", в предмете "теория вероятности и математическая статистика" в общих файлах.
Онлайн просмотр документа "lr4"
Текст из документа "lr4"
82
Работа N4. Доверительные границы и интервалы
результатом применения тчечной оценки â(x1,...,xn) является одно числовое значение; оно не дает представления о точности, т.е. о том, насколько близко полученное значение к истинному значению параметра. Интуитивно ясно, что такое представление может дать, например, дисперсия оценки, так что истинное значение должно находиться где-то в пределах
Внесем уточнения.
1.Основные положения
1.1. Определения и построение интервалов
Пусть (x1,...,xn) x - n независимых наблюдений над случайной величиной с законом распределения F(z/a), зависящим от параметра a, значение которого неизвестно.
Определение 1. Функция наблюдений a1(x1,...,xn) (заметим, что это случайная величина) называется нижней доверительной границей для параметра a с уровнем доверия РД (обычно близким к 1), если при любом значении
P{ a1(x1,...,xn) a} PД
Определение 2. Функция наблюдений a2(x1,...,xn) (случайная величина) называется верхней доверительной границей для параметра с уровнем доверия РД , если при любом значении
P{ a2(x1,...,xn) a } PД .
Определение 3. Интервал со случайными концами (случайный интервал)
I(x) = ( a1(x), a2(x) ) ,
определяемый двумя функциями наблюдений, называется доверительным интервалом для параметра a с уровнем доверия РД , если при любом значении a
P{ I(x) a } P{ a1(x1,...,xn) a a2(x1,...,xn) } PД ,
т.е. вероятность (зависящая от a) накрыть случайным интервалом I(x) истинное значение a - велика: больше или равна РД.
Построение доверительных границ и интервалов. Для построения доверительного интервала (или границы) необходимо знать закон распределения статистики =(x1,...,xn), по которой оценивается неизвестный параметр (такой статистикой может быть оценка = â(x1,...,xn) ). Один из способов построения состоит в следующем. Предположим, что некоторая случайная величина = (, a), зависящая от статистики и неизвестного параметра a такова, что
1) закон распределения известен и не зависит от a;
2) (, a) непрерывна и монотонна по .
Выберем диапазон для интервал так, чтобы попадание в него было практически достоверно:
P{ f1 (, a) f2 } PД , (1)
для чего достаточно в качестве и взять квантили распределения уровня (1- РД )/2 и (1+ РД )/2 соответственно. Перейдем в (1) к другой записи случайного события, разрешив неравенства относительно параметра a; получим (полагая, что монотонно возрастает по ):
P{ g(, f1) a g(, f2) } PД .
Это соотношение верно при любом значении параметра a (поскольку это так для (1)), и потому, согласно определению, случайный интервал
( g(, f1) , g(, f2) )
является доверительным для a с уровнем доверия РД . Если убывает по , интервалом является ( g(, f2) , g(, f1) ).
Для построения односторонней границы для a выберем значения и так, чтобы
P{ (, a) f1 } PД , f1=Q(1 - PД )
или P{ (, a) f2 } PД , f2 = Q( PД ),
где квантиль уровня . После разрешения неравенства под знаком получим односторонние доверительные границы для a.
Пример. Доверительный интервал с уровнем доверия РД для среднего a нормальной совокупности при известной дисперсии .
Пусть x , ... , xn - выборка из нормальной N(a, ) совокупности. Достаточной оценкой для а является
распределенная по закону N(a, ) ; пронормируем её, образовав случайную величину
которая распределена нормально N(0,1) при любом значении а.
По заданному уровню доверия РД определим для отрезок -fp, fp так, чтобы
т.е. fp - квантиль порядка (1+ РД )/2 распределения N(0,1); заметим, что зависит от а , но (3) верно при любом значении а. Подставим в (3) выражение для из (2) и разрешим неравенство под знаком вероятности в (3) относительно а ; получим соотношение
верное при любом значении а. под знаком вероятности две функции наблюдений
определяют случайный интервал
I( x1, ... , xn) =(a1( x1, ... , xn), a2( x1, ... , xn)), (5a)
который в силу (4) обладает тем свойством , что накрывает неизвестное значение параметра а с большой вероятностью РД при любом значении а, и потому, по определению доверительно интервала, он является доверительным с уровнем доверия РД .
В общем случае случайную величину в (1) можно построить следующим образом. Определим функцию распределения F(z/a) статистики (F, конечно, зависит от а). Для непрерывной случайная величина (, а) F( /a), как нетрудно видеть, распределена равномерно на отрезке 0, 1 при любом значении а; приняв f1= (1- PД)/2, f2 =(1+PД)/2, будем иметь в качестве (4)
P{f1 F( /a) f2} = PД .
Для дискретной ситуация аналогична.
Можно рассуждать иначе: при любом фиксированном значении а определим отрезок z1(a), z2(a) так, что
P{ z1(a) z2(a) } РД ; (6)
ясно, что в качестве z1 и z2 можно взять квантили, т.е. определить из условий
F(z!/a)=(1- РД )/2, F(z2/a)=(1+ РД )/2.
Если z1(a) и z2(a) монотонно возрастают по а, то, разрешив два неравенства под знаком Р в (6) и учитывая, что z1(a) < z2(a), получим:
P{ z2-1() a z1-1() } РД ,
вверное при любом а; ясно, что интервал ( z2-1() , z1-1() ), определяемый двумя функциями от , является доверительным с уровнем доверия РД.
1.2. Уровень доверия
Уровень доверия РД означает, что правило определения интервала дает верный результат с вероятностью РД, которая обычно выбирается близкой к 1, однако, 1 не равно.Убедимся статистически на примере в том, что доверительный интервал с уровнем доверия РД может не содержать (с малой вероятностью 1- РД ) истинное значение параметра.
Пример. рассмотрим приведенный в (5) случайный интервал I(x1, ..., xn), который при любом значении а накрывает это значение с большой вероятностью РД:
Р{ I(x1,...,xn) a } = РД ,
и потому, если пренебречь возможностью осуществления события aI, имеющего малую вероятность (1-РД), можно считать событие aI(x1,...,xn) практически достоверным, т.е. можно верить тому, что вычисленный по конкретным наблюдениям x1,...,xn интервал I содержит неизвестное значение параметра а.
Испытаем интервал (5) на 50 выборках объема n=10 для трех уровней доверия РД : 0.9 , 0.99 , 0.999 (соответственно, три значения fp) .
При РД = 0.9 число неверных из k =50 результатов окажется в окрестности 5, так как среднее число неверных
k(1- РД) = 5;
при РД =0.99 появление хотя бы одного неверного из k =50 весьма вероятно: вероятность этого события
1- РДk=1-0.9950 0.61;
при РД =0.999 появление хотя бы одного неверного весьма сомнительно: вероятность этого события
1- РДk=1-0.99950 0.05.
Задание.
1. Определить, сколько раз из k =50 доверительный интервал оказался неверным;.это сделаем для трех значений РД . Графики для РД =0.9 и РД =0.99 распечатать. Выполнение в пакетах см. в пп. 2 - 4.
2. Провести аналогично 50 испытаний доверительного интервала (7) - (9) для случая неизвестной дисперсии.
1.3. Интервалы для параметров нормального распределения
Пусть х1, … ,хn - выборка из нормального N(a,2) распределения; значения среднего а и дисперсии 2 неизвестны. Оценки для а и 2:
Как известно, доверительным интервалом для среднего а с уровнем доверия РД при неизвестной дисперсии является интервал
I(x) = (a1(х), a2(х) ), (8)
где , , (9) tp - квантиль порядка (1+ РД)/2 распределения Стьюдента с n-1 степенями свободы.
Доверительным интервалом для стандартного отклонения с уровнем доверия РД является интервал
I (x)=(1(х), 2(х)) , (10)
t1 и t2- квантили порядков соответственно (1+ РД)/2 и (1- РД)/2 распределения хи-квадрат с n-1 степенями свободы.
Сгенерируем выборку объема n=20 из нормального распределения с параметрами a =10, 2=22=4 и определим доверительные интервалы для a и с уровнем доверия РД : 0.8 , 0.9 , 0.95 , 0.98 , 0.99 , 0.995 , 0.998 , 0.999. Результаты выпишем в виде таблицы. C ростом РД интервал расширяется, с ростом n - уменьшается.
Выполнение см. в пп. 2 - 4.
Если нас интересуют не интервалы, а верхние или нижние доверительные границы, то, как известно, они определяются теми же формулами (9) è (11), îäíàêî, çíà÷åíèÿ ïîðîãîâ t изменяются. Например, нижней доверительной границей для a с уровнем доверия РД является значение
где tp - квантиль порядка РД распределения Стьюдента с n-1 степенями свободы, а верхней границей для с уровнем доверия РД является