lr4 (542535)

Файл №542535 lr4 (Лабник)lr4 (542535)2015-08-162015-08-16СтудИзба

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла

Работа N4. Доверительные границы и интервалы

результатом применения тчечной оценки â(x₁,...,x_n) является одно числовое значение; оно не дает представления о точности, т.е. о том, насколько близко полученное значение к истинному значению параметра. Интуитивно ясно, что такое представление может дать, например, дисперсия оценки, так что истинное значение должно находиться где-то в пределах

â  (24)

Внесем уточнения.

1.Основные положения

1.1. Определения и построение интервалов

Пусть (x₁,...,x_n)  x - n независимых наблюдений над случайной величиной с законом распределения F(z/a), зависящим от параметра a, значение которого неизвестно.

Определение 1. Функция наблюдений a₁(x₁,...,x_n) (заметим, что это случайная величина) называется нижней доверительной границей для параметра a с уровнем доверия Р_Д (обычно близким к 1), если при любом значении

P{ a₁(x₁,...,x_n) a}  P_Д

Определение 2. Функция наблюдений a₂(x₁,...,x_n) (случайная величина) называется верхней доверительной границей для параметра с уровнем доверия Р_Д , если при любом значении

P{ a₂(x₁,...,x_n)  a }  P_Д .

Определение 3. Интервал со случайными концами (случайный интервал)

I(x) = ( a₁(x), a₂(x) ) ,

определяемый двумя функциями наблюдений, называется доверительным интервалом для параметра a с уровнем доверия Р_Д , если при любом значении a

P{ I(x) a }  P{ a₁(x₁,...,x_n)  a  a₂(x₁,...,x_n) }  P_Д,

т.е. вероятность (зависящая от a) накрыть случайным интервалом I(x) истинное значение a - велика: больше или равна Р_Д.

Построение доверительных границ и интервалов. Для построения доверительного интервала (или границы) необходимо знать закон распределения статистики =(x₁,...,x_n), по которой оценивается неизвестный параметр (такой статистикой может быть оценка  = â(x₁,...,x_n) ). Один из способов построения состоит в следующем. Предположим, что некоторая случайная величина  = (, a), зависящая от статистики  и неизвестного параметра a такова, что

1) закон распределения известен и не зависит от a;

2) (, a) непрерывна и монотонна по .

Выберем диапазон для  интервал так, чтобы попадание в него было практически достоверно:

P{ f₁  (, a)  f₂ }  P_Д , (1)

для чего достаточно в качестве и взять квантили распределения уровня (1- Р_Д )/2 и (1+ Р_Д )/2 соответственно. Перейдем в (1) к другой записи случайного события, разрешив неравенства относительно параметра a; получим (полагая, что монотонно возрастает по ):

P{ g(, f₁)  a  g(, f₂) }  P_Д .

Это соотношение верно при любом значении параметра a (поскольку это так для (1)), и потому, согласно определению, случайный интервал

( g(, f₁) , g(, f₂) )

является доверительным для a с уровнем доверия Р_Д . Если убывает по , интервалом является ( g(, f₂) , g(, f₁) ).

Для построения односторонней границы для a выберем значения и так, чтобы

P{ (, a)  f₁ }  P_Д , f₁=Q(1 - P_Д )

или P{ (, a)  f₂ }  P_Д, f₂= Q( P_Д ),

где  квантиль уровня . После разрешения неравенства под знаком получим односторонние доверительные границы для a.

Пример. Доверительный интервал с уровнем доверия Р_Д для среднего a нормальной совокупности при известной дисперсии  .

Пусть x , ... , x_n - выборка из нормальной N(a,  ) совокупности. Достаточной оценкой для а является

â = â(x ,...,x_n) = ,

распределенная по закону N(a, ) ; пронормируем её, образовав случайную величину

, (2)

которая распределена нормально N(0,1) при любом значении а.

По заданному уровню доверия Р_Д определим для  отрезок -f_p, f_p так, чтобы

, (3)

т.е. f_p - квантиль порядка (1+ Р_Д )/2 распределения N(0,1); заметим, что  зависит от а , но (3) верно при любом значении а. Подставим в (3) выражение для  из (2) и разрешим неравенство под знаком вероятности в (3) относительно а ; получим соотношение

, (4)

верное при любом значении а. под знаком вероятности две функции наблюдений

, ( 5)

определяют случайный интервал

I( x₁, ... , x_n) =(a₁( x₁, ... , x_n), a₂( x₁, ... , x_n)), (5a)

который в силу (4) обладает тем свойством , что накрывает неизвестное значение параметра а с большой вероятностью Р_Д при любом значении а, и потому, по определению доверительно интервала, он является доверительным с уровнем доверия Р_Д .

В общем случае случайную величину  в (1) можно построить следующим образом. Определим функцию распределения F(z/a) статистики  (F, конечно, зависит от а). Для непрерывной  случайная величина (, а) F( /a), как нетрудно видеть, распределена равномерно на отрезке 0, 1 при любом значении а; приняв f₁= (1- P_Д)/2, f₂=(1+P_Д)/2, будем иметь в качестве (4)

P{f₁ F( /a)  f₂} = P_Д .

Для дискретной  ситуация аналогична.

Можно рассуждать иначе: при любом фиксированном значении а определим отрезок z₁(a), z₂(a)  так, что

P{ z₁(a)    z₂(a) }  Р_Д ; (6)

ясно, что в качестве z₁ и z₂ можно взять квантили, т.е. определить из условий

F(z_!/a)=(1- Р_Д )/2, F(z₂/a)=(1+ Р_Д )/2.

Если z₁(a) и z₂(a) монотонно возрастают по а, то, разрешив два неравенства под знаком Р в (6) и учитывая, что z₁(a) < z₂(a), получим:

P{ z₂^-1()  a  z₁^-1() }  Р_Д _,

вверное при любом а; ясно, что интервал ( z₂^-1() , z₁^-1() ), определяемый двумя функциями от  , является доверительным с уровнем доверия Р_Д.

1.2. Уровень доверия

Уровень доверия Р_Д означает, что правило определения интервала дает верный результат с вероятностью Р_Д, которая обычно выбирается близкой к 1, однако, 1 не равно.Убедимся статистически на примере в том, что доверительный интервал с уровнем доверия Р_Д может не содержать (с малой вероятностью 1- Р_Д ) истинное значение параметра.

Пример. рассмотрим приведенный в (5) случайный интервал I(x₁, ..., x_n), который при любом значении а накрывает это значение с большой вероятностью Р_Д:

Р{ I(x₁,...,x_n)  a } = Р_Д ,

и потому, если пренебречь возможностью осуществления события aI, имеющего малую вероятность (1-Р_Д), можно считать событие aI(x₁,...,x_n) практически достоверным, т.е. можно верить тому, что вычисленный по конкретным наблюдениям x₁,...,x_n интервал I содержит неизвестное значение параметра а.

Испытаем интервал (5) на 50 выборках объема n=10 для трех уровней доверия Р_Д : 0.9 , 0.99 , 0.999 (соответственно, три значения f_p) .

При Р_Д= 0.9 число неверных из k =50 результатов окажется в окрестности 5, так как среднее число неверных

k(1- Р_Д) = 5;

при Р_Д =0.99 появление хотя бы одного неверного из k =50 весьма вероятно: вероятность этого события

1- Р_Д^k=1-0.99⁵⁰  0.61;

при Р_Д =0.999 появление хотя бы одного неверного весьма сомнительно: вероятность этого события

1- Р_Д^k=1-0.999⁵⁰  0.05.

Задание.

1. Определить, сколько раз из k =50 доверительный интервал оказался неверным;.это сделаем для трех значений Р_Д . Графики для Р_Д =0.9 и Р_Д =0.99 распечатать. Выполнение в пакетах см. в пп. 2 - 4.

2. Провести аналогично 50 испытаний доверительного интервала (7) - (9) для случая неизвестной дисперсии.

1.3. Интервалы для параметров нормального распределения

Пусть х₁, … ,х_n- выборка из нормального N(a,²) распределения; значения среднего а и дисперсии ² неизвестны. Оценки для а и ²:

, . (7)

Как известно, доверительным интервалом для среднего а с уровнем доверия Р_Д при неизвестной дисперсии является интервал

I(x) = (a₁(х), a₂(х)), (8)

где , , (9) t_p- квантиль порядка (1+ Р_Д)/2 распределения Стьюдента с n-1 степенями свободы.

Доверительным интервалом для стандартного отклонения  с уровнем доверия Р_Д является интервал

I (x)=(₁(х), ₂(х)) , (10)

где , , (11)

t₁и t₂- квантили порядков соответственно (1+ Р_Д)/2 и (1- Р_Д)/2 распределения хи-квадрат с n-1 степенями свободы.

Сгенерируем выборку объема n=20 из нормального распределения с параметрами a =10, ²=2²=4 и определим доверительные интервалы для a и  с уровнем доверия Р_Д : 0.8 , 0.9 , 0.95 , 0.98 , 0.99 , 0.995 , 0.998 , 0.999. Результаты выпишем в виде таблицы. C ростом Р_Д интервал расширяется, с ростом n - уменьшается.

Выполнение см. в пп. 2 - 4.

Если нас интересуют не интервалы, а верхние или нижние доверительные границы, то, как известно, они определяются теми же формулами (9) è (11), îäíàêî, çíà÷åíèÿ ïîðîãîâ t изменяются. Например, нижней доверительной границей для a с уровнем доверия Р_Д является значение

где t_p - квантиль порядка Р_Д распределения Стьюдента с n-1 степенями свободы, а верхней границей для  с уровнем доверия Р_Д является

где t₂ - квантиль порядка 1- Р_Д распределения хи-квадрат с n-1 степенями свободы.

Задание: определить верхние доверительные границы для а и  с уровнем доверия Р_Д = 0.95 .

1.4. Задание на самостоятельную работу

1) для заданной задачи построить оценку заданным методом (варианты заданий см. ниже);

2) построить доверительный интервал, основанный на этой оценке;

3) сгенерировать выборку заданного объема;

4) вычислить доверительный интервал.

Отчет по работе должен содержать:

постановки вопросов, формулы,

графики испытания доверительного интервала для 2-х случаев: с известной и неизвестной дисперсией (по п. 1.2),

таблицу доверительных интервалов для различных Р_Д (по п. 1.3),

вывод формул для оценок и интервалов, сгенерированную выборку и вычисленный интервал (по п. 1.4) .

Варианты задач.

Задача1. Расстояние а до некоторого объекта измерялось n₁ раз одним прибором и n₂- вторым; результаты х₁,…,х_n₁; y₁,…,y_n₂. Оба прибора при каждом измерении дают независимые случайные ошибки, нормально распределенные со средним 0 и стандартными отклонениями ₁ и ₂ соответственно. Методом максимального правдоподобия построить оценку â для а и доверительный интервал с уровнем доверия Р_Д .

Варианты исходных данных

¹	n₁	n₂	₁, êì	₂, êì	Ðä	a, êì
1	5	10	3	5	0.95	300
2	8	12	3	5	0.98	300
3	10	15	3	5	0.95	300
4	5	10	4	6	0.98	350
5	8	12	4	6	0.95	350
6	10	15	4	6	0.98	350
7	5	10	5	8	0.95	400
8	8	12	5	8	0.98	400
9	10	15	5	8	0.95	400

измерения получить моделированием с заданным параметром а.

Решение (без вывода). Оценка

, где с= ;

доверительный интервал

I=( , ),

где - квантиль порядка (1+Р_Д)/2 распределения N(0,1).

Задача 2. Изготовлена большая партия из N=10000 приборов. Известно, что время безотказной работы случайно и распределено по показательному закону с плотностью

, x  0

С целью определения значения параметра а этой партии были поставлены на испытания n приборов; времена безотказной работы оказались равными х₁,…,х_n. Методом моментов построить оценку для а и доверительный интервал с уровнем доверия Р_Д . Кроме того, построить доверительный интервал для числа М приборов, имеющих время безотказной работы менее 50 часов.

Варианты исходных данных

	1	2	3	4	5	6	7	8	9
n	20	25	30	20	25	30	20	25	30
Ð_Д	0.95	0.99	0.95	0.99	0.95	0.99	0.95	0.99	0.95
à	300	400	500	300	400	500	300	400	500

измерения получить моделированием с заданным параметром а.

Решение (без вывода). Оценка

;

доверительный интервал для а

I_a = ( , ),

где t₁=Q(2n, (1-Р_Д)/2), t₂=Q(2n, (1+Р_Д)/2) - квантили распределения хи-квадрат с 2n степенями свободы; доверительный интервал для М

I_M = ( N(1- exp(- )), N(1- exp(- )) ).

Çàäà÷à 3. Некоторое неизвестное расстояние а измерялось с аддитивной случайной ошибкой  , распределенной по закону Коши с плотностью

p_( x ) = , -  < x < .

По результатам х₁,…,х_n независимых измерений методом порядковых статистик построить оценку для а и приближенный доверительный интервал с коэффициентом доверия Р_Д .

Варианты исходных данных

	1	2	3	4	5	6	7	8	9
n	30	40	50	30	40	50	30	40	50
b	3	4	5	6	3	4	5	6	3
Ð_Д	0.95	0.98	0.95	0.98	0.96	0.98	0.95	0.98	0.95
a	15	20	25	15	20	25	15	20	25

измерения получить моделированием с заданным параметром а.

Решение (без вывода).Оценкой для а является выборочная медиана - порядковая статистика с номером [n/2]+1

или

(у этих статистик асимптотические свойства одинаковы). Приближенный доверительный интервал, основанный на асимптотическом распределении выборочной р-квантили

I=( ),

где t_p=Q((1+Р_Д)/2) - квантиль порядка (1+Р_Д)/2 распределения N(0,1).

Задача 4. В водоеме обитает некоторая биологическая популяция, состоящая из смеси особей двух возрастов. Длина особи - случайная величина, распределенная по нормальному закону N( a_i, _i²), где i=1,2 - индекс, относящийся к возрасту. С целью определения доли q особей 1-го возраста проведен отлов n особей и измерена их длина. По результатам х₁,…,х_n методом моментов построить оценку для q и приближенный доверительный интервал с уровнем доверия Р_Д . Построить гистограмму наблюдений.

Варианты исходных данных

	1	2	3	4	5	6	7	8	9
n	40	50	60	40	50	60	40	50	60
à₁	5	6	5	6	5	6	5	6	5
à₂	8	9	8	9	8	9	8	9	8
Ð_Ä	0.95	0.95	0.98	0.95	0.95	0.98	0.95	0.95	0.98
q	0.5	0.4	0.3	0.5	0.4	0.3	0.5	0.4	0.3

Принять ₁=1см, ₂=1см. измерения получить моделированием с заданным значением q.

Решение (без вывода):

I = ( q₁, q₂),

, _n ,

t_p- квантиль порядка (1+ Р_Д)/2 для N(0,1).

2. Выполнение в пакете STATGRAPHICS

Уровень доверия

а) Сгенерируем массив z размером kn=5010=500 наблюдений, распределенных нормально с параметрами а=10, ² = 2²= 4 (процедурой H.5. Random Number Generation) и образуем k=50 выборок объема n=10 т.е. матрицу х размерности 10 х 50: процедура A.2. File Operation, операция J.Update, оператором

10 50 RESHAPE z

б) Оценим средние (массив xs длиной k=50) по (1) процедурой A.2, операция J, оператором

SUM x/10

в) Определим квантили f_p порядков (1+ Р_Д)/2 (0.95 , 0.995 , 0.9995) нормального распределения N(0,1):

H.4. Critical Values (критические значения) - (Dist. Number: 14 (Normal)) - F6 - (mean: 0, std. deviation: 1) - F6 - (Area at or below: 0.95) - F6.

г) Определим массив a1 длины k = 50 левых концов интервалов по (5): процедура A.2 , операция J, оператор

xs - f_p * / SQRT ( n )

д) Аналогично определим массив а2 правых концов интервалов.

е) Результаты k = 50 испытаний доверительных интервалов проанализируем по графику, полученному с помощью процедуры E.2. Multiple X-Y Plots, задав

X: COUNT 50

Y: a1

Y: a2

Y: 50 REP 10

Последняя строка потребовалась для изображения истинного значения а=10.

Определим, сколько раз из k=50 доверительный интервал оказался неверным. Это сделаем для трех значений Р_Д (соответственно f_p).

Графики для Р_Д =0.9 и Р_Д =0.99 распечатаем.

Задание. Провести аналогично k =50 испытаний доверительного интервала (7) - (9) для случая неизвестной дисперсии.

Интервалы для параметров нормального распределения

Сгенерируем выборку из 20 наблюдений над нормальной случайной величиной со средним а = 10 и дисперсией ² = 4 и определим доверительные интервалы для а и  с уровнем доверия Р_Д : 0,8, 0,9, 0,95, 0,98, 0,99. Выполняется в процедурном блоке G. Estimation and Testing процедурой 1. One-Sample Analysis Результаты выпишем в виде таблицы. C ростом Р_Д интервал расширяется, с ростом n - уменьшается.

3. Выполнение в пакете STATISTICA

Уровень доверия

Работаем в модуле Basic Statistics and Tables.

а) Генерируем k = 50 выборок по n = 10 наблюдений, нормально распределенных с параметрами: среднее а = 10, дисперсия ²= 4.

Создадим таблицу с 50 строками (выборками) и 10 (объем выборки) столбцами:

File - New Data - File Name: Doverit (например)- ОК.

Создана таблица 10v  50c; добавим 40 строк после 10-й:

Кнопка Vars (или Edit - Cases) - Add - Number of Cases to Add: 40, insert after Case: 10 - OK.

Сгенерируем наблюдения:

Vars - All Specs - в появившейся таблице Variables Doverit.sta в 4-м столбце Long name выделим 1-ю клетку и запишем в ней

= Vnormal (Rnd (1); 10, 2)

и перенесем эту запись в строки со 2-й по 10-ю:

Edit - Copy (или кнопка Copy) (копирование в буфер),

затем выделим следующую клетку и

Edit - Paste (или кнопка Paste).

Закроем окно. Выполним назначения:

Edit - Variables - Recalculate...(или кнопка Х = ?).

б) Оценим средние:

Edit - Block Stats/Rows - Means.

Образован 11-й столбец MEAN. Присвоим ему имя xs:

выделим столбец MEAN - Vars - Current Specs...-Name: xs - OK.

в) Определим квантили f_pпорядков (1 + Р_Д)/2 (0.95, 0.995, 0.9995) нормального N (0, 1) распределения:

Analisis-Probability Calculator - в окне устанавливаем Distribution Z (Normal), выделим Inverse, p: 0.95 - Compute; результат в поле Z: 1.645.

Аналогично определим f_pдля остальных вероятностей (2.57 и 3.29).

г) Определим по (5) столбцы а1 и а2 левых и правых концов доверительных интервалов.

Выделим заголовок столбца xs - Vars - Add - Number...: 2, after: xs - OK - выделим новый столбец - Vars - Current Specs - Name: A1 (левые концы), Long name:

= xs - 1,65  2 / Sgrt(10)

После ОК получаем столбец левых концов. Аналогично получаем столбец а2 правых концов.

д) Результаты k = 50 испытаний доверительного интервала представим графически:

выделим столбец а1 и а2 - Graphs - Custom Graphs - 2D Graphs - OK (соглашаемся с предложениями).

Видим график (рис.1), по которому определяем число экспериментов (6 из k = 50), в которых интервал не содержит истинного значения параметра. Можем определить координаты любой точки на рисунке, поставив на нее стрелку: координаты в верхнем левом углу. Распечатаем график.

е) повторим пп. г) и д) для двух других значений доверительной вероятности.

Задание: Провести аналогично k = 50 испытаний доверительного интервала (7) - (9) для случая неизвестной дисперсии (рис.2 для Р_Д= 0.9; 5 ошибок).

Рис. 1.

Рис .2.

Интервалы для среднего нормальной совокупности

Сгенерируем выборку (столбец) из 20 наблюдений над нормальной случайной величиной со средним а = 10 и дисперсией ² = 4 и определим доверительные интервалы для а с уровнем доверия Р_Д : 0.8, 0.9, 0.95, 0.98, 0.99, 0.999. Выполняется командой

Analisis - Descriptive staistics - в поле Statistics выбрать Conf. Limits for means и указывать значение Alpha error: 80 (90, 95 т.д.).

4. Выполнение в пакете SPSS

Уровень доверия

а) Генерация k = 50 выборок по n = 10 наблюдений, нормально распределенных с параметрами: среднее а = 10, дисперсия  ²= 4.

Выборки поместим в таблицу с 50 строками (выборками) и 10 (объем выборки) столбцами (при таком размещении сокращается работа по генерации наблюдений). В первом столбце таблицы выделяем клетку в 50-й строке и вводим точку. 50 строк создано.

Переименуем 1-й столбец:

Data - Define Variable - Name: x 01 - OK

Сгенерируем наблюдения:

Transform - Compute - Target Variable (целевая переменная): x 01, Numeric Expression (числовое выражение):

NORMAL (2) + 10

это выражение вводим кнопками окна - ОК.- Change? - OK.

В первом столбце наблюдения получены. Повторяем, начиная с Transform, заменив х 01 на х 02; и так 9 раз (5 нажатий на 1 столбец). Матрица наблюдений получена.

б) Оценка средних.

В пакете статистики определяются по столбцам (переменным), поэтому выборки-строки преобразуем транспонированием в выборки-столбцы:

Data - Transpose...- все имена переменных переносим в правый список Variables (выделяем все, нажимаем кнопку-стрелку) - ОК.

Теперь имеется 50 столбцов - выборок по 10 строк - наблюдений. Первый столбец case - lbl можно удалить:

выделим его - Edit - Clear (или клавиша Delete).

Определим среднее по выборкам:

Statistics - Summarize - Descriptives...- перенесем имена всех столбцов в правый список, отметим Display labels (имена показывать) - Options...- отметим только Mean; îòìåòèì Display Order: Name (показывать по порядку) - Continue - OK.

В окне Output получаем столбец Mean результатов. Если в столбце есть пропуски или текст, удаляем лишние строки, чтобы столбец результатов состоял из 50 строк с числами.

Сохраним столбец результатов в буфере операцией Copy. Снова транспонируем матрицу (чтобы в дальнейшем не было пустых блоков). Получили 10 числовых столбцов и 50 строк (выборок).

Выделяем 1-й справа свободный столбец и с помощью Edit - Paste помещаем в него столбец средних. Присвоим ему имя as:

выделим его - Data - Define Variable - Name: as

в) Определение столбцов а1 и а2 левых и правых концов доверительных интервалов.

Пусть Р_Д = 0.9, квантиль порядка (1 + Р_Д )/2 = 0.95 есть f_Р = 1.645. Вычислим левые концы:

Transform - Compute - Target Variable: a1, Numeric Expression (по (5), учитывая, что  = 2): as – 1.645  2/ SQRT(10).

Аналогично вычислим левые концы а2.

г) Результаты k = 50 испытаний доверительного интервала представим графически, предварительно образовав столбец а с истинным значением 10 параметра; затем:

Graphs - Line...- Multiple (несколько графиков), Values of individual cases - Define - Line Represent (представить линии): а, а1, а2 - ОК.

Наблюдаем график, из которого видно, сколько интервалов из 50 не содержат истинное значение. Записываем его; оно должно находиться приближенно в пределах 5  2  5  4. График распечатаем или сохраним: File - Save As...

д) Пусть Р_Д = 0.99; тогда f_Р  2.57; если Р_Д = 0.999, то f_Р  3.29. Повторим пп. в) и г) для этих значений Р_Д . Убеждаемся, что с ростом Р_Д число ошибок уменьшается, но ширина интервала увеличивается (чем надежнее гарантия, тем меньше она гарантирует).

Задание: провести аналогично k = 50 испытаний доверительного интервала (7) - (9) для случая неизвестной дисперсии.

ПРИЛОЖЕНИЕ 1. Методы построения оценок

Метод моментов

Пусть x₁, ..., x_n- n независимых наблюдений над случайная величиной  с функцией распределения F (x/a), зависящей от параметра a  (a₁, ..., a_R), nR; значение параметра требуется оценить по наблюдениям.

Пусть m_k = M^k - момент порядка k. Моменты являются функциями параметра a: m_k= f_k(a₁, ..., a_R). Пусть существуют первые R моментов m₁, ..., m_R. Если бы моменты были известны, можно было бы составить систему уравнений для определения параметров по моментам:

m₁= f₁(a₁,...,a_R),

. . .

m_R= f_R(a₁,...,a_R );

пусть эта система разрешима относительно a:

a₁= g₁(m₁,...,m_R),

. . . (1)

a_R= g_R(m₁,...,m_R ).

когда решается задача оценивания, значения моментов неизвестны, однако, для моментов имеются несмещенные и состоятельные оценки

, k =1,...,R.

Подставив их в (1) вместо m_k, получим некоторые оценки для a_j:

(x₁ ,... x_n) = g₁( ₁ ,..., _R),

. . .

( x₁ ,... x_n) = g_R( ₁ ,..., _R),

которые называют моментными оценками.

Несмещенностью они, вообще говоря, не обладают; обычно их исправляют. Справедливы следующие свойства.

1. Если функции g_j(), j = 1 ,..., R, непрерывны, то оценки состоятельны.

2. Если функции g_j() дифференцируемы, а распределение при любом a имеет 2R моментов, то оценки асимптотически нормальны:

 N (a_j, .

Замечания.

1. В равенствах (1) вместо первых моментов можно взять любые R моментов так, чтобы система была разрешима.

2. Моментные оценки не всегда обладают хорошими характеристиками. Однако, часто они достаточно просты в вычислительном отношении.

Метод наибольшего правдоподобия

Определения. Пустьимеетсянекоторая совокупность x  (x₁ ,..., x_n) наблюдений. Рассмотрим вероятность (или плотность) p(x/a) получить это x при различных a  (a₁ ,..., a_R). в качестве оценки возьмем то значение а, для которого вероятность p(x/a) максимальна; такой способ оценивания называется методом наибольшего (максимального) правдоподобия.

Функция p(x/a), понимаемая как функция от а, называется функцией правдоподобия. Значение а, доставляющее максимум функции правдоподобия, называется оценкой наибольшего (максимального) правдоподобия:

p(x/a) = p (x/a). (2)

Заметим, что а есть функция наблюдений х: а = а (х). При обычных условиях регулярности максимум находится из системы уравнений

i = 1, ..., R. (3)

Пример. Пусть х  (х₁, ..., x_n) - независимые наблюдения над случайной величиной, нормально распределенной с параметрами b и ² (роль двумерного параметра а в определении играет пара b и ² ). Плотность распределения выборки

p(x/ b, ²)  p(x₁, ..., x_n /b, ²) = . (3)

Поскольку значения х₁ ,..., x_n известны, величина p(x₁, ..., x_n/b,²) является функцией от b и ². система (3):

Решение этой системы, т.е. оценки наибольшего правдоподобия:

Свойства оценок наибольшего правдоподобия.

Пусть  - случайная величина с законом распределения q( /a), x(x₁,..x_n)- n независимых наблюдений, p(x₁, ..., x_n /a) = - распределение выборки.

При некоторых достаточно широких условиях оценки наибольшего правдоподобия обладают хорошими свойствами, а именно, они состоятельны, асимптотически эффективны и асимптотически нормальны с параметрами (для одномерного случая)

Mа = а, Dа ={n }^-1

условия таковы: а) независимость множества X = x: q(x/a) = 0 от а; б) существование производных и ; в) существование . Доказательство можно найти, например, в 2.

Метод порядковых статистик

Пусть x₁, ..., x_n- n независимых наблюдений над случайная величиной  с функцией распределения, зависящей от параметра a, значение которого тебуется оценить; x₍₁₎ x₍₂₎ ...  x₍_n)- вариационный ряд (наблюдения, упорядоченные по возрастанию), x₍_k₎- порядковая статистика с номером k.

Квантиль x_р выбранного уровня р (например, р = 0.5, x_0.5 -медиана) является функцией параметра а:

x_р= f(a),

выразим а через x_р

а = g(x_р)

и вместо x_р подставим выборочную квантиль = x₍_[_np_]+1₎, которой является порядковая статистика с номером [np] +1; получим оценку

= g(x₍_[_np_]+1₎)

Известны следующие свойства.

Если функция g непрерывна, то оценка состоятельна. Если распределение наблюдений непрерывно с плотностью q(x) , то асимптотически нормальна с параметрами

M = x_р, D =

(теорема Крамера).

Ясно, что таким же образом можно построить оценки и для неодномерного параметра. Основное и очень важное преимущество оценок, основанных на порядковых статистиках, - их устойчивость к засорению наблюдений.

приложение 2. операторы пакета STATGRAPHICS

Здесь описываются операторы, использованные в работах.

N TAKE x –Выбирает заданное число значений с начала (N - поло жительно) или конца (N - отрицательно) массива х.

2 TAKE 1 2 3 4 дает 1 2

–2 TAKE 1 2 3 4 дает 3 4

m n RESHAPE x – Преобразует массив х в матрицу из m строк и n столбцов. Если требуется больше значений, чем в массиве х, значения повторяются циклически; если меньше – значения в конце массива опускаются.

2 3 RESHAPE COUNT 4 дает

1 2 3

4 1 2

n RESHAPE x – Расширяет циклически x до размера n.

7 RESHAPE 1 2 3

дает 1 2 3 1 2 3 1

n REP x – Делает n копий каждого элемента в массиве x.

2 REP 3 4 5 дает 3 3 4 4 5 5

2 3 4 REP 3 4 5 дает 3 3 4 4 4 5 5 5 5.

COUNT n – Создает вектор с целыми числами от 1 до n.

SUM x – Суммирует элементы массива. Если массив - матрица, ре-

зультат есть вектор сумм элементов столбцов.

MIN x – Выбирает минимальное (максимальное) значение в массиве.

MAX x  Если х – матрица, результат есть вектор минимумов

(максимумов) элементов столбцов.

TAN x – Определяет тангенсы элементов массива х. Этот оператор относится к числу загружаемых. Перед использованием необходимо выполнить загрузку процедурой V. 1. Load Operators and Functions, опциями Mathematical functions и Read (после использования рекомендуется выгрузить (чтобы освободить память) опцией Erase).

SORTUP x – располагает в порядке возрастания элементы массива x; если x-матрица, - сортирует все столбцы. Этот оператор, как и предыдущий, относится к числу загружаемых.

заключение

использование пакетов существенно улучшает процесс изучения основ математической статистики, ускоряя его и вызывая интерес у студентов. Это показал двухлетний опыт применения в МЭИ на АВТФ. Данное учебное пособие является началом работы в этом направлении.

Авторам приятно отметить,что изобретателем и вдохновмтелем этого пособия является Наталья Александровна Сливина, зажигательный и неповторимый энтузиаст применения компьютеров и пакетов в преподавании математики. Хотелось бы также отметить участие в деле освоения пакетов студентов АВТФ - прекрасных программистов Евгения Голода, Дмитрия Горбунова, Петра Комарова.

Литература

Севастьянов Б.А. Курс теории вероятностей и математической статистики. М.: Наука, 1982. 256 с.
Рао С.Р. Линейные статистические методы и их применение. М.: Наука, 1968. 548 с.
Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1983. 416 с.
Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. М.: ИНФРА-М, Финансы и статистика, 1995. 384 с.
Краткое описание пакета STATGRAPHICS. / Э.А. Вуколов, В.В.Лесин, Ю.П. Лисовец др. М.: МГИЭТ. вып. 1, 2. 1993.

Характеристики

Тип файла

Документ

Размер

383,5 Kb

Материал

Лабник

Тип материала

Книга

Предмет

Вычислительные машины, системы и сети (ВМСиС)

Высшее учебное заведение

НИУ «МЭИ»

Тип файла документ

Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.

Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.

Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.

Список файлов книги

labnik-4920505-1439734990.zip

Лабник

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.