04_Статистическая оценка параметров распределения (1120097), страница 2
Текст из файла (страница 2)
8
Статистическая мода m o - середина интервала с наибольшей частотой.
m o = 0,75.
Статистическая медиана m e - варианта, стоящая посередине вариационного ряда.
Так как число вариант равно 30 , берем среднее между 15 и 16 вариантами :
Статистические дисперсия Dв и среднеквадратическое отклонение в :
или по вспомогательной формуле :
-
Точечные оценки параметров распределения :
Найденные числовые характеристики выборки используем для оценки параметров распределения.
Статистической оценкой для математического ожидания служит выборочная средняя:
Статистической оценкой для дисперсии служит исправленная выборочная дисперсия:
Статистической оценкой для среднеквадратического отклонения служит исправленное выборочное среднеквадратическое отклонение:
Задача 3.
9
Задана выборка :
| x i | 3 | 5 | 8 | 12 | 16 | 19 | 21 | |
| n i | 8 | 13 | 16 | 14 | 11 | 9 | 5 |
Необходимо:
-
Построить статистическую функцию распределения F(x) .
Записать ее аналитическое выражение . Построить график.
-
Выполнить интервальную оценку параметров распределения:
математического ожидания m x ; среднеквадратического отклонения x .
(Доверительную вероятность принять равной 0,95)
Объем выборки (общее количество проведенных опытов) равен сумме всех частот:
1). Строим статистическую функцию распределения.
По определению, статистическая функция распределения - это функция F(x) , которая при каждом значении аргумента x равна относительной частоте того, что случайная величина примет значение, меньшее, чем аргумент (попадет в область, лежащую слева от аргумента):
Она дает представление о теоретической функции распределения . Принцип ее построения тот же, что и для теоретической функции распределения для дискретной случайной величины, только вместо вероятностей p i берем относительные частоты w i . Подсчитываем относительные частоты:
| x i | 3 | 5 | 8 | 12 | 16 | 19 | 21 | |
| n i | 8 | 13 | 16 | 14 | 11 | 9 | 5 | |
| w i | 0,1053 | 0,1711 | 0,2105 | 0,1842 | 0,1447 | 0,1184 | 0,0658 |
Записываем функцию распределения . Для этого при любом значении аргумента x нужно подсчитать относительную частоту появления опытных данных в области, лежащей слева от x.
10
Например, запишем значение функции распределения для указанного на рисунке стрелкой значения x. Слева от такого x лежит 37 опытных значений : значение (3) повторилось в опытах 8 раз, значение (5) - 13 раз и значение (8) - 16 раз. Таким образом, частота n появления опытных данных в выделенной области равна 37, а относительная частота w равна 37 / 76 = 0,4868 . Т.е., статистическая функция распределения в указанной точке x равна : F(x) = 0,4868 и такое же значение эта функция имеет в любой точке, лежащей между 8 и 12 .
Теперь запишем значения F(x) для любого x , пробегающего значения от (‑) до (+) :
при ‑ < x 3 F(x) = W(X<x) = 0 (слева от таких x нет опытных данных) ;
при 3< x 5 F(x) = W(X<x) = W(X=3) = w 1 = 0,1053;
при 5< x 8 F(x) = W(X=3)+W(X=5) = 0,1053 + 0,1711 = 0,2763 ;
при 8< x 12 F(x) = W(X=3)+W(X=5)+W(X=8) =
= 0,1053 + 0,1711 + 0,2105 = 0,4868;
при 12< x 16 F(x) = W(X=3)+W(X=5)+W(X=8)+W(X=12) =
= 0,1053 + 0,1711 + 0,2105 + 0,1842 = 0,6711;
при 16< x 19 F(x) = W(X=3)+W(X=5)+W(X=8)+W(X=12)+W(X=16) =
= 0,1053 + 0,1711 + 0,2105 + 0,1842 + 0,1447 = 0,8158;
при 19< x 21 F(x) = W(X=3)+W(X=5)+W(X=8)+W(X=12)+W(X=16)+W(X=19) =
= 0,1053 + 0,1711 + 0,2105 + 0,1842 + 0,1447 + 0,1184 = 0,9342;
при 21< x + F(x) = 1 .
В последнем случае все опытные данные лежат слева от аргумента x . Сумма всех относительных частот обязательно равна единице.
Таким образом, с ростом значения аргумента x идет процесс накопления относительных частот. Можно записать общую формулу :
Статистическая функция распределения в каждой точке x равна сумме относительных частот для всех значений вариант, лежащих слева от этого x.
Окончательно получаем выражение для статистической функции распределения:
11
Теперь рисуем график функции распределения F(x):
-
Выполняем интервальную оценку параметров распределения .
Точное значение математического ожидания, дисперсии и среднеквадратического отклонения мы найти по опытным данным в принципе не можем, так как в опытах мы получаем только часть информации о случайной величине.
Когда вместо математического ожидания мы берем из опыта выборочную среднюю, мы допускаем погрешность. Оценить ее можно с помощью доверительного интервала . Выбирается интервал
и находится доверительная вероятность - вероятность того, что истинное значение математического ожидания лежит в этом интервале. Имеются формулы, по которым для заданного находят величину и положение доверительного интервала:
s (1-q) x s (1+q)
Д
12
ля того, чтобы ими воспользоваться, находим числовые характеристики выборки: Исправленное выборочное среднеквадратическое отклонение
Коэффициенты t (,n) и q (,n) находим по соответствующим таблицам :
t (0,95; 76) = 1,994 ; q (0,95; 76) = 0,168 .
Подставляем в формулы для доверительных интервалов :
5,7608(1-0,168) x 5,7608 (1+0,168) .
Окончательно получаем:
4,7930 x 6,7286 .
С вероятностью 0,95 истинные значения математического ожидания и среднеквадратического отклонения лежат в полученных интервалах.
из конспекта
Статистическая оценка параметров распределения.
Задача: по опытным данным восстановить числовые характеристики распределения или параметры предполагаемого распределения:
-
Нормального (а, σ)
-
Показательного (λ)
-
Равномерного (a,b)
-
Пуассоновского (а)
Понятие статистической оценки как с.в.
Пусть необходимо оценить по выборке некоторый параметр распределения а. Для оценки имеются только данные вошедшие в выборку (х1,х2…хn). По этим числа мы должны подсчитать (≈) значение а. Точное значение а мы получить не можем, т.к. в выборке содержится только часть информации с.в. и данные, вошедшие в выборку случайные. В другой серии опытов это будут другие числа. То число, которое мы подсчитаем по выборке, назовем оценкой параметра а
.
(1) – это функция данных, попавших в выборку.
Подсчитав по выборке это число, получим
. Проведя другую серию опытов, по этой же формуле, получим
и тд.
Статистическая оценка
для параметра а сама есть с.в. с каким-то законом распределения. Как найти ее закон распределения?
Каждая из вариант, попадающих в выборку, одновременно является с.в. (в разных сериях опытов получим для нее разные значения) и закон распределения этой варианты совпадает с законом распределения с.в. Х, над которым ставятся опыты. Таким образом статистическая оценка
является функцией одинакового распределения с.в. xi.
Если закон распределения х является известным, то можно построить закон распределения для
.
Требования, предъявляемые
к статистическим оценкам.
Для одного и того же параметра а можно построить разные формулы оценки.
mx (среднее)
оценки:
Как построить формулу оценки, чтобы она как можно лучше отражала
Требования к формуле (к статистической оценке):
-
несмещенность :
(3) Математическое ожидание оценки должно совпадать с оцениваемым параметром.
-
Эффективность:
Эффективной называется статистическая оценка с минимальной дисперсией.
-
Состоятельность (для выборок большого объема):
Оценка
называется состоятельной, если с ростом объема выборки дисперсия оценки стремится к нулю.
Точечные статистические оценки для
математического ожидания и дисперсии
-
Эффективность: можно проверить, что из всех предложенных формул у формулы (6) дисперсия наименьшая.
Возьмем в качестве оценки Dx Dв
Поместим начало координат в точку mx. Тогда:














