04_2 Стат оценка Интервальные оценки (1120095), страница 3
Текст из файла (страница 3)
С вероятностью 0,95 истинные значения математического ожидания и среднеквадратического отклонения лежат в полученных интервалах.
из конспекта
Статистическая оценка параметров распределения.
Задача: по опытным данным восстановить числовые характеристики распределения или параметры предполагаемого распределения:
-
Нормального (а, σ)
-
Показательного (λ)
-
Равномерного (a,b)
-
Пуассоновского (а)
Понятие статистической оценки как с.в.
Пусть необходимо оценить по выборке некоторый параметр распределения а. Для оценки имеются только данные вошедшие в выборку (х1,х2…хn). По этим числа мы должны подсчитать (≈) значение а. Точное значение а мы получить не можем, т.к. в выборке содержится только часть информации с.в. и данные, вошедшие в выборку случайные. В другой серии опытов это будут другие числа. То число, которое мы подсчитаем по выборке, назовем оценкой параметра а
.
(1) – это функция данных, попавших в выборку.
Подсчитав по выборке это число, получим
. Проведя другую серию опытов, по этой же формуле, получим
и тд.
Статистическая оценка
для параметра а сама есть с.в. с каким-то законом распределения. Как найти ее закон распределения?
Каждая из вариант, попадающих в выборку, одновременно является с.в. (в разных сериях опытов получим для нее разные значения) и закон распределения этой варианты совпадает с законом распределения с.в. Х, над которым ставятся опыты. Таким образом статистическая оценка
является функцией одинакового распределения с.в. xi.
Если закон распределения х является известным, то можно построить закон распределения для
.
Требования, предъявляемые
к статистическим оценкам.
Для одного и того же параметра а можно построить разные формулы оценки.
mx (среднее)
оценки:
Как построить формулу оценки, чтобы она как можно лучше отражала
Требования к формуле (к статистической оценке):
-
несмещенность :
(3) Математическое ожидание оценки должно совпадать с оцениваемым параметром.
-
Эффективность:
Эффективной называется статистическая оценка с минимальной дисперсией.
-
Состоятельность (для выборок большого объема):
Оценка
называется состоятельной, если с ростом объема выборки дисперсия оценки стремится к нулю.
Точечные статистические оценки для
математического ожидания и дисперсии
-
Эффективность: можно проверить, что из всех предложенных формул у формулы (6) дисперсия наименьшая.
Возьмем в качестве оценки Dx Dв
Поместим начало координат в точку mx. Тогда:
0
nDx
Вывод: оценка дисперсии Dx по Dв – это смещенная оценка.
Несмещенной оценкой для дисперсии является т.н. исправленная выборочная дисперсия:
-
Оценка для среднеквадратического отклонения: - это исправленное выборочное среднеквадратическое S.
Замечание: смещенность и исправление дисперсии коэффициентом n/n-1 играют роль только для выборок малого объема.
Метод моментов.
Если параметры распределения не являются одновременно числовыми характеристиками этого распределения, то для их отыскания применяются специальные методы:
-
метод моментов;
-
метод наибольшего правдоподобия.
По выборке оцениваются теоретические начальные и центральные моменты с помощью статистических начальных и центральных моментов.
Теоретические моменты выражаем через параметры распределения и приравниваем к статистическим оценкам.
Например:
По выборке оценим параметр p:
-
Предполагаем, что распределение подчиняется параболической зависимости:
Нужно оценивать a,b,c. Подсчитаем по предполагаемым формулам mx, Dx, M3.
Решаем систему и находим оценки для a, b, c т.е.
.
Интервальные оценки распределения.
Полученные в предыдущем параграфе оценки называются точечными.
доверительный интервал
Попробуем оценить погрешность от замены истинного значения параметра а на приближенное
, найденное по выборке, т.е. величину отклонения а от
.
- с.в. Построим интервал
, оценим вероятность того, что этим случайным интервалом мы накроем истинное значение параметра а, т.е.
.
Интервал
называется доверительным интервалом. Вероятность того, что параметр а окажется в этом интервале называется доверительной вероятностью (надежностью) статической оценки.
Чем больше размах интервала δ, тем больше вероятность γ. Нужно установить связь между ними.
Доверительные интервалы
для параметров нормального распределения.
-
Интервальная оценка mx.
-
Известно точное значение Dx (или δx)
Все xi нормальные
- нормальное.
Найдем параметры нормального распределения для с.в.
.
В формуле (15) подсчитывается вероятность отклонения нормальной с.в.
от ее mx.
tγ – обратная функции Лапласа.
С доверительной вероятностью γ mx нормального распределения находится в интервале:
Обычно задают γ=0,95; 0,99; 0,999 и находят интервал.
Замечание: формулой (20) можно пользоваться и других распределений, но только для выборок большого объема.
-
Значения Dx не известно:
Формулой
воспользоваться нельзя: хотя
- нормальная величина, но параметры его неизвестны. Преобразуем это неравенство:
с.в.с распределением
Стьюдента
Получено уравнение, связывающее γ и tγ. Сущ-ют таблицы tγ= tγ(γ,n)
tγ= tγ(γ,n) (22)
Для mx получаем доверительный интервал:
tγ(γ,n) – по таблицам
П.Интервальная оценка для параметра δ
S-δ σx S S+δ
Перестраивается с.в. S и сводится к распределению Х2 . Окончательная ф-ла для доверительного интервала:
q=q(γ,n) – по таблицам.
образец набора
При изучении теории вероятностей мы рассмотрели два различных типа случайностей: случайные события и случайные величины.
Выяснили, что во многих случаях можно теоретическим путем рассчитывать вероятности случайных событий (классическое определение вероятности). В то же время существуют ситуации (и таких, вообще говоря, гораздо больше), когда классическое определение применить невозможно. Тогда единственным путем для определения вероятности случайных событий остается эксперимент, наблюдения.
При изучении случайных величин оказалось, что мы можем прогнозировать их поведение, предсказывать вероятности попаданий случайных величин в любые интересующие нас интервалы, если только нам известен закон распределения. При этом во многих случаях теория может предсказать, с каким законом распределения мы имеем дело в данной конкретной ситуации. А как быть в тех случаях, когда о характере закона распределения мы ничего сказать не можем? Единственный выход – проведение эксперимента, наблюдений над случайной величиной и построение закона распределения по результатам этих наблюдений.
Замечание: О содержании понятия опыт, эксперимент.
В инженерных науках, в технике, в физике и т. д. это специально создаваемые исследователем условия для появления интересующего нас явления, для измерений интересующей нас величины. Такой эксперимент (опыт) называют активным экспериментом.
В экономике, в социологии и в ряде других наук гораздо чаще приходится добывать интересующую нас информацию, не вмешиваясь активно в условия, а только наблюдая происходящие независимо от исследователя явления. Это иногда называют пассивными экспериментом. Здесь правильнее использовать термин «наблюдение».
Что касается определения вероятностей случайных событий опытным путем, то это вопрос уже нами обсуждался, причем в самом начале курса теории вероятностей (см. статистическое определение вероятности ). Вероятность оценивается по данным наблюдений с помощью относительной частоты появления события A:
( 1 )
Здесь знаменатель N – число опытов (проведенных наблюдений);
числитель M – число наблюдений, в которых событие появилось.
,
(24) 













