Л.Н. Фадеева, А.В. Лебедев - Теория вероятностей и математическая статистика (1115296), страница 43
Текст из файла (страница 43)
В таких случаях их «округляют» до разумных пределов, 5 и1.г. Точные доверительные интервалы Точные доверительные интервалы строятся, как правило, в предположении нормальности данных. Следует понимать, что реальные данные, на основании которых мы строим эти интервалы, могут совсем не выглядеть нормальными (например, это целые положительные числа, в то время как нормальное распределение непрерывно и рассредоточено по всей действительной прямой).
Тем не менее широкое практическое применение описываемых методов дает неплохие результаты (это объясняется, в частности, асимптотической нормальностью оценок), и такое несоответствие не должно нас смущать в дальнейшем. Предположим, что наблюдается случайная величина 4 а 1)Г(а, о'). Для параметров строятся следующие точные доверительные интервалы. 1) Для неизвестного среднего а при известной дисперсии о'. о о х- — и„<а<х+ — и„, ~Я ~/и где и„определяется из соотношения Ф,(и„) = т/2. а95 ЧАСТЬ П. Математичесиаи статипииа 2) Для неизвестного среднего а при неизвестной дисперсии о'.
х- — Г„<а<х хь — Т„, /л /и где ҄— критическая точка распределения Стьюдента (для дву- сторонней области) с л — 1 степенями свободы и уровнем зна- чимости а = 1 — у. 3) Для неизвестной дисперсии о'. (и -1)ят, („1)з2 <о'< Ха Х п —,«-! 1 —,«-1 г' т' где Х„', — критические точки Х'-распределения с и — 1 сте- пенями свободы и соответствующими уровнями значимости, а=1 — у. Доказательство.
1) По теореме Фишера (см. 5 12.8) име- ем хе)у'(а,о /и). Случайная величина т)м — /л тогда имеет 2 х-а и стандартное нормальное распределение У(0, 1) и Р(~ т) ) < и) = Р(-и < т) < и) = Ф(и) — Ф(-и) = Ф, (и) — Фр (-и) = 2Фр(и). Выбирая и из соотношения Ф,(и ) = у/2, получаем, что Р()т))<и,)=у. Таким образом, с вероятностью у верно х-а т-~ — ~а~<и, откуда следует и а х- — и„<а<х+ — и„.
/ ",Я"' 2) По следствию 2 из теоремы Фишера (см. 5 12.8) статистих-а ка Т= — «/и имеет распределение Стьюдента с и — 1 степенями свободы. Заметим, что критическая точка распределения Стьюдента (для двусторонней области) определяется таким образом, чтобы выполнялось Р(~21 > Т«а) = а. Выбирая а = 1 — у, получаем Р(Щ < т ) = у. таким образом, с вероятностью у верх-а но — ~а <г, откуда следует т' х- — т, <а<х+ — г,. «/и «/и а96 Гаава аь 3) По теореме Фишера имеем, еХл с Заметим, что (и 1)а 2 о' критические точки распределения Х', „, определяются из усло- вия Р(Х' >Х',„1) = р.
Выбирая а = 1 — у, получаем 1 (Х а Х Ха ) ~(Х Х а ) Р(Х Ха ) 1 — ', л-1 —,л-1 1 —,л-1 2 2 2' 2' к 2' = 1 — а = у. Таким образом, с вероятностью у верно х а «, у„ 2 (» 1)з 2 откуда следует (и — 1)в 1 (» — 1)в — <о < 2 2 Ха Х а †, -1 1 —, -1 2' 2 Доказательство. Заметим, что случайные величины х„„и х независимы, причем х„„е)У(а,о1) и х е)у(а, о1/и), следова- тельно, х„„-х е)У~а~1+ — ут ~. Тогда величина ! 2 и меет 1 о 1+— и стандартное нормальное распределение )т'(О, 1).
Введем статистику 1 (и- 1)о' (и-1)в' Поскольку, е Х„'1, статистика Т имеет распредеи ление Стьюдента с и — 1 степенями свободы. Рассуждая как з97 Можно также по выборке х„х„..., х„построить доверительный интервал для следующего (и + 1)-го наблюдения (т.е. определить границы, в которых оно будет лежать с заданной вероятностью у). А именно, имеем х — лг л1+ — <х„<х+вг ~1+ —. Понятно, что это может быть полезно в качестве прогноза на будущее. й! ЧАСТЫ!. Математическая статксткка ранее в доказательстве 2, получаем, что с вероятностью т верно <т„, откуда следует х — а!т !1+ — <х„„<х+аг,.!1+ —. л и Задача 1.
Найти минимальный объем выборки, при котором с надежностью 0,925 точность оценки математического ожидания нормально распределенной случайной величины (по выборочному среднему х ) равна Ь = 0,2, если известно среднее квадратическое отклонение о = 1,5. Решение. Формула, определяющая точность оценки математического ожидания по выборочному среднему, выглядит слеи„о и„'о' дующим образом: 8= — ". Отсюда следует л= — ", (при этом ,Я' 8' обычно и округляют в большую сторону для надежности).
По таблице функции Лапласа находим и, для данного примера, учитывая, что функция принимает значение Ф,(и„) = 0,925/2 = = 0,4625. Таким образом, и„= 1,78. Подставив данные зада- 1,78' х 1,5' чи, получим искомый объем выборки: л= ™ =178,22. 0,2' Принимаем округленно п = 179. Задача 2. Из генеральной совокупности извлечена выборка объема и = 12. Варианта х, — 0,5 — 0,4 — 0,2 0 0,2 0,6 0,8 1 1,2 1,5 Частота л,.
1 2 1 1 1 1 1 1 2 1 и = — 2 и,.х,. = 4,2; 1 1е л; ! х = — =0,42; 10 а' = — Х~ л,х,.' — — ) л,.х,. =0,52. Находим для уровня значимости а = 0,05 и числа степеней свободы и — 1 = 11 по таблице распределения Стьюдента кри- а98 ! Оценить с надежностью 0,95 математическое ожидание а нормально распределенной случайной величины с помощью доверительного интервала.
Решение. Найдем выборочное среднее х и исправленное выборочное среднее квадратическое отклонение к Пусть и,. = 10хя тогда Глава га 4В тическую точку г„= 2,23 и определяем границы доверительного интервала: х- — '=042 — ' ' = — 0,04; х+ — '=0,42+ ' ' =0,88. 2,23х0,72 Гтг 2,23х0,72 «/л /12 Л Г2 Таким образом, искомый доверительный интервал -0,04 < а < 0,88. (н — 1), (н — 1) 2 Х вЂ”,«-! 2 Х 1 —,«-~ г' где х'„и х' „находят по таблице критических точек рас—,«-! ы-",«-1 2' пределения хи-квадрат.
По таблице определяем для данного примера х,'дан —— 28,9; х,'люл =9,39. Подставив в формулу необходимые величины, получаем искомый доверительный интервал: 25~/~8/28,9 < о < 25,/Г8/9,39, откуда 19,74 < а < 34,61 (человек). Задача 3.
Для отрасли, включающей 1200 фирм, составлена случайная выборка из 19 фирм. По выборке оказалось, что исправленное среднее квадратическое отклонение для числа работающих на фирме составляет д = 25 человек. Построить 90%-ный доверительный интервал для среднего квадратического отклонения числа работающих на фирме по всей отрасли. Решение. Доверительный интервал ддя параметра о имеет вид Задачи 4. За последние 5 лет годовой рост цены актива А составлял в среднем 20% со средним квадратическим отклонением (исправленным) 5%. Построить доверительный интервал с вероятностью 95% для цены актива в конце следующего года, если в начале года она равна 100 денежных единиц.
Решение. Рассмотрим величины относительного прироста цены актива за год. Будем пользоваться нормальным приближением'. Применяем формулу х — аг ~1+-<х„, <х+а (1+-, ' Такое приближение и соответствующие оценки являются довольно грубыми. На практике распределение относительного прироста цены обычно далеко от нормального и, к сожалению, не описывается ни одной из классических ФОРмУл. ф ЧАСТЫ Ь Математическая статистика где г„находим из таблицы критических точек распределения Стьюдента (для двусторонней области): Т„= т„я(0,05; 4) = 2,78. Получаем 0,2 — 0,05 2,78,/Г2<х, <0,2+0,05 2,78,/Г2, откуда 0,05 < х, < 0,35. Таким образом, цена актива в следующем году составит от 105 до 135 денежных единиц. Помимо случаев построения доверительных интервалов для параметров одной выборки, иногда рассматривают и случай двух выборок.
Например, когда имеются две выборки х„х„..., х„ и у„у„..., у из распределений Ф(аи а,'7 и Ж(а„тт,') соответственно, и надо построить доверительный интервал для разности средних. 1) При известных дисперсиях ~22 х — у — )~ — '+ — ит <а — а, <х — у+~ — + — и, у(л т у 2 т(л т у> где и определяется из соотношения Ф,(и,) = Т/2. Доказательство основано на следствии 3 теоремы Фишера (см. 5 12.8). 2) При неизвестных, но равных дисперсиях (л — 1)а„'+(т — 1)а,' 1л+т х у " у Г г„<ау — а <х — у+ и+т — 2 уГ ит (и — 1)а„+(т — 1)а, 1л+тт л+т — 2 у1 ит где г — критическая точка распределения Стьюдента (для двуу сторонней области) с п + т — 2 степенями свободы и уровнем значимости сс = 1 — Т.
Доказательство основано на следствии 4 теоремы Фишера. в 1т).З. Асимптотические доверительные интервалы Асимптотическвмдоверительным интервалом при оценивании параметра 6 называется такой интервал (О„О,), что Р(6, < 6 < 6,) Т (при л -+ е). Предположим, мы решили учитывать тот факт, что наши наблюдения имеют распределение, отличное от нормального. Пусть это распределение зависит только от одного параметра 6, Зоо Глава 1д ф лля которого надо построить доверительный интервал, а также известно, что оценка е„асимптотически нормальна и верно 0 — Ф(е,о'(6)/л) при л -+ о.
Приведем два метода построения асимптотических доверительных интервалов. 1) Подстановка оценки параметра в формулу для дисперсии. По аем: луч (в) - о(е) В- — и <0<В+ — и,, /л ",/л " где и„определяется из соотношения ф,(и„) = т/2. 2) Использование функционального преобразования. Определим функцию г аи 6 я(и)=~ —, тогда верно л(6) — Ф(Л(6),1/л) при и -+ о.
(и) Следовательно, можно использовать асимптотическое неравенство л(е) — —" < л(е) < я(в)+ — ". ,/а ,/л ' Решая его относительно Е, получаем асимптотический доверительный интервал. Например, доверительный интервал для вероятности «успеха» р в л испытаниях Бернулли обычно строится первым методом. Поскольку МЧ = р и И, = р(1 — р), то из ЦПТ получаем в — ' Ф(р, р(1 — р)/л), и доверительный интервал имеет вид 1в (1 — в) 1в(1 — и«)) ю 11 и <~Р<м~+)~ и, где в — относительная частота события. Асимптотические доверительные интервалы рекомендуется применять, когда объем выборки достаточно велик (порядка сотен и более).