А.Н. Бородин - Элементарный курс теории вероятностей и математической статистики (DJVU) (1115320), страница 23
Текст из файла (страница 23)
е. 7„(Х) должно сходиться к 6 при неограниченном возрастании и. В этом случае разность 7„(Х) — Р стремится к нулю. Естественно ожидать, что, домножив ее на некоторый возрастающий множитель, можно получить в пределе случайную величину, неравную постоянной. Оказывается, и это является следствием центральной предельной теоремы,что для большинства оценок таким множителем является Ч/и. Определение 1.
Оценка 7„(Х) называется асимптотически нормальной с дисперсией Ь~, если функция распределения случайной величины — (7„(х) — Р) сходится при Ь и — ~ оо к функции распределения стандартного нормального закона. Исследуем условия асимптотической нормальности конкретных оценок. Как и в предыдущем параграфе мы предположим, что если рассматриваетсл оценка момента порядка Й или центрального момента порядка й, то у случайной величины Х конечен момент порядка 25. 1. Выборочное среднее. Теорема 1.
Выборочное среднее Хп аспмптоепичеспи нормально с дисперсией Ьз = Р(Х). Локазательство. Воспользуемся центральной предельной теоремой (5 17). Обозначим т = Е(Хе), Ьт = Р(Х~), Я„= ~ ~ Хп Величина Х„служит оценкой для еп, и 20. АСИМПТОТИЧЕСКИЕ СВОЙСТВА МОМЕНТОВ 157 нам нужно убедиться в том, что нормированная разность «/» — (Մ— п1) распределена в пределе по нормальному закону со средним О и дисперсией 1. Имеем Поскольку величины Х1 независимы и одинаково распределены со средним т и дисперсией Ьз, то, согласно центральной предельной теореме, распределение величины Я» = 1 — (Я» — тп) сходится при и -+ оо к стандартному нор- Ь,/» мальному распределению, что и требовалось доказать.
2. Выборочный момент порядка Е Выборочный момент Х„= — 2 1 1 Х11 является оценкой для та = Е(Х1). — (1) 1» -(1) Теорема 2. л)иБорочний момент Х„аеимптотически НОРМаЛЕК Е диЕПЕРЕиЕЕ Ь = ЕПМ вЂ” та. 2 2 Показательство. Применим центральную предельную теорему для величин У~ = Х11. Тогда 5» = ~ 1» Р1 и ЕД) = Е(Х,) = а, В®) = Е(Ь ) — Ез()1) = Е(Х, )- -Ез(Ха) = тхи — т~~ = Ьз, Имеем » Х" М1 Величины У1 независимы, поскольку независимыми являются величины Хь и одинаково распределены со средним та и дисперсией Ь = тм — та. Согласно центральной предель- 1 3 1 ной теореме распределение величины Л;, = †(о» вЂ” тип) » сходится при п -+ оо к стандартному нормальному распределению.
3. Выборочная дисперсия. Пусть ра = Е(Х вЂ” т)ив Е-й центральный момент случайной величины Х со средним т. Заметим, что рз = ои = Р(Х), т. е. второй центральный момент совпадает с дисперсией. Выборочная дисперсия Я»з является оценкой для дисперсии еез. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 'аеорема 3. Вььборочная дисперсия Воз асимптотичесни нормальна с дисперсией ььз = ра — Д. Показательство. Имеет место следующее предста вление и /:-(Вз з) /и( 1 ~(Х Х )з з) 1=1 о = ( — ",) — '~((«1 — «„)' — (1 — -') оз). 1=1 Множитель и/(и — 1) на предельное поведение не влияет, поскольку и/(п — 1) -+ 1. Далее, так как Х -+ т со скоростью 1/1/й в том смысле, что среднеквадратичное отклонение имеет порядок 1/и (см.
(16.5)), то можно доказать, что предельное поведение нормированной суммы в правой части не изменится, если в ней слагаемые заменить на 1"1 = (Х1 — ш) — пз. Это доказательство довольно громоздкое и мы его опускаем. Таким образом, предельное поведение нормированной разности ь/й(Вй — пз) совпадает с предельным поведением величины г„= — '~1ь и— Случайные величины Уь независимы, одинаково распределе- ны и Е®) = Е(Х1 — ш)з — оз = О, О(У1) = О((«1 — т)з) = Е(Х, — пь)а Ез(Х, — т)з,н, — рзз По центральной предельной теореме распределение величины В„//р~ — рз зсходится при п — ь оо к стандартному нормальному распределению.
Аналогичным будет и предельное поведение распределения величины ь/й(~ — о~)/~/р~ — ьнз. Это и требовалось доказать. В следующем параграфе свойство асимптотической нормальности будет использовано при построении граничных значений для оцениваемого параметра. ы. доверительные интврвдлы 1 21. ДОВеРительные интеРВАлы При решении некоторых практических задач вместо оценки неизвестного параметра распределения случайной величины важнее знать границы, в которых атот параметр находится.
Границы интервала, содержащего неизвестный параметр, строятся по выборке. При небольшом объеме выборки, как правило, не удается указать верхнюю и нижнюю границы, достаточно близкие к параметру с большой вероятностью. Чем больше компонент в выборке, тем более точные границы с более близкой к единице вероятностью можно построить. Пусть д — неизвестный параметр распределения случайной величины Х, и Х = (Хы Хз,..., Х„) — случайная выборка, отвечающая величине Х. Пусть а — некоторое число между нулем и единицей, а д(Х), д(Х) — две функции от случайной выборки Х такие, что е(Х) < 0(Х). Определение 1.
Интервал ЩХ),д(Х)) называетсядоверительным интервалом для оценки параметра О, отвечающим доверительной вероятности а, если Р(В(Х) < 0 < д(Х)) ) а. Величина д(Х) называется нижней доверительной границей, а о(7) — верхней доверительной границей для параметра д. Иными словами, доверительным называется такой интервал, который с наперед заданной вероятностью содержит оцениваемый параметр. Границы д(Х) и д(Х) кроме наблюдений Х будут зависеть от а и от числа наблюдений и. Рассмотрим методы построения доверительных интервалов для конкретных параметров.
1. Доверительные интервалы для неизвестного математического ожидания тл = Е(Х) при известной дисперсии аз = Р(Х). Согласно свойству асимптотической нормальности выборочного среднего Х„имеем МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 160 Тогда для любого х > б Р(-х < — (Х вЂ” хл) < х) ж Ф(х) — Ф(-х). ~/а Очевидно, что неравенства ~/о — х< — (Մ— т) < х вквивалентны неравенствам Մ— — « Х„+ —. ~/о ~/а 1 1 Поэтому, используя формулу Ж(х) = — + -Ф(х), выражаюп1ую функцию распределения стандартного нормального закона через функцию Лапласа Ф(х) = — ) е / ое, получим ~З ' -н'1 / о Р~Х„- —" < та < Х„+ — "1 ю -'(Ф(х) - Ф(-х)) = Ф(х). и т В последнем равенстве мы использовали нечетность функции Лапласа Ф(х). Лля значений функции Лапласа и ее квантилей суп1ествуют таблицы.
Повтому, если в качестве х взять х,„— квантиль порядка а функции Ф(х), то окончательно будем иметь Р(Хо — — < 1й < Хо + — 1 ж Ф(х~) = а. (21.1) /п о /-) Сравнивая вто с определением доверительного интервахъя хаеЪ ла мы видим что случайный интервал (Մ— — Х„+ — ~ в / ~ и является доверительным интервалом для математического ожидания т с доверительной вероятностью приблизительно равной а. Лля того, чтобы приближенные равенства были более точными, необходимо, чтобы п было велико. Таблица значений функции Лапласа позволяет по заданной величине 1 о а найти значение хо.
Выборочное среднее Х„= — 2 1 Х1 вычисляется по наблюдениям выборки Х> о — известно, и 21. ДОВЕРИТЕЯЬНЫЕ ИНТЕРВАЯЫ 1б1 — известно, поэтому полностью определен и доверительный интервал, указанный выше. 2. Доверительные интервалы для неизвестного математического ожидания Е(Х) при неизв е с т н о й д и с и е р с и и хУ(Х).
Можно поступить аналогично предыдущему случаю, когда дисперсия «тг была известна. Однако, поскольку теперь она неизвестна, то ее следует предварительно оценить. В качестве оценки для «гг возьмем выборочную дисперсию «« ~г 1 ~(Х, Х)г 1=1 ПосколькУ Бег — пг пРи Я - оо по веРоЯтности, то можно доказать, что если в приближенном равенстве (21.1) вместо «г использовать ./Яг, то мы получим аналогичное приближенное равенство Р (Ха — ~ с вг < Х„+ ~~ " ) м а.
,/й «/» Таким образом, случайный интервал (21.2) где г«« — квантиль порядка а функции Ф(л), является доверительным интервалом для математического ожидания при неизвестной дисперсии с доверительной вероятностью приблизительно равной а. Пусть можно считать, что исходная случайная величина Х, математическое ожидание которой мы оцениваем, распределена по нормальному закону с неизвестной дисперсией. Тогда можно построить доверительный интервал для пг с доверительной вероятностью, точно равноИ «з.
Кроме того, при таком предположении, если оно справедливо, число наблюдениИ может быть небольшим потому, что при построении доверительного интервала не будут использоваться асимптотические формулы. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА тет Для случайной выборки Х, отвечающей нормально распределенной случайной величине, положим 8е ~(х) = Р( — (Хе гя) < х) х Е (-оо,оо). Распределение 82(х) — так называемое распределение Стьюднита с х степенями свободы, для которого есть таблицы. Плотность этого распределения задается выражением Г((Ь+ 1)/2) / Ф2 З -(2+!)/2 Поскольку 82(-х) = 1 — 82(х), то для любого 2 ) 0 Р(-2 < — -(Մ— ю) < х) = н л = 8я-1(2) — 8~~-1(-х) = 28ю-1(2) — 1~ и, следовательно, Р~Մ— —" < п2 < Х„+ — "~ = 28 1(х) — 1.
— 4Р— *Д$~ ~/а ~/й Существуют таблицы, с помощью которых по значениям а и и — 1 можно определить такое число х,„,„и что 28„-2(2,„,„2) — 1 = а. Величина х д является квантилью порядка (1+ а)/2 распределения Стьюдента с Е степенями свободы, поскольку 82(х~ «) = (1+ а)/2. Таким образом, случайный интервал является доверительным интервалом с доверительной вероятностью равной а для математического ожидания п2 нормально распределенной случайной величины при неизвестной дисперсии. 3, Доверительные интервалы для неизвестной дисперсии при неизвестных других парам е т р а х. 11.
440ВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ 163 В силу свойства асимптотической нормальности выборочной дисперсии имеем Вместо неизвестных параметров 144 и пз возьмем нх оценки я„'" = 1 Е(х, — х„)4, Тогда в силу состоятельности етих оценок выполняется при- ближенное равенство Отсюда, как и в пункте 1, получим, что где го — квантиль порядка а функции Лапласа Ф(я).
Следовательно, в качестве доверительного интервала для дисперсии о~ можно использовать Задача 1. Пусть наблюдается следующая реализация выборки, состоящей из 40 компонент: -1.80 -2.01 -1.63 0.54 0.25 -0.16 0.03 0.07 -1.18 1.18 1.11 0.88 1.09 -0.20 0.15 -0.37 0.65 — 1.14 1.15 — 1.21 -0.92 0.42 0.29 — 0.90 — 0.43 0.35 -1.93 0.89 — 0.22 0.60 0.87 -0.43 -1.39 -0.23 0.38 -0.64 -0.57 0.23 -0.28 0.51 МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 164 Вычислить выборочное среднее и выборочную дисперсию, Построить доверительный интервал для математического ожидания с доверительной вероятностью приблизительно равной 0.9. Решение.