Н.И. Чернова - Математическая статистика (1119916), страница 4
Текст из файла (страница 4)
Введём случайные величиныYi = Xi −a с нулевым математическим ожиданием и такой же дисперсиейDY1 = DX1 = σ2 . Выборочную дисперсию можно представить в следующем виде:nn221 X1 X2S =(Xi − X) =Xi − a − (X − a) = Y 2 − Y .nn2i=1i=1Тогда √ √√√ 2222222n S −σ=n Y − (Y ) − σ = n Y − EY1 − n(Y )2 =nPYi2 − nEY12√= i=1 √− Y · n Y ⇒ N0, D(X1 −a)2 ,n§ 4.
Вопросы и упражнения19поскольку первое слагаемое слабо сходится к N0, DY 2 по ЦПТ, а второе1√слагаемое Y · n Y слабо сходится к нулю как произведение двух последовательностей: последовательности Y , сходящейся√ к нулю по вероятностипри n → ∞ (почему?), и последовательности n Y , слабо сходящейсяк N0, DX1 (почему?).У п р а ж н е н и е . При доказательстве дважды использовано одно изсвойств слабой сходимости. Какое именно? Что такое слабая сходимость?Что такое сходимость по вероятности?§ 4. Вопросы и упражнения1.
Можно ли по эмпирической функции распределения, приведённойна рис. 1, восстановить выборку X1 , . . . , Xn , если n известно? Вариационный ряд? А если n неизвестно?2. Можно ли по гистограмме, приведённой на рис. 2, восстановить выборку X1 , . . . , Xn , если n известно? Вариационный ряд?3. Нарисовать график эмпирической функции распределения, построенной по выборке объёма n из распределения Бернулли Bp . Использоватьвыборочное среднее X.
Доказать непосредственно, что для этого распределения выполнена теорема Гливенко — Кантелли: psup Fn∗ (y) − F (y) −→ 0 при n → ∞.y∈R4. Проверить, выполнено ли утверждение теоремы Колмогорова длявыборки объёма n из распределения Бернулли Bp . Найти предельное распределение.5. Вспомнить, как найти по функции распределения величины X1функцию распределения первой и последней порядковой статистикиX(1) = min{X1 , . . . , Xn }, X(n) = max{X1 , . .
. , Xn }. Выписать выражениядля плотности этих порядковых статистик через функцию и плотностьраспределения величины X1 .6. Доказать (или вспомнить), что функция распределения k -й порядковой статистики X(k) имеет видP(X(k) < y) = P(хотя бы k элементов выборки < y) =nX=Cni F (y)i (1 − F (y))n−i ,i=kгде F (y) — функция распределения величины X1 .20ГЛАВА I. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ7. Из курса эконометрики: доказать, что среднее степенноеvu n 1u1 Xkkk= tXikXni=1а) сходится к X(1) при k → −∞; б) сходится к X(n) при k → +∞.Имеется в виду сходимость для любого набора чисел X1 , . .
. , Xn , такого,что среднее степенное определено, т. е. сходимость п. н.У к а з а н и е. Вынести X(1) или X(n) из-под корня, применить лемму√√о двух милиционерах и свойства k k → 1, k 1 → 1 при k → ∞.8. Пусть x1 > 0, . . . , xn > 0 — произвольные неотрицательные числа.Доказать, что в этом случае числовая последовательностьrqkxk=kxk1 + . . .
+ xkn,nk = 1, 2, 3, . . .не убывает по k. Воспользоваться неравенством Йенсена.9. Пусть дана выборка X1 , . . . , Xn такая, что X1 > 0 п. н. Доказать,что в этом случае последовательность случайных величинqkX k , k = 1, 2, 3, . . .почти наверное не убывает по k. Воспользоваться результатом предыдущей задачи.10.
Доказать теорему 7.11. Объяснить термины: «оценка», «несмещённость», «состоятельность», «асимптотическая нормальность» оценки.Г Л А В А IIТОЧЕЧНОЕ ОЦЕНИВАНИЕСитуация, когда о распределении наблюдений не известно совсем ничего,встречается довольно редко. Проводя эксперимент, мы можем предполагатьили утверждать что-либо о распределении его результатов.
Например, можетоказаться, что это распределение нам известно с точностью до значений одного или нескольких числовых параметров. Так, в широких предположенияхрост юношей одного возраста имеет нормальное распределение с неизвестными средним и дисперсией, а число покупателей в магазине в течение часа —распределение Пуассона с неизвестной «интенсивностью» λ.
Рассмотрим задачу оценивания по выборке неизвестных параметров распределения. Оказывается, различными способами бывает возможно построить даже не одну,а множество оценок для одного и того же неизвестного параметра.§ 1. Точечные оценки и их свойстваПараметрические семейства распределений. Пусть имеется выборкаX1 , . . . , Xn объёма n, извлечённая из распределения Fθ , которое известным образом зависит от неизвестного параметра θ.Здесь Fθ — некий класс распределений, целиком определяющихся значением скалярного или векторного параметра θ. Параметр θ принимаетзначения из некоторого множества Θ, которое мы будем называть множеством возможных значений параметра.Примерами параметрических семейств распределений могут служитьвсе известные нам распределения: распределение Пуассона Πλ , где λ > 0;распределение Бернулли Bp , где p ∈ (0, 1); равномерное распределениеUa, b , где a < b; равномерное распределение U0, θ , где θ > 0; нормальноераспределение Na, σ2 , где a ∈ R, σ > 0 и т.
д.Точечные оценки. Итак, пусть X1 , . . . , Xn — выборка объёма n изпараметрического семейства распределений Fθ , где θ ∈ Θ.О п р е д е л е н и е 3. Статистикой называется произвольная борелевская функция θ∗ = θ∗ (X1 , . . . , Xn ) от элементов выборки.22ГЛАВА II. ТОЧЕЧНОЕ ОЦЕНИВАНИЕЗ а м е ч а н и е 4.
Статистика есть функция от эмпирических данных,но никак не от параметра θ. Статистика, как правило, предназначенаименно для оценивания неизвестного параметра θ (поэтому её иначе называют оценкой) и уже поэтому от него зависеть не может.Статистика есть не любая, а измеримая функция от выборки (борелевская, для которой прообраз любого борелевского множества из R естьснова борелевское множество в Rn ), иначе оценка θ∗ не будет случайной величиной. Далее мы всюду будем иметь дело только с измеримымифункциями, и отдельно это оговаривать не будем.Свойства оценок.
Дадим три определения хороших свойств оценок.О п р е д е л е н и е 4. Статистика θ∗ = θ∗ (X1 , . . . , Xn ) называетсянесмещённой оценкой параметра θ, если для любого θ ∈ Θ выполнено равенство E θ∗ = θ.О п р е д е л е н и е 5. Статистика θ∗ = θ∗ (X1 , . . . , Xn ) называетсяасимптотически несмещённой оценкой параметра θ, если для любогоθ ∈ Θ имеет место сходимость E θ∗ → θ при n → ∞.О п р е д е л е н и е 6. Статистика θ∗ = θ∗ (X1 , . . . , Xn ) называется состоятельной оценкой параметра θ, если для любого θ ∈ Θ имеет местоpсходимость θ∗ −→ θ при n → ∞.Несмещённость — свойство оценок при фиксированном n. Означает этосвойство отсутствие ошибки «в среднем», т.
е. при систематическом использовании данной оценки. Несмещённость является желательным, ноне обязательным свойством оценок. Достаточно, чтобы смещение оценки(разница между её средним значением и истинным параметром) уменьшалось с ростом объёма выборки. Поэтому асимптотическая несмещённостьявляется весьма желательным свойством оценок. Свойство состоятельности означает, что последовательность оценок приближается к неизвестному параметру при увеличении количества наблюдений. В отсутствие этогосвойства оценка совершенно «несостоятельна» как оценка.П р и м е р 3. Пусть X1 , .
. . , Xn — выборка объёма n из нормальногораспределения Na,σ2 , где a ∈ R, σ > 0. Как найти оценки для параметровa и σ2 , если оба эти параметра (можно считать это и одним двумернымпараметром) неизвестны?Мы уже знаем хорошие оценки для математического ожидания и дисперсии любого распределения. Оценкой для истинного среднего a = EX1может служить выборочное среднее a∗ = X. Теорема 6 (с. 17) утверждает,что эта оценка несмещённая и состоятельная.23§ 2. Метод моментовДля дисперсии σ2 = DX1 у нас есть сразу две оценки:nn1 X1 X222S =(Xi − X) и S0 =(Xi − X)2 .nn−1i=1i=1Как показано в теореме 8 (с. 17), обе эти оценки состоятельны, и одна изних — несмещённая (которая?), а другая — асимптотически несмещённая.§ 2.
Метод моментовРассмотрим некоторые стандартные методы получения точечных оценок. Метод моментов предлагает для нахождения оценки неизвестногопараметра использовать выборочные моменты вместо истинных. Этот метод заключается в следующем: любой момент случайной величины X1(например, k -й) является функцией от параметра θ. Но тогда и параметрθ может оказаться функцией от теоретического k -го момента. Подставивв эту функцию вместо неизвестного теоретического k -го момента его выборочный аналог, получим вместо параметра θ его оценку θ∗ .Пусть X1 , . . . , Xn — выборка объёма n из параметрического семействараспределений Fθ , где θ ∈ Θ ⊆ R. Выберем некоторую функцию g(y) :R → R так, чтобы существовал моментEg(X1 ) = h(θ)(3)и функция h была обратима в области Θ.Решим уравнение (3) относительно θ, а затем вместо истинного момента возьмём выборочный:!nX1g(Xi ) .θ = h−1 (Eg(X1 )) ,θ∗ = h−1 g(X) = h−1ni=1Полученная таким образом оценка θ∗ называется оценкой метода моментов (ОММ) для параметра θ.Чаще всего в качестве функции g(y) берут g(y) = y k .
В этом случае!nX1EX1k = h(θ), θ = h−1 EX1k , θ∗ = h−1 X k = h−1Xik ,ni=1если, конечно, функция h обратима в области Θ.Можно сказать, что при построении оценки метода моментов мы берёмв качестве оценки такое (случайное) значение параметра θ, при которомистинный момент совпадает с выборочным.24ГЛАВА II.