1625915145-5b3debabab98d9e994cc3a1bc8da0f5b (843876), страница 4
Текст из файла (страница 4)
Величина S 2 — смещённая оценка дисперсии, а S02 — несмещённая:ES 2 =n−1 2n−1DX1 =σ ̸= σ2 ,nnES02 = DX1 = σ2 .3. Если 0 ̸= D(X1 − EX1 )2 < ∞, то S 2 и S02 являются асимптотически нормальными оценками истинной дисперсии:)√ ( 2n S − DX1 ⇒ N0,D(X1 −EX1 )2 .18ГЛАВА I.
ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИД о к а з а т е л ь с т в о. Докажем первое утверждение теоремы. Раскрыв скобки, полезно убедиться в том, чтоn1 ∑S =(Xi − X)2 = X 2 − (X)2 .n2(2)i=1Используя состоятельность первого и второго выборочных моментови свойства сходимости по вероятности, получаемpS 2 = X 2 − (X)2 −→ EX12 − (EX1 )2 = σ2 .Далее,pnn→ 1, поэтому S02 =S 2 −→ σ2 .n−1n−1Для доказательства второго утверждения теоремы воспользуемся формулой (2) и несмещённостью первого и второго выборочных моментов:()222ES = E X − (X) = EX 2 − E(X)2 = EX12 − E(X)2 =( ∑)n(())12= EX12 − EX + DX = EX12 − (EX1 )2 − DXi =nσ2n−1 21=σ ,= σ2 − 2 nDX1 = σ2 −nnnоткуда сразу следует ES02 =i=1nES 2 = σ2 .n−1Проверим третье утверждение теоремы.
Введём случайные величиныYi = Xi −a с нулевым математическим ожиданием и такой же дисперсиейDY1 = DX1 = σ2 . Выборочную дисперсию можно представить в следующем виде:nn)2( )21 ∑1 ∑(2S =(Xi − X) =Xi − a − (X − a) = Y 2 − Y .nn2i=1i=1Тогда) √ () √√ (√ ()2222222n S −σ=n Y − (Y ) − σ = n Y − EY1 − n(Y )2 =n∑Yi2 − nEY12√i=1√− Y · n Y ⇒ N0, D(X1 −a)2 ,=nпоскольку первое слагаемое слабо сходится к N0, DY 2 по ЦПТ, а второе1√слагаемое Y · n Y слабо сходится к нулю как произведение двух последовательностей: последовательности Y , сходящейся к нулю по вероятности19§ 4. Вопросы и упражненияпри n → ∞ (почему?), и последовательностик N0, DX1 (почему?).√n Y , слабо сходящейсяУ п р а ж н е н и е .
При доказательстве дважды использовано одно изсвойств слабой сходимости. Какое именно? Что такое слабая сходимость?Что такое сходимость по вероятности?§ 4. Вопросы и упражнения1. Можно ли по эмпирической функции распределения, приведённойна рис. 1, восстановить выборку X1 , . . .
, Xn , если n известно? Вариационный ряд? А если n неизвестно?2. Можно ли по гистограмме, приведённой на рис. 2, восстановить выборку X1 , . . . , Xn , если n известно? Вариационный ряд?3. Нарисовать график эмпирической функции распределения, построенной по выборке объёма n из распределения Бернулли Bp . Использовать выборочное среднее X.
Доказать непосредственно, что для этогораспределения выполнена теорема Гливенко — Кантелли: psup Fn∗ (y) − F (y) −→ 0 при n → ∞.y∈R4. Проверить, выполнено ли утверждение теоремы Колмогорова длявыборки объёма n из распределения Бернулли Bp . Найти предельноераспределение.5. Вспомнить, как найти по функции распределения величины X1функцию распределения первой и последней порядковой статистикиX(1) = min{X1 , . . . , Xn }, X(n) = max{X1 , .
. . , Xn }. Выписать выражения для плотности этих порядковых статистик через функцию и плотность распределения величины X1 .6. Доказать (или вспомнить), что функция распределения k -й порядковой статистики X(k) имеет видP(X(k) < y) = P(хотя бы k элементов выборки < y) =n∑=Cni F (y)i (1 − F (y))n−i ,i=kгде F (y) — функция распределения величины X1 .20ГЛАВА I. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ7. Из курса эконометрики: доказать, что среднее степенноеvu n( )1u1 ∑kkkX= tXikni=1а) сходится к X(1) при k → −∞; б) сходится к X(n) при k → +∞.Имеется в виду сходимость для любого набора чисел X1 , .
. . , Xn , такого,что среднее степенное определено, т. е. сходимость п. н.У к а з а н и е. Вынести X(1) или X(n) из-под корня, применить лемму√√о двух милиционерах и свойства k k → 1, k 1 → 1 при k → ∞.8. Пусть x1 ⩾ 0, . . . , xn ⩾ 0 — произвольные неотрицательные числа.Доказать, что в этом случае числовая последовательность√√kxk=kxk1 + . .
. + xkn,nk = 1, 2, 3, . . .не убывает по k. Воспользоваться неравенством Йенсена.9. Пусть дана выборка X1 , . . . , Xn такая, что X1 ⩾ 0 п. н. Доказать,что в этом случае последовательность случайных величин√kX k , k = 1, 2, 3, . . .почти наверное не убывает по k. Воспользоваться результатом предыдущей задачи.10. Доказать теорему 7.11. Объяснить термины: «оценка», «несмещённость», «состоятельность», «асимптотическая нормальность» оценки.Г Л А В А IIТОЧЕЧНОЕ ОЦЕНИВАНИЕСитуация, когда о распределении наблюдений не известно совсем ничего,встречается довольно редко. Проводя эксперимент, мы можем предполагатьили утверждать что-либо о распределении его результатов.
Например, можетоказаться, что это распределение нам известно с точностью до значений одного или нескольких числовых параметров. Так, в широких предположенияхрост юношей одного возраста имеет нормальное распределение с неизвестными средним и дисперсией, а число покупателей в магазине в течение часа —распределение Пуассона с неизвестной «интенсивностью» λ. Рассмотрим задачу оценивания по выборке неизвестных параметров распределения. Оказывается, различными способами бывает возможно построить даже не одну,а множество оценок для одного и того же неизвестного параметра.§ 1.
Точечные оценки и их свойстваПараметрические семейства распределений. Пусть имеется выборкаX1 , . . . , Xn объёма n, извлечённая из распределения Fθ , которое известным образом зависит от неизвестного параметра θ.Здесь Fθ — некий класс распределений, целиком определяющихся значением скалярного или векторного параметра θ. Параметр θ принимаетзначения из некоторого множества Θ, которое мы будем называть множеством возможных значений параметра.Примерами параметрических семейств распределений могут служитьвсе известные нам распределения: распределение Пуассона Πλ , где λ > 0;распределение Бернулли Bp , где p ∈ (0, 1); равномерное распределениеUa, b , где a < b; равномерное распределение U0, θ , где θ > 0; нормальноераспределение Na, σ2 , где a ∈ R, σ > 0 и т.
д.Точечные оценки. Итак, пусть X1 , . . . , Xn — выборка объёма n изпараметрического семейства распределений Fθ , где θ ∈ Θ.О п р е д е л е н и е 3. Статистикой называется произвольная борелевская функция θ∗ = θ∗ (X1 , . . . , Xn ) от элементов выборки.22ГЛАВА II.
ТОЧЕЧНОЕ ОЦЕНИВАНИЕЗ а м е ч а н и е 4. Статистика есть функция от эмпирических данных,но никак не от параметра θ. Статистика, как правило, предназначенаименно для оценивания неизвестного параметра θ (поэтому её иначе называют оценкой) и уже поэтому от него зависеть не может.Статистика есть не любая, а измеримая функция от выборки (борелевская, для которой прообраз любого борелевского множества из R естьснова борелевское множество в Rn ), иначе оценка θ∗ не будет случайной величиной. Далее мы всюду будем иметь дело только с измеримымифункциями, и отдельно это оговаривать не будем.Свойства оценок. Дадим три определения хороших свойств оценок.О п р е д е л е н и е 4.
Статистика θ∗ = θ∗ (X1 , . . . , Xn ) называетсянесмещённой оценкой параметра θ, если для любого θ ∈ Θ выполнено равенство E θ∗ = θ.О п р е д е л е н и е 5. Статистика θ∗ = θ∗ (X1 , . . . , Xn ) называетсяасимптотически несмещённой оценкой параметра θ, если для любогоθ ∈ Θ имеет место сходимость E θ∗ → θ при n → ∞.О п р е д е л е н и е 6. Статистика θ∗ = θ∗ (X1 , . . . , Xn ) называется состоятельной оценкой параметра θ, если для любого θ ∈ Θ имеет местоpсходимость θ∗ −→ θ при n → ∞.Несмещённость — свойство оценок при фиксированном n.
Означаетэто свойство отсутствие ошибки «в среднем», т. е. при систематическомиспользовании данной оценки. Несмещённость является желательным, ноне обязательным свойством оценок. Достаточно, чтобы смещение оценки(разница между её средним значением и истинным параметром) уменьшалось с ростом объёма выборки. Поэтому асимптотическая несмещённостьявляется весьма желательным свойством оценок. Свойство состоятельности означает, что последовательность оценок приближается к неизвестному параметру при увеличении количества наблюдений. В отсутствиеэтого свойства оценка совершенно «несостоятельна» как оценка.П р и м е р 3. Пусть X1 , .
. . , Xn — выборка объёма n из нормальногораспределения Na,σ2 , где a ∈ R, σ > 0. Как найти оценки для параметровa и σ2 , если оба эти параметра (можно считать это и одним двумернымпараметром) неизвестны?Мы уже знаем хорошие оценки для математического ожидания и дисперсии любого распределения. Оценкой для истинного среднего a = EX1может служить выборочное среднее a∗ = X. Теорема 6 (с. 17) утверждает, что эта оценка несмещённая и состоятельная.23§ 2.