Ю.В. Прохоров, Л.С. Пономаренко - Лекции по теории вероятностей и математической статистике (1115359), страница 23
Текст из файла (страница 23)
. , Xn ) называютстатистикой, а статистику,которую используют в качестве приближенного значения неизвестного параметра θ, называют оценкой этого параметра. Оценку обычно обозначают той же буквой, что и сам параметр,только с каким-либо значком сверху, например θ̂, θ∗ и т.д.Определение 15.1. Оценка θ̂ = θ̂(X1 , . . . , Xn ) называется несмещенной оценкой параметра θ, еслиEθ θ̂ = θдля ∀θ ∈ Θ.Прикладники в этом случае говорят, что оценка лишена систематической ошибки.Определение 15.2.
Оценка θ̂ называется состоятельной для параметра θ, если для ∀ε > 0Pθ {|θ̂ − θ| > ε} → 0 при n → ∞для всех θ ∈ Θ.158Другими словами, оценка называется состоятельной для θ, если онасходится по веростности к неизвестному параметру θ.Подробно о свойствах этих (так называемых точечных ) оценок иметодах их получения мы будем говорить в следующей главе, а покаостановимся на другом способе оценивания — интервальных оценках (доверительных интервалах ), когда по результатам наблюдений указывается не одно приближенное значение параметра, а целое множествоприближенных значений.Пусть Pθ {T1 (X1 , .
. . , Xn ) < T2 (X1 , . . . , Xn )} = 1 для всех θ ∈ Θ.Определение 15.3. Случайный интервал (T1 (X1 , . . . , Xn ), T2 (X1 , . . . , Xn ))называется доверительным интервалом для неизвестного параметраθ с надежностью 1 − α, если для всех допустимых значений параметраPθ {T1 (X1 , . . . , Xn ) < θ < T2 (X1 , . . . , Xn )} = 1 − α.(15.1)Число 1 − α называют также доверительной вероятностью интервала, обычно его выбирают близким к 1.
Таким образом, каково быни было значение параметра, интервал (T1 , T2 ) накрывает параметр сзаданной вероятностью.Для дискретных распределений не всегда удается построить доверительный интервал так, чтобы в (15.1) выполнялось равенство. Поэтомудля дискретных распределений будем строить доверительные интервалы, удовлетворяющие неравенствуPθ {T1 (X1 , . . . , Xn ) < θ < T2 (X1 , . . . , Xn )} ≥ 1 − α,(15.2)добиваясь при этом, чтобы вероятность в (15.2) была как можно ближек 1 − α.Существует несколько стандартных приемов построения доверительных интервалов.
Продемонстрируем их при построении доверительныхинтервалов для параметров нормального и биномиального распределений.15.2Доверительный интервал для математического ожидания нормального распределения при известной дисперсииПусть случайные величины X1 , . . . , Xn независимы и имеют одинаковоенормальное распределение N (a, σ02 ). Математическое ожидание неизвестно и для него требуется построить доверительный интервал надежности1 − α, дисперсию считаем известной и равной σ02 .159Для построения доверительного интервала воспользуемся статистиσ2кой X.
Известно, что X ∼ N (a, n0 ). С помощью невырожденного линейного преобразования получим новую статистикуZ=X −aX − a√√ =n,σ0σ0 / nтакже имеющую нормальное распределение, но с параметрами (0, 1). Этораспределение не зависит от неизвестного параметра. Поэтому для заданного числа 1 − α можно указать неслучайный интервал (c1 (α), c2 (α))такой, чтоPa {c1 (α) < Z < c2 (α)} = 1 − αодновременно для всехa ∈ (−∞, ∞).Такой интервал определен неоднозначно, и обычно при выборе чиселc1 , c2 используют некоторые дополнительные соображения.
Например,можно выбирать интервал наименьшей длины. Тогда−c1 (α) = c2 (α) = uα/2 ,где по – прежнему uα/2 — это решение уравнения P{|Z| ≥ uα/2 } = α.Поскольку|Z| < uα/2 ⇐⇒σ0|X − a| √n < uα/2 ⇐⇒ |X − a| < uα/2 √ ⇐⇒σ0nσ0σ0X − uα/2 √ < a < X + uα/2 √ ,nn(15.3)то полученный интервал (15.3) является искомым доверительным интервалом.Разобранный способ построения доверительногоинтервалаX−a √использовал свойства статистики Z = σ0 n :1) распределение статистики не зависит от неизвестных параметров;2) статистика Z является монотонной функцией неизвестного параметра a, что позволило решить неравенство |Z| < uα/2относительно неизвестной величины a.Статистику, обладающую перечисленными свойствами, называют центральной статистикой, а описанный выше метод построения доверительного интервала, называют методом, использующим центральнуюстатистику.16015.3Построение доверительного интервала длядисперсии нормального распределенияПусть случайные наблюдения X1 , .
. . , Xn независимы, одинаково нормально распределены с параметрами (a0 , σ 2 ), но теперь неизвестным параметром является дисперсия σ 2 , а математическое ожидание известнои равно a0 .Для построения доверительного интервала воспользуемся статистикойn1X2(Xi − a0 )2 ,S0 =n i=1которую можно использовать в качестве оценки для неизвестной дисперсии σ 2 , так как2n σ 2 X Xi − a02= χ2n ,(15.4)S0 =n i=1σтоσ2 2σ2Eχn =· n = σ2,nn2σ 4σ4σ4DS02 = 2 Dχ2n = 2 · 2n =→ 0,nnnи, следовательно, эта оценка является несмещенной, состоятельной оценкой для неизвестной дисперсии. Кроме того, из нее легко получить центральную статистикуnS 2G = 20 = χ2n .σПоскольку эта статистика имеет распределение хи-квадрат с n степенямисвободы, не зависящее от неизвестного параметра, то по таблицам этогораспределения для заданной надежности 1 − α можно определить числаc1 = c1 (α), c2 = c2 (α), такие, чтоES02 =Pσ {c1 < G < c2 } = 1 − α.Выбор чисел c1 и c2 неоднозначен.
Можно, например, выбрать их изусловийP{χ2n ≤ c1 } = α/2, P{χ2n ≥ c2 } = α/2.Такой интервал называют центральным.Обозначим gn (α) – решение уравнения P{χ2n ≤ g(n; α)} = α. Такиечисла, как известно, называют квантилями данного распределения. Тогда c1 = g(n; α/2), c2 = g(n; 1 − α/2). Решая неравенство относительно161неизвестного параметра,nS02< c2 ,σ2находим искомый доверительный интервал:c1 < G < c2 ⇐⇒ c1 <nS02nS02< σ2 <.g(n; 1 − α/2)g(n; α/2)(15.5)Замечание. Если использовать как и в предыдущем примере соображения о кратчайшей длине интервала, то получим другие значенияконстант c1 , c2 .
Покажите, что в этом случае они должны удовлетворять уравнениюc2 pn (c1 ) = c1 pn (c2 ),где pn (x) — плотность распределения хи-квадрат с n степенями свободы.15.3.1Совместное распределение статистик X и S 2Пусть по-прежнему X1 , . . . , Xn — независимые случайные величины содинаковым нормальным распределением N (a, σ 2 ), но теперь оба параметра этого распределения неизвестны.Обозначимnn1X1XX=Xi , S 2 =(Xi − X)2n i=1n i=1– выборочное среднее и выборочную дисперсию. Докажем следующуютеорему о совместном распределении статистик X и S 2 в нормальныхвыборках.Теорема 15.1.
Если X1 , X2 , . . . , Xn - независимая выборка из нормального распределения с параметрами (a, σ 2 ), то1) X и S 2 независимы,22) X ∼ N (a, σn ),23) S 2 = σn χ2n−1 .Доказательство теоремы использует свойства многомерного нормального распределения.Определение 15.4. Случайный вектор Y~ = (Y1 , Y2 , . . . , Yn )T имеет n мерное стандартное нормальное распределение, если совместная плотность распределения равнаn1 Pn12pY (y1 , .
. . , yn ) = √e− 2 i=1 yi .2π162Нетрудно проверить, что компоненты Yi случайного вектора, имеющего стандартное нормальное распределение, независимы и Yi ∼ N (0, 1).~ получен из вектора Y~ со станЛемма 15.1. Пусть случайный вектор Zдартным нормальным распределением с помощью ортогонального пре~ = CY~ . Тогда Z~ также имеет стандартное нормальноеобразования Zраспределение.Доказательство. Напомним, что строки матрицы ортогонального преобразования образуют ортонормированный базис в Rn ,C−1 = CT ,det C = 1и что ортогональное преобразование сумму квадратов переменных переводит в сумму квадратов новых переменных.Пусть A - событие из борелевской σ- алгебры в Rn , B = C−1 (A)−прообраз события A при преобразовании C.
ТогдаZ~~P{Z ∈ A} = P{CY ∈ A} = pY (y1 , . . . , yn )dy1 · · · dyn =BZ 12πn/2Bn1X 2exp (−y )dy1 · · · dyn ..2 i=1 iВ последнем интеграле сделаем замену переменных ~z = C~y , тогда~ ∈ A} =P{ZZ A12πn/2n1X 2exp (−z )dz1 · · · dzn .2 i=1 iПодинтегральная функция – по определению является плотностью рас~ следовательно, распределение Z~ явпределения случайного вектора Z,ляется стандартным нормальным.Возвратимся к доказательству теоремы.Доказательство. Утверждение 2) теоремы почти очевидно, поэтому докажем только утверждения 1), 3). Наряду с исходными случайными величинами Xi рассмотримYi =Xi − a(i = 1, .
. . , n).σ163Отметим, что случайный вектор Y~ = (Y1 . . . . , Yn )T имеет стандартноенормальное распределение. Рассмотрим ортогональную матрицу 1√√1. . . √1nnn c 21 c22 . . . c2n ,C= .... . .. ... . .cn1 cn2 . . . cnnу которой первая строка выбрана специальным образом, а остальныепроизвольным образом дополняют первую строку до ортогонального базиса в Rn .~ = CY~ также имеет стандартное нормальное распреВ силу леммы Zделение, поэтому компоненты вектора Zi ∼ N (0, 1) и независимы. ПриэтомσX = a + σY = a + √ Z1 ,n!nnn1Xσ2 X1X 222222S =(Xi − X) =(Yi − Y ) = σY −Y=n i=1n i=1n i=1 i!nnX1σ2 X 21222=σZ − ( √ Z1 ) =Z .n i=1 in i=2 inМы видим, что выборочное среднее X зависит лишь от Z1 , а выборочная дисперсия S 2 от не зависящих от Z1 случайных величин Z2 , .
. . , Zn ,следовательно, X и S 2 — независимые случайные величины.Кроме того,σ2 2S2 =· χn−1 ,nтак как по определению случайная величина, представленная в видесуммы квадратов независимых случайных величин со стандартным нормальным распределением, имеет распределение хи – квадрат с числомстепеней свободы, равным числу независимых слагаемых.Тем самым теорема доказана.Воспользуемся доказанными свойствами статистик X и S 2 при построении доверительных интервалов для неизвестных математическогоожидания a и дисперсии σ 2 .Доверительный интервал для σ 2 строится с помощью центральнойстатистикиnS 2G = 2 = χ2n−1 ,σ164которая имеет распределение хи – квадрат с n − 1 степенью свободы.Построение полностью повторяет рассуждения примера 2, поэтому сразувыпишем интервал с надежностью 1 − α :nS 2nS 2< σ2 <,g(n − 1; 1 − α/2)g(n − 1; α/2)(15.6)где gn−1 (α) обозначает α- квантиль распределения хи-квадрат.Замечание.