1625915143-9358bde957c0693ae60a95b83ad382f6 (843873), страница 16
Текст из файла (страница 16)
Делать это непросто, хотя соответствующие методы разработаны. Из-за дефицита времени мы упомянем только один подход, позволяющий во многих случаяхопределять, является ли данная оценка эффективной. В математической статистике71известно неравенство Рао–Крамера, которое гласит: если f (θ, t) как функция переменной θ обладает определенными свойствами регулярности (мы не уточняем здесь— какими), то для любой несмещенной оценки θ∗Dθ θ∗ ≥ C(θ, n).Константа C(θ, n) легко вычисляется, после чего с ней можно сравнивать дисперсии оценок.
Если для некоторой оценки в неравенстве Рао–Крамера выполняетсяравенство, значит, эта оценка обладает наименьшей дисперсией, в силу неравенстваменьше уже не бывает.Пример. Вернемся к ситуации, рассмотренной выше: X ⊂= U0,θ , и θ неизвестно.∗∗Сравним ММ-оценку θ1 = 2X и ММП-оценку θ = X(n) . Первая из них являетсянесмещенной:θE (2X) = 2E X1 = 2 = θ.2Для нееθ2DX1= .Dθ1∗ = 4n3nИсследуем вторую оценку.nYFθ∗ (t) = P(X(n) < t) = P(X1 < t, . . . , Xn < t) =P(Xi < t) =0, nt= (U0,θ (t))n =,nθ1,i=1если t ≤ 0,если 0 < t ≤ θ,если t > θ.Отсюда, кстати, следует состоятельность оценки θ∗ .
Поскольку всегда X(n) ≤ θ,то для любого ε > 0P(|X(n) − θ| ≥ ε) = P(θ − X(n) ≥ ε) = P(X(n) ≤ θ − ε) =при n → ∞.Далее находим плотность n−1 nt,nf (θ, t) =θ0,и моментыZθ∗Eθ =0nθntn−1,t n dt =θn+1(θ − ε)n→0θnесли 0 < t ≤ θ,иначеZθ∗ 2E(θ ) =0t2ntn−1nθ2dt=.θnn+2∗Оценка θ оказалась смещенной; чтобы сравнение было справедливым, подправимее, сделав, как и θ1∗ , несмещенной. Пустьn+1 ∗θ , Eθ2∗ = θ,nи дальше сравниваем θ1∗ и θ2∗ . Найдем дисперсию новой оценки.Ã!2 222(n + 1)(n + 1)nθnθθ2∗=Dθ2∗ =Dθ=−.n2n2n+2n+1n(n + 2)θ2∗ =Мы видим, что Dθ2∗ < Dθ1∗ при n > 1, причем Dθ2∗ стремится к нулю с ростом n напорядок быстрее, чем Dθ1∗ .727.7.1.Доверительные интервалыНекоторые распределения, связанные с нормальнымНам потребуется ввести некоторые распределения, играющие большую роль вматематической статистике.I. Распределение хи-квадрат.
По определению, распределением хи-квадрат с nстепенями свободы называется χ2n = Γ1/2, n/2 . Таким образом, это распределение сплотностью1ntt 2 −1 e− 2 , t > 0,γ1/2, n/2 (t) = 2n/2 Γ(n/2)0,t ≤ 0.6γ1/2, n/2 (t)n=1n>2n=2-t0Свойства распределения хи-квадрат1. Если случайные величины Z1 и Z2 независимы, Z1 ⊂= χ2n1 , Z2 ⊂= χ2n2 , тоZ1 + Z2 ⊂= χ2n1 +n2 .Это свойство в свое время было доказано в общем виде для сверток плотностейгамма-распределения.2.
Пусть случайные величины Y1 , . . . , Yn независимы и Yi ⊂= Φ0,1 при всехi = 1, . . . , n. ТогдаY12 + . . . + Yn2 ⊂= χ2n .Доказательство. Достаточно проверить утверждение для n = 1 и затем воспользоваться предыдущим свойством. Имеем FY12 (y) = P(Y12 < y) = 0 для y ≤ 0. Еслиy > 0, то√FY12 (y) =P(Y12√< y) = P(− y < Y1 <√2= √2πZy√1y) = √2πZy√− y½u2exp −2¾du =½ 2¾uexp −du.20Сделав замену t = u2 , получим1FY12 (y) = √2πZy−1/2t½ ¾texp −dt = Γ1/2, 1/2 (y).203. При больших значениях n распределение χ2n (y) можно аппроксимировать нормальным.73Действительно, пользуясь обозначениями предыдущего утверждения, находимÃ!222Y+...+Y−nEYy−nEY111p nχ2n (y) = P(Y12 + . . .
+ Yn2 < y) = P< p.22nDY1nDY1Если n велико, то можно применить ЦПТ. Здесь EY12 = 1, EY14 = 3 (последнеепредлагается проверить в качестве самостоятельного упражнения), поэтомуDY12 = 2. Получаем¶µy−n2.χn (y) ' Φ0,1 √2nII. Распределение Стьюдента. Пусть случайные величины Y и Zn независимы,Y ⊂= Φ0,1 , Zn ⊂= χ2n . Тогда распределение Tn случайной величиныrY1Znnназывается распределением Стьюдента с n степенями свободы.Вместо случайной величины Zn в этом определении можно поставить Y12 +. . .+Yn2 ,где Y, Y1 , . . . , Yn независимы и Yi ⊂= Φ0,1 при всех i = 1, . . .
, n.Плотность распределения Стьюдента равна (приводится без доказательства)Γ((n + 1)/2)tn (y) = √πn Γ(n/2)µy21+n¶−(n+1)/2.Это симметричная кривая, по своему виду напоминающая график плотности распределения Коши (кстати, распределение Коши совпадает с распределением Стьюдентас одной степенью свободы).6tn (y)-y0Данное распределение введено английским математиком В. С. Госсетом; он подписывал свои работы псевдонимом Student, что и закрепилось в названии распределения.Если n → ∞, то tn (y) → ϕ0,1 (y). Этот результат нетрудно получить из явнойформулы для tn (y), воспользовавшись замечательным пределом. Кстати, из законабольших чисел и свойств сходимости по вероятности следует, чтоrпосколькуYY12+ ...
+nPYn2→Y ⊂= Φ0,1 ,Y12 + . . . + Yn2 P→ EY12 = 1.n74Здесь, напомним, случайные величины Y, Y1 , . . . , Yn независимы и все имеют стандартное нормальное распределение.III. Распределение Фишера. Пусть Z1 и Z2 независимы, Z1 ⊂= χ2n1 , Z2 ⊂= χ2n2 . Тогдараспределение случайной величиныZ1 /n1Z2 /n2называется распределением Фишера с числом степеней свободы (n1 , n2 ) и обозначается Fn1 ,n2 .Мы не будем приводить формулу для плотности этого распределения, ее графикв своих общих чертах выглядит так:6fn1 ,n2 (t)-t0Все три введенных распределения широко используются в статистических вычислениях, поэтому почти во всех пособиях по математической статистике можновстретить таблицы значений этих функций распределения. Наиболее полно таблицы представлены в работе Большев Л.Н., Смирнов Н.В.
Таблицы математическойстатистики. М., 1965.7.2.Свойства выборок из нормального распределенияСледующая лемма лежит в основе многих статистических выводов.Лемма Фишера. Пусть случайные величины X1 , . . . , Xn независимы, Xi ⊂= Φ0,1 ,i = 1, . . . , n, иY1X1 Y2 X2 ... = A ... ,YnXnгде A — ортогональная матрица. Тогда для любого r = 1, . .
. , n − 1nXXi2 − Y12 − . . . − Yr2 ⊂= χ2n−ri=1и эта случайная величина не зависит от Y1 , . . . , Yr .Доказательство. Ранее было установлено, что в наших условиях случайные величины Y1 , . . . , Yn независимы и имеютΦ0,1 . Ортогональное преобраPnPn распределение22зование не меняет длины вектора: i=1 Xi = i=1 Yi , поэтомуnX2Xi2 − Y12 − . . .
− Yr2 = Yr+1+ . . . + Yn2 ⊂= χ2n−r ,i=175и эта случайная величина не зависит от Y1 , . . . , Yr . Лемма доказана.Теорема о свойствах выборок из нормального распределения. ПустьX = (X1 , . . . , Xn ) ⊂= Φα,σ2 . ТогдаX − α√n⊂= Φ0,1 ;σnS 22) 2 ⊂= χ2n−1 ;σ1)3) X и S 2 независимы.Доказательство. 1. Ранее установлено, что X ⊂= Φα,σ2 /n . Применяем операциюстандартизации:X − α√X − EX√n⊂= Φ0,1 .=σDXXi − αX −α, i = 1, .
. . , n. Тогда Zi ⊂= Φ0,1 ,=Zσσ¶2¶2n µn µ1 X Xi − X1 X Xi − α X − α==−=n i=1σn i=1σσ2. Обозначим Zi =S2σ2n=ПоэтомуВ свою очередь,Ãиn1X1X 2(Zi − Z)2 =Zi − (Z)2 .n i=1n i=1n√nS 2 X 2=Zi − ( n Z)2 .2σi=1Z1µ¶ Z2 √11.n Z = √ ,..., √nn ... Zn!11Вектор √ , . . .
, √имеет единичную длину. Его всегда можно достроить до орnn√тогональной матрицы A, в которой он будет являться первой строкой. Тогда n Zбудет совпадать с первой компонентой вектора A(Z1 , . . . , Zn )T и по лемме ФишераnX√= χ2n−1 .Zi2 − ( n Z)2 ⊂i=1nS 2 √X − α√и nZ =n независимы. Следо2σσвательно, независимы S 2 и X как функции этих величин.Теорема доказана.Следствие. В условиях теоремыИз леммы Фишера следует также, чтоX −α √n−1⊂= Tn−1 .S76Доказательство. Согласно определению, Tn−1 — это распределение дробиpY / Z/(n − 1), где Y и Z независимы, Y ⊂= Φ0,1 и Z ⊂= χ2n−1 . В силу теоремы мыможем взятьX − α√nS 2Y =n,Z= 2.σσСледствие доказано.7.3.Доверительные интервалы для параметров нормальногораспределенияПусть X ⊂= Fθ , θ ∈ R — неизвестный параметр. Ранее мы занимались поискомподходящих оценок для θ, что можно назвать также точечным оцениванием, поскольку вместо неизвестной точки θ на прямой предлагалось использовать другую,случайную точку θ∗ .
В этом разделе мы будем поступать по-другому: постараемсяуказать интервал, содержащий точку θ с большой вероятностью.Определение. Доверительным интервалом уровня 1 − ε для неизвестного параметра θ называется интервал (A(X1 , . . . , Xn ), B(X1 , . . . , Xn )) такой, чтоP(A(X1 , . . .
, Xn ) < θ < B(X1 , . . . , Xn )) ≥ 1 − ε.Обычно в качестве ε выбирают достаточно малое число.Доверительный интервал называется асимптотическим, еслиlim P(A(X1 , . . . , Xn ) < θ < B(X1 , . . . , Xn )) ≥ 1 − ε.n→∞Разумеется, пользоваться асимптотическим доверительным интервалом следует только при больших объемах выборки.Отметим, что доверительный интервал — это интервал со случайными концами,коль скоро они строятся по выборке. Ясно, что интервал тем лучше, чем он у́же.Далее мы займемся построением доверительных интервалов для неизвестных параметров в случае выборки из нормального распределения.Пусть X = (X1 , .
. . , Xn ) ⊂= Φα,σ2 .1. Доверительный интервал для α при условии, что σ 2 известно. МыX − α√установили ранее, чтоn⊂= Φ0,1 . С помощью таблиц стандартного нормальσного распределения можно найти число q > 0 такое, что Φ0,1 (−q) = ε/2. Это значит,чтоÃ!X − α√P −q <n < q = Φ0,1 (q) − Φ0,1 (−q) = 1 − εσили после преобразованийÃqσqσP X−√ <α<X+√nn!= 1 − ε.Ã!qσqσТем самым мы построили доверительный интервал X − √ , X + √ , его длинаnn√равна 2qσ/ n. Это значит, что при больших n мы можем довольно точно локализовать значение неизвестного параметра α.772.
Доверительный интервал для α при условии, что σ 2 неизвестно. Предыдущая конструкция не годится, поскольку в ней участвует неизвестный параметрσ. Здесь поможет следствие из теоремы предыдущего раздела, согласно которогоX − α√случайная величинаn − 1 (уже не зависящая от σ) распределена по законуSСтьюдента с n − 1 степенью свободы. Теперь мы воспользуемся таблицами распределения Tn−1 и найдем число q такое, что Tn−1 (−q) = ε/2. ТогдаÃ!X − α√P −q <n − 1 < q = Tn−1 (q) − Tn−1 (−q) = 1 − ε,Sи после преобразований получаем доверительный интервалÃ!qSqSP X−√<α<X+√= 1 − ε.n−1n−13.
Доверительный интервал для σ 2 при условии, что α известно. СлуXi − αчайные величины, i = 1, . . . , n, независимы и имеют стандартное нормальноеσраспределение, поэтомуÃ!2nXXi − α⊂= χ2n .σi=1Из таблиц распределения χ2n найдем числа q1 и q2 такие, что χ2n (q1 ) = ε/2,χ2n (q2 ) = 1 − ε/2. Тогда!Ãn2X(Xi − α)< q2 = χ2n (q2 ) − χ2n (q1 ) = 1 − ε.P q1 <2σi=1Это соотношение эквивалентно тому, чтоPnµPn¶222i=1 (Xi − α)i=1 (Xi − α)P<σ <= 1 − ε.q2q14. Доверительный интервал для σ 2 при условии, что α неизвестно. ВосnS 2пользуемся тем, что 2 ⊂= χ2n−1 . Из таблиц распределения χ2n−1 находим числа q1 иσq2 такие, что χ2n−1 (q1 ) = ε/2, χ2n−1 (q2 ) = 1 − ε/2. Тогда!ÃnS 2P q1 < 2 < q2 = χ2n−1 (q2 ) − χ2n−1 (q1 ) = 1 − εσи после преобразований получаем доверительный интервал¶µ 2nS 2nS2<σ <= 1 − ε.Pq2q1787.4.Построение доверительных интервалов с помощьюнормального приближенияВ предыдущем разделе нам удалось построить точные доверительные интервалы для параметров нормального распределения, пользоваться которыми можно прилюбых значениях n.