Аркашов Н.С. - Высшая математика. Теория вероятностей и математическая статистика (1275646), страница 21
Текст из файла (страница 21)
Пусть Yn ⊂= Tn . Тогда1) для любого t выполнено P{Yn < −t} = P{Yn > t}, то естьраспределение Стьюдента симметрично;2) Yn → X почти наверное при n → ∞, где X имеет стандартноенормальное распределение.Доказательство.1) Симметрия следует из симметрии стандартного нормальногораспределения:ppP{Yn < −t} = P{X < −t Zn /n} = P{X > t Zn /n} = P{Yn > t}.2) Сходимость следует из свойства сходимости почти наверное,√непрерывности функции x/ y и из свойства распределения хи-квадрат.Доказательство завершено.§ 14.3.Точные доверительные интервалыНаиболее распространенной ситуацией, когда возможно построениеточных доверительных интервалов, является случай нормального~ ⊂распределения: X= Na,σ2 , — когда хотя бы один из его параметров141неизвестен. В этом случае известно совместное распределение наиболееупотребительных оценок X и S 2 параметров a и σ2 , с помощьюкоторого и строятся соответствующие доверительные интервалы.Основные результаты содержатся в следующей теореме, которую примембез доказательства.~ ⊂Теорема 14.1.
(Теорема Фишера) Пусть X= Na,σ2 . Тогда верныследующие 4 факта:√n(X − a)⊂= N0,1 .1)σPn2i=1 (Xi − a)2)⊂= χ2n .2σnS 2⊂= χ2n−1 .σ2√n−1 X −a⊂= Tn−1 .4)SОтметим, что первое утверждение теоремы следует сразу же из свойствнормального распределения, второе — из определения распределенияхи-квадрат с учетом того факта, что Xiσ−a имеет стандартноенормальное распределение. Третье утверждение — нетривиальный факт,прокомментировать который можно следующим образом. Вспомним, что3)nS 2 =nXi=1(Xi − X)2 .Если выборка состоит из одного элемента X1 , то есть n = 1, тоnS 2(X1 − X1 )2== 0,σ2σ2— случайная величина имеет распределение, вырожденное в точке ноль,которое можно по определению считать распределением хи-квадрат снулевым числом степеней свободы.Если выборка состоит из двух элементов (X1 ; X2 ), то есть n = 2, тоnS 2(X1 − (X1 − X2 )/2)2 + (X2 − (X1 − X2 )/2)2(X1 − X2 )2==.σ2σ22σ2Отметим, что E(X1 − X2 ) = a − a = 0.
Так как X1 и X2 независимы,то D(X1 − X2 ) = DX1 + DX2 = 2σ2 . Согласно свойствам нормального142распределения, X1 − X2 ⊂= N0,2σ2 , то есть X1 − X2 =стандартное нормальное распределение. Поэтому√2σX, где X имеетnS 22σ2 X 2== X2 ⊂= χ21 .σ22σ2Доказательство для n ≥ 2 оказывается существенно более сложным, иприводить его здесь мы не будем.Четвертое утверждение следует из третьего и определенияраспределения Стьюдента.§ 14.4.АсимптотическиеинтервалыдоверительныеЕсли распределение не является нормальным, точный доверительныйинтервал, как правило, не удается построить. Поэтому строятасимптотический доверительный интервал, применяя центральнуюпредельную теорему (теорема 10.4), которая утверждает, что для всехt1 , t2 ∈ R (t1 < t2 ) выполнено (10.2)nX − na√lim P t1 ≤< t2 = Φ(t2 ) − Φ(t1 ), n → ∞n→∞σ nто есть центрированные и нормированные суммы случайных величин nX =X1 + .
. . + Xn сходятся по распределению к случайной величине, имеющейстандартное нормальное распределение.Здесь a = EX1 , σ2 = DX1 — математическое ожидание и дисперсияэлементов выборки.Если выбрать t2 = −t1 = A и принять доверительный уровень равнымγ, тоnX − na√lim P −A ≤< A = Φ(A) − Φ(−A) = 2Φ(A) − 1 = γ, n → ∞n→∞σ nоткуда получаемΦ(A) = (γ + 1)/2.(14.2)По заданному γ можно найти A с помощью таблиц нормальногораспределенияилипрограммныхприложений.Отметимбез143доказательства следующее свойство сходимости по распределению:если Yn сходится по распределению к Y , а Zn сходится почти наверное к1, то их произведение Yn Zn сходится по распределению к Y . ВыберемYn =nX − na√=σ n√n(X − a),σZn =σ.SqВспомним, что S = X 2 − (X)2 → σ почти наверное, и по свойствусходимости почти наверное Zn → 1 п. н.
Следовательно,√√n(X − a) σn(X − a)Yn Zn =· =σSSсходится по распределению к стандартной нормальной случайнойвеличине, то есть√n(X − a)< A = Φ(A) − Φ(−A) = 2Φ(A) − 1 = γ, n → ∞,lim P −A ≤n→∞S(14.3)где константа A выбирается по формуле 14.2.Чтобы для неизвестного параметра θ найти доверительныйинтервал асимптотического уровня γ, нужно для исследуемогооднопараметрического семейства распределений найти зависимостьEX1 = a = a(θ) и подставить полученное выражение в 14.3, то естьрешить относительно параметра θ двойное неравенство−A ≤√n(X − a(θ))<AS(14.4)(для этого нужно, чтобы функция a(θ) была непрерывной и строгомонотонной).
Получившиеся границы дверительного интервала будемобозначать через θ− и θ+ .§ 14.5.Решение типовых примеров~ ⊂Пример 14.1. Пусть X= Na,σ2 , a ∈ R. Построить доверительныйинтервал (a− ; a+ ) для параметра a, считая σ2 известным.Вычислить реализацию доверительного интервала с уровнем доверия γ =0, 95, располагая данными: n = 10, X = 2, 7, σ2 = 4.144Решение. Для построения доверительного интервала используемоценку X, распределение которой известно.
Для заданной доверительнойвероятности γ найдем такое A > 0, что√ X − a σAσA < A = P −√√<.(14.5)γ = P nX−a<σ nnσAТаким образом, нужно искать ε1 = − √, ε2 =nвыполняется равенство:P ε1 < X − a < ε2 = γ.σA√nтакие, чтоДля этого вернемся к (14.5). В силу теоремы 14.1, случайная величина,стоящая под знаком модуля, имеет стандартное нормальное распределение,поэтому вероятность в правой части можно выразить через функциюраспределения Φ(t) закона N0,1 , и тогда уравнение (14.5) приобретаетвид:1+γ2Φ(A) − 1 = γ ⇐⇒ Φ(A) =,(14.6)2гдеΦ(t)— функция Лапласа, значения которой представленыв таблице приложения в конце книги. Заметим, что значениеA = A 1+γ , удовлетворяющее (14.6), представляет квантиль уровня1+γ22распределения N0,1 . Найдя его по таблице и подставив в (14.5),получим равенство:√ X − a √ < A 1+γ = P −A 1+γ < n a − X < A 1+γγ =P n⇐⇒222σ σ()A 1+γA 1+γ22⇐⇒ γ = P X − σ √ < a < X + σ √,(14.7)nnоткуда искомый γ-доверительный интервал:(a− ; a+ ) =A 1+γA 1+γX − σ √2 , X + σ √2nn!.Подставляя сюда конкретные данные из условия, вычисляемреализацию доверительного интервала:1, 961, 96(a− ; a+ ) ≈ 2, 7 − 2 √ , 2, 7 + 2 √≈ (1, 46; 3, 94) ⇐⇒1010⇐⇒ P(1, 46 < θ < 3, 94) = 0, 95.145Замечание14.1.
Построенныйдоверительныйинтервалоказывается симметричным относительно выборочного среднегоX и имеет длину 2A √σn , пропорциональную значению A, которое былонайдено из условия (14.5).~ ⊂Пример14.2. Пусть X= Na,σ2 , где a ∈ R, σ2 > 0 —два неизвестных параметра. Построить доверительный интервал дляпараметра σ2 . Вычислить реализацию доверительного интервала суровнем доверия γ = 0, 9, располагая данными: n = 10, S 2 = 4.Решение. Используя лемму Фишера, проще всего построить такназываемый односторонний доверительный интервал. Для этого позаданной доверительной вероятности γ = 0, 9 найдем такое B > 0, что 2 2nSnSγ=P>B⇐⇒P≤B= 1 − γ.(14.8)σ2σ22nSимеет распределениеУчитывая, что случайная величинаσ22χn−1 ,нетрудно видеть, что искомоеBесть не что иное, какквантиль χ21−γ,n−1 этого распределения.
Подставляя ее в (14.8) иразрешая неравенство под знаком вероятности относительно σ2 , находимдоверительный интервал:() 2nSnS 222γ=P⇐⇒> χ1−γ,n−1⇐⇒ γ = P>σσ2χ21−γ , n − 1⇐⇒(σ2− ;σ2+ )=0,nS 2χ21−γ,n−1!.Подставляя конкретные данные, находим реализацию доверительногоинтервала:χ20.1,9 = 4, 17; (σ2− ; σ2+ ) = (0; 8, 63).Чтобы построить двусторонний доверительный интервал, вместо (14.8)используем следующее уравнение: 2nS 2nSnS 2γ = P x1 < 2 < x2⇐⇒ Pθ< σ2 <= γ,(14.9)σx2x1где 0 < x1 < x2 , удовлетворяющие (14.9), находим по известному2распределению χ2n−1 случайной величины nSσ2 .
В общем случае эта задачане имеет единственного решения. Если обратиться к графику плотности146распределения χ2n−1 , представленному на рис. 14.1, то x1 < x2 следуетвыбирать таким образом, чтобы сумма вероятностей, представленныхплощадями заштрихованных областей под графиком плотности, равнялась1 − γ. Ясно, что это можно сделать многими способами.y6γ1 + γ2 = 1 − γγ1j0γ2j-x2x1xРис. 14.1: Плотность распределения χ2n−1Чтобы сделать решение однозначным, выберем x1 < x2 так, чтобыкаждая из заштрихованных площадей равнялась 1−γ2 , тогда нетрудновидеть, что x1 , x2 выражаются через квантили распределения χ2n−1 :x1 = χ21−γ ,n−1 ,2x2 = χ21+γ ,n−1 .2Подставляя это в (14.9), находим искомый двусторонний доверительныйинтервал: nS 2222nSnSnS.Pθ< σ2 < 2= γ ⇐⇒ (σ2− ; σ2+ ) = 2, 2 χ21+γχχχ1−γ1+γ1−γ,n−1,n−1,n−1,n−1222Находя по таблице распределения хи-квадратχ21−γ ,n−1 ,22χ21+γ ,n−1—2квантили распределения χ2n−1 для конкретных значений γ = 0, 9, n =10, и данных в условии численных значений, находим реализациюдоверительного интервала:χ21+0,9 ,9 = 16, 9; χ21−0,9 ,9 ≈ 3, 325;22(σ2− , σ2+ ) = (2, 37; 12, 03).~ ⊂Пример14.3.