Аркашов Н.С. - Высшая математика. Теория вероятностей и математическая статистика (1275646), страница 17
Текст из файла (страница 17)
Пусть νi - число опытов, в которыхнаблюдалось значение X = i; i = 0, 1, ..., 12. Данные для n = 4096 опытовприведены в следующей таблице:iνi0017260319844305731694878478536925710711111120а) Построить гистограмму и сравнить ее с графиком функции y =ce2− x6.б) Вычислить выборочные среднее и дисперсию.11.3Измеренрост(всм)студентоводнойучебнойгруппы.Результатыизмеренийдаливыборку(171; 186; 164; 190; 158; 181; 176; 180; 174; 157; 176; 169; 164; 186).а) Построить реализацию гистограммы.б) Вычислить реализации выборочного среднего, выборочнойдисперсии и выборочного стандартного отклонения S.
На одном графикес гистограммой построить график плотности нормального закона спараметрами X, S 2 .11.4 Пассажир маршрутного такси измерил 8 раз время ожидания таксии получил следующие результаты (в минутах): 8; 4; 5; 4; 2; 15; 1; 6.У него есть две гипотезы относительно графика движения такси: либо110график движения соблюдается, и время ожидания имеет равномерноераспределение на отрезке [0; θ], либо график движения не соблюдается, ивремя ожидания имеет показательное распределение с параметром λ.а) Вычислить реализации оценок параметров θ и λ, использовав оценкиeθ2 = (n + 1)X(n) /n и eλ2 = n−1.nXб) Построить на одном графике реализацию эмпирической функциираспределения и теоретические функции распределения равномерногои показательного законов, в которые вместо неизвестных параметровподставлены реализации их оценок.в) Построить на одном графике реализацию гистограммы итеоретические плотности распределения равномерного и показательногозаконов, в которые вместо неизвестных параметров подставленыреализации их оценок.г) На основании проведенного исследования сделать вывод о том, какаяиз гипотез выглядит более соответствующей экспериментальным данным.~ ⊂11.5 Пусть X= N (a, σ2 ).
Вычислить EX, DX. Какое распределениеимеет случайная величина X?11.6 Дана выборка X ⊂= Π(λ), λ > 0 — неизвестный параметр. Проверить,что статистикиn1XX1 + XnT1 = X, T2 =I(Xi = k), T3 =n i=12являются несмещенными оценками соответственно для λ, λk! e−λ и λ.Являются ли эти оценки состоятельными?11.7 По выборке (X1 , . . . , Xn ) из бернуллиевского распределения Bp снеизвестным параметром p ∈ (0; 1) построить оценки параметра p:a) по первому моменту;б) по второму моменту;в) по произвольному k-му моменту.Можно ли отдать предпочтение какой-либо из построенных оценок?Исследовать их состоятельность и несмещенность.11.8 По выборке (X1 , .
. . , Xn ) из биномиального распределения Bm,pпостроить оценки методом моментов:a) параметра p по первому и по второму моменту при известном m > 0;б) параметров p и m.Исследовать состоятельность построенных оценок.11.9 При каких значениях параметра θ > 0 распределения Парето сплотностью θtθ+1 , t ≥ 1,fθ (t) =0,t<1k111существует оценка параметра по первому моменту? Можно ли построитьсостоятельную оценку методом моментов в случае, когда оценки попервому моменту не существует?11.10 По выборке (X1 , .
. . , Xn ) из распределения Лапласа с плотностьюt ∈ R, построить оценку параметра λ > 0 методомfλ (t) = λ2 e−λ|t| ,моментов.11.11 Пусть дана выборка из нормального распределения с параметрамиα и σ2 . Используя метод моментов, построить оценкиа) неизвестного математического ожидания α;б) неизвестной дисперсии σ2 , если α известно;в) неизвестной дисперсии σ2 , если α неизвестно.Исследовать полученные оценки на несмещенность и состоятельность.11.12 Используя метод моментов, оценить параметр θ равномерногораспределения на отрезкеа) [−θ; θ], θ > 0; б) [θ; θ + 1].Исследовать полученные оценки на несмещенность и состоятельность.11.13 С помощью метода моментов найти оценки параметров aи b равномерного распределения на отрезке [a, b].
Будут ли онисостоятельными?11.14Используяметодмоментов,построитьбесконечнуюпоследовательность различных оценок параметра θ равномерногораспределения на отрезке [0; θ]. Будут ли полученные оценкисостоятельными?11.15 С помощью метода моментов построить оценку параметра θ > 0,если распределение выборки имеет плотностьа) θtθ−1 при t ∈ [0; 1]; б) 2t/θ2 при t ∈ [0; θ].Исследовать полученные оценки на состоятельность.11.16 Дана выборка из распределения с плотностью 2 −33t θ , t ∈ [0; 1],fθ (t) =0,t 6∈ [0; 1].Найти оценку параметра θ > 0 методом моментов, исследовать ее нанесмещенность и состоятельность.11.17 Методом моментов найти оценку параметра α > 0 по выборке изпоказательного распределения с плотностью fα (t) = αe−αt , t > 0. Будетли оценка несмещенной и состоятельной?11.18 По выборке (X1 , .
. . , Xn ) методом моментов найти две различныеоценки параметра p ∈ (0, 1), если известно, чтоP {X1 = 1} = p/2, P {X1 = 2} = p/2, P {X1 = 3} = 1 − p.Будут ли полученные оценки несмещенными и состоятельными?112Глава 12Оценки максимальногоправдоподобия.Сравнение оценок§ 12.1.Метод максимального правдоподобия~ ⊂Пусть X= F (t, θ), θ ∈ Θ. Предположим, что теоретическоераспределение либо абсолютно непрерывно с плотностью f (t, θ) =fXi (t),либо дискретно, при этом для ряда распределения будемиспользовать то же обозначение: f (t, θ) = P(Xi = t). Функцией~ называется функцияправдоподобия, соответствующей выборке X,~ θ) =Π(θ) = Π(X,nYf (Xi , θ).(12.1)i=1Оценкой максимального правдоподобия (ОМП) называется такое~значение параметра θ = θ̂(X),при котором функция правдоподобияпринимает наибольшее значение, то есть~ θ̂) = max Π(X,~ θ).Π(X,θ∈Θ(12.2)Если функция правдоподобия дифференцируема при всех θ ∈ Θ, тозначение θ = θ̂ должно быть решением уравненияΠ′ (θ) = 0,113(12.3)которое называется уравнением правдоподобия, или эквивалентногоуравненияnXddln Π(θ) = 0 ⇐⇒ln f (Xi , θ) = 0.(12.4)dθdθi=16y = Π(θ, X)-X(n)0θ~ ⊂Рис.
12.1: Функция правдоподобия для X= U[0,θ] .Рассмотрим теперь случай многомерного параметра, предположивопять для простоты, чтоθ = (θ1 , θ2 ) - двумерный параметр. Тогдадля нахождения ОМП нужно найти точку θ̂ = (θ̂1 , θ̂2 ) наибольшегозначения функции двух переменныхΠ(θ1 , θ2 ). В частности, еслифункция правдоподобия дифференцируема, то для решения этой задачи,вместо уравнения правдоподобия (12.3) или (12.4), нужно найти решениеследующей системы уравнений:∂Π(θ1 ,θ2 )= 0,∂θ1(12.5) ∂Π(θ1 ,θ2 ) = 0.∂θ2§ 12.2.Сравнение оценок:среднеквадратический подход~ ⊂Пусть X= F (t, θ),нибудь оценка параметраe~ — какаяθ ∈ Θ,иθ = eθ(X)θ.
Так как оценка является случайной114величиной, то даже свойство несмещенности не гарантирует близость ееконкретной реализации eθ(~x) к оцениваемому параметру. Если оценкаявляется состоятельной, то такая близость гарантируется с заданнойвероятностью, но только при достаточно больших объемах выборки n.При фиксированном объеме выборки наиболее распространенной «меройблизости» оценки к оцениваемому параметру является квадратическаяхарактеристика, или среднее значение квадрата отклонения E(eθ − θ)2 .eeИз двух оценок θ1 считается лучше, чем θ2 , если при всех θ ∈ Θвыполняется неравенствоE(eθ1 − θ)2 ≤ E(eθ2 − θ)2 ,(12.6)а хотя бы для одного θ неравенство в (12.6) оказывается строгим.Заметим, что квадратическая характеристика оценки не меньше еедисперсии, и равенство достигается для несмещенных оценок:22E(eθ − θ)2 = E(eθ − θ) + D(eθ − θ) = Eeθ − θ + Deθ ≥ Deθ.Если eθ — несмещенная оценка параметра θ, то есть Eeθ = θ, то для нее2E(eθ − θ)2 = Eeθ − θ + Deθ = Deθ.Отметим, что при среднеквадратическом подходе к сравнению оценокнельзя найти наилучшую в классе всех оценок (в частности, существуютнесравнимые оценки).Теорема 12.1.
В невырожденной статистической задаче (то естьв ситуации, когда по выборке нельзя однозначно определить неизвестныйпараметр) не существует наилучшей в классе всех оценок.Доказательство. Предположим, что существует наилучшая в классе всехоценок параметра θ оценка θ̌. Рассмотрим следующую дурацкую оценкуθ̃d = θ0 . Эта оценка равняется константе θ0 для любых выборочныхзначений, то есть никак не использует информацию, представленнуювыборкой. Однако если θ0 — возможное значение параметра θ, то нельзяисключить ситуации, когда θ = θ0 (дурацкая оценка может оказатьсянаиболее верной, если правильно угадывает значение неизвестногопараметра). В этом случае квадратичная характеристика этой оценкиравна 0:E(θ̃d − θ)2 = E(θ0 − θ0 )2 = 0.115Но если оценка θ̌ не хуже, чем θ̃d , то ее квадратичная характеристикавсегда не больше, чем квадратичная характеристика оценки θ̃d для любогоθ. В частности, при θ = θ0 получаем:E(θ̌ − θ0 )2 ≤ E(θ0 − θ0 )2 = 0.Отсюда E(θ̌ − θ0 )2 = 0, то есть θ̌ = θ0 с вероятностью 1.
Этопротиворечит невырожденности статистической задачи — предполагалось,что по выборке нельзя однозначно определить неизвестный параметр.Итак, не может существовать наилучшей в классе всех оценок. Теоремадоказана.Для того, чтобы избежать необходимости сравнивать получаемыеоценки с вырожденными оценками (рассмотренными в доказательстветеоремы), нужно ограничить класс рассматриваемых оценок. Как правило,сравнивают только несмещенные оценки.