Аркашов Н.С. - Высшая математика. Теория вероятностей и математическая статистика (1275646), страница 20
Текст из файла (страница 20)
График приведен на рис. 13.5.132Рис. 13.5: Оценка функции сдвинутого показательного распределенияметодом максимального правдоподобия.Сравнивая результат с рис. 13.3, видим, что использование оценокмаксимального правдоподобия позволяет более точно приблизитьэмпирическую функцию распределения.Построим оценки параметров распределения Парето по первому ивторому моментам. Вспомним, что плотность распределения задаетсяформулойγhγ t−(γ+1) , если t ≥ h;fγ,h (t) =0иначе.Вычислим EXi и EXi2 :Z ∞ZEXi =tfγ,h (t)dt == γhγZ−∞∞ht−γ dt = γhγ∞tγhγ t−(γ+1) dt =htγhγ h−γ+1γh|∞=,h =−γ + 1γ−1γ −1−γ+1133если γ > 1 (в противном случае математическое ожидание не существует).АналогичноZ ∞Z ∞22EXi =t fγ,h (t)dt =t2 γhγ t−(γ+1) dt == γhγZ−∞∞ht−γ+1 dt = γhγhγhγ h−γ+2γh2t−γ+2 ∞|h ==,−γ + 2γ −2γ −2если γ > 2 (в противном случае второй момент не существует).Получаем систему уравнений(γh2EXi = γ−2,EXi2 =Выразим параметры:h=γh2γ−2 .γ −1EXi ,γγ(γ − 1)2(EXi )2 = EXi2 ,γ 2 (γ − 2)(γ − 1)2 (EXi )2 = γ(γ − 2)EXi2 .Получаем квадратное уравнение:DXi γ 2 − 2DXi γ − (EXi )2 = 0.Решая его и выбирая положительный корень, получаем:s(EXi )2γ =1+ 1+.DXiЗаменим математическое ожидание и дисперсию на выборочноесреднее X и выборочную дисперсию S 2 , а параметры h и γ на их оценкиh∗ и γ ∗ .
Получим оценки параметров:q2 ∗γ = 1 + 1 + (X)2 ,S∗ h = γ −1γ ∗ X.Отметим, что оценка параметра γ всегда не меньше числа 2, чтосоответствует требованию к параметру, обеспечивающему конечностьвторого момента. Найдем реализации оценок по выборке и построим134графики реализаций параметрической оценки функции распределенияF (t, h∗ , γ ∗ ) по формуле=ЕСЛИ(СТРОКА() < R$1; 0; 1 − (СТРОКА()/R$1)∧(−R$2))и эмпирической функции распределения Fn∗ (t). График приведен нарис.
13.6.Рис. 13.6: Оценка функции распределения Паретометодом моментов.Из рисунка видно, что приближение в этом случае оказывается оченьнеудачным.Получим оценки параметров распределения Парето методоммаксимального правдоподобия.Сначала найдем оценку параметра h непосредственно отысканиемточки максимума функции правдопобобия. Для этого запишем функциюправдоподобия Qnγ −(γ+1)), если все Xi ≥ θ;~i=1 (γh XiΠ(X, h, γ) =0иначе.Зависимость функции правдоподобия от параметра h имеет тотже характер, что и в случае сдвинутого показательного распределения135зависимость от параметра θ.
Она изображена схематично на рис. 13.4. Еемаксимум достигается в точке bh = min{Xi }, которая является оценкоймаксимального правдоподобия параметра h.Найдем оценку максимального правдоподобия параметра γ. Для этогопоследовательно вычислимln f (t, h, γ) = ln γ + γ ln h − (γ + 1) ln tпри t ≥ h;1∂ln f (t, h, γ) = + ln h − ln t∂γγпри t ≥ h. Приравнивая производную логарифма функции правдоподобияк нулю, получаем уравнение для определения оценки параметра γ:n X1i=1γ+ ln h − ln Xi= 0,решением которого являетсяγ=1.ln X − ln hПоскольку параметр h неизвестен, заменим его на оценкумаксимального правдоподобия bh = min{Xi } (так же мы поступалипри нахождении оценок для сдвинутого показательного распределения) иполучим1bγ=.ln X − ln(min{Xi })Условие Xi ≥ bh оказывается выполненным автоматически.Найдем реализации оценок максимального правдоподобия.
Отметим,что для нахождения выборочного усреднения логарифма ln X нужнопредварительно в отдельном столбике вычислить логарифмы всехвыборочных значений, скопировав функцию =LN(A1), и затем вычислитьсреднее из 30 значений логарифмов.Построим графики реализаций параметрической оценки функциираспределения F (t, bh, bγ ) (как для оценок методом моментов) иэмпирической функции распределения Fn∗ (t).График приведен на рис. 13.7.136Рис. 13.7Анализируя график, видим, что для распределения Парето иоценки максимального правдоподобия не дают хорошего приближенияэмпирической функции распределения. На основании проведенногоисследования можно заключить, что более адекватной моделью являетсямодель сдвинутого показательного распределения, и лучший методоценивания ее параметров — метод максимального правдоподобия. Оценкимаксимального правдоподобия здесь получаются смещенными, однако мыне будем обсуждать, как можно уменьшить смещение.137§ 13.2.Задачи для самостоятельного решенияЗадача 13.1В тексте задачи через № обозначен номер студента по спискугруппы.1.
Для выборки X1 , . . . , Xn из равномерного распределения на [0; θ]получить оценки параметра θ методом моментов на основаниипервого, второго, №+2-го момента. Вычислить E(X1 + №)eX1 /№ ина этом основании получить оценку параметра θ через усреднениесоответствующей функции по выборке.2. Для той же выборки найти оценку максимального правдоподобияпараметра θ, вычислить ее математическое ожидание и исправитьее, получив несмещенную оценку.3. Генерировать реализацию выборки объема n =равномерного распределения на [0; θ], приняв θ = №.100+№ из4. Вычислить реализации всех полученных оценок. Подсчитатьабсолютные погрешности оценивания и ранжировать оценки поабсолютной погрешности.Задача 13.2Случайнаявеличинаимеетлогарифмическинормальноераспределение, если ее логарифм распределен по нормальному закону.1.
Для выборки X1 , . . . , Xn из логарифмически нормальногораспределения с параметрами a, σ получить оценки параметровметодом моментов и методом максимального правдоподобия.2. Генерировать реализацию выборки объема n = 100поформуле U1 U2 U3 /U4 , где U1 , . . . , U4 — случайные числа, равномернораспределенные на [0; 1]. Построить гистограмму, выбрав числопромежутков группирования по формуле Стеджеса.3.
По реализации выборки вычислить реализации всех полученныхоценок.4.∗Найти теоретические значения параметров. Подсчитатьабсолютные погрешности оценивания и ранжировать оценкипо абсолютной погрешности.138Глава 14Интервальное оценивание§ 14.1.Определение доверительногоинтервалаПусть имеется выборка объема n из распределения, известного с точностью~ ⊂до параметра: X= F (t, θ), θ ∈ Θ. Доверительным интервалом с уровнемдоверия γ ( γ-доверительным интервалом) для неизвестного параметраθ называют случайный интервал (θ− ; θ+ ) ⊂ Θ, построенный по выборке,который накрывает неизвестное значение параметра с вероятностью,равной γ, или по крайней мере стремящейся к γ с ростом объема выборки,то естьP{θ ∈ (θ− ; θ+ )} → γ(14.1)при n → ∞.В случае, когда вместо сходимости выполняется точное равенство,доверительный интервал называется точным.θ− , θ+ — это оценки параметра θ, называемые нижней и верхнейдоверительными границами.
Число γ ∈ (0; 1) — уровень доверия, илидоверительная вероятность, — выбирается заранее и отражает, как сказанов [7], «степень готовности мириться с возможностью ошибки»: чем менеемы готовы мириться с возможной ошибкой, тем большее (более близкое кединице) значение γ должны устанавливать.139§ 14.2.Распределения, связанныес нормальнымПри построении доверительных интервалов для параметров нормальногораспределения мы будем использовать два специальных распределения,связанных с нормальным: распределение хи-квадрат и распределениеСтьюдента.
Название «распределение Стьюдента» связано с именеманглийского статистика К. Госсета, который подписывал свои работыпсевдонимом «Стьюдент».Случайная величина Zn имеет распределение хи-квадрат с nстепенями свободы, еслиZn = X1 2 + . . . + Xn 2 ,где X1 , . . . , Xn — независимые случайные величины со стандартнымнормальным распределением. Отметим, что «число степеней свободы» —это просто традиционное название для параметра n распределения хиквадрат. Параметр n — положительное целое число. В частности, приn = 1 получаем квадрат одной случайной величины со стандартнымнормальным распределением: Z1 = X 2 , где X ⊂= N0, 1 .Будем использовать следующее обозначение: Zn ⊂= χ2n .Отметим следующие свойства распределения хи-квадрат.Следствие 14.1.
Пусть Zn ⊂= χ2n . Тогда1) EZn = n;2) Zn /n → 1 почти наверное при n → ∞.Доказательство.Во-первых,EZ1 = EX 2 = DX + (EX)2 ,где X имеет стандартное нормальное распределение, и потому EX = 0,DX = 1. Следовательно,EZ1 = 1 + 02 = 1.1) По определению распределения хи-квадрат,EZn = E(X1 2 + . . . + Xn 2 ) = EX1 2 + . . .
+ EXn 2 = nEX1 2 = n · 1 = n.1402) Так как Zn — сумма независимых одинаково распределенныхслучайных величин, то справедлив закон больших чисел Колмогорова:Zn /n =X1 2 + . . . + Xn 2→ EX1 2 = 1nпочти наверное при n → ∞. Доказательство завершено.Случайная величина Yn имеет распределение Стьюдента с nстепенями свободы, еслиXYn = p,Zn /nгде случайные величины X и Zn независимы, причем X имеет стандартноенормальное распределение, а Zn имеет распределение хи-квадрат с nстепенями свободы. Здесь, как и у распределения хи-квадрат, n — этопросто положительный целый параметр.Будем использовать следующее обозначение: Yn ⊂= Tn .Отметим следующие свойства распределения Стьюдента.Следствие 14.2.