Аркашов Н.С. - Высшая математика. Теория вероятностей и математическая статистика (1275646), страница 16
Текст из файла (страница 16)
н.θ̃n −→ θ,(11.6)то есть P{θ̃n → θ} = 1.К следующему примеру мы будем часто возвращаться в дальнейшем.Пример11.2. (Задача о расписании автобусов). Придя наостановку, пассажир пытается оценить длительность интерваловмежду автобусами выбранного им маршрута. Он анкетирует другихпассажиров, ожидающих этот автобус, и у каждого из n пассажироввыясняет время, проведенное им на остановке, получая таким образомвыборку X1 , . . .
, Xn . Предполагается, что X1 , . . . , Xn образуют выборкуиз равномерного распределения U[0; θ] , где θ > 0 — неизвестный параметр— интервал времени между автобусами.Первый пассажир предлагает для оценки параметра θ использоватьвыборочное среднее, т. е. получить оценку в виде eθ1 = c1 X.Второй пассажир предлагает использовать самое большое времяожидания, т.
е. получить оценку в виде eθ2 = c2 X(n) .Третий пассажир предлагает сложить самое большое и самоемаленькое время ожидания: eθ3 = X(n) + X(1) .Вычислить константы c1 , c2 , обеспечивающие несмещенность оценокeθ1 , eθ2 . Проверить несмещенность оценки eθ3 . Исследовать сильнуюсостоятельность всех полученных оценок.Решение. Вычислим математическое ожидание статистики eθ1 :Eeθ1 = c1 EX = c1 EX1 = c1 θ/2.Условие несмещенности выполнено, еслиEeθ1 = c1 θ/2 = θ.Отсюда с необходимостью c1 = 2.
Итак, мы получили первуюнесмещенную оценку: eθ1 = 2X. Ее сильная состоятельность следует из103усиленного закона больших чисел: так как X → EX1 = θ/2 п. н., тоeθ1 = 2X → θ п. н. в силу непрерывности функции y(t) = 2t.Исследование оценки eθ2 значительно более трудоемко. Найдемраспределение статистики X(n) . Ее функция распределения равнаFX(n) (y) = P{X(n) < y} = P{max(X1 , . . .
, Xn ) < y} == P{n\(Xi < y)} =i=1гдеnYP(Xi < y) = F n (y),i=10, если y ≤ 0F (y) = yθ , если 0 < y ≤ θ,1, если y > θ.— функция распределения закона U[0; θ] . Дифференцируя FX(n) (y), найдемплотность распределения случайной величины X(n) :fX(n) (y) = nF n−1 (y)F ′ (y) = nF n−1 (y)f (y).Подставляя в последнее равенство функцию распределения закона U[0;и его плотность(1, если y ∈ (0, θ),f (y) = θ0, если y ∈/ [0, θ],находим плотность распределения X(n) :( n−1nyθn , если y ∈ (0, θ),fX(n) (y) =0,если y ∈/ [0, θ].θ](11.7)Для проверки несмещенности найдем математическое ожиданиеоценки:Eθ eθ = Eθ X(n) =Zθ0θn y n+1 nny n−1y n dy =θ.
=nθn+1 θn+10Отсюда следует, что оценка eθ2 = c2 eθ = c2 X(n) является несмещеннойдля параметра θ при условии c2 nθ/(n + 1) = θ. Отсюда находим c2 =(n + 1)/n. Мы получили вторую несмещенную оценку: eθ2 = (n + 1)X(n) /n.Проверим сильную состоятельность eθ2 . Согласно отмеченномусвойству сходимости почти наверное, максимум из независимых104одинаково распределенных случайных величин, имеющих на интервалеположительную плотность, сходится п. н.
к правому концу интервала:X(n) → θ п. н.Так как (n + 1)/n → 1 как числовая последовательность, то в силунепрерывности функции g(x, y) = xy имеет место сходимостьeθ2 = (n + 1)/n · X(n) → 1 · θ = θ п. н.Для доказательства несмещенности третьей оценки заметим, чтоминимум выборки X(1) распределен симметрично максимуму X(n)относительно середины отрезка θ/2, т. е. для всех t выполненоP{X(1) < t} = P{θ − X(n) < t}.ОтсюдаEX(1) = θ − EX(n) = θ/(n + 1),Eθ eθ3 = θ — оценка несмещенная.В силу той же симметрии получаем, что X(1) → 0 п.
н., и в силунепрерывности функции g(x, y) = x + y имеет место сходимость eθ3 → θп. н.§ 11.5.Оценки методом моментовНаиболее распространенными методами нахождения оценок являютсяметод моментов и метод максимального правдоподобия.Метод моментов (одномерный случай)Пусть θ ∈ Θ - одномерный параметр, и g : R −→ R некоторая~ = (X1 , X2 , ..., Xn ) можночисловая функция. Тогда по данной выборке X~построить выборку g(X) = (g(X1 ), g(X2 ), ..., g(Xn )). Обозначимng(X) =1Xg(Xi )n i=1выборочное среднее этой выборки.
С другой стороны, можно найти~ :теоретическое среднее выборки g(X)mg (θ) = Eg(Xi ).105Определение 11.1. Оценкой метода моментов (ОММ) называетсятакое значение θ∗g = θ∗g (X), при котором теоретическое среднее выборкиg(X) совпадает с выборочным средним:mg (θ∗g ) = g(X),(11.8)то есть ОММ является решением уравнения (11.8) относительнонеизвестного θ∗g .Если при этом оказывается, что функция mg (θ) непрерывна и строгомонотонна, то для нее существует обратная m−1g , и ОММ имеет вид:θ∗g (X) = m−1g (g(X)).В качестве функции g чаще всего выбирают степенные функции:g(x) = xk , где k = 1, 2, ...
. В этом случае теоретическое среднее выборки~g(X)совпадает с теоретическим моментом соответствующего порядка,например, если g(X) = x, то mg (θ) = EXi = α1 (θ); если g(X) = x2 , тоmg (θ) = EXi2 = α2 (θ), и т.д. При этом уравнение (11.8) для нахожденияОММ приобретает вид:αk (θ∗ ) = X k .(11.9)Оценка по методу моментов в этом случае называется оценкой по kтому моменту и обозначается θ∗kОтметим, что если функция mg (θ) = Eg(X1 ) непрерывна и строгомонотонна, то оценка по методу моментов θ∗g (X) = m−1g (g(X)) сильносостоятельна.Метод моментов (многомерный случай)~ ⊂Пусть X= Fθ , где параметр θ ∈ Θ, подлежащий оцениванию,— многомерный.
Рассмотрим для простоты двумерный случай, то естьθ = (θ1 , θ2 ). Тогда для однозначного нахождения двух неизвестныхθ1 , θ2 одного уравнения (11.8) (или (11.9)) недостаточно. Оценкой методамоментов в этом случае называется решение (θ∗1 , θ∗2 ) системы уравненийвида:(mg1 (θ1 , θ2 ) = g1 (X),(11.10)mg2 (θ1 , θ2 ) = g2 (X).В качестве функций g1 , g2 можно выбрать, как и раньше, степенныефункции gi (x) = xk , где k = 1, 2, ... . Тогда уравнения системы(11.10) получаются как результат приравнивания эмпирических моментов106~ соответствующим теоретическим. Например, приравниваявыборки Xпервые два момента, получим систему:(α1 (θ1 , θ2 ) = X,(11.11)α2 (θ1 , θ2 ) = X 2 .Как и раньше, вместо вторых моментов можно приравнивать дисперсии.§ 11.6.Решение типовых примеровПример11.3.
По данной реализации выборки~x=(3, 8, 6, 4, 6, 1, 5, 4, 9, 4) построить реализацию вариационного ряда,графикиреализацийэмпирическойфункциираспределенияигистограммы. Число интервалов для построения гистограммы выбратьпо формуле Стеджеса.Решение. Реализацию вариационного ряда образуем из элементовданной реализации выборки, расположив их в порядке возрастания:1, 3, 4, 4, 4, 5, 6, 6, 8, 9.(11.12)Объем выборки n = 10. График реализации эмпирической функциираспределения строим с помощью полученной реализации вариационногоряда: это ступенчатая функция со скачками в точках вариационного ряда,принимающая значение 0 в промежутке (−∞, 1] и имеющая скачки вточках x(i) , равные частоте элемента x(i) .
Например, скачок в точке x(1) =111 равен 10, скачок в точке x(2) = 3 равен 10и т.д. График реализацииэмпирической функции распределения изображен на рис.11.4Расчитаем число промежутков по формуле Стеджеса: K = [log2 10] +1 = 3 + 1 = 4. Размах выборки равен 9 − 1 = 8, шаг гистограммы h = 8/4 =2. Разобьем отрезок [1; 9] на промежутки длины h = 2:∆1 = [1; 3); ∆2 = [3; 5); ∆3 = [5; 7); ∆4 = [7; 9].Число элементов выборки, попавших в интервал ∆1 , равноАналогично находим:ν1 = 1.ν2 = 4; ν3 = 3; ν4 = 2.Вычисляя значения функции fn∗ (t) =∆k , строим гистограмму (рис.11.5):νknh , t107∈ ∆k на каждом из интерваловFn∗ (t)619108106105102101100uu56u1uu34uu-89Рис.
11.4: Эмпирическая функция распределения Fn∗ (t).~ ⊂Пример 11.4. Пусть X= Πλ ,где λ > 0 — неизвестныйпараметр. Найти оценки параметра λ по а) первому и б) второмумоментам.Решение. а) Так как для распределения Пуассона EXi = λ, то λ∗1получается сразу из равенств (11.8) или (11.9): заменяя λ на λ∗1 , а EXi наX, получаем λ∗1 = X.б) В этом случае вычисляем второй момент распределения Пуассона:EXi2 = (EXi )2 + DXi = λ + λ2 .Приравнивая эту функцию второму выборочному моменту и заменяяλ на λ∗2 , получим уравнение:λ∗2 + (λ∗2 )2 = X 2 ,из которого находим λ∗2 :λ∗21=− ±2r1081+ X 2.4tfn∗ (t)641012003101101210-3579 tРис.
11.5: Гистограмма fn∗ (t).Так как λ∗2 > 0, то из двух решений выбираем одно — положительное, иОММ имеет вид:r11∗λ2 (X) = − ++ X 2.24Замечание 11.1. Из двух найденных оценок λ∗1 представляетсяпредпочтительней. Во-первых, она несмещенная, так какnEλ λ∗1 = Eλn1X1X1Xi =Eλ Xi = nλ = λ;n i=1n i=1nво-вторых, она состоятельная в силу усиленного закона больших чисел(УЗБЧ).В то же время, оценка λ∗2 менее удобна для исследования, хотяона является состоятельной (проверьте, используя УЗБЧ). Например,исследовать для нее свойство несмещенности — технически труднаязадача.~ ⊂Пример 11.5.
Пусть X= U[θ1 ; θ2 ] ,неизвестные параметры. Найти ОММ.где −∞ < θ1 < θ2 < ∞ —Решение. Вычислим моменты первых двух порядков равномерногораспределенияθ1 + θ2α1 (θ1 , θ2 ) = EXi =,2(θ2 − θ1 )2DXi =.12109Составим систему уравнений, приравнивая теоретическиеэмпирические математическое ожидание и дисперсию:(((θ1 +θ2= X,EX1 = X,θ1 + θ2 = 2X,2√⇐⇒ (θ2 −θ1 )2⇐⇒2DX1 = S 2 ,θ2 − θ1 = 12S.=S,12иРешая последнюю систему относительно неизвестных θ1 , θ2 (вычитая искладывая уравнения системы), получим оценки ММ:√√θ∗1 = X − 3S, θ∗2 = X + 3S.§ 11.7.Задачи для самостоятельного решения11.1 По данной реализации выборки x = (0, 0, 1, 1, 0, 0, 0, 0, 0, 1):а) построить графики эмпирической функции распределения игистограммы;б) вычислить выборочные среднее и дисперсию.11.2 Проводились опыты с бросанием одновременно 12 игральных костей.Наблюдаемую случайную величину X считали равной числу костей, накоторых выпало не больше трех очков.