Книга - Теория вероятности и математическая статистика (1082418), страница 10
Текст из файла (страница 10)
Получены следующие результаты (тыс. км.):3,0; 25,0; 18,6; 12,1; 10,6; 18,0; 17,3; 29,1; 20,0; 18,3; 21,5; 26,7; 12,2; 14,4; 7,3; 9,1;2,9; 5,4; 40,1; 16,8; 11,2; 9,9; 25,3; 4,2; 29,6.Составить интервальный ряд. Решение. Очевидно, что величина среднего пробега автомобилей, находящихсяв эксплуатации в течение двух лет, является непрерывной случайной величиной. Полученные данные представляют собой выборку из n = 25 наблюдений. Найдем сначала минимальное и максимальное значения случайной величины (т.е.
крайние члены вариацион-ется относительной частотой варианты и обозначается pi∗ =50ногоряда):∗nX min = 2,9иX max = 40,1 .Размахварьированиябудетравен∗1R = X − X = 40 ,1 − 2,9 = 37 ,2 .Возьмем число частичных интервалов l = 6 . В этом случае длина частичного интервала равнаR X ∗ − X 1∗ 37 ,2== 6,2 .h= = nn6nСоответствующий интервальный ряд приведен в таблице 7.1.Таблица 7.1Номеринтервалаi123456Средний пробег автомобилей(интервалы)xi < X ≤ xi +12,9 — 9,19,1 — 15,315,3 — 21,521,5 — 27,727,7 — 33,933,9 — 40,1Частотаni667321Относительная частотаnpi∗ = in0,240,240,280,120,080,04zПример 2. Наблюдается число выигрышей в мгновенной лотерее.
В результате наблюдения получены следующие значения выигрышей (тыс. руб.):0, 1, 0, 0, 5, 0, 10, 0, 1, 0, 0, 1, 5, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 5, 0, 5, 0, 0, 1, 1, 1, 5, 10, 0,1, 1, 0, 5, 0, 0, 0, 0, 1, 0, 1, 0, 5, 0, 0, 0, 0, 1, 0.Требуется составить статистический ряд случайной величины X — выигрыша вмгновенной лотерее. Решение. Случайная величина X принимает 4 различных значения: 0, 1, 5 и 10.Для каждого значения подсчитаем частоту и относительную частоту. Результаты задачипредставим в таблице 7.2.Таблица 7.21234Выигрыш в мгновенной лотерееiZi01510Частотаni31147231/547/277/541/27z№pОтносительная частота∗i§3. Эмпирическая функция распределенияПо статистическом ряду, приведенному в таблице 7.3,Таблица 7.3№1Z12Z2……Варианты Z iОтносительнаяnnp1∗ = 1p 2∗ = 2…частота pi∗nnможно построить эмпирическую (выборочную) функцию распределения.51LZLp1∗ =nLnОпределение.
Эмпирической (выборочной) функцией распределения называется функция F ∗ ( x ) , задающая для каждого значения x относительную частоту событияX < x.Следовательно, по определениюnF ∗ (x ) = x ,(7.3.1)nгде n x — число элементов выборки, значения которых меньше x .Очевидно, что для нахождения функции распределения можно использовать формулуF ∗ ( x ) = ∑ p i∗ .(7.3.2)Zi < xЭмпирическую функцию распределения можно задать таблично или графически.Построим эмпирическую функцию распределения по данным, приведенным в таблице 7.2.Объем выборки по условию примера n = 54 .
Наименьшая варианта равна 0, следовательно, n x = 0 при x ≤ 0 . Тогда F ∗ ( x ) = 0 / 54 = 0 при x ≤ 0 . Если 0 < x ≤ 1 , то неравенство X < x выполняется для варианты z1 = 0 , которая встречается 31 раз, поэтому n x = 31и F ∗ ( x ) = 31 / 54 . Если 1 < x ≤ 5 , то неравенство X < x выполняется для вариант z1 = 0 иz 2 = 1 , которые встречаются 31 и 14 раз соответственно, поэтому, n x = 31 + 14 = 45 ,F ∗ (x ) = 45 / 54 и т.д. Результаты вычисления F ∗ ( x ) приведем в таблице 7.4Таблица 7.4F ∗ (x )xx≤00 < x ≤10F ∗ ( x ) = p1∗ =315431 + 14 45=545431 + 14 + 7 52F ∗ ( x ) = p1∗ + p 2∗ + p3∗ ==5 < x ≤ 10545431 + 14 + 7 + 2F ∗ ( x ) = p1∗ + p 2∗ + p3∗ + p 4∗ ==1x > 1054График этой функции приведен на рис.
7.1.1< x ≤ 5F ∗ (x ) = p1∗ + p 2∗ =52В случае интервального ряда значения эмпирической функции F ∗ ( x ) подсчитывают на концах частичных интервалов.Эмпирическая функция F ∗ ( x ) применяется для оценивания теоретической функции распределения генеральной совокупности.§4. Полигон и гистограммаОпределение. Полигоном частот (многоугольником распределения) называетсяломаная линия, проходящая через точки с координатами (Z i , ni ) , где Z i — варианты ста-тистического ряда, а ni — соответствующие им частоты.Если ломаная линия строится по точкам (Z i , pi∗ ) , где pi∗ — относительные частоты, то получаем полигон относительных частот.Построим полигон относительных частот для выборки из примера 2.
Используястатистический ряд, представленный в таблице 7.2, получаем полигон относительных частот, изображенный на рис. 7.2.В случае непрерывной случайной величины выборку преобразуют следующим образом. Всю ось абсцисс делят на интервалы (xi , xi +1 ) длины Δ i = xi +1 − xi и определяютфункцию f ∗ ( x ) , которая на i -м интервале принимает значение53np ∗ (x )= i ,ΔinΔ iгде ni — число элементов выборки, попавших в интервал.f ∗ (x ) =(7.4.1)Определение.
Функция f ∗ ( x ) , определенная соотношением (7.4.1), называетсягистограммой.Гистограмма является выборочной оценкой плотности вероятности.Построим гистограмму по данным, приведенным в примере 1. Длина каждого инnтервала равна Δ i = 6,2 . Подсчитаем значения i :nΔ ixi < X ≤ xi +1ninΔ i2,9 — 9,19,1 — 15,315,3—21,521,5—27,727,7—33,933,9—40,10,0387100,0387100,0451610,0193550,0129030,006452На рис.
7.3 представлена гистограмма примера 1.Графическое изображение статистических рядов в виде полигона и гистограммыпозволяет получить первоначальное представление о закономерностях, имеющих место всовокупности наблюдений.54Глава 8. Статистическое оценивание§1. Точечные оценки. Выборочная средняя и выборочная дисперсияПусть θ — некоторый параметр закона распределения генеральной совокупности.Определение. Точечной оценкой θ n* параметра θ называется произвольная функ-ция θ n∗ ( X 1 , ..., X n ) случайной выборки X 1 , ..., X n .Статическая оценка является случайной величиной и меняется в зависимости отвыборки.
Опишем свойства, которым должна удовлетворять оценка θ n* .Определение. Оценка θ n∗ называется несмещенной, если ее математическое ожидание равно оцениваемому параметру, т.е.M θ n* = θ .(8.1.1)( )Определение. Оценка θ n∗ называется состоятельной, если с ростом объема выборкиона сходится к оцениваемому параметру. Можно рассматривать сходимость различныхтипов: по вероятности, с вероятностью равной единице, в среднем квадратичном и т.д.Как правило, рассматривается сходимость по вероятности, т.е. состоятельной называетсяоценка θ n∗ , которая для каждого ε > 0 при всех возможных значениях неизвестного пара-метра θ удовлетворяет соотношениюlim Ρ θ n∗ − θ > ε = 0 .n→∞{}(8.1.2)Определение.
Несмещенная оценка θ n∗ называется эффективной, если она имеетнаименьшую дисперсию среди всех возможных несмещенных оценок параметра θ , вычисленных по случайным выборкам одного и того же объема.Если оценка не является несмещенной, то она будет либо завышать значение θ ,либо занижать его. В обоих случаях это приводит к систематическим ошибкам одногознака в оценке параметра θ . Состоятельность оценки обосновывает увеличение объемаслучайной выборки, так как при этом становится менее вероятной возможность большойошибки в оценке параметра θ .Замечание. В дальнейшем вместо обозначения θ n∗ будем использовать θ ∗ .Определение.
Выборочной средней называется среднее арифметическое полученных по выборке значений1 n(8.1.3)m∗ = ∑ X i .n i =1Определение. Вторым выборочным моментом называется среднее арифметическое квадратов, полученных по выборке значений1 n(8.1.4)m 2∗ = ∑ X i2 .n i =1Определение. Выборочной дисперсией называется среднее арифметическое квадратов отклонений значений в случайной выборке от выборочной средней∗221 nσ 2 = ∑ X i − m ∗ = m2∗ − m ∗ .(8.1.5)n i =1Определение.
Исправленной выборочной дисперсией называется произведениеnвыборочной дисперсии на величину, т.е.n −1()( )55()∗21 nnσ2 =X i − m∗ .(8.1.6)∑n −1n − 1 i =1Пример 1. Проверить, является ли второй выборочный момент m2∗ несмещеннойоценкой второго теоретического момента. Решение. Найдем математическое ожидание оценки m 2* .111 nM m2∗ = M X 12 + X 22 + ...
+ X n2 = MX 12 + MX 22 + ... + MX n2 = ∑ m2 = m2 .znnn i =1∗S2 =( )()()Пример 2. Проверить, является ли оценка σ 2* несмещенной. Решение.2⎞2 ⎞⎛1 n⎛1 nMσ 2* = M ⎜ ∑ X i − m ∗ ⎟ = M ⎜ ∑ X i2 − 2m ∗ X i + m ∗ ⎟ =⎝ n i =1⎠⎝ n i =1⎠(()( )= m2 −2 nM m∗ X i + M m∗∑n i =1= m2 −1n2n∑M Xi =1()2i−1n22= m2 −∑ M (Xi2n2( ))∑∑ M (X i X j ) +ni =1 j =1X j ) = m2 −i, ji≠ jn1n2∑∑ M (Xnni =1 j =1iX j )=1n −1 2 n −1 2σ ≠ σ 2.m2 −m =nnnТаким образом, σ 2* является смещенной оценкой дисперсии σ 2 . Очевидно, что∗S 2 будет уже несмещенной оценкой дисперсии σ 2 . z§2. Метод моментовПусть имеется выборка X 1 ,..., X n , произведенная из генеральной совокупности стеоретической функцией распределения F (x ) , зависящей от k параметров θ1 ,..., θ k , которые нужно оценить. Зная функцию распределения, можно найти первые k теоретическихмоментов, которые будут зависеть от параметров θ1 ,..., θ k :⎧m1 = MX = m1 (θ1 ,..., θ k ) ,⎪2⎪m2 = MX = m2 (θ1 ,..., θ k ) ,⎨...⎪k⎪m = MX = m (θ ,..., θ ),k1k⎩ k(8.2.1)где X — случайная величина, имеющая функцию распределения F ( x ) .Метод моментов состоит в том, что в системе (8.2.1) при большом объёме выборкиn теоретические моменты m1 ,..., mk заменяются на выборочные m1∗ ,..., mk∗ , а затем, решаяэту систему относительно θ1 ,..., θ k , находят оценки неизвестных параметров.
Таким образом, в методе моментов оценки θ1∗ ,..., θ k∗ неизвестных параметров θ1 ,..., θ k определяютсяиз системы уравнений⎧m1∗ = m1 (θ1∗ ,...,θ k∗ ) ,⎪ ∗∗∗⎪m2 = m2 (θ1 ,...,θ k ) ,(8.2.2)⎨...⎪⎪m ∗ = m (θ ∗ ,...,θ ∗ ).k1k⎩ kМетод моментов был предложен в 1894 г. К. Пирсоном. Оценки, полученные методом моментов, как правило, являются состоятельными.56Пример 3. Выборка X 1 ,..., X n произведена из генеральной совокупности с теоретической функцией распределения, имеющей плотность показательного законаp ( x ) = p (x ,θ ) = θ e −θ x ( x ≥ 0).Найти оценку параметра θ . Решение. Математическое ожидание случайной величины X , имеющей плотность показательного закона, задаётся формулой∞∞1m1 = MX = ∫ xp( x )dx = ∫ xθ e −θx dx = .00θИспользуя систему (8.2.2), получаем m1∗ =Откуда окончательно получаем θ ∗ =1θ∗.1.zm∗§3.
Метод максимального правдоподобияМетод максимального правдоподобия является наиболее распространеннымметодом нахождения оценок. Метод максимального правдоподобия опирается на использование условий экстремума функций одной или нескольких случайных величин. В качестве такой функции используется функция правдоподобия.Определение. Функцией правдоподобия называется функцияL( X 1 ,... , X n ) = L( X 1 ,... , X n ;θ ) = P( X 1 ;θ ) ⋅ ⋅ ⋅ P( X n ;θ )(8.3.1)в дискретном случае иL( X 1 ,... , X n ) = L( X 1 ,...
, X n ;θ ) = p ( X 1 ;θ ) ⋅ ⋅ ⋅ p ( X n ;θ )(8.3.2)в непрерывном случае.В функции правдоподобия L( X 1 ,... , X n ;θ ) элементы выборки X 1 , ... , X n являютсяфиксированными параметрами, а θ — аргументом.Определение. Оценкой максимального правдоподобия называется такое θ ∗ , длякоторого(8.3.3)L (X 1 , ... , X n ;θ ∗ ) = max L( X 1 , ... , X n ;θ ) .θПоскольку L и ln(L ) принимают максимум при одном и том же значении аргумента θ , то при практической реализации метода максимального правдоподобия удобно использовать не саму функцию правдоподобия, а ее логарифм.Определение.