А.И. Волковец, А.Б. Гуринович. Практикум для студентов, страница 7
Описание файла
Файл "А.И. Волковец, А.Б. Гуринович. Практикум для студентов" внутри архива находится в папке "А.И. Волковец, А.Б. Гуринович. Практикум для студентов". PDF-файл из архива "А.И. Волковец, А.Б. Гуринович. Практикум для студентов", который расположен в категории "". Всё это находится в предмете "теория вероятностей и математическая статистика" из 4 семестр, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "теория вероятности и математическая статистика" в общих файлах.
Просмотр PDF-файла онлайн
Текст 7 страницы из PDF
Независимые случайные величины X и Y имеют нулевоематематическое ожидание и единичную дисперсию. Найти коэффициенткорреляции случайных величин U = 2X + Y и V = 2X – Y.Ответ: RYZ = 0,6.11.4. В треугольник с вершинами (0, 0), (0, 4), (4, 0) наудачу ставится точка(X, Y). Вычислить M[XY] и D[X + Y].Ответ: M[XY] = 12/9, D[X + Y] = 8/9.12. ОЦЕНКА ЗАКОНА РАСПРЕДЕЛЕНИЯГенеральной совокупностью называется множество объектов, из которыхпроизводится выборка. Каждый из объектов задает фиксированное значениеслучайной величины.Выборка – множество {x1, x2, ..., xn} случайно отобранных объектов(значений) из генеральной совокупности.Объемом выборки n называется число входящих в нее объектов.Вариационным рядом называется выборка { xˆ1 , xˆ2 ,..., xˆn } , полученная врезультате расположения значений исходной выборки в порядке возрастания.Значения xˆ i называются вариантами.Эмпирическая функция распределения определяется формулой⎧0, x ≤ xˆ1;⎪i⎪*F ( x) = ⎨ , xˆi < x ≤ xˆi+1;(12.1)⎪n⎪⎩1, x > xˆn .Эмпирическая функция распределения F*(x) является наилучшей оценкойфункции распределения F(x) (несмещенной, состоятельной, эффективной).Если анализируемая СВ Х является дискретной с известным множествомзначений { x1 , x 2 , ..., x m } , то по исходной выборке объемом n определяетсястатистический ряд распределения вероятностей:х1k1xjp*где p j =*jх2k2........хmkmkj– частота появления j-го значения,nkj – число значений xj в выборке.Если анализируемая СВ Х является непрерывной, то по исходной выборкестроится интервальный статистический ряд вероятностей:jAjBjhjνjp *jf j*1A1B1h1ν1p1*f1*0MAMBMhMνMpM*fM*где j – номер интервала;M – число непересекающихся и примыкающих друг к другу интервалов,на которые разбивается диапазон значений [ xˆ1 , xˆ n ] :( )⎧int n , n ≤ 100,⎪M≈⎨(12.2)⎪⎩int ( ( 2 − 4 ) ⋅ lg ( n ) ) , n > 100,где int(x) – целая часть числа x.
Желательно, чтобы n без остатка делилось на M;Aj, Bj – левая и правая границы j-го интервала (Aj+1 = Bj), причемA1 = xˆ1 , B M = xˆ n ;hj = Bj – Aj – длина j-го интервала;νj – количество чисел в выборке, попадающих в j-й интервал;ν jp *j =– частота попадания в j-й интервал;nf =*jp*jhj=νjnh j– статистическая плотность вероятности в j-м интервале.При построении интервального статистического ряда вероятностейиспользуют следующие методы разбиения диапазона значений на интервалы:1) Равноинтервальный, т.е.
все интервалы одинаковой длины:xˆn − xˆ1, ∀j ,MAj = xˆ1 + ( j −1)h, j = 2, M .hj = h =(12.3)(12.4)2) Равновероятностный, т.е. границы интервалов выбирают так, чтобы вкаждом интервале было одинаковое число выборочных значений (необходимо,чтобы n без остатка делилось на M):νjAj =n1, p *j =∀j ,MM+ xˆ( j −1)ν +1, j = 2, M .2=ν =xˆ( j −1)ν(12.5)(12.6)Гистограмма – статистический аналог графика плотности вероятностиf ( x) СВ и она строится по интервальному статистическому ряду.Гистограммапредставляетсобойсовокупностьпрямоугольников,построенных, как на основаниях, на интервалах hj статистического ряда с**высотой, равной статистической плотности вероятности f j в соответствующеминтервале. Для равноинтервального метода все прямоугольники гистограммыимеют одинаковую ширину, а для равновероятностного метода – одинаковуюплощадь.
Сумма площадей всех прямоугольников гистограммы равна 1.Пример 12.1. Задана выборка случайной величины X: {4, 3, 3, 5, 2, 4, 3, 4,4, 5}. Построить вариационный ряд и график эмпирической функциираспределения F*(x).Решение. Вариационный ряд случайной величины имеет вид {2, 3, 3, 3, 4,4, 4, 4, 5, 5}.Определяем значения эмпирической функции распределения F*(x) поформуле (12.1):⎧ 0, x ≤ 2;⎪⎪⎪ 0 , 1, 2 < x ≤ 3;F * ( x ) = ⎨ 0, 4, 3 < x ≤ 4;⎪ 0 , 8, 4 < x ≤ 5;⎪⎪⎩ 1, x > 5 .График функции F*(x) имеет вид (рис. 12.1):F * (x )1 ,00 ,80 ,60 ,40 ,2x2345Рис.
12.1Замечание. В каждой точке оси x, соответствующей значениям xi, функцияF*(x) имеет скачок. В точке разрыва F*(x) непрерывна слева и принимаетзначение, выделенное знаком .Пример 12.2. Вариационный ряд случайной величины x имеет вид–6,237 –6,229 –5,779 –5,139 –4,950 –4,919 –4,636 –4,560 –4,530 –4,526 –4,523–4,511 –4,409 –4,336 –4,259 –4,055 –4,044 –4,006 –3,972 –3,944 –3,829 –3,794–3,716 –3,542 –3,541 –3,431 –3,406 –3,384 –3,307 –3,181 –3,148 –3,124 –3,116–2,892 –2,785 –2,734 –2,711 –2,637 –2,633 –2,428 –2,381 –2,339 –2,276 –2,222–2,167 –2,111 –2,034 –1,958 –1,854 –1,803 –1,774 –1,755 –1,745 –1,713 –1,709–1,566 –1,548 –1,480 –1,448 –1,353 –1,266 –1,229 –1,179 –1,130 –1,102 –1,060–1,046 –1,035 –0,969 –0,960 –0,903 –0,885 –0,866 –0,865 –0,774 –0,721 –0,688–0,673 –0,662 –0,626 –0,543 –0,445 –0,241 –0,174 –0,131 0,115 0,205 0,3550,577 0,591 0,795 0,986 1,068 1,099 1,195 1,540 2,008 2,160 2,5342,848.Построить гистограмму равноинтервальным и равновероятностнымметодами.Решение.
Объем выборки равен 100. Количество интервалов определяемпо формуле (12.2): M ≈ n = 100 = 10.Дляравноинтервальногометодапостроенияинтервальногостатистического ряда вероятностей величины hj, Aj, Bj рассчитаны поформулам (12.3), (12.4):j12345678910Aj–6,237–5,3345–4,426–3,5175–2,6091,7005–0,7920,11651,0251,9335Bj–5,3345–4,426–3,5175–2,609–1,7005–0,7920,11651,0251,93352,848νj391314161912644hj0,90850,90850,90850,90850,90850.90850,90850,90850,90850,9085p *jf j*0,030,090,130,140,160,190,120,060,040,040,0330,0990,1430,1540,1760,2090,1320,0660,0440,044Равноинтервальная гистограмма имеет вид (рис.
12.2):f* (x )0 ,2 00 ,1 50 ,1 00 ,0 5x-6-40-22Рис. 12.2Дляравновероятностногометодапостроенияинтервального*jстатистического ряда вероятностей величины νj, p , Aj, Bj рассчитаны поформулам (12.5), (12.6):j12345678910Aj–6,2370–4,5245–3,8865–3,1645–2,4045–1,7885–1,3085–0,9319–0,58430,6932Bj–4,5245–3,8865–3,1645–2,4045–1,7885–1,3095–0,9319–0,58430,69322,8480hiνjp *jf j*1,71250,63800,72200,76000,61600,47900,37660,34761,27752,1548101010101010101010100,10,10,10,10,10,10,10,10,10,10,05840,15670,13850,13160,16230,20860,26550,28770,07830,0464Равновероятностная гистограмма имеет вид (рис. 12.3):f*(x)0,30,20,1x-6-4-202Рис.
12.3ЗАДАЧИ12.1. Построить эмпирическую функцию распределения по вариационномуряду из примера 12.2.12.2. Построить эмпирическую функцию распределения, а такжегистограмму равноинтервальным и равновероятностным методами длявыборки, заданной вариационным рядом2,60 2,62 2,74 2,76 3,17 3,18 3,29 3,35 3,40 3,42 3,46 3,54 3,684,06 4,07 4,09 4,15 4,23 4,24 4,28 4,30 4,43 4,46 4,68 4,77 5,195,22 5,45 5,51 5,57 5,59 5,64 5,66 5,67 5,73 5,76 5,88 6,11 6,136,23 6,55 6,70 7,30 7,62 7,72 7,80 7,91 7,94 7,97 8,00 8,10 8,478,63 8,80 8,84 8,97 9,01 9,02 9,20 9,22 9,41 9,57 9,65 9,92 9,9810,02 10,07 10,16 10,24 10,27 10,38 10,62 10,63 10,73 10,96 10,98 10,99 11,0011,01 11,01 11,11 11,23 11,35 11,56 11,58 11,73 11,77 11,99 12,10 12,13 12,1812,24 12,53 12,57 12,96 12,98 13,04 13,22 13,35 13,45.12.3.
Построить равноинтервальным и равновероятностным методамиинтервальный статистический ряд вероятностей и гистограмму случайнойвеличины по следующей выборке:8,60 6,54 3,26 5,96 4,68 6,55 11,33 9,50 8,58 7,16 10,84 5,81 2,928,96 12,60 11,08 4,52 8,06 2,42 10,05 10,29 10,03 4,77 9,46 7,26 2,624,49 11,80 11,68 8,61 12,82 5,36 7,85 11,69 11,00 5,07 2,23 10,14 9,8910,53 5,10 7,27 6,94 6,53 11,08 6,61 9,27 5,83 9,56 7,51 5,98 8,645,69 10,54 10,20 12,11 2,92 12,31 5,95 2,82 7,69 4,30 11,17 6,99 12,783,64 11,80 8,61 3,80 7,42 5,09 7,68 3,98 10,59 8,40 12,76 4,37 5,889,94 10,46 2,75 4,22 11,56 10,43 3,66 10,14 6,53 10,83 5,36 6,67 4,839,66 2,30 7,04 7,88 8,30 2,22 8,71 7,79 9,82.13. ТОЧЕЧНЫЕ ОЦЕНКИ ЧИСЛОВЫХ ХАРАКТЕРИСТИКИ ПАРАМЕТРОВСтатистической оценкой Q̂ параметра Q распределения называетсяприближенное значение параметра, вычисленное по результатам эксперимента(по выборке).Точечной называется оценка, определяемая одним числом.Оценка Q̂ называется состоятельной, если при увеличении объемавыборки n она сходится по вероятности к значению параметра Q:pQˆ ⎯⎯⎯→ Q ⇒ lim( P( Qˆ − Q < ε )) = 1, ∀ε > 0 .n →∞n→∞Оценка Q̂ называется несмещенной, если ее математическое ожиданиеточно равно параметру Q для любого объема выборки:M [ Qˆ ] = Q , ∀ n .Несмещенная оценка Q̂ является эффективной, если ее дисперсияминимальна по отношению к дисперсии любой другой оценки этого параметра.Состоятельная несмещенная оценка математического ожидания,называемая выборочным средним x , вычисляется по формулеm*X1= x =nЧисловые характеристики x :nxi .∑i =1M[x ] = m X , D[x ] =(13.1)DX.nСостоятельная несмещенная оценка дисперсии равна1 n1 n 2n 22*2DX = S0 =x−x=x−()∑ i∑ i n −1 x .n − 1 i =1n − 1 i =1(13.2)2Числовые характеристики S 0 :M [ S 02 ] = D X , D [ S 02 ] =Состоятельнаяотклонения:несмещеннаяµ 4 ( x)nоценкаS0 =n−3D X2 .n ( n − 1)среднегоквадратического−S 02 .(13.3)Состоятельная оценка начального момента k-го порядка определяется поформуле1 nk(13.4)αˆ k ( x ) = ⋅ ∑ ( xi ) .n i =1Состоятельная оценка центрального момента k-го порядка равна1 nkµˆ k ( x ) = ⋅ ∑ ( xi − x ) .n i =1(13.5)Несмещенная состоятельная и эффективная оценкаслучайного события A в схеме независимых опытов Бернулли:mp * ( A) = ,nгде m – число опытов, в которых произошло событие A;n – число проведенных опытов.**Числовые характеристики p ( A) = p :M[p * ] = p ( A ) = p , D[p * ] =вероятности(13.6)p (1 − p ).nДля вычисления оценок параметров распределения чаще всегоприменяются методы моментов и максимального правдоподобия.Суть метода моментов заключается в следующем.
Пусть имеетсявыборка {x1, ..., xn} независимых значений случайной величины с известнымзаконом распределения f(x, Q1 , ..., Qm) и m неизвестными параметрами Q1, ...,Qm. Последовательность вычислений следующая:1. Вычислить значения m начальных и/или центральных теоретическихмоментовkα k ( x) = M ⎡⎣ X k ⎤⎦ ,µ k ( x ) = M ⎡ ( X − mx ) ⎤ .⎣⎦2. Определить m соответствующих выборочных начальных αˆ k ( x) и/илицентральных µˆ k ( x) моментов по формулам (13.4),( 13.5).3.
Составить и решить относительно неизвестных параметров Q1, ..., Qmсистему из m уравнений, в которых приравниваются теоретические ивыборочные моменты. Каждое уравнение имеет видα k ( x) = αˆ k ( x) илиµ ( x ) = µˆ ( x ) . Найденные корни являются оценками Qˆ , ..., Qˆ неизвестныхk1kmпараметров.Замечание. Часть уравнений может содержать начальные моменты, аоставшаяся часть – центральные.Согласно методу максимального правдоподобия оценки Qˆ1 , ..., Qˆ mполучаются из условия максимума по параметрам Q1, ..., Qm положительнойфункции правдоподобия L(x1, ..., xn, Q1, ..., Qm).Если случайная величина X непрерывна, а значения xi независимы, тоnL( x1,..., xn , Q1,..., Qm ) = ∏ f ( xi , Q1,..., Qm ).i =1Если случайная величина X дискретна и принимает независимые значенияxi с вероятностями p ( X = xi ) = pi ( xi , Q1,..., Qm ), то функция правдоподобияравнаnL( x1,..., xn , Q1,..., Qm ) = ∏ pi ( xi , Q1,..., Qm ).i =1Система уравнений согласно этому методу может записываться в двухвидах:∂ L( x1, ..., xn , Q1, ..., Qm )i = 1, 2, ..., m= 0,∂ Qiили∂ ln ( L ( x1, ..., xn , Q1, ..., Qm ) )= 0,i = 1, 2, ..., m.∂ QiНайденные корни выбранной системы уравнений являются оценкамиQˆ1 , ..., Qˆ m неизвестных параметров Q1, ..., Qm.Пример 13.1.