М.А. Маталыцкий, Т.В. Русилко - Теория вероятностей и математическая статистика (1115300), страница 19
Текст из файла (страница 19)
Гистограмма является статистическим аналогом кривой распределения (кривой плотности распределения pξ (x) ), наблюдаемой случайной величины ξ . При большомобъеме выборки и достаточно маломс вероятностью, близкой к 1,можно считать кривую распределения и гистограмму приблизительно совпадающими.Весьма важным является понятие эмпирической функции распределения.Эмпирической функцией распределения называется функция, определяющая для каждого значения x относительную час, то естьтоту событияКроме того, площадь каждого прямоугольника,nF <(xx)ξ∆/ nn ( ) =xгде n x – накопленная частота, равная числу вариант меньших, чемx , – объем выборки.является статистическим аналогом функции расФункцияпределения Fξ (x) генеральной совокупности. Функцию распределения генеральной совокупности Fξ (x) в математической статистикеназывают теоретической функцией распределения.
Различие междуэмпирической и теоретической функциями распределения состоит в– оттом, что Fξ (x) определяет вероятность события ξ < x , аносительную частоту этого события, в силу закона больших чиселPFn (x ) →Fξ (x) .n →∞Функция Fn (x ) обладает всеми свойствами функции распределения:1. 0 ≤ Fn ( x) ≤ 1 ;2. Fn (x ) – неубывающая функция;3. Fn ( x) = 0 при x ≤ x min , Fn ( x) = 1 при x > x max .Кумулятивная кривая (кумулята) – ломаная, соединяющая точки с координатами ( xi , n xi ), где n xi – накопленные частоты; для интервального ряда n xi – число вариант меньших значений вариантинтервала J i .127Итак, эмпирическая функция распределения и кумулята служатдля оценки вида теоретической функции распределения дискретногои непрерывного признаков, полигон и гистограмма – для оценки видатеоретической кривой распределения.Пример 11.1.
В течение суток измеряют напряжение тока в электросети в вольтах. В результате опыта получена выборка X объемаn = 30 :107108110109110111109110111107108109110108107111109111111110109112113110106110109110108112Построить:1) статистический ряд данной выборки,2) полигон,3) эмпирическую функцию распределения.Решение.1) Для построения статистического ряда различные значенияпризнака располагаем в порядке их возрастания и под каждым из этихзначений записываем его частоту2) Построим полигон этого распределения.ni87654321106107108109Рис.
81281101111121133) Построим эмпирическую функцию распределения. Наименьшая варианта x min = 106 , значит, Fn ( x) = 0 при x ≤ 106 . Пусть106 < x ≤ 107 , меньше таких x только106, это значение наблюда-1при 106 < x ≤ 107 . Пусть30107 < x ≤ 108 , меньше значения x , удовлетворяющего этому интер-лось 1 раз, следовательно, Fn ( x) =и x 2 = 107 , n1 + n 2 = 1 + 3 = 4 , следовательно,валу42при 107 < x ≤ 108 . Аналогично находим Fn (x) на=30 15остальных интервалах. Убеждаемся, что действительно Fn ( x) = 1 приFn ( x) =x > x max = 113 .x1 = 1060 при x ≤ 106,0 при x ≤ 106,°1°1при106<x≤107,°при 106 < x ≤ 107,°° 3030142°° (1 + 3) ==при 107 < x ≤ 108,° 2 при 107 < x ≤ 108,° 3030 15°15°184°4(4+4)==при108<x≤109,°30 15° при 108 < x ≤ 109,° 301147°°15° (8 + 6) =7=при 109 < x ≤ 110,Fn ( x) = ® 30= ® при 109 < x ≤ 110,30 1515°1°22 11° 30 (14 + 8) = 30 = 15 при 110 < x ≤ 111, °11 при 110 < x ≤ 111,°1°15° (22 + 5) = 27 при 111 < x ≤ 112,° 27при 111 < x ≤ 112,30° 30°29°1° 30° 30 (27 + 2) = 30 при 112 < x ≤ 113,° 29 при 112 < x ≤ 113,°1° 30° (29 + 1) = 1 при x > 113;°¯1 при x > 113.¯ 30Построим график эмпирической функции распределения.129112106 107 108 109 110 111 112 113Рис.
9Пример 11.2. В таблице приведены значения промежутков времени τ (в минутах) между вызовами такси в городе Гродно.Построить по этим данным:1) интервальный вариационный ряд;2) полигон;3) гистограмму;4) эмпирическую функцию распределения.Решение.1) По условию объем выборки n = 50 . Определим оптимальнуюдлину частичного интервала с помощью формулы Стерджеса:xmax − xminx − xmin0,702 − 0= max=≈ 0,106 .s1 + 3,322 lg n 1 + 3,322 lg 50За начало первого интервала можно выбрать величину xнач = xmin − ∆ / 3(или xнач = xmin − ∆ / 2 ), при этом первый интервал должен покрывать xmin , а последний – xmax . В данном случае xнач = 0 − 0,106 / 3 == −0,035 . Сгруппированный ряд представим в виде таблицы 2, где ni –число вариант, принадлежащих i -му интервалу.∆=130Таблица 2НакоНакопл.2) Согласно определениюОтноси- полигон имеет следующий вид:iИнтервалыxi − xi +1Часто-13та12ni 11Сереniдиныинтерваловтельнаячастотаnin∆пленнаячастотачастостьwiнак =nxixi∗nwi = in0,0180,262,45130,260,1240,242,26250,500,2300,181,70340,680,3360,121,13400,800,4420,121,13460,92n xi1-0,035 – 0,07120,071 – 0,17730,177 – 0,28340,283 – 0,38950,389 – 0,49560,495 – 0,60110913812 79 65646 32 20,5480,040,38480,9670,601– 0,7072 10,6540,040,3850150– 0,124 0,23010,0180,336– 0,442 –0,548 0,654–¦nРис.
10131xi3) Построим гистограмму.nin∆2,452,261,701,130,38-0,0350,071 0,177 0,283 0,389 0,495 0,601 0,707xiРис. 114) В данном случае исследуется интервальный вариационный ряд,для непрерывно распределенного случайного признака τ . Эмпирическую функцию распределения находим таким же способом, как и в примере 11.1.
Однако, учитывая, что теоретическая функция распределенияявляется функцией распределения непрерывной случайной ве-личины, ее эмпирическое приближение можем определить лишь наконцах интервалов. Для графического изображения этой функции целесообразно ее доопределить, соединив точки графика, соответствующие концам интервалов, отрезками прямой. В результате полученнаяломанная совпадет с кумулятой. В последней графе таблицы 2 приведены значения функции распределения на концах интервалов:, Fn (0,071) = 0,26 , Fn (0,177) = 0,5 , Fn (0,283) = 0,68 ,Fn (0,389) = 0,8 , Fn (0,495) = 0,92 , Fn (0,601) = 0,96 , Fn (0,707) = 1 .132Построим график Fn (x ) .Fn (x)10,920, 80,680,50,26-0,035 0,071 0,177 0,283 0,389 0,495 0,601 0,707Рис.
12Анализируя полученные результаты, можем предположить, интервалы времени между поступлениями вызовов такси распределены по показательному закону, так как полученная гистограмма схожас кривой показательного распределения, график Fn (x) также схож сфункцией показательного распределения.Задачи11.1. На телефонной станции производились наблюдения за числом неправильных соединений в минуту. Наблюдения в течение часадали следующие результаты:313421132720121403020213312032020434202011223414201011011155Построить дискретный вариационный ряд, полигон, эмпирическуюфункцию распределения.13311.2.
Пятьдесят наблюдений за жирностью молока дали следующие результаты в %:Построить по этим данным интервальный вариационный ряд с равными интервалами. Построить полигон, гистограмму и эмпирическую функцию распределения.11.3. Данные ежедневных измерений температуры в течениемесяца представлены в таблице:Построить по этим данным интервальный вариационный ряд с равными интервалами. Построить полигон, гистограмму и эмпирическую функцию распределения.11.4. Ошибки 40 измерений приведены в таблицеПостроить по этим данным интервальный вариационный ряд с равными интервалами. Построить полигон, гистограмму и эмпирическую функцию распределения.11.5.
При сверлении отверстий одним и тем же сверлом и последующем измерении диаметров получены следующие данные (в мм.):134Построить по этим данным интервальный вариационный ряд с равными интервалами. Построить полигон, гистограмму и эмпирическую функцию распределения.11.6. В ОТК завода была измерена глубина паза ста плашек ирезультаты приведены в следующей таблице (в мм.):).")"." .4.N"3") 3.)."?)"?"*>.)."?)?">).. "*AN" A*).. "AN"" 4*"3" >?.)."3))."3" 3">"A">** ">"* ")N."4?>).
"**"? N."4 )."?"*3N."3AA"). "*)" ). ."*."3."3) ).N."*.") 3N").).". "4AN.".).4*. ". 3A"4A"). "3). "**"AN."*>>). "*?"* . " 4?)."3"*)N.". ) A">). "*.. "4A"* ). .")*"> ).. "")>*)")."?)."3??N."3>4" ?A") ). N"3? ).. ""4"*N">.)." "3*) ")N."A).>?"*) ">. "* ).? "*">N."*A).">")*. "A>*">).
"*3. ">>>"*). "*)*)"3"3")")">")")">"N.)."?")3. . ")).)"* . ". *.). "*) . ". >4). "* . ". A*). "*. "?34 ). ."*3" 3> ).. ""334*)этимвариацион"4" .данным"*4"3по).A"*?"*3).. ")">.")).". ."*4)ПостроитьN.".).>4N."*A" . .).")"*?.вариационный"34 ")). "*A. "*>3"* ). ряд,N. "."4дискретный)>и эмпирическую"3N."*3>">. "полигон"3")функцию">).3*"*?Построить).
"*?). "*>N"?.)." "*A*ный". "ряд.4>).">"*3N.")>>N."?3"> ). ."*" A4 ).. "*34>распределения.11.7. Ошибки при округлении чисел заданы в таблице:"3"3). " A "> ). "* "3 ). "*")).")" 4 ">). " A "> ). " ? "3 ). "*>">")")""*">">"3"?"A"?"3">")">")"A")">")">")"?"3"*"*")Построить по этим данным интервальный вариационный ряд с равными интервалами.
Построить полигон, гистограмму и эмпирическую функцию распределения.13511.8. В таблице приведены данные исследований срока работыэлектрических лампочек (в годах):Построить по этим данным интервальный вариационный ряд с равными интервалами. Построить полигон, гистограмму и эмпирическую функцию распределения.11.9. Время ожидания водителем зеленого света на перекресткепредставлено случайной выборкой (в мин):Построить по этим данным интервальный вариационный ряд с равными интервалами.