В.Е. Гмурман - Руководство к решению задач по теории вероятностей и математической статистике (1115340), страница 26
Текст из файла (страница 26)
По определению коэффициента корреляции,где|ixif = Л1 [[Х-М (X)] [Y-M (У)]).(•)Найдем математическое ожидание К:М (К) = Л1 laX+b] =аМ (Х) + Ь.(••)Подставив (••) в (•), после элементарных преобразований получимlixy^^aM IX—М (Х)]^=-аО(Х)=^ао1.Учитывая, чтоY—M(Y)=-(aX+b)—(aM(X)+b)^alX—M(X)lнайдем дисперсию Y:D(Y)^M[Y—M(Y)]^==a^MlX—M{X)]^=a^(^x'Отсюда Оу = \а\Ох' Следовательно, коэффициент корреляции""v а^УОх(\а\Ох)ТаТ*Если а > О, то Гху^\\ если а < О, то Гху = — 1.Итак, \Гху\^=х\^ что и требовалось доказать.Часть третьяЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИГлава девятаяВЫБОРОЧНЫЙ МЕТОД§ 1 .
Статистическое распределение выборкиПусть для изучения количественного (дискретного или непрерывного) признака X из генеральной совокупности извлечена выборкаJCi, .V2, . . . , Xk объема /г. Наблюдавшиеся значения xi признака Xназывают вариантами, а последовательность вариант, записанныхв возрастающем порядке,—вариационным рядом,Статиспхическим распределением выборки называют переченьвариант xi вариационного ряда и соответствующих им частот п/(сумма всех частот равна объему выборки п) или относительных частот Wi (сумма всех относительных частот равна единице).Статистическое распределение выборки можно задать также в видепоследовательности интервалов и соответствующих им частот (в качестве частоты интервала принимают сумму частот вариант, попавшихв этот интервал).439, Выборка задана в виде распределения частот:X,.257AZ;136Найти распределение относительных частот.Р е ш е н и е .
Найдем объем выборки; /г = 1-{-3 + 6 = Ю. Найдемотносительные частоты:и>1== 1/10 = 0,1;м;2 = 3/10 = 0,3;ш.,=6/10 = 0,6.Напишем искомое распределение относительных частот:Xi 2 Ъ 7Wi 0,1 0,3 0,6К о н т р о л ь : 0,1+0.3 + 0,6=1.440. Выборка задана в виде распределения частот:X,. 4 7 8 12п,. 5 2 3 10Найти распределение относительных частот.151§ 2. Эмпирическая функция распределенияЭмпирической функцией распределения (функцией распределениявыборки) называют функцию F** (х), определяющую для каждого значения X относительную частоту события X < х:F*(x)==njn,где Пх — число вариант, меньших х\ п—объем выборки.Эмпирическая функция обладает следующими свойствами.С в о й с т в о 1.
Значения эмпирической функции принадлежатотрезку (0; 1].С в о й с т в о 2. /•• (х) — неубывающая функция.С в о й с т в о 3. Если Xi—найменыиая варианта, а х/^ — наибольшая, то F*(jc)=0 при x^Xiи F*(jr) = l при х > х^,441. Найти эмпирическую функцию по данному распределению выборки:л:, 1 4 6п^ 10 15 25Р е ш е н и е . Найдем объем выборки: п = 10 +15-{-25 = 50.Наименьшая варианта равна единице, поэтому F^(jc)==0 прих< 1.Значение X < 4, а именно X i = l , наблюдалось 10 раз, следовательно, f*(x) = 10/50 = 0 , 2 при I < j c < 4 .Значения jc < 6, а именно: jci=»l и Ха = 4, наблюдались 104-15=25 раз; следоI • I »вательно, F* (JC) =25/50 = 0 , 5/0.50Л\I<JНIIНРис.
11IприIjТаккак дг = 6—наибольшая варианта, то F*(х)== 1 при JC > 6.Напишем искомую эмпирическую функцию:О приД^^1,0,2 при 1 < л г < 4 ,F^(x).0.5 при 4 < JC < ; 6VI приX > 6.!IIL6,X4 < ДГ<6.График этой функции изображен на рис. 11.442. Найти эмпирическую функцию по данному распределению выборки:а) л:, 2 5 7 8б) д:,. 4 7 8п,. 1 3 2 4п^ 5 2 3§ 3.
Полигон и гистограммал. Дискретное распределение признака X. Полигоном частотназывают ломаггую, отрезки которой соединяют точки (дгх, п{)щ (х%, п^,. . . . (jC)^,/1^)» где Xi—варианты выборки и /i/—соответствующие имчастоты.1S2Полигоном относительных частот называют ломаную, отрезкикоторой соединяют точки (xi\ Wi), (хг\ w^), . .
. , (х^\ w^), где Х( —варианты выборки и ш/—соответствующие им относительные частоты.Б. Непрерывное распределение признака X, При непрерывномраспределении признака весь интервал, в котором заключены всенаблюдаемые значения признака, разбивают на ряд частичных интервалов длины h и находят л,-—сумму частот вариант, попавшихв 1-й интервал.
Гистограммой частот называют ступенчатую фигуру,состоящую из прямоугольников, основаниями которых служат частичные интервалы длины Л, а высоты равны отношению л,/А (плотность частоты). Площадь частичного i-vo прямоугольника равнаh{ni/h)=ni—суммечастот вариант, попавших в i-u интервал. Площадь гистограммы частот равна сумме всех частот, т. е. объемувыборки п.Гистограммой относительных частот называют ступенчатуюфигуру, состоящую из прямоугольников, основаниями' которыхслужат частичные интервалы длины Л, а высоты равны отношениюWi/h (плотность относительной частоты). Площадь частичного 1-гопрямоугольника равна h{wi/h)=Wf — относительной частоте вариант,попавших в 1-й интервал. Площадь гистограммы относительныхчастот равна сумме всех относительных частот, т.
е. единице.443. Построить полигон частот по данномуделению выборки:X,. 1 4 5 7П( 20 10 14 6распреР е ш е н и е . Отложим на оси абсцисс варианты х,-, а на осиординат—соответствующие им частоты л/; соединив точки (JC/, Л/)отрезками прямых, получим искомый полигон частот (рис. 12).141061-и-Рис. 127XiЧ 57Рис. 13WXi444. Построить полигон частот по данному распределению выборки:а) х, 2 3 5 6б) Xi 15 20 25 30 35rii 10 15 5 20rii 10 15 30 20 25445. Построить полигон относительных частот по данному распределению выборки:г) Xi 245 710Wi 0.15 0,2 0,1 0,1 0,45б) X,- 14589Wi 0,15 0,25 0,3 0,2 ОД153в) JC; 20 40 65 80w^ 0,1 0,2 0,3 0,4Р е ш е н и е , a) Отложим на оси абсцисс варианты ж/, а на осиординат—соответствующие относительные частоты wi* Соединив точки(дг/, Wi) отрезками прямых, получим искомый полигон относительныхчастот (рис. 13).446.
Построить гистограмму частот по данному распределению выборки объема п = 1 0 0 :Номеринтервала1Сумма частотвариант интервала'^iЧастичныйинтервал^/"^i + l1—55—99—1313—1717—2112345102050128Плотностьчастотыnj/H2,5512,532Р е ш е н и е . Построим на оси абсцисс заданные интервалы длиныh=4. Проведем над этими интервалами отрезки, параллельные осиабсцисс и находящиеся от нее на расстояниях, равных соответствующим плотностям частоты п^/к.
Например, над интервалом (1, 5)построим отрезок, параллельный оси абсцисс, на расстоянии П(/Н=:= 10/4 = 2,5; аналогично строят остальные отрезки.л/J/2S3Z10ii1/.JП'iЧ XРис. 14Искомая гистограмма частот изображена на рис. 14.447. Построить гистограмму частот по данному распределению выборки:154а)Номеринтервала12345Сумма частотвариант интервалаЧастичныйинтервал^i'^i + i2—77—1212—1717—2222—27Плотностьчастоты5102564б)НомеринтервалаiЧастичныйинтервал^n^i + i3—55—77—99—1111—1313—1515—171234567Сумма частотiвариант интервала"i1Плотностьчастоты«,/*4^204020^6У к а з а н и е . Найти предварительно плотность частоты п///гдля каждого интервала и заполнить последний столбец таблицы.448.
Построить гистограмму относительных частот поданному распределению выборки:НомеринтервалаiЧастичныйинтервалСумма частот вариантчастичного интервала1230—22—44—6203050л=2'»/ = '00Р е ш е н и е . Найдем относительные частоты:0/1 = 20/100=0.2, 0/2=30/100 = 0.3, о/, =50/100 = 0 , 5 .155Найдем плотности относительных частот, учитывая, что длинаинтервала / i = 2 :ш,//1 =0,2/2 = 0 , 1 , оУа/Л =0,3/2 = 0,15, Шд/Л = 0,5/2 =0,25.Построим на оси абсцисс данные частичные интервалы. Прове*дем над этими интервалами отрезки, параллельные оси абсцисс инаходящиеся от нее на расстояниях, равных соответствующим плотностям относительной частоты.
Например, над интервалом (О, 2)проведем отрезок, параллельный оси абсцисс и находящийся от неена расстоянии, равном 0,1; аналогично строят остальные отрезки.Щh/hРис. ISИскомаярис. 15.гистограмма относительныхчастот изображена на449. Построить гистограмму относительных частот поданному распределению выборки:а)^1астич11ЫЙинтервал^/"•^1 + 1Номеринтервала1I2345110—1515—2020—2525—3030—35Сумма частот вариантчастичного интервала124842л = 2 ^ / = 20156б)Номеринтервалаi1234ЧастичныйинтервалСумма частот вариантчастичного интервала«12—55—88—1111 — 14110145П==^П(:=2ЪУ к а з а н и е . Найти сначала относительные частоты, соответствующие плотности относительной частоты для каждого интервала.Глава десятаяСТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ§ 1. Точечные оценкиСтатистической оценкой в* неизвестного параметра в теоретического распределения называют функцию / ( X i , Х2, . .
. Хп) отнаблюдаемых случайных величин Xi, Х2, . . . , Хп.Точечной называют статистическую оценку, которая определяетсяодним числом e* = /(jvi, Х2, . . . , Хп)у где xj, jcj», . . . , х„—результаты п наблюдений над количественнЫхМ признаком X (выборка).HecMeu^f*HHOu называют точечную оценку, математическое ожидание которой разно оцениваемому параметру при любом объемевыборки.Смещенной называют точечную оценку, математическое ожидание которой не равно оцениваемому параметру.Несмещенной оценкой генеральной средней (математическогоожидания) служит выборочная средняя\ж"'где Х{ — варианта выборки, «/-частотап,варианты лг/, л = 2 ^ ' —*= 1объем выборки.З а м е ч а н и е 1. Если первоначальные варианты Х(—большиечисла, то для упрощения расчета целесообразно вычесть из каждойварианты одно и то же число С, т.
е. перейти к условным вариантамw/=jc/—С (в качестве С выгодно принять число, близкое к выборочной средней; поскольку выборочная средняя неизвестна, число Свыбирают «на глаз»). Тогда^в=С + (2л/а/)//г.157Смещенной оценкой генеральной дисперсии служит выборочнаядисперсияD»=(^ni(Xi-x,)Alntэта оценка является смещенной, так какAIID,l = l j j i z ) r .Более удобна формулаЗ а м е ч а н и е 2. Если первоначальные варианты ж/—большиечисла, то целесообразно вычесть из всех вариант одно и то жечисло С, равное выборочной средней или близкое к ней, т.
е. перейтик условным вариантам Ui^xi-^-C (дисперсия при этом не изменится).Тогда0^{Х)^0^{и)^и^^[Ъ\^З а м е ч а н и е 3. Если первоначальные варианты являются десятичными дробями с k десятичными знаками после запятой, то,чтобы избежать действий с дробями, умножают первоначальные варианты на постоянное число С=:10*, т.е. переходят к условнымвариантам ui^Cxi.
При этом дисперсия увеличится в С* раз.Поэтому, найдя дисперсию условных вариант, надо разделить еена С*:Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия^• = n = I - ^ B =Более удобна формула»*7[=\в условных вариантах она имеет видтип.*«•"7[^\'—•причем если ui*=^X{—С, то sx^ssS; если utrs&Cxi^ то sx«5tf/C^.З а м е ч а н и е 4. При большом числе данных используют методпроизведений (см. гл.