metodicheskie_ukazania_prikladnaya_stati stika_06_04_17 (818945), страница 2
Текст из файла (страница 2)
В зависимостиот того, имеют ли значения частоты (иначе говоря, вариантывстречаются несколько раз), среднее арифметическое можетбыть простое и взвешенное.̅= +⋯+̅=– простое; × +⋯+ ×∑ - взвешенноегде xi – значение признака, fk – частота i-го признака, ∑ fi – суммачастот вариационного ряда.2) Выборочная дисперсия (S2)Это сумма квадратов отклонений выборочных результатовнаблюдений от их среднего арифметического, деленная наобъем выборки (представляет собой средний квадрат̅̅̅̅11__________________________________________________________отклонений индивидуальных значений признака).
Такжебывает простой и взвешенной. = =∑̅)=( −∑( −̅) ×∑ – простая;– взвешенная.3) Выборочное среднее квадратическое отклонение (S)Представляет собой квадратный корень из среднего квадратаотклонений отдельных значений признака от средней: = √ Имеет размерность усредняемого признака.4) Коэффициент вариации ( )Используется для сравнения рассеивания двух и болеепризнаков, имеющих различные единицы измерения.Коэффициент вариации представляет собой относительнуюмеру рассеивания, выраженную в процентах.
= × %̅Vn принимает значение от 0 до 1 при xi≥0. Если Vn≥33%, тосовокупность неоднородна.5) МинимумМинимальное значение в ряду,вариационного ряда. = ()илипервыйчлен6) МаксимумМаксимальное значение в ряду, или последний членвариационного ряда. = ()̅̅̅̅12__________________________________________________________7) Размах вариацииПредставляет собой разность между максимальным иминимальнымзначениямипризнаковвизучаемойсовокупности. = () − ()Этот показатель удобен простотой расчета, но придобавлении новых значений может резко измениться.8) МодаВеличина признака, который встречается в совокупностичаще всего. Это определение позволяет найти медианудискретного* ряда значений. Для определения медианынепрерывного* ряда значений необходимо воспользоватьсяформулой: − − = + ( − − ) + ( − + )где x0 –нижняя граница модального интервала (модальнымпризнается интервал с наибольшей частотой fi);h – шаг (величина) модального интервала;fm – частота модального интервала;fm-1 – частота интервала, предшествующего модальному;fm+1 – частота интервала, следующего за модальным.*Примечание: отличия дискретного и непрерывного рядов будутизучаться в теме «Сводка и группировка».9) Амплитуда модыА – частота моды или модального интервала.10) МедианаВариант, расположенный в середине упорядоченноговариационного ряда, и делящий его на две равные части –половина значений слева и половина – справа от медианы.̅̅̅̅13__________________________________________________________Это определение позволяет найти медиану дискретного* рядазначений.( + ), = + = { ()+(+).,=Т.е.
если объем выборки n – нечетное, медианой будет( + 1)-я порядковая статистика; если n – четное, медианойбудет среднее значение из левой и правой медиан, т.е.порядковые статистики с номерами и ( + 1).Для определения медианы непрерывного* ряда значенийнеобходимо воспользоваться формулой:∑ − − = + где x0 –нижняя граница медианного интервала (медианнымпризнается интервал, в котором расположено значение с1порядковым номером половина от суммы частот, т.е. ∑ );2h – шаг (величина) медианного интервала;Σfi- сумма частот ряда;fm – частота медианного интервала;Sm-1 – сумма накопленных частот ряда, предшествующегомедианному интервалу.*Примечание: отличия дискретного и непрерывного рядов будутизучаться в теме «Сводка и группировка».11) Выборочный нижний квартиль (Q1)Нижний квартиль – значение вариационного ряда,расположенное не далее, чем ¼ от начала ряда, или x([0,25n])– квантиль порядка 0,25, т.е.
значение, расположенное недалее, чем ¼ от начала ряда, где [0,25n] – целая часть числа0,25n (или ¼n), а круглые скобки указывают, что значениевыбирается из вариационного ряда.̅̅̅̅14__________________________________________________________12) Выборочный верхний квартиль (Q3)Верхний квартиль – значение вариационного ряда,расположенное не далее, чем ¾ от начала ряда, или x([0,75n])– квантиль порядка 0,75 (или ¾), где [0,75n] – целая частьчисла 0,75n. Круглые скобки обозначают, что значениеверхнего квартиля является одной из порядковых статистик.Пример: 1,5,6,7,9,12,15,19,20Число вариант n=9 - нечетное.
Следовательно, медиана ряда: = (5) = 9.Нижний квартиль: Q1=([0,25 ∗ 9]) = ([2,25]) = (2) = 5.Верхний квартиль: Q3=([0,75 ∗ 9]) = ([6,75]) = (6) = 12.0,250,250,250,25Q3Q113) Межквартильное расстояние (Q)Расстояние между выборочными квартилями x([0,75n]) иx([0,25n]). = ([, ∙ ]) − ([, ∙ ])Пример. Получены выборочные значения: 3,4,5,11,3,21,12,10,8,7.Построим вариационный ряд, т.е. расположим их в порядкенеубывания: 3,3,4,5,7,8,10,11,12,21.n = 10;3[1],3[2],4[3],5[4],7[5],8[6],10[7],11[8],12[9],21[10].Нижний квартиль: ([0,25 × 10]) = ([2,5]) = (2) = 3,следовательно, нижним квартилем является значение: (2) = 3.Верхний квартиль: ([0,75 × 10]) = ([7,5]) = (7) = 10.̅̅̅̅15__________________________________________________________Задачи2.1 Доходы пяти банков по операциям с ценнымибумагами за отчетный период составили: 0,4; 0,7; 0,8; 1,1;1,2 тыс.
руб. Найти средний годовой доход банка поданной операции и дисперсию.Ответ: x̅ = 0,84, S2=0,08242.2 Имеются данные страховых организаций области очисле заключенных договоров по личному добровольномустрахованию:ЧислоЧисло страховыхдоговоров, тыс. организаций, шт.206261015153216363Определить среднее число заключенных договоров врасчете на одну страховую организацию области.Ответ: x̅ = 24,5Примечание: Для расчета средней используется формула среднейарифметической взвешенной.
Необходимо сначала определить, что висходных данных является вариантами, что частотами. Числодоговоров – x (вариант), число организаций – f (частота).2.3 Распределение междугородних телефонных звонков поих продолжительности следующее:Продолжительность,минКоличество звонков345678910808495986047218Определитьсреднююпродолжительностьодногоразговора, медиану, моду, амплитуду моды, размахвариации.Ответ: x̅ = 5,48; ; xmed= x((493-1)/2+1)=x(247)= 5; xmod = 6; Аmod = 98;R= 10-3 = 7.̅̅̅̅16__________________________________________________________2.4 Имеются данные о распределении работниковпредприятия по уровню среднемесячной заработнойплаты.№З/П, руб.Число работников1.1500-1800102.1800-2100303.2100-2400704.2400-2700605.2700-3000256.
Свыше 30003Рассчитать среднюю з/п, моду, медиану.Примечание.При необходимости осуществить расчеты в группировке спервым или последним открытым интервалом шагом такогоинтервала принимается шаг ближайшего к нему закрытогоинтервала. Так, для настоящего примера для целей расчетов 6ой интервал принимается как [3000;3300].Ответ:̅x = (1650×10+1950×30+…+3150×3)/198=2354,55Медианный интервал: по результатам расчета накопленных частот1ищем элемент под номером: ∑ 198 = 99 - он расположен в2интервале [2100;2400). Следовательно, данные этого интервала иподставляем в формулу расчета медианы: =2100 + 300 ×1∑ 198−402= 2352,9 руб.Модальный интервал: наибольшая частота встречается в интервале[2100;2400). Следовательно, данные этого интервала и подставляем в70−30формулу расчета моды: = 2100 + 300 × (70−30)+(70−60) =702340 руб.2.5 Дисперсия равна 10, средний квадрат индивидуальныхзначений признака – 130.
Чему равна средняя?̅̅̅2 = 130. Предложить студентам вспомнитьРешение: S2=10, «упрощенную» формулу дисперсии, или формулу, основанную на̅̅̅̅2 . x̅ = √̅̅̅методе моментов: S2= ̅̅̅ 2 − () 2 − 2 = √130 − 10 = 10,95.̅̅̅̅17__________________________________________________________2.6 Средняя величина признака в совокупности равна 19, асредний квадрат индивидуальных значений этого признака– 397.
Определить коэффициент вариации.Решение: x̅ = 19, ̅̅̅ 2 = 397; =̅̅̅2 − ()̅̅̅̅2√√397 − 192× 100% === 31,58%̅̅192.7 Дан ряд выборочных значений признака:92; 100; 89; 98; 101; 84; 113; 93; 81; 74; 113; 86; 98; 99; 105;88; 101; 89; 93; 102; 101; 99; 87; 109; 92; 99; 111; 98; 99;111; 98; 102; 95.Найти верхний и нижний квартили, межквартильноерасстояние.Решение: Построить вариационный ряд.74; 81; 84; 86; 87; 88; 89; 89; 92; 92; 93;93; 95; 98; 98; 98; 98; 99; 99; 99;99; 100; 101; 101; 101; 102; 102; 105; 109; 111; 111; 113; 113.Q1 = x([0,25×33]) = x([8,25]) = x(8)=89.Q3 = x([0,75×33]) = x([24,75]) = x(24) = 101.Q3-Q1= 101-89= 12.2.8 Произведена группировка вкладчиков по размерувклада в банке:Размер вклада,тыс. руб.Числовкладчиков, чел200400400600600800800100010001200325612010488Определитьдисперсию,среднееотклонение, коэффициент вариации.квадратическоеОтвет:x̅ = 780; S2= 57 600; S = 240; Vn = 30,77%.Примечание: Т.к.
размеры вклада даны в виде интервалов, а в формулесредней арифметической взвешенной необходимо подставить толькоодно значение из каждого интервала - полусумма границ интервала,т.е. хц1=(200+400)/2=300 (т.е. хц: 300, 500, 700, 900, 1100).̅̅̅̅18__________________________________________________________Чтобы охарактеризовать выборку по форме распределениявычисляются следующие показатели:1. Коэффициент асимметрии ( As ).Асимметрия – это свойство распределения выборки, котороехарактеризует несимметричность распределения случайнойвеличины.