metodicheskie_ukazania_prikladnaya_stati stika_06_04_17 (818945), страница 3
Текст из файла (страница 3)
На практике симметричные распределениявстречаются редкоAs где 3 ( xi x)3 f if 3S3,- центральный момент 3-го порядка,i3S3 S2As 0 ,Еслиасимметрияправосторонняя,левосторонняя, а при As 0 наблюдаетсяраспределения.П2. Показатель асимметрии К. Пирсона ( As ):AsП As 0 симметрияx xmodSГраничные значения для этого показателя аналогичныКоэффициенту асимметрии As .̅̅̅̅19__________________________________________________________Рис.1.
Графики плотности вероятностей при различных значенияхасимметрии3. Показатель эксцесса ( Ex ).Эксцесс – это мера крутости кривой распределения.Ex 4S434где 4 ( xi x) f i - центральный момент 4-го порядка,fа S4 i S .24При Ex 0 распределение островершинное, Ex 0 плосковершинное, а Ex 0 для нормального распределения.Рис.2. Графики плотности вероятностей при различных значенияхэксцесса̅̅̅̅20__________________________________________________________Тема 3. Сводка и группировкаГруппировка – процесс разделения совокупности на частигруппы по одному или нескольким существенным признакам.Классификация: простая группировка – по одному признаку; сложная группировка – по нескольким признакам.Значения признаков в исследуемой совокупности могутизменяться:1) дискретно – результат исследования есть дискретныйряд значений (обычно целые, часто повторяющиесячисла).2) непрерывно – значения могут быть очень разными,часто дробными, повторяться не часто.Для группировки дискретных данных записываются значенияпризнака, и подсчитывается количество встреч каждого иззначений (в качестве примера группировки дискретныхзначений можно вспомнить исходные данные задачи 2.3).Для группировки непрерывного ряда изменяющихся данныхиспользуется группировка с разделением на интервалы.Самая простая группировка – группировка с равнымиинтервалами.В процессе группировки необходимо выбрать: количество групп, на которые будет разделенасовокупность: одним из самых распространенныхметодов определения количества групп являетсяиспользование формулы Стéрджесса (Strugess).
= + , где k – количество групп, n – число единиц совокупности.Количество групп k – всегда целое число.̅̅̅̅21__________________________________________________________ величина (шаг) интервала: − ==где xmax и xmin – максимальное и минимальное значениепризнаков в совокупности.Интервалы тогда будут строиться следующим образом:Количествозначений,ГруппаИнтервалпопавших винтервал[xmin - xmin+h)1(где xmin - нижняя граница 1-гоинтервала, xmin+h – верхняяграница 1-го интервала)[xmin+h - xmin+h+h)2…k(где xmin+h - нижняя граница 2го интервала, xmin+h+h – верхняяграница 2-го интервала)…… - xmax]Примечание.Группировка с равными интервалами наилучшим образом применима ксовокупностям, в которых значения признака изменяются равномерно.
Вслучае если наблюдаются «скачки» значений, некоторые интервалы могутоказаться пустыми. Тогда прибегают к объединению пустого интервала сблизлежащим или увеличению шага интервала до результата, когдапустых интервалов не будет.Группировка с равными интервалами обычно применяетсяпри равномерности изменения значений признака (без резкихскачков).Вслучаенеравномерностииспользуетсягруппировка с неравными интервалами.̅̅̅̅22__________________________________________________________Способы группировки с неравными интервалами:1) в арифметической прогрессииОпределяется количество групп k.
После этого определяетсявеличина первого интервала: − =∑где h1 – величина 1-го интервала, Σi – сумма номеровинтервалов (например, если k = 4, то Σi= 1+2+3+4 = 10).Шаг остальных интервалов определяется по формуле: = × где hi – величина (шаг) i-го интервала.2) равнонаполненные интервалыОпределяется количество групп k (любым из известныхспособов).
После этого определяется количество значений,которое будет входить в каждый из интервалов:=где m –число единиц совокупности в интервале, n – общее числоединиц совокупности.В каждый интервал будет входить m значений признака.Тогда при построении группировки непрерывного рядазначений,упорядоченногоповозрастанию,делимсовокупность значений на несколько частей, каждая изкоторых состоит из m значений. Нижней границей интервалабудет 1-ое из m значений, а последним – m-ое из m значений,и так для каждой части.Задачи3.1 Имеются следующие данные о тарифных разрядахрабочих цеха:4453423465424445325344454634441355432445545344354244566̅̅̅̅23__________________________________________________________Произвести группировку рабочих по тарифному разряду.Сделать выводы о квалификации рабочих цеха.Ответ:Разрядырабочих123456ИТОГО:Количествочеловек15924124553.2 По участку имеются данные о выполнении сменныхнорм выработки каждым рабочим, %:100,8; 103,4; 105,2; 110,4; 108,7; 111,6; 101,9; 106,3Произвести группировку рабочих по величине выполнениясменной выработки.Ответ: k = 4; h = 2,7Группа1234Интервал100,8 – 103,5103,5 – 106,2106,2 – 108,9108,9 – 111,6Кол-возначений31223.3 Распределить 30 районов по величине товарооборота втекущем году.Число групп принять равным 5.31 331208 49251 387178 29124 55956 44010451836 77568 86521 94699 21282 97265 6809 76744 876̅̅̅̅2434 08845 50121 25360 674117 02143 520137 44547 24823 94433 77538 19628 97092 955127 72536 637__________________________________________________________Построить группировку:А) с равными интервалами;Б) с равнонаполненными интерваламиВ) с интервалами, меняющимися в арифметическойпрогрессии.Решение:А.
Равные208492 − 9767= 397455ИнтервалКол-во в группе9767 - 495121649512 – 89257689257 – 1290025129002 – 1687471168747 - 2084922h=№12345Б. Равнонаполненные30=6521 94634 08845 50168 865127 725m=123459 76731 33143 52060 674104 51821 25333 77544 87665 680117 021№1234523 94436 63747 24882 972137 44524 55936 77551 38792 955178 291Интервал9 767 - 28 79031 331 - 38 19643 520 - 56 44060 674 - 99 212104 518 - 208 492В.
С арифметической прогрессиейТ.к. k = 5, Σi = 1+2+3+4+5 = 15208492 − 9767ℎ1 == 13248, 33 (сотые можно отбросить)15h2 = 13248, 33 × 2 = 26496,67̅̅̅̅2528 79038 19656 44099 212208 492__________________________________________________________h3 = 13248, 33 × 3 = 39745h4 = 52993,33h5 = 66214,66№ИнтервалКол-во в группе19767 – 230153223015 – 4951113349511 – 892556489255 – 14224765142247 – 208492*2*Примечание.
По расчетам верхняя граница последнего интервалаполучится меньше (≈ 208487) – списываем получившуюся верхнююграницу на погрешность вычислений и округляем до максимальногочисла, чтобы оно попало в интервал.Графический анализ рядов распределенияАнализ рядов распределения удобно и наглядно производитьна основе графического анализа.Есть несколько видов графиков, с помощью которых можнопроанализировать вариационные ряды: Полигон частот: по оси oХ расположены значенияпризнаков (или границы интервалов), по оси oY –частоты. Расставляются точки в соответствующихместах (либо в средине соответствующего интервала),после чего соединяются прямыми линиями. Гистограмма: простая столбчатая диаграмма.
По осиoХ расположены значения признаков (или границыинтервалов – границ будет на одну больше, чем числоинтервалов), по оси oY – частоты. Кумулята (огива): по оси oХ расположены значенияпризнаков (или границы интервалов), по оси oY –накопленные частоты, начиная с первой варианты(или первого интервала) (у огивы наоборот - по оси oХ- накопленные частоты, начиная с первой варианты̅̅̅̅26__________________________________________________________(или первого интервала), по оси oY расположенызначения признаков (или границы интервалов).Пример. Имеются данные о прибыли банков: 3,7; 4,3; 6,7; 5,6; 5,1;8,1; 4,6.3,7 - 4,64,6 – 5,6 5,6 - 7 7 - 92311431223,7-4,64,6-5,65,6-7,017,0-9,00Рис. 3.
Гистограмма и полигон1 – Гистограмма2 – Полигон частотРис. 4. Кумулята̅̅̅̅27__________________________________________________________Задача3.4 Дан ряд значений выборки:403; 472; 109; 670; 337; 4506; 125; 369; 191; 261; 1213; 702;168; 692; 47; 8; 106; 1014; 1193.Построить графически ряд распределения с помощьюгистограммы, полигона, кумуляты.Решение.n = 19. По формуле Стерджесса k = 5. h = 900.8-908908-18081808-2708 2708-3608153003608-45081208-90815908-1808101808-27082708-360853608-45080Рис. 5. Гистограмма и полигонЧтобы построить кумуляту, избавляемся от интервалов, в которые невошло ни одного элемента, объединяя последние три интервала водин.8-908908-18081808-45081531Рис.
6. Кумулята̅̅̅̅28__________________________________________________________Тема 4. Эмпирическая функция распределения (ЭФР)Выборочная (эмпирическая) функция распределения – этоприближение теоретической функции распределения*,построенное с помощью выборки из него. Это функция Fn(x),определяющая для каждого значения x относительнуючастоту события X<x. () =где nx – число вариант, меньших x; n – объем выборки.*Теоретическая функция распределения (ТФР) определяетвероятность события X<x. ЭФР стремится к ТФР прибольших количествах испытаний.Пример:xi57 8 10fi52 4 6Объем выборки n = 5+2+4+6 = 17.Наименьшая варианта x1 = 5, следовательно, F17(x) = 0 при x≤5.Значения x<7 (а именно x1 = 5), наблюдались 5 раз, следовательно,F17 (x) = 5/17 = 0,3 при 5<x≤7.Значения x<8 (а именно x1 = 5, x2 = 7), наблюдались 7 раз,следовательно, F17 (x) = 7/17 = 0,4 при 7<x≤8.Значения x<10 (а именно x1 = 5, x2 = 7, x3 = 8), наблюдались 11 раз,следовательно, F17 (x) = 11/17 = 0,6 при 8<x≤10.Значения x>10 (а именно x1 = 5, x2 = 7, x3 = 8, x4 = 10), наблюдались17 раз, следовательно, F17 (x) = 17/17 = 1 при x>10.Ответ записывается следующим образом:0; ≤ 50,3; 5 < ≤ 717 () = 0,4; 7 < ≤ 80,6; 8 < ≤ 10{ 1; > 10.̅̅̅̅29__________________________________________________________Строится график:Fn(x)хРис.
7. Эмпирическая функция распределенияЭФР – функция, выражающая зависимость накопленнойчастоты от значений признака (для упорядоченныхэлементов), иначе говоря, накопленная частость.Критерий КолмогороваКритерий Колмогорова – критерий согласия с заданнымфиксированным распределением.Теоретическая функция распределения () (ТФР)определяет вероятность события X<x. ЭФР стремится к ТФРпри больших количествах испытаний.Критерий согласия Колмогорова основан на определениимаксимального расхождения (измерении расстояний) междуЭФР и выбранным распределением.Проверяются гипотезы: : () ≡ ()–теоретическоераспределениесоответствует заданному, а любые отклонения случайны; : | () − ()| > – распределения различны иотклонения не случайны.̅̅̅̅30__________________________________________________________Чтобы понять, какую гипотезу стоит принять, вычисляетсястатистика Колмогорова = √ × | () − ()|Для принятия решений руководствуемся выражением:D ≤ K(γ), принимается 0{ nDn > K(γ), принимается 1Ориентируемся на таблицу квантилей.Величина γ0,850,90,950,9750,99Квантиль порядка γ для1,141,221,361,481,63DnКвантиль порядка γ дляD*n (для нормального0,775 0,819 0,8950,9551,035распределения)Например, уровень значимости α = 0,05, следовательно, квантильпорядка γ = 0,95: K(0,95)=1,36.