metodicheskie_ukazania_prikladnaya_stati stika_06_04_17 (818945), страница 5
Текст из файла (страница 5)
Общая дисперсия измеряет вариацию признака во всейсовокупностиподвлияниемвсехфакторов,обуславливающих эту вариацию:∑( − ̅) × =∑ II. Межгрупповая дисперсия характеризует систематическуювариацию, т.е. различия в величине изучаемого признака,возникающиеподвлияниемпризнакафактора,положенного в основание группировки:∑(̅ − ̅) × =∑ где ̅ – средние групповые (т.е. средние величины, найденныедля каждой из групп).III. Внутригрупповаядисперсияотражаетслучайнуювариацию, происходящую под влиянием не учтенныхфакторов и не зависящую от признака – фактора,положенного в основание группировки.∑( − ̅) × =∑ где σ2i – дисперсия, определенная для каждой из групп..Может потребоваться найти среднюю из внутригрупповыхдисперсий:∑ × ̅̅̅̅ =∑ Между указанными видами дисперсий существуетсоотношение, которое называют правилом сложениядисперсий: общая дисперсия равна сумме средней из частных(внутригрупповых) дисперсий и межгрупповой: = ̅̅̅ + ̅̅̅̅42__________________________________________________________Это соотношение также называется балансовым уравнением,или разложением дисперсий Фишера.Если основанием группировки является факторный признак,то с помощью правила сложения дисперсий можно измеритьсилу его влияния на результативный признак, вычисливкоэффициент детерминации.= Он показывает долю общей вариации результативногопризнака, обусловленную вариацией группировочногопризнака.Эмпирическое корреляционное отношение: = √Изменяется от 0 до 1.
Если k=0, группировочный признак неоказывает влияния на результативный; если k=1, изменениерезультативногопризнакаполностьюобусловленогруппировочным признаком, следовательно, между нимифункциональная связь.Задачи6.1 Имеются данные о чистой прибыли предприятий двухрайонов:ЧислоЧистая прибыль,Районпредприятиймлн. руб.164,6,9,7,6,42108,12,8,9,6,5,7,7,8,10Определить дисперсии чистой прибыли:1) Групповые (по каждому району);2) Среднюю из групповых дисперсий;3) Межгрупповую дисперсию.4) Общую дисперсию.̅̅̅̅43__________________________________________________________6.2 Имеются следующие данные о вкладах населения:СреднийЧислоКоэффициентГруппыразмервкладов,вариациинаселениявклада, тыс.тыс. ед.вклада, %руб.Городское7420Сельское3630Рассчитать эмпирическое корреляционное отношение (т.е.определить тесноту связи между размером вклада и типомнаселения).Решение:Находим общую среднюю ̅общ = 4,6 тыс.
руб.С помощью коэффициентов вариации находим групповыедисперсии: = ̅=> S = Vn×̅S22=(0,3×6)2=3,24 => ̅̅̅ 2 = 1,42 2 = 0,84; 2 = 2,26 = 0,84⁄2,26 = 0,3; k = √ = 0,61.=>S12=(0,2×4)2=0,64;Средние величиныСредняя величина – это обобщенная характеристикапризнака в статистической совокупности в конкретныхусловиях места и времени.Средняя величина имеет ту же размерность, что и признак уотдельных единиц совокупности.Среднее, рассчитанное по совокупности в целом, называетсяобщим средним и отражает общие черты изучаемого явления.Среднее, исчисленное для каждой группы – групповоесреднее.Две категории средних величин: алгебраические (арифметическое, гармоническое,геометрическое, квадратическое и пр.);̅̅̅̅44__________________________________________________________ структурные (мода,персентили и пр.).медиана,квартили,децилиАлгебраические средние: Среднее арифметическое: варианты представлены ввиде перечня в любом порядке или в видеранжированного ряда:̅ =∑ ∑ ×∑ – взвешенное.Среднеегармоническое:применяется,когданеобходимые веса в исходных данных не заданынепосредственно, а входят множителем в один изимеющихся показателей:̅ =– простое; ̅ =1∑– простое; ̅ =∑ ∑ – взвешенное.Среднеегеометрическое:используетсядляусреднения относительных величин (к примеру,темпов роста в рядах динамики):̅ = √∏ – простая; ̅ =∑ √∏ –взвешеннаяОбобщенная формула средних - степенное среднее:̅ = (∑ )1⁄∑ ×– простое; ̅ = (∑ 1⁄)– взвешенное,где > 0; ≠ 0.В зависимости от того, какое значение принимает показательстепени с, получаем различные виды средних:с = -1 – гармоническое с → 0 - геометрическоес = 1 - арифметическое с = 2 - квадратическоеПравило мажорантности средних.
Чем больше значение c вформуле степенного среднего, тем больше значение среднего(при использовании одних и тех же исходных данных):̅гарм ≤ ̅геом ≤ ̅арифм ≤ ̅квадр̅̅̅̅45__________________________________________________________Задачи6.4 Вычислить среднемесячную производительность трудаодногорабочегонаоснованииданныхопроизводительности труда на трех шахтах.№шахтыСреднемесячнаяпроизводительностьтруда 1 рабочего, т.123203040Общаядобыча угляна шахте замесяц, т.201003780062100Решение:̅гарм =∑ ∑ ==общая месячная добыча на шахтесреднемесячная производительность на шахте=1200003817,5=31,4 (т/чел.*мес.)6.5 Имеется ряд показателей, характеризующихрезультаты работы бригады рабочих из 10 человек:8,12,8,11,11,9,10,12,9,9.Рассчитать среднюю при условии, что:1) Эторядпоказателей,оценивающийпроизводительность труда каждого рабочего –выработка, шт./смену;2) Это ряд показателей, определяющих штучную нормувремени, показываемую каждым рабочим, мин/шт.;3) Это ряд показателей, характеризующих темп приростаобъема продукции бригады за смену, %.Для решения: 1 – ср.
арифметическое; 2 – ср. гармоническое; 3- ср. геометрическое.̅̅̅̅46__________________________________________________________Тема 7. КорреляцияКорреляция, корреляционная зависимость – взаимосвязь двухили более величин. Суть ее заключается в том, что приизменении значения одной переменной происходитзакономерное изменение (уменьшение или увеличение)другой (-их) переменной (-ых).Корреляционный анализ состоит в том, чтобы выявитьналичие/отсутствие связи.!Наличиекорреляционнойзависимостимеждупеременными не всегда означает наличие непосредственнойсвязи этих величин друг с другом – наблюдаемая связь частосуществует благодаря другим переменным.y↔z и x↔z не означает, что x↔y.!Корреляционная связь НЕ означает влияния однойвеличины на другую (причинно-следственной связи), можноговорить лишь о степени связи между ними.Коэффициент корреляции – это статистический показательзависимости двух случайных величин.Линейный парный коэффициент корреляции Пирсона∑=( − ̅) × ( − ̅) ==̅) × √∑=( − ̅ )√∑=( − ∑( − ̅)( − ̅) ̅̅̅̅ − ̅̅ (, )=== Свойства: rxy изменяется в пределах от -1 до 1; x и у могут взаимозаменяться (rxy = ryx) соотношение между двумя переменными – линейное;̅̅̅̅47__________________________________________________________ при |rxy| = 1 => x, y линейно зависимы; при |rxy| = 0 => x, y линейно не зависимы (линейнаязависимость отсутствует, но не исключены другиеформы зависимости – квадратичная, степенная ипр.); если x и y независимы, то |rxy| = 0.Степень тесноты связи по результатам расчета rxy удобнооценивать с помощью шкалы Чеддока (Chaddock Scale):0…0,1Отсутствует0,11…0,3Слабая0,31…0,5Умеренная0,51…0,7Заметная0,71…0,9Тесная0,9…0,99Очень тесная1,0ФункциональнаяНепараметрический ранговый коэффициент корреляцииСпирмена ( )Не связан с характером распределения признаков.
Егозначение зависит не от конкретных значений признаков, а отпорядка расположения этих значений. используется для определения тесноты связи между двумявеличинами (определение тесноты связи между признаками,измеренными в порядковых шкалах), а также дляопределения качества связи между ними.∑( − ̅)( − ̅) ∑ () ==−( − )√∑( − ̅) √∑( − ̅ )где n – количество наблюдений, рi – ранг для хi, qi – ранг для yi, di разность рангов каждой i-ой пары из n наблюдений.− ≤ () ≤ ̅̅̅̅48__________________________________________________________Равенство () нулю означает отсутствие связи междурангами рядов, а равенство 1 или -1, соответственно, прямойили противоположный порядок расположения значенийв рассматриваемых рядах.Этапы расчета коэффициента Спирмена:1) Упорядочивание значений признаков в порядкенеубывания;2) Определение разностей рангов di;3) Возведение разностей di в квадрат;4) Вычисление коэффициента корреляции.Оба вышеуказанных коэффициента являются парными иявляются мерой линейной корреляции между величинами.Определение связи между качественными признакамиДля этой цели применяется коэффициент контингенцииК.
Пирсона Кконт.Используется, когда оба признака дихотомические (илиальтернативные, или бинарные), т.е. могут принимать двапротивоположных значения, например: пол – мужской,женский; наличие детей в семье – есть, нет).конт = − √( + )( + )( + )( + )Длярасчетакоэффициентасоставляетсятаблицасопряженности для двух таких признаков – таблица «четырехполей»:Признак 1Значение 1.1Значение 1.2ВсегоПризнак 2Значение 2.1 Значение 2.2abcda+cb+d̅̅̅̅49Всегоa+bc+dn__________________________________________________________В таблице a,b,c и d – число комбинаций соответствующихзначений признаков (т.е. число ответивших на один и второйвопрос определенным образом), полученных по результатамисследования.− ≤ конт ≤ При конт = 0 связь отсутствует. Чем ближе значение |конт |к 1, тем теснее связь.
При |конт | > 0,3 связь междупризнаками существенная.Задачи7.1 В ходе обследования оценки уровня жизниработающих на предприятиях различной формысобственности было опрошено 100 респондентов. Врезультате опроса было выявлено, что из числаработающих на государственном предриятии уровнемжизни удовлетворены 30 человек, не удовлетворены – 55человек. На частном предприятии уровнем жизнидовольны 10 человек, недовольны – 5.Вычислить коэффициент контингенции.Ход решения:ФормасобственностипредприятияУдовлетворенность уровнемжизнинеудовлетворенудовлетворен3055ВсегоГосударственное85Негосударственное10515(частное)Всего406010030 × 5 − 55 × 10−400Кконт === 0,23√85 × 15 × 40 × 60 1749,29̅̅̅̅50__________________________________________________________7.2 Известны объем выпуска продукции в рублях, фондзаработной платы и среднесписочная численностьработников двадцати предприятий (данные приведены втаблице).№предпр.1234567891011121314151617181920Выпускпродукции,млн.
руб.36,4523,4046,5459,7541,4226,8679,254,7240,4230,2142,4264,5851,6135,4214,4036,9453,3941,6055,6842,05Фонд з/п,млн. руб.11 3408 11215 03619 01213 0358 53226 40017 10012 0629 54013 69421 32016 08210 46511 78011 50216 35612 79217 47231 168Среднесписочнаячисленностьработников, чел.1621561791941651582201901631591672051871611201621881641921301) Рассчитать коэффициент корреляции Пирсона;2) Присвоитьранги,рассчитатьранговыйкоэффициент корреляции Спирмена.Подсказка: из трёх столбцов для решения дать два любых, либовсе три сразу, и тогда искать к-ты по двум разным парамстолбцов.̅̅̅̅51__________________________________________________________7.3 Дана матрица рангов:px y28 21 130 25 236 29 440 31 530 32 346 34 656 35 854 38 760 39 1056 41 960 42 1168 44 1270 46 1376 50 14qd2102031415460718191101110120130140Σ 105 105 10*Примечание: Черным цветом – исходные данные, серымцветом – решение.Найти ранговый коэффициент корреляции Спирмена.Ответ:10ρ = 1 − 6 14(142 −1) = 0,98 => Связь между x и у сильная ипрямая.̅̅̅̅52__________________________________________________________Тема 8.