179247 (Статистика), страница 13
Описание файла
Документ из архива "Статистика", который расположен в категории "". Всё это находится в предмете "экономика" из , которые можно найти в файловом архиве . Не смотря на прямую связь этого архива с , его также можно найти и в других разделах. Архив можно найти в разделе "книги и методические указания", в предмете "экономика" в общих файлах.
Онлайн просмотр документа "179247"
Текст 13 страницы из документа "179247"
Для оценки плотности связи статистика использует группу коэффициентов с такими общими особенностями:
-
при отсутствии какой-либо связи значение коэффициента приближается к нулю; при функциональной связи – к единице;
-
при наличии корреляционной связи коэффициент выражается дробью, которая по абсолютной величине тем больше, чем плотнее связь.
Среди мер плотности связи самым распространённым является:
1) коэффициент корреляции Пирсона - . Поскольку сфера его использования ограничивается линейной зависимостью, то и в названии его фигурирует слово «линейный».
Коэффициент корреляции определяется по формуле:
.
2) Коэффициент детерминации – квадрат коэффициента корреляции ( ), показывающий, какая часть общей вариации результативного признака определяется исследуемым фактором.
3) Мерою плотности связи является также корреляционное отношение:
,
где - межгрупповая дисперсия, которая измеряет вариацию признака под влиянием фактора ,
- общая дисперсия.
Корреляционное отношение показывает, сколько процентов вариации признака объясняется вариацией фактора и используется для оценки плотности связи по данным аналитической группировки (например, для оценки плотности связи между глубиной разработки угольных пластов и фондоёмкости добычи угля).
Взаимосвязь между признаками, которые можно ранжировать, прежде всего, на основе бальных оценок, измеряется методами ранговой корреляции. Упорядочение единиц совокупности по значению признака называется ранжированием. Рангами называются числа натурального ряда, которые согласно значениям признака присваиваются элементам совокупности и в определённой степени упорядочивают её. Ранжирование проводится по каждому признаку отдельно: первый ранг присваивается наименьшему значению признака, последний – наибольшему или наоборот. Количество рангов равно объёму совокупности. Учитывая то, что ранговая корреляция не требует соблюдения каких-либо математических предпосылок распределения признаков, ранговые оценки плотности связи целесообразно использовать для совокупностей небольшого объёма.
Решение типовых задач
Задача № 1.
С помощью методов периодизации выделены периоды однотипной динамики безработицы и преступности.
-
По одному из таких периодов с помощью линейного коэффициента корреляции определите наличие связи между числом преступлений и численностью лиц, не занятых в экономике. Дайте оценку.
-
Постройте уравнение регрессии.
-
Нанесите на график эмпирическую и теоретическую линии регрессии.
Таблица 1
Год | Лица в трудоспособном возрасте, не занятые в экономике, тыс. чел. | Число зарегистрированных преступлений |
1999 | 117,1 | 54 929 |
2000 | 134,7 | 77 915 |
2001 | 191,9 | 86 615 |
2002 | 215,0 | 72 404 |
Ход решения:
Так как с увеличением числа лиц в трудоспособном возрасте ( ), не занятых в экономике, равномерно увеличивается число зарегистрированных преступлений ( ), то оценку зависимости проводим с помощью линейного уравнения регрессии, а оценку тесноты связи – линейного коэффициента корреляции.
-
Линейный коэффициент корреляции рассчитывается по формуле:
= .
-
Уравнение прямой, с помощью которой оценивается форма зависимости изучаемых показателей, имеет вид:
,
где - теоретическое число зарегистрированных преступлений;
- численность лиц в трудоспособном возрасте, не занятых в экономике;
- параметры уравнения прямой, определяемые системой нормальных уравнений:
;
Откуда
.
Для определения параметров уравнения регрессии и линейного коэффициента корреляции строим таблицу и находим параметры уравнения:
Таблица 2
Годы |
|
|
|
|
|
|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
1999 | 117,1 | 54 929 | 6432185,9 | 13712,41 | 65183 | 3017195041 |
2000 | 134,7 | 77 915 | 10495150,5 | 18144,09 | 68062 | 6070747225 |
2001 | 191,9 | 86 615 | 16621418,5 | 36825,61 | 77420 | 7502158225 |
2002 | 215,0 | 72 404 | 15566860 | 46225,00 | 81199 | 522339216 |
Итого | 658,7 | 291 863 | 49115614,9 | 114907,11 | 291863 | 21832439707 |
Линейный коэффициент корреляции:
Полученное значение коэффициента корреляции свидетельствует о заметной (умеренной) связи между численностью лиц в трудоспособном возрасте, не занятых в экономике, и числом зарегистрированных преступлений.
Найдём по формулам параметры уравнения:
Уравнение корреляционной связи примет вид:
Подставив в это уравнение значения , определяют теоретические значения . Так,
.
и т.д.
Теоретические значения приведены в табл. 2.
Задачи для самостоятельного выполнения
Задача №2.
По 10 совхозам есть данные об урожайности зерновых культур и качестве грунта. Необходимо провести корреляционно-регрессионный анализ связи между двумя признаками – урожайностью и качеством грунта. Для характеристики этой связи необходимо определить: 1) форму связи и математическое уравнение связи, для чего построить график корреляционной зависимости между урожайностью ( - результативный признак) и качеством грунта ( - факторный признак); 2) параметры уравнения регрессии; 3) тесноту связи (коэффициенты корреляции и детерминации).
Таблица 1
№ | Урожайность, ц/га | Качество грунта, баллов | Расчётные величины | |||||
|
|
|
|
|
| |||
1 | 2 | 3 | 4 | 5 | 6 | 7 | ||
1 | 28,0 | 79 | 2212,0 | 784,00 | 6241 | 27,84 | ||
2 | 21,0 | 70 | 1470,0 | 441,00 | 4900 | 19,48 | ||
3 | 27,6 | 80 | 2208,0 | 761,76 | 6400 | 28,77 | ||
4 | 16,2 | 71 | 1150,2 | 262,44 | 5041 | 20,40 | ||
5 | 29,7 | 77 | 2286,9 | 882,09 | 5929 | 25,98 | ||
6 | 26,8 | 77 | 2063,6 | 718,24 | 5929 | 25,98 | ||
7 | 30,3 | 84 | 2545,2 | 918,09 | 7056 | 32,48 | ||
8 | 15,7 | 66 | 1036,2 | 246,49 | 4356 | 15,77 | ||
9 | 25,5 | 74 | 1887,0 | 650,25 | 5476 | 23,20 | ||
10 | 15,8 | 67 | 1058,6 | 249,64 | 4489 | 16,70 | ||
Всего | 236,6 | 745 | 17917,7 | 5914,00 | 55817 | 236,60 | ||
В среднем | 23,66 | 74,5 | 1791,77 | 591,40 | 5581,7 | 23,66 |
Задача № 3.
По данным задачи №2 необходимо осуществить статистическую проверку существенности выборочных коэффициентов регрессии и корреляции, найти интервалы, в которых находятся их значения в генеральной совокупности. Уровень значимости .