180020 (628458), страница 9
Текст из файла (страница 9)
соответственно.
Данные, необходимые для расчётов представлены в приложении G.
Для фактора x1 после подстановки данных в формулу, получаем следующий коэффициент корреляции r1:
Для фактора x2 после подстановки данных в формулу, получаем следующий коэффициент корреляции r2:
Для фактора x3 после подстановки данных в формулу, получаем следующий коэффициент корреляции r3:
По полученным данным можно сделать вывод о том, что:
-
Связь между x1 и y прямая (так как коэффициент корреляции положительный) и слабая, так как она находится между 0,21 и 0,30. Тем не менее, будем использовать фактор в дальнейших расчётах.
-
Связь между x2 и y прямая (так как коэффициент корреляции положительный) и умеренная, так как она находится между 0,31 и 0,40. Данный фактор также будем использовать в дальнейших расчётах.
-
Связь между x3 и y отсутствует, так как коэффициент корреляции меньше 0,15. Таким образом, возникает необходимость исключить данный фактор из дальнейших исследований.
В целом мы выполнили поставленную задачу, определив два наиболее влиятельных фактора для дальнейших исследований. Это: обменный курс рубля (слабая связь) и доход на душу населения (умеренная связь).
Далее для данных факторов x1 и x2 рассчитываем показатели вариации для анализа исходных данных:
- размах колебаний - R;
- среднее линейное отклонение - d;
- дисперсию -
;
- среднее квадратичное отклонение -
;
- коэффициент вариации - V.
Данные показатели рассчитываются по следующим формулам:
где:
хмах и хmin - соответственно максимальное и минимальное значения
фактора.
Рассчитаем данные показатели для факторов x1 и x2 . Данные для расчётов можно взять из приложения G. Для x1 :
R = 28,534 - 6,048 = 22,486 ;
d = 88,14/12 = 7,345;
Коэффициент вариации V > 15%. Из этого можно сделать вывод, что совокупность нельзя признать однородной. Данная модель не может применяться на практике, однако в учебных целях продолжим наш анализ, используя данный фактор.
Для x2 :
R = 7748,7-2500,9 = 5247,8 ;
d = 16740,5/12=1395,04;
Полученный коэффициент вариации V также больше 15%, поэтому можно сделать вывод о том, что совокупность нельзя признать однородной, а следовательно использовать модель на практике. Однако в учебных целях продолжим рассмотрение влияния данного факторного признака на наш результативный признак.
Для фактора x1 (обменный курс рубля (поквартально, среднее значение за квартал), руб./дол.) проанализируем две следующие формы связи:
- Линейную (прямая форма связи);
- Параболическую;
Уравнение прямой имеет следующий вид: ŷ = a + bx1
Д
ля вывода данного уравнения необходимо решить следующую систему уравнений:
Уравнение параболы имеет следующий вид: ŷ = a + bx1 + cx12
Для вывода данного уравнения необходимо решить следующую систему уравнений:
Все необходимые расчеты параметров А и B для линейной модели представлены в приложении I, а для А, В и С для параболы представлены также в приложении I.
После расчетов получаем два параметризованных уравнения:
Прямая – ŷ = 540,301 + 7,476*x1;
Парабола – ŷ = -111,026 +113,276*x1 – 3,068*(x1)2
П
о нижеприведённой формуле рассчитаем ошибки аппроксимации для уравнений прямой и параболы (данные в приложении J). У какого уравнения будет наименьшая ошибка, то и оставляем для дальнейшего исследования:
Рассчитаем ошибку аппроксимации для прямой:
Рассчитаем ошибку аппроксимации для параболы:
Так как минимальная ошибка аппроксимации в уравнении параболы (7,35%), то данное уравнение мы оставляем для дальнейшего анализа. Однако эта ошибка больше 5%, то есть данную модель нельзя использовать на практике, но в учебных целях продолжим наш анализ, используя уравнение параболы.
Для уравнения проведем оценку параметров на типичность по формулам:
Данные для расчёта - в приложении G и J.
где: S2 – остаточная уточненная дисперсия;
S – среднее квадратическое отклонение от тренда;
ŷt – расчетные значения результативного признака;
ma, mb, mc – ошибки параметров;
ta, tb, tc – расчетные значения t критерия Стьюдента.
Рассчитаем значения данных величин:
S2 = 486117,16/10 = 48611,716;
mb = mc = 48611,716/852,15 = 57,046;
tb = 113,276/57,046= 1,986;
tc = 3,068/57,046 = 0,054;
Сравним полученные значения для α = 0,05 и числа степеней свободы
V = 10 (12 – 2) с теоретическим значением t-критерия Стьюдента. Для
α = 0,05 и числа степеней свободы V = 10 значение tтеор = 2,228. Расчетные значения ta , tb и tc < tтеор. Это значит, что данный параметр не типичен, что еще раз говорит нам о том, что данную модель нельзя использовать на практике. Однако в учебных целях продолжим наше исследование.
Для фактора x2 (доход на душу населения (поквартально, общее значение за квартал) (руб./квартал)) рассмотрим две формы связи:
- Линейную (прямую форму связи);
- Гиперболическую;
Уравнение прямой будет иметь вид: ŷ = a + bx2
Для вывода данного уравнения необходимо решить следующую систему уравнений:
Уравнение гиперболы имеет следующий вид вид: ŷ = a + b(1/x2)
Для вывода данного уравнения необходимо решить следующую систему уравнений:
Все необходимые данные для расчётов представлены в приложении К.
После решения систем уравнений получается два параметризованных уравнения:
- ŷ = 472,3682 + 0,0476x2 - уравнение прямой;
- ŷ = 916,844 – 909008,4(1/x2) - уравнение гиперболы.
Рассчитаем ошибки аппроксимации для уравнений прямой и гиперболы. У какой модели она будет наименьшая, ту модель используем для дальнейшего исследования. Данные для расчёта ошибки аппроксимации находятся в приложении L.
Рассчитаем ошибку аппроксимации для прямой:
Для гиперболы рассчитаем ошибку аппроксимации:
Так как минимальная ошибка аппроксимации в уравнении гиперболы (9,19%), то данное уравнение мы оставляем для дальнейшего анализа. Однако эта ошибка больше 5%, то есть данную модель нельзя использовать на практике, но в учебных целях продолжим наш анализ, используя уравнение гиперболы.
Для уравнения проведем оценку параметров на типичность по формулам:
где: S2 – остаточная уточненная дисперсия;
S – среднеквадратическое отклонение от тренда;
ŷt – расчетные значения результативного признака;
ma, mb – ошибки параметров;
ta, tb – расчетные значения t критерия Стьюдента.
Подставим данные в формулы (приложение G и L) и рассчитаем значения данных величин:
S2 = 631712,98/10 = 63171,298;
ta = 916,844/72,555 = 12,64;
mb = 63171,298/2663707,21 = 0,0237;
tb = 909008,4/0,0237 = 38329626,04;
Полученные значения сравним с теоретическим значением t-критерия Стьюдента при α = 0,05 и V = 10 (12 – 2) составляет 2,228. Как видно из сопоставления ta и tb > tтеор, следовательно параметры типичны и существенны. По ним можно проводить дальнейший анализ.
Оценку существенности связи произведу на основе t-критерия Стьюдента. Он рассчитывается по следующей формуле:
где:
r – коэффициент корреляции;
n – число уровней ряда;
После подстановки данных в формулу и произведённого расчёта получаем следующий показатель:
Так как tрасчётное > t теоретическое , или 3,565 > 2,228 при уровне значимости
α = 0,05 и числе степеней свободы V = 10 (12 – 2), связь x2 c y можно признать существенной и данный фактор можно использовать в дальнейшем анализе.
Для имеющихся факторов x1 и x2 составим уравнение множественной регрессии. Уравнение множественной регрессии изучает статистические закономерности между результативным признаком и несколькими факторами, влияющими на результат.
Для анализа уравнения множественной регрессии воспользуемся линейной формой связи. Составим линейное уравнение. На это есть следующие причины:
- Линейное уравнение легче подвергать анализу, интерпретации;
- В многочленах различных степеней каждый член степени, находящейся выше первой, может рассматриваться как новая переменная и таким образом уравнение переводится в линейную форму.
На основе имеющихся данных будем подвергать анализу во множественной регрессии следующие факторы:
-
обменный курс рубля (поквартально, среднее значение за квартал) - x1 (руб./дол.)
-
доход на душу населения (поквартально, общее значение за квартал) – x2 (руб./квартал)
Данные факторы проверим на мультиколлинеарность, для чего рассчитаем коэффициент корреляции rx1x2 ,то есть между факторами x1и x2. Он рассчитывается по формуле:
где:
и
– дисперсии факторного и результативного признака соответственно;
x,y – среднее значение суммы произведений значений факторного и
результативного признака;
x и y – средние значения факторного и результативного признака
соответственно. Подставив имеющиеся данные (Приложение G и М) в формулу имеем следующее значение:
Полученный коэффициент говорит об очень высокой связи, то есть влияние одного фактора во множественной регрессии осуществляется через другой фактор, поэтому дальнейший анализ по обоим факторам вестись не может. Однако в учебных целях продолжим анализ.
Дольше проведу оценку существенности связи с помощью коэффициента множественной корреляции. Он показывает совокупное влияние факторов, включенных в модель и находится по следующей формуле по формуле:














