Вопросы/задания к контрольной работе: Построение и анализ регрессионных моделей
Описание
Содержание
Таблица с исходными данными.............................................................. 4 стр.
Введение.................................................................................................. 5 стр.
Задание 1................................................................................................ 7 стр.
Задание 2................................................................................................. 9 стр.
Задание 3................................................................................................ 10 стр.
Задание 4................................................................................................ 15 стр.
Задание 5................................................................................................ 19 стр.
Задание 6................................................................................................ 21 стр.
Задание 7................................................................................................ 21 стр.
Задание 8................................................................................................ 26 стр.
Задание 9................................................................................................ 28 стр.
Таблица 1 – Исходные данные
ТЕРРИТОРИЯ | ТИПНАС | НЕПРОД | АЛКО | ДОХОД | СБЕРЕЖ | ЧИСЛОЛЮД | ЧИСЛОДЕТ |
97 | 1 | 8,66379 | 0 | 41,12158 | 0 | 2 | 0 |
97 | 1 | 12,798 | 1,73583 | 47,47385 | 0 | 2 | 0 |
97 | 1 | 20,52251 | 0 | 171,36049 | 60,11 | 5 | 3 |
97 | 1 | 3,1687 | 0 | 51,17353 | 1 | 1 | 0 |
97 | 1 | 6,574 | 0 | 86,71872 | 2,5 | 3 | 0 |
97 | 1 | 9,0319 | 0 | 41,35626 | 2 | 2 | 0 |
97 | 1 | 46,4428 | 0 | 110,9246 | 3 | 1 | 0 |
97 | 1 | 7,129 | 0 | 55,25011 | 0 | 2 | 0 |
97 | 1 | 16,77 | 0 | 130,99631 | 2,5 | 2 | 0 |
97 | 1 | 7,03095 | 2,59282 | 65,97144 | 0 | 3 | 0 |
97 | 1 | 16,53874 | 0 | 70,07543 | 2,5 | 2 | 0 |
97 | 1 | 13,98043 | 1,54296 | 63,1462 | 3,5 | 4 | 0 |
97 | 1 | 20,3877 | 0 | 72,75707 | 1 | 1 | 0 |
97 | 1 | 18,391 | 2,89305 | 82,91068 | 295 | 7 | 5 |
97 | 1 | 9,162 | 2,52017 | 38,7379 | 0 | 1 | 0 |
97 | 1 | 0,09 | 0 | 21,70776 | 5 | 1 | 0 |
97 | 1 | 6,65 | 1,94734 | 43,89832 | 1 | 1 | 0 |
97 | 1 | 7,206 | 0 | 28,95586 | 0 | 1 | 0 |
97 | 1 | 14,9343 | 2,44302 | 56,74352 | 4 | 2 | 0 |
97 | 1 | 8,897 | 0,2443 | 44,47046 | 0 | 1 | 0 |
97 | 1 | 18,875 | 0 | 71,75535 | 2 | 3 | 1 |
97 | 1 | 4,281 | 0 | 40,11608 | 3 | 1 | 0 |
97 | 1 | 15,33 | 0 | 84,03464 | 30 | 2 | 0 |
97 | 1 | 9,902 | 0 | 55,7151 | 3 | 2 | 0 |
97 | 1 | 13,4927 | 0,23723 | 69,73129 | 1 | 4 | 1 |
97 | 1 | 23,54 | 3,08592 | 152,02153 | 7,5 | 2 | 0 |
97 | 1 | 12,091 | 0 | 123,93525 | 14,6 | 5 | 1 |
97 | 1 | 12,292 | 0 | 90,25596 | 9 | 4 | 1 |
Данная таблица в исходном виде имеет 320 значений
Введение.
Задание:
Федеральной службой государственной статистики РФ ежеквартально проводятся бюджетные обследования домашних хозяйств по всем регионам России об условиях проживания и уровне благосостояния населения.
Необходимо проанализировать данные обследования о расходах и доходах домохозяйств по заданному территориальному округу (переменная ТЕРРИТОРИЯ) и типу населенного пункта (город/село, переменная ТИПНАС). Выбор задания по вариантам осуществляется в соответствии с файлом с данными (см. лист «Выбор вариантов»).
В рамках работы считается, что домохозяйства описываются следующими показателями:
- расходы на продукты питания (переменная ПРОДПИТ, y1);
- расходы на непродовольственные товары (переменная НЕПРОД, y2);
- расходы на оплату услуг (переменная УСЛУГИ, y3);
- расходы на покупку алкогольной продукции (переменная АЛКО, x0);
- доходы домохозяйства (переменная ДОХОД, x1);
- сбережения домохозяйства (переменная СБЕРЕЖ, x2);
- число людей в домохозяйстве (ЧИСЛОЛЮД, x3);
- число детей в домохозяйстве (ЧИСЛОДЕТ, x4).
Необходимо построить и проинтерпретировать модель, описывающую изменение значения отклика (y) в зависимости от значений объясняющих переменных (x0, x1, x2, x3 и x4) в пределах указанной территории и типа населенного пункта.
Порядок выполнения:
- Построить корреляционные поля по данным о расходах и каждом объясняющем показателе. Сделать предварительное заключение о наличии (отсутствии) связи между этими факторами, о ее виде и форме, а также о наличии аномальных наблюдений (выбросов).
- Провести проверку данных на наличие выбросов с удалением всех наблюдений, для которых выполняется соотношение, где X – матрица, составленная из значений переменных x1 и x2. На основе оставшихся наблюдений провести первичный эконометрический анализ, включающий расчет основных выборочных характеристик и построение гистограмм, проинтерпретировать полученные результаты, сделать выводы.
- Рассчитать выборочные парные коэффициенты корреляции для всех возможных пар переменных (в случае порядковых переменных – число людей и число детей – воспользоваться коэффициентами ранговой корреляции Спирмена), проверить их на значимость, сделать выводы о тесноте связи между признаками.
- Построить линейную модель множественной регрессии с учетом всех входных переменных, оценить ее при помощи МНК, проверить параметры на значимость. Оценить качество построенной модели на основе критерия Фишера. Сделать выводы.
- Проранжировать входные факторы по степени влияния на отклик при помощи коэффициентов эластичности. Сделать выводы.
- С помощью критериев Спирмена, Голдфельда-Квандта и Бартлетта изучить модель на предмет наличия гетероскедастичности относительно переменной x1. При помощи критерия Глейзера оценить форму гетероскедастичности. Избавиться от гетероскедастичности путем корректировки исходных данных (значений отклика).
- Оценить заново параметры модели множественной регрессии, проверить их на значимость по критерию Стьюдента, выяснить вопрос о значимости модели в целом по критерию Фишера. Сравнить полученные результаты с исходной моделью, сделать выводы.
- На основе второго уравнения регрессии рассчитать частное уравнение регрессии значений отклика от дохода в предположении, что значения остальных входных переменных заменены их медианами. Построить 95%-й доверительный интервал на всем диапазоне скорректированных исходных данных. Изобразить в одной системе координат исходные данные (до корректировки), линию регрессии и доверительный интервал. Проанализировать результаты.
- Сделать общие выводы по проделанной работе в терминах исходных показателей, разработать рекомендации для региона РФ, вытекающие из результатов, полученных в работе.
vitalievnatalia
















